{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Tematy projektów proponowanych w roku akademickim 2023/2024" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "W ninejszym pliku podane są przykładowe tematy projektów, które mogą stać się inspiracją do projektu wykonywanego przez studentów w roku akaedmickim 2023/2024. \n", "\n", "W pierwszej części podane są tematy nowych projektów - proponowanych obecnie. \n", "\n", "W drugiej części podane są tematy projektów realizowanych w roku akademickim 2022/2023, w których zawarty był element analizy danych / uczenia maszynowego.\n", "\n", "Grupa może wybrać temat:\n", " * spośród proponowanych obecnie, \n", " * spośród realizowanych w roku 2022/2023, \n", " * włąsny w uzgodnieniu z wykładowcą. \n", "\n", "Warunkiem akceptacji tematu jest zastosowanie **metody uczenia maszynowego**. \n", "\n", "Warunkiem koniecznym zaliczenia projektu będzie ewaluacja modelu opracowanego w ramach zadania w systemie **Gonito** lub na platformie **Kaggle**." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Tematy nowe" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Temat oparty na wyzwaniu z platformy Gonito\n", "Grupa może wybrać dowolny temat oparty na istniejącym wyzwaniu na platformie Gonito. \n", "Dokładna treść projektu powinna zostać uzgodniona z prowadzącymi.\n", "Przykładowe wyzwania z platformy Gonito, które mogą stać się inspiracją dla projektów to:\n", " - wyzwania zwiąane z wyceną mieszkań\n", " - wyzwanie Meteo Rain - prognoza opadów deszczu\n", "\n", "## Temat oparty na wyzwaniu z platformu Kaggle\n", "Platforma Kaggle udostępnia dużą liczbę wyzwań - dla każdego z nich podając zbiory danych trenujących. Dodatkową motywacją skorzystania z danych na tej platformie jest możliwość (ale nie jest to konieczność) wzięcia udziału w konkursie z dziedziny uczenia maszynowego.\n", "\n", "https://www.kaggle.com/datasets\n", "\n", "## Temat oparty na danych z GUS\n", "Główny urząd statystyczny udostępnia zestawy danych w formacie *csv* dotyczące życia w Polsce. Na podstawie tych danych można wytrenować system uczenia mazynowego pomocny w analizie i przewidywaniu zachowań polskiego społeczeństwa.\n", "\n", "https://stat.gov.pl/\n", "\n", "## Temat oparty na danych dotyczących Europy\n", "Eurostat jest europejskim odpowiednikiem GUSu. Dane satystystyczne z tego zbioru są dostępne tutaj:\n", "\n", "https://ec.europa.eu/eurostat/data/database\n", "\n", "## Temat oparty na danych z wyszukiwarki Google\n", "W wyszukiwarce Google dzięki odpowiedniemu zapytaniu można odszukać zbiór danych trenujących do zadanego przez siebie tematu. Warto wypróbować tę możliwość - nawet jeśli nie doprowadzi do sformułowania tematu.\n", "\n", "https://datasetsearch.research.google.com/" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Tematy proponowane lub realizowane w roku 2022/2023" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Portfel inwestycyjny\n", "Celem projektu jest opracowanie algorytmu predykcji notowań spółek na bazie danych z www.gpw.pl/archiwum-notowan. \n", "\n", "Komentarz (2023): Projekt został zrealizowany, ale model predykcji nie został poddany ewaluacji.\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Handel walutami\n", "Celem projektu jest opracowanie algorytmu predykcji notowań walut na podstawie danych ze strony https://www.nbp.pl/home.aspx?f=/statystyka/kursy.html. \n", "Tak opracowany algorytm należy zastosować w atrakcyjnej aplikacji, np. w grze dla wielu osób handlujących walutami (w grze należy założyć, że gracze nie mają wglądu w przyszłe notowania i określić zasady zwycięstwa).\n", "\n", "Komentarz (2023): Ten temat nie został wybrany w roku 2022." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Anonimizacja zdjęć pojazdów\n", "Celem projektu jest wytrenowanie algorytmu uczenia maszynowego, który znajduje i zasłania wrażliwe elementy na zdjęciu pojazdu. Są to m.in. tablice rejestracyjne i twarze osób znajdujących się w pojeździe.\n", "Algorytm może bazować na kodzie otwarto-źródłowym. Do trenowania należy skorzystać z bazy danych zdjęć udostępnionej specjalnie dla tego projektu.\n", "W ramach projektu wskazane jest opracowanie również interfejsu użytkownika.\n", "\n", "Komentarz (2023): Projekt w efekcie nie był realizowany z powodu braku dostępu do bazy zdjęć. W przypadku realizacji tego projektu niezbędne byłoby pozyskania bazy danych zdjęć." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Wycena wartości szkody na podstawie zdjęć\n", "Celem projektu jest wytrenowanie algorytmu uczenia maszynowego, który szacuje wartość szkody na podstawie zestawu zdjęć uszkodzonego pojazdu. Algorytm może bazować na kodzie otwarto-źródłowym. Do trenowania należy skorzystać z bazy danych zdjęć udostępnionej specjalnie dla tego projektu. \n", "\n", "Komentarz (2023): Projekt realizowano w dwóch niezależnych grupach. Obie grupy miały spore trudności z pozyskaniem odpowiednio dużej bazy danych." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Generowanie obrazów z ich opisów \n", "Celem projektu jest wykorzystanie otwartego kodu do generowania obrazów z tekstu (https://stability.ai/blog/stable-diffusion-public-release). (Przykład takiego wykorzystania można zobaczyć na stronie creator.nightcafe.studio.) W projekcie można wykorzystać dostępny kod w dowolny sposób. \n", "\n", "Komentarz (2023): Ten temat nie został wybrany w roku 2022. Wydaje się, że aby ten temat mógł być zastosowany obecnie, należałoby dla wybranego zadania opracować jakąś metodę ewaluacji oraz przygotować zbiór testowy." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Rozpoznawanie biedronki azjatyckiej \n", "Celem projektu było zaklasyfikowanie zdjęcia zawierającego biedronkę do jednej z klas: biedronka polska i biedronka azjatycka. \n", "\n", "Komentarz (2023): Ten niezwykle przydatny temat (wydaje się, że polska biedronka jest pod ochroną, a azjatycka jest szkodnikiem) został wymyślony przez studentów. Realizacja tego projektu wymagała wygenerowania sztucznych danych treningowych (np. poprzez przetworzenie istniejących zdjęć) ze względu na niewielką liczbę danych autentycznych. \n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "