Projekt_1 | ||
.gitignore | ||
README.md |
Matma_AI_cyber
Szanowni Państwo,
Przesyłam propozycje 8 tematów projektu nr 1.
Zasady zaliczenia: 40 punktów podzielone następująco:
10 pkt - prezentacja projektu 15 pkt - implementacja, w tym: 5 pkt - zgodność z tematem, 5 pkt - jakość kodu, 5 pkt - poprawność implementacji 10 pkt - efekt "wow" 5 pkt - aktywność wszystkich członków grupy Grupy domyślnie są 3-osobowe. Idealnie każda grupa studencka (w danej grupie ćwiczeniowej) powinna realizować inny temat. Studenci mogą zaproponować inne tematy spoza listy po konsultacji z nami. Do wyboru: Python lub R.
Jutro (5 kwietnia 2022) podczas ćwiczeń odbędzie się podział na grupy i przypisanie do tematów. Proszę sprawę przemyśleć.
Termin oddania na Moodle: do 3 maja. Prezentacja projektów w terminie ustalonym na ćwiczeniach.
Lista tematów:
- Bootstrapowa wersja testu t. Implementacja powinna obejmować test dla jednej próby, dla dwóch prób niezależnych oraz dla dwóch prób zależnych. W każdej sytuacji oczekiwanym wejście jest zbiór danych w odpowiednim formacie, a wyjściem p-wartość oraz ostateczna decyzja. Dodatkowo powinien być rysowany odpowiedni rozkład statystyki testowej.
- Klasyfikacja za pomocą naiwnej metody bayesowskiej (rozkłady ciągłe). Implementacja powinna założyć, że cechy są ciągłe (do wyboru rozkład normalny i jądrowe wygładzenie). Na wejściu oczekiwany jest zbiór, który zawiera p-cech ciągłych, wektor etykiet oraz wektor prawdopodobieństw a priori dla klas. Na wyjściu otrzymujemy prognozowane etykiety oraz prawdopodobieństwa a posteriori. Dodatkową wartością może być wizualizacja obszarów decyzyjnych w przypadku dwóch cech.
- Klasyfikacja za pomocą naiwnej metody bayesowskiej (rozkłady dyskretne). Implementacja powinna założyć, że cechy są dyskretne/jakościowe. Na wejściu oczekiwany jest zbiór, który zawiera p-cech dyskretnych/jakościowych, wektor etykiet oraz wektor prawdopodobieństw a priori dla klas. Na wyjściu otrzymujemy prognozowane etykiety oraz prawdopodobieństwa a posteriori. Dodatkową wartością odpowiednia wizualizacja.
- Regresja jądrowa. Zakładamy, że dysponujemy zbiorem składającym się z dwóch cech (x i y). Modelujemy zależność y od x. Implementacja powinna umożliwiać wybór funkcji jądrowej oraz szerokości okna. Na wyjściu otrzymujemy prognozy dla y oraz wizualizacją pokazującą przebieg oszacowanej zależności.
- Kompresja obrazów oraz modyfikacje metodą SVD. Dysponujemy na wejściu obrazem bitmapowym (kolor lub odcienie szarości). Wykorzystując rozkład SVD dokonaj kompresji obrazu o pożądanym wskaźniku. Przygotuj funkcję filtrującą, która wartości wartości osobliwe przekształca na nowe wartości. W projekcie powinny być przetestowane pod względem użytkowym obrazy o różnych rozmiarach i typach (ilustracja, diagram, font, pejzaż).
- Uproszczony algorytm Page Rank. Implementacja iteracyjnej metody obliczania wartości własnych macierzy. Wykorzystanie do uproszczonej implementacji algorytmu Page Rank. Dyskusja zachowania przy różnych skalach grafów relacji.
- Rozkład QR i metoda najmniejszych kwadratów. Implementacja rozkładu QR dla macierzy z uwzględnieniem odbić Householdera i obrotów Givensa. Wykorzystanie rozkładu QR do rozwiązania problemu najmniejszych kwadratów i zastosowanie w obliczaniu najlepszego przybliżenia punktów do zadanej klasy funkcji.
- Rozkład Cholesky'ego i próbkowanie. Implementacja rozkładów Choleskiego i uogólnionego rozkładu Choleskiego dla macierzy kowariancji i wykorzystanie do generowania próbek dużych rozmiarów do symulacji Monte-Carlo z zadaną macierzą kowariancji. Wizualizacja przykładów.
Pozdrawiam,
Bartosz Naskręcki