- Nazwa przedmiotu:
- Zaawansowane metody uczenia maszynowego
- Koordynator przedmiotu:
- Prof. dr hab. Jan Mielniczuk
- Status przedmiotu:
- Obowiązkowy
- Poziom kształcenia:
- Studia II stopnia
- Program:
- Informatyka
- Grupa przedmiotów:
- Wspólne
- Kod przedmiotu:
- 1120-INPAD-MSP-XXXX
- Semestr nominalny:
- 2 / rok ak. 2017/2018
- Liczba punktów ECTS:
- 5
- Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
- .
- Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
- .
- Język prowadzenia zajęć:
- polski
- Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
- .
- Formy zajęć i ich wymiar w semestrze:
-
- Wykład0h
- Ćwiczenia0h
- Laboratorium30h
- Projekt15h
- Lekcje komputerowe0h
- Wymagania wstępne:
- Wstęp do uczenia maszynowego, Statystyka obliczeniowa
- Limit liczby studentów:
- .
- Cel przedmiotu:
- Celem przedmiotu jest zapoznanie słuchaczy z zaawansowanymi metodami uczenia maszynowego oraz nauczenie ich aktywnej umiejętności modelowania i analizy danych regresyjnych przy użyciu szeregu nowoczesnych metod statystycznych i data miningowych, w szczególności metod modelowania krzywych regresji, metod klasyfikacji i analizy szeregów czasowych.
- Treści kształcenia:
- Wykład:
Regresja liniowa: metoda MNK, diagnostyka dopasowania i podstawowe testy.
Regresja liniowa: podstawowe odstępstwa od modelu i metody jego adaptacji.
Metoda Lasso, regresja grzbietowa, metody odporne.
Metody selekcji predyktorów w modelu, filtry, wrappery, kryteria informacyjne, metody zachłanne.
Regresja nieliniowa: nieliniowe metody parametryczne, metody nieparametryczne: lokalnie liniowa, spline’y, metoda dopasowania wstecznego w modelu addytywnym.
Nieliniowe metody klasyfikacyjne: nieliniowe empiryczne reguły bayesowskie, estymatory gęstości.
Nieliniowe metody klasyfikacyjne: QDA, drzewa klasyfikacyjne CART, metoda jądrowa SVM.
Drzewa regresyjne CART, metoda MARS.
Komitety klasyfikatorów (bagging, boosting, lasy losowe).
Metody rangowania (rank classification): algorytm Pagerank, HTS.
Modelowanie z użyciem dużych zbiorów danych: metoda stochastycznego spadku gradientu.
Praktyczna budowa systemu uczącego się (case study), metody Multisplit i RSM.
Szeregi czasowe: charakterystyki procesów stacjonarnych, problem prognozy, metoda Yule’a-Walkera, algorytm innowacyjny.
Procesy liniowe: modelowanie procesami ARMA(p,q).
Modelowanie i prognoza dla procesów niestacjonarnych.
Laboratorium:
Analiza i modelowanie zbiorów danych wykorzystująca metody regresyjne, klasyfikacyjne, analizy skupień i prognozy szeregów czasowych.
Projekt:
Praktyczna wieloaspektowa analiza zbioru danych i konstrukcja systemu automatycznego modelowania spełniającego określone kryteria (zadana precyzja, kryterium LIFT na zbiorze testowym, zadany błąd średniokwadratowy prognozy).
- Metody oceny:
- Projekt maks. 50 p., egzamin maks. 50 p., łącznie maks. 100 p. Na zaliczenie konieczne jest uzyskanie łącznie ponad 50 p. na 100 p. możliwych. Ostateczna ocena z przedmiotu wynika z sumy zdobytych punktów: [0, 50] – 2,0; (50, 60] – 3,0; (60, 70] – 3,5; (70, 80] – 4,0; (80, 90] – 4,5; (90, 100] – 5,0.
- Egzamin:
- tak
- Literatura:
- 1. T. Hastie, R. Tibshirani, J.H. Friedman, The elements of statistical learning, wydanie drugie, Springer 2009
2. Ch.M. Bishop, Pattern recognition and machine learning, Springer 2006
3. J. Koronacki, J. Ćwik, Statystyczne systemy uczące się, WNT 2005
- Witryna www przedmiotu:
- e.mini.pw.edu.pl
- Uwagi:
- .
Efekty uczenia się
Profil ogólnoakademicki - wiedza
- Efekt W2_01
- Zna metody dopasowania modelu liniowego przy użyciu metody najmniejszych kwadratów, estymatora Lasso i estymatora ridge, zna podstawowe przyczyny odstępstw od modelu i środki zaradcze; zna metody selekcji predyktorów, również dla sytuacji wysokowymiarowej
Weryfikacja: egzamin, ocena projektu
Powiązane efekty kierunkowe:
PD_W01, PD_W08, PD_W10, PD_W11, PD_W13
Powiązane efekty obszarowe:
, , , ,
- Efekt W2_02
- Zna podstawowe metody nieliniowe klasyfikacji i wie, kiedy mogą być użyteczne; wie jak oceniać jakość klasyfikatora
Weryfikacja: egzamin, ocena projektu
Powiązane efekty kierunkowe:
PD_W01, PD_W08, PD_W10, PD_W11, PD_W13
Powiązane efekty obszarowe:
, , , ,
- Efekt W2_03
- Wie jak stosować komitety klasyfikatorów i dobierać ich parametry, i jak je wykorzystać do uporządkowania predyktorów
Weryfikacja: egzamin, ocena projektu
Powiązane efekty kierunkowe:
PD_W01, PD_W08, PD_W10, PD_W11, PD_W13
Powiązane efekty obszarowe:
, , , ,
- Efekt W2_04
- Zna podstawowe charakterystyki procesów stacjonarnych, zna metody identyfikacji komponent periodycznej i trendu procesu, zna podstawowe procesy liniowe (ARMA) i nieliniowe (GARCH)
Weryfikacja: egzamin, ocena projektu
Powiązane efekty kierunkowe:
PD_W01, PD_W08, PD_W10, PD_W11, PD_W13
Powiązane efekty obszarowe:
, , , ,
Profil ogólnoakademicki - umiejętności
- Efekt U2_01
- Umie ocenić dopasowanie modelu liniowego, zidentyfikować ewentualne odstępstwa od modelu i zaadaptować model
Weryfikacja: egzamin, ocena projektu
Powiązane efekty kierunkowe:
PD_U05, PD_U06, PD_U13, PD_U14, PD_U15, PD_U16, PD_U23
Powiązane efekty obszarowe:
, , , , , ,
- Efekt U2_02
- Umie skonstruować klasyfikator nieliniowy i ocenić jego jakość
Weryfikacja: egzamin, ocena projektu
Powiązane efekty kierunkowe:
PD_U05, PD_U06, PD_U13, PD_U14, PD_U15, PD_U16, PD_U23
Powiązane efekty obszarowe:
, , , , , ,
- Efekt U2_03
- Umie skonstruować nieliniowy estymator regresji i ocenić jego jakość
Weryfikacja: egzamin, ocena projektu
Powiązane efekty kierunkowe:
PD_U05, PD_U06, PD_U13, PD_U14, PD_U15, PD_U16, PD_U23
Powiązane efekty obszarowe:
, , , , , ,
- Efekt U2_04
- Umie skonstruować prognozę na podstawie podstawowych modeli liniowych i nieliniowych szeregów czasowych
Weryfikacja: egzamin, ocena projektu
Powiązane efekty kierunkowe:
PD_U05, PD_U06, PD_U13, PD_U14, PD_U15, PD_U16, PD_U23
Powiązane efekty obszarowe:
, , , , , ,
Profil ogólnoakademicki - kompetencje społeczne
- Efekt K2_01
- Rozumie społeczne aspekty podejmowanych działań data miningowych, w szczególności związane z popełnionymi błędami fałszywego sygnału i braku jego detekcji
Weryfikacja: ocena projektu
Powiązane efekty kierunkowe:
PD_K01, PD_K02
Powiązane efekty obszarowe:
,