- Nazwa przedmiotu:
- Data Mining
- Koordynator przedmiotu:
- prof. dr hab. Jan Mielniczuk
- Status przedmiotu:
- Obowiązkowy
- Poziom kształcenia:
- Studia II stopnia
- Program:
- Matematyka
- Grupa przedmiotów:
- Wspólne
- Kod przedmiotu:
- 1120-MASMA-NSP-0019
- Semestr nominalny:
- 2 / rok ak. 2019/2020
- Liczba punktów ECTS:
- 6
- Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
- 1. godziny kontaktowe – 70 h; w tym
a) obecność na wykładach – 30 h
b) obecność na laboratoriach – 30 h
c) obecność na egzaminie – 5 h
d) konsultacje – 5 h
2. praca własna studenta – 60 h; w tym
a) przygotowanie do laboratoriów – 25 h
b) zapoznanie się z literaturą – 10 h
c) przygotowanie do egzaminu – 25 h
Razem 130 h, co odpowiada 6 pkt. ECTS
- Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
- a) obecność na wykładach – 30 h
b) obecność na laboratoriach – 30 h
c) obecność na egzaminie – 5 h
d) konsultacje – 5 h
Razem 70 h, co odpowiada 3 pkt. ECTS
- Język prowadzenia zajęć:
- polski
- Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
- a) obecność na laboratoriach – 30 h
b) przygotowanie do laboratoriów – 25 h
Razem 55 h, co odpowiada 2 pkt. ECTS
- Formy zajęć i ich wymiar w semestrze:
-
- Wykład30h
- Ćwiczenia0h
- Laboratorium30h
- Projekt0h
- Lekcje komputerowe0h
- Wymagania wstępne:
- Stosowana analiza regresji
- Limit liczby studentów:
- 30, 2 grupy laboratoryjne, 15 osób/grupa
- Cel przedmiotu:
- Zapoznanie słuchaczy z podstawowymi technikami data miningu i uczenia maszynowego
- Treści kształcenia:
- Wykład:
1. analiza dyskryminacyjna LDA . Kwadratowa analiza dyskryminacyjna QDA
2. Klasyfikator bayesowski i jego wersje empiryczne.
3. Metoda najbliższego sąsiada, naiwna metoda bayesowska, klasyfikacja logistyczna.
4. Metody oceny klasyfikatorów.
5. Drzewa klasyfikacyjne CART.
6.Drzewa regresyjne.
7. Maszyny wektorów podpierających SVM Vapnika,
8.Wprowadzenie do metody przekształcenia jądrowego.
9. Sieci neuronowe, modele addytywne,
10. Metody łączenia klasyfikatorów i estymatorów regresji
11. Problemy wysokiego wymiaru wektora atrybutów: selekcja i ekstrakcja cech.
12. Analiza skupień: metody kombinatoryczne/hierarchiczne
13. Modelowanie mieszankowe, zastosowania
14. Analiza czynnikowa i analiza składowych niezależnych
Laboratorium:
Praktyczna realizacja tematów 1-14 omawianych na wykładzie w oparciu o system R w oparciu o rzeczywiste i symulowane zbiory danych
- Metody oceny:
- Laboratoria: 30%, egzamin 70 %
- Egzamin:
- tak
- Literatura:
- 1. J Friedman, T Hastie, R. Tibshirani, Elements of statistical learning, Springer, 2001
2. J. Koronacki, J. Ćwik, Statystyczne systemy uczące się, WNT, 2005
- Witryna www przedmiotu:
- brak
- Uwagi:
- .
Efekty uczenia się
Profil ogólnoakademicki - wiedza
- Charakterystyka DAM_W01
- Zna ogólne sformułowanie problemu klasyfikacji pod nadzorem i bez nadzoru oraz podstawowe metody klasyfikacji liniowej LDA i klasyfikacji logistycznej. Wie, na czym polega kwadratowa analiza dyskryminacyjna QDA.
Weryfikacja: Egzamin, zaliczenie laboratoriów
Powiązane charakterystyki kierunkowe:
M2SMAD_W07
Powiązane charakterystyki obszarowe:
- Charakterystyka DAM_W02
- Zna pojęcie i postać estymatora bayesowskiego w problemie klasyfikacji oraz konstrukcję jego odpowiedników empirycznych. Zna podstawowe metody oceny błędu klasyfikacji.
Weryfikacja: Egzamin, zaliczenie laboratoriów
Powiązane charakterystyki kierunkowe:
M2SMAD_W07
Powiązane charakterystyki obszarowe:
- Charakterystyka DAM_W03
- Zna metodologię konstrukcji drzew klasyfikacyjnych oraz maszyn wektorów podpierających. Wie, na czym polegają metody łączenia klasyfikatorów
Weryfikacja: Egzamin, zaliczenie laboratoriów
Powiązane charakterystyki kierunkowe:
M2SMAD_W08
Powiązane charakterystyki obszarowe:
- Charakterystyka DAM_W04
- Zna podstawowe metody analizy skupień: metodę k-średnich, dendrogramy, metodę mieszanek, sieci samoorganizujące się Kohonena.
Weryfikacja: Egzamin, zaliczenie laboratoriów
Powiązane charakterystyki kierunkowe:
M2SMAD_W09
Powiązane charakterystyki obszarowe:
Profil ogólnoakademicki - umiejętności
- Charakterystyka DAM_U01
- Umie skonstruować klasyfikatory liniowe w oparciu o metodologię LDA i model logistyczny, porównać z klasyfikatorem QDA i ocenić ich błędy klasyfikacji.
Weryfikacja: Zaliczenie laboratoriów
Powiązane charakterystyki kierunkowe:
M2SMAD_U07
Powiązane charakterystyki obszarowe:
- Charakterystyka DAM_U02
- Umie stosować metodę CART i SVM do problemu klasyfikacji i estymacji regresji.
Weryfikacja: Zaliczenie laboratoriów
Powiązane charakterystyki kierunkowe:
M2SMAD_U07
Powiązane charakterystyki obszarowe:
- Charakterystyka DAM_U03
- Umie stosować metody analizy składowych głównych w konkretnych zagadnieniach, wybierać liczbę kierunków w tej metodzie oraz oceniać jej skuteczność.
Weryfikacja: Zaliczenie laboratoriów
Powiązane charakterystyki kierunkowe:
M2SMAD_U08
Powiązane charakterystyki obszarowe:
- Charakterystyka DAM_U04
- Umie przeprowadzać analizę skupień w oparciu o podstawowe stosowane metodologie.
Weryfikacja: Zaliczenie laboratoriów
Powiązane charakterystyki kierunkowe:
M2SMAD_U09
Powiązane charakterystyki obszarowe:
Profil ogólnoakademicki - kompetencje społeczne
- Charakterystyka DAM_K01
- Potrafi współdziałać i pracować w zespole przyjmując w nim różne role.
Weryfikacja: Zaliczenie laboratoriów
Powiązane charakterystyki kierunkowe:
M2SMAD_K01
Powiązane charakterystyki obszarowe: