- Nazwa przedmiotu:
- Analiza i indeksowanie multimediów
- Koordynator przedmiotu:
- dr inż. Jacek Krzysztof Naruniec
- Status przedmiotu:
- Fakultatywny ograniczonego wyboru
- Poziom kształcenia:
- Studia II stopnia
- Program:
- Telekomunikacja
- Grupa przedmiotów:
- Przedmioty techniczne - zaawansowane
- Kod przedmiotu:
- AIM
- Semestr nominalny:
- 2 / rok ak. 2012/2013
- Liczba punktów ECTS:
- 5
- Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
- 150
- Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
- 3
- Język prowadzenia zajęć:
- polski
- Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
- 2
- Formy zajęć i ich wymiar w semestrze:
-
- Wykład30h
- Ćwiczenia0h
- Laboratorium15h
- Projekt15h
- Lekcje komputerowe0h
- Wymagania wstępne:
- programowanie, programowanie obiektowe
- Limit liczby studentów:
- 60
- Cel przedmiotu:
- Przedmiot dotyczy technik budowy systemów wyszukiwania a analizy informacji multimedialnej: projektowania architektury systemu wyszukiwania, projektowania indeksu, kompresji indeksu, budowy słowników, kwerendy przez przykład, kwerendy złożonej, ekstrakcji cech wizualnych, ekstrakcji cech dźwiękowych, klasyfikacji, śledzenia obiektów, reprezentacji meta-danych w XML. Dodatkowo omówiona będzie struktura standardu MPEG-7 i jego rola w indeksowaniu multimediów. W efekcie studenci opanują wiedzę o najnowszych metodach analizy i indeksowania danych multimedialnych oraz zdobędą doświadczenie praktyczne w projektowaniu i implementacji praktycznych systemów w tym zakresie.
- Treści kształcenia:
- - Wprowadzenie do indeksowania: system indeksowania a system wyszukiwania, miary selektywności atrybutu indeksowego (2h).
- Kompresja indeksu: kody przedziałowe, kompresja interpolacyjna (2h).
- Budowa słowników skalarnych: tablice skalarne, funkcje numeracji dokładnej, słowniki ortograficzne – drzewa trie i typu B, wydobywanie danych w sieci, silnik Google (4h).
- Budowa słowników wektorowych: przedziały wektorowe, drzewa typu R, drzewa typu M, akceleracja kwerend przez przykład (2h).
- Ekstrakcja cech wizualnych: cechy koloru, tekstury i kształtu obiektu w obrazie, charakterystyka ruchu, transformata Hougha i Radona (6h)
- Klasyfikacja deskryptorów cech: PCA, LDA, DLDA, SDA, SVM. (4h)
- Analiza i indeksowanie obrazów i modeli twarzy: detekcja śledzenie twarzy 2D, akwizycja modelu 3D (4h).
- Wykrywanie obiektów w obrazie: ISM, filtry Haara w połączeniu z metodami typu boosting (2h)
- Ekstrakcja cech dźwiękowych: cechy czasowe i widmowe, charakterystyka barwy dźwięku, sygnatura audio(4h).
Zakres laboratorium:
Laboratorium 1 (3h): Budowa słownika ortograficznego.
Laboratorium 2 (3h): Sygnatura obrazu.
Laboratorium 3 (3h): Śledzenie twarzy.
Laboratorium 4 (3h): Rozpoznawanie twarzy.
Laboratorium 5 (3h): Rozpoznawanie komend głosowych.
Zakres projektu:
Projekt do wyboru: „System indeksowania” lub
„System rozpoznawania”
- Metody oceny:
- Zaliczenie na podstawie wyników laboratorium, projektu i egzaminu.
Maksymalna liczba punktów za egzamin: 40
Maksymalna liczba punktów za projekt: 20
Maksymalna liczba punktów za laboratorium: 40
Do zaliczenia przedmiotu wymagane jest zdobycie min. 20 punktów za egzamin i przekroczenie łącznej sumy 50 punktów. Pozostałe progi punktowe według standardowej skali.
- Egzamin:
- tak
- Literatura:
- 1. Literatura podstawowa:
Notatki wykładowe - materiały elektroniczne
Dokumenty i raporty grupy MPEG
2. Literatura dodatkowa:
- Bing Liu, Web Data Mining: Exploring Hyperlinks, Contents and Usage Data. Springer, 2007.
- T. Huang, Z. Wen: 3D Face Processing, Springer, 2007
- C. Bishop: Pattern Recognition and Machine Learning, Springer 2006
- Witten, Moffat, Bell: Managing Gigabytes, Morgan Kauffman Publishers,San Francisco, 1999.
- Knuth: Sztuka programowania – Wyszukiwanie i sortowanie (tom 3), WNT, Warszawa, 2002.
- Witryna www przedmiotu:
- ztv.ire.pw.edu.pl/aim
- Uwagi:
Efekty uczenia się
Profil ogólnoakademicki - wiedza
- Efekt W1
- Student, który zaliczył przedmiot posiada wiedzę na temat metod indeksowania danych oraz analizy semantycznej obrazu i dźwięku.
Weryfikacja: Sprawdzian pisemny.
Powiązane efekty kierunkowe:
K_W07
Powiązane efekty obszarowe:
T2A_W03, T2A_W04, T2A_W07
Profil ogólnoakademicki - umiejętności
- Efekt U1
- Student potrafi samodzielnie zaprojektować i wykonać system indeksowania lub przetwarzania obrazu.
Weryfikacja: Ocena wyników projektu.
Powiązane efekty kierunkowe:
K_U06, K_U09, K_U12
Powiązane efekty obszarowe:
T2A_U07, T2A_U09, T2A_U05, T2A_U07, T2A_U09, T2A_U15, T2A_U15, T2A_U16, T2A_U17, T2A_U18, T2A_U19
- Efekt U2
- Student potrafi zaimplementować poznane metody analizy i indeksowania w typowych dla tej dziedziny zagadnieniach
Weryfikacja: Ocena z laboratorium.
Powiązane efekty kierunkowe:
K_U08, K_U09
Powiązane efekty obszarowe:
T2A_U12, T2A_U13, T2A_U05, T2A_U07, T2A_U09, T2A_U15
Profil ogólnoakademicki - kompetencje społeczne
- Efekt K1
- Potrafi określić priorytety rozwoju technik multimedialnych 3D w kraju i na świecie.
Weryfikacja: Pytania testowe.
Powiązane efekty kierunkowe:
K_K01, K_K02
Powiązane efekty obszarowe:
T2A_K06, T2A_K07