Nazwa przedmiotu:
Analiza i indeksowanie multimediów
Koordynator przedmiotu:
dr inż. Jacek Krzysztof Naruniec
Status przedmiotu:
Fakultatywny ograniczonego wyboru
Poziom kształcenia:
Studia II stopnia
Program:
Telekomunikacja
Grupa przedmiotów:
Przedmioty techniczne - zaawansowane
Kod przedmiotu:
AIM
Semestr nominalny:
2 / rok ak. 2012/2013
Liczba punktów ECTS:
5
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
150
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
3
Język prowadzenia zajęć:
polski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
2
Formy zajęć i ich wymiar w semestrze:
  • Wykład30h
  • Ćwiczenia0h
  • Laboratorium15h
  • Projekt15h
  • Lekcje komputerowe0h
Wymagania wstępne:
programowanie, programowanie obiektowe
Limit liczby studentów:
60
Cel przedmiotu:
Przedmiot dotyczy technik budowy systemów wyszukiwania a analizy informacji multimedialnej: projektowania architektury systemu wyszukiwania, projektowania indeksu, kompresji indeksu, budowy słowników, kwerendy przez przykład, kwerendy złożonej, ekstrakcji cech wizualnych, ekstrakcji cech dźwiękowych, klasyfikacji, śledzenia obiektów, reprezentacji meta-danych w XML. Dodatkowo omówiona będzie struktura standardu MPEG-7 i jego rola w indeksowaniu multimediów. W efekcie studenci opanują wiedzę o najnowszych metodach analizy i indeksowania danych multimedialnych oraz zdobędą doświadczenie praktyczne w projektowaniu i implementacji praktycznych systemów w tym zakresie.
Treści kształcenia:
- Wprowadzenie do indeksowania: system indeksowania a system wyszukiwania, miary selektywności atrybutu indeksowego (2h). - Kompresja indeksu: kody przedziałowe, kompresja interpolacyjna (2h). - Budowa słowników skalarnych: tablice skalarne, funkcje numeracji dokładnej, słowniki ortograficzne – drzewa trie i typu B, wydobywanie danych w sieci, silnik Google (4h). - Budowa słowników wektorowych: przedziały wektorowe, drzewa typu R, drzewa typu M, akceleracja kwerend przez przykład (2h). - Ekstrakcja cech wizualnych: cechy koloru, tekstury i kształtu obiektu w obrazie, charakterystyka ruchu, transformata Hougha i Radona (6h) - Klasyfikacja deskryptorów cech: PCA, LDA, DLDA, SDA, SVM. (4h) - Analiza i indeksowanie obrazów i modeli twarzy: detekcja śledzenie twarzy 2D, akwizycja modelu 3D (4h). - Wykrywanie obiektów w obrazie: ISM, filtry Haara w połączeniu z metodami typu boosting (2h) - Ekstrakcja cech dźwiękowych: cechy czasowe i widmowe, charakterystyka barwy dźwięku, sygnatura audio(4h). Zakres laboratorium: Laboratorium 1 (3h): Budowa słownika ortograficznego. Laboratorium 2 (3h): Sygnatura obrazu. Laboratorium 3 (3h): Śledzenie twarzy. Laboratorium 4 (3h): Rozpoznawanie twarzy. Laboratorium 5 (3h): Rozpoznawanie komend głosowych. Zakres projektu: Projekt do wyboru: „System indeksowania” lub „System rozpoznawania”
Metody oceny:
Zaliczenie na podstawie wyników laboratorium, projektu i egzaminu. Maksymalna liczba punktów za egzamin: 40 Maksymalna liczba punktów za projekt: 20 Maksymalna liczba punktów za laboratorium: 40 Do zaliczenia przedmiotu wymagane jest zdobycie min. 20 punktów za egzamin i przekroczenie łącznej sumy 50 punktów. Pozostałe progi punktowe według standardowej skali.
Egzamin:
tak
Literatura:
1. Literatura podstawowa: Notatki wykładowe - materiały elektroniczne Dokumenty i raporty grupy MPEG 2. Literatura dodatkowa: - Bing Liu, Web Data Mining: Exploring Hyperlinks, Contents and Usage Data. Springer, 2007. - T. Huang, Z. Wen: 3D Face Processing, Springer, 2007 - C. Bishop: Pattern Recognition and Machine Learning, Springer 2006 - Witten, Moffat, Bell: Managing Gigabytes, Morgan Kauffman Publishers,San Francisco, 1999. - Knuth: Sztuka programowania – Wyszukiwanie i sortowanie (tom 3), WNT, Warszawa, 2002.
Witryna www przedmiotu:
ztv.ire.pw.edu.pl/aim
Uwagi:

Efekty uczenia się

Profil ogólnoakademicki - wiedza

Efekt W1
Student, który zaliczył przedmiot posiada wiedzę na temat metod indeksowania danych oraz analizy semantycznej obrazu i dźwięku.
Weryfikacja: Sprawdzian pisemny.
Powiązane efekty kierunkowe: K_W07
Powiązane efekty obszarowe: T2A_W03, T2A_W04, T2A_W07

Profil ogólnoakademicki - umiejętności

Efekt U1
Student potrafi samodzielnie zaprojektować i wykonać system indeksowania lub przetwarzania obrazu.
Weryfikacja: Ocena wyników projektu.
Powiązane efekty kierunkowe: K_U06, K_U09, K_U12
Powiązane efekty obszarowe: T2A_U07, T2A_U09, T2A_U05, T2A_U07, T2A_U09, T2A_U15, T2A_U15, T2A_U16, T2A_U17, T2A_U18, T2A_U19
Efekt U2
Student potrafi zaimplementować poznane metody analizy i indeksowania w typowych dla tej dziedziny zagadnieniach
Weryfikacja: Ocena z laboratorium.
Powiązane efekty kierunkowe: K_U08, K_U09
Powiązane efekty obszarowe: T2A_U12, T2A_U13, T2A_U05, T2A_U07, T2A_U09, T2A_U15

Profil ogólnoakademicki - kompetencje społeczne

Efekt K1
Potrafi określić priorytety rozwoju technik multimedialnych 3D w kraju i na świecie.
Weryfikacja: Pytania testowe.
Powiązane efekty kierunkowe: K_K01, K_K02
Powiązane efekty obszarowe: T2A_K06, T2A_K07