Nazwa przedmiotu:
Projektowanie hurtowni danych
Koordynator przedmiotu:
dr inż. Katarzyna Rostek
Status przedmiotu:
Obowiązkowy
Poziom kształcenia:
Studia I stopnia
Program:
Zarządzanie i Inżynieria Produkcji
Grupa przedmiotów:
Technologie informatyczne
Kod przedmiotu:
PROHU
Semestr nominalny:
4 / rok ak. 2010/2011
Liczba punktów ECTS:
2
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
Język prowadzenia zajęć:
polski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
Formy zajęć i ich wymiar w semestrze:
  • Wykład15h
  • Ćwiczenia0h
  • Laboratorium15h
  • Projekt0h
  • Lekcje komputerowe0h
Wymagania wstępne:
Słowa kluczowe: bazy danych, hurtownie danych, składnice danych, ROLAP, MOLAP, OLAP, HOLAP, analiza OLAP, eksploracja danych, fakty, wymiary, agregacje, metadane.
Limit liczby studentów:
Cel przedmiotu:
Przedmiot składa się z jednostki wykładowej oraz laboratorium. Wykłady oparte są na prezentacjach multimedialnych prezentowanych przez prowadzącego. Elementem pracy twórczej w ramach wykładu jest tworzony w zespołach 2-osobowych projekt hurtowni danych dla wybranego problemu decyzyjnego oraz wybranego środowiska projektowego. Laboratorium oparte jest na ćwiczeniach wykonywanych indywidualnie, w ramach których tworzona jest od podstaw składnica danych i realizowany jest pakiet analiz OLAP oraz eksploracji danych. Elementem twórczego wkładu studentów jest przygotowanie raportu końcowego z samodzielnie wydedukowanymi i opracowanymi wnioskami z wykonanych analiz.
Treści kształcenia:
Wykład 15h: 1h - Wprowadzenie do zagadnień hurtowni danych: Geneza powstania hurtowni danych. Porównanie hurtowni danych i baz transakcyjnych. Definicja hurtowni danych. Cechy charakterystyczne hurtowni danych. 1h - Przykłady rzeczywistych wdrożeń hurtowni danych: Racjonalne przesłanki wdrożenia hurtowni danych w przedsiębiorstwie. Korzyści wdrożenia hurtowni danych w przedsiębiorstwie na wybranych przykładach firm polskich i zagranicznych. 1h - Typy struktur modelu danych hurtowni: Typy danych hurtowni: fakty, wymiary, agregacje, metadane. Typy struktur danych: Rolap, Molap, Holap. 1h - Projektowanie struktury modelu danych hurtowni: Metodyka projektowania struktur tabel faktów i wymiarów w modelu Rolap. 1h - Typy architektury hurtowni danych : Czynniki determinujące dobór architektury hurtowni danych w przedsiębiorstwie. Architektura niezależnych składnic danych. Architektura korporacyjnej hurtowni danych. Architektura CIF Bill’a Inmon’a. Architektura BUS Ralpha Kimball’a. Architektura przyrostowa. Architektura federacyjna. 1h - Różne podejścia do projektowania architektury hurtowni danych: Fazy projektowania hurtowni danych. Metodyka „od ogółu do szczegółu”. Metodyka „od szczegółu do ogółu”. Metodyka federacyjna. 1h - Korzyści i zagrożenia wdrożenia hurtowni danych: Ryzyko inwestycyjne. Ryzyko organizacyjne i biznesowe. Ryzyko technologiczne. Cechy efektywnego i użytecznego projektu hurtowni danych. 1h - Metodyka wdrożenia hurtowni danych: Podejście całościowe vs. podejście iteracyjne. 1h - Systemy informatyczne z hurtownią danych: Systemy analityczno-raportujące. Systemy Business Intelligence. Systemy Corporate Performance Management. Systemy wspomagania decyzji. 1h - Wprowadzenie do zagadnień przetwarzania analitycznego danych: Typy przetwarzania analitycznego danych. Języki przetwarzania analitycznego danych. Technologie analitycznego przetwarzania danych. 1h - Przetwarzanie analityczne na bieżąco – OLAP: Definicja OLAP E. Codd’a. 12 cech systemów OLAP według Codd’a. Definicja OLAP FASMI. Zakres zastosowań systemów OLAP. Przykłady rzeczywistych wdrożeń systemów OLAP. 1h - Eksploracja danych - data mining: Definicja eksploracji danych. Podział klasyfikacyjny analiz eksploracji danych. Metody i techniki eksploracji danych. Zakres zastosowań systemów eksploracji danych. Przykłady rzeczywistych wdrożeń systemów eksploracji danych. 1h - Metodyka realizacji procesu pozyskiwania wiedzy z danych: Definicja procesu pozyskiwania wiedzy z danych. 13 etapowa metodyka realizacji procesu pozyskiwania wiedzy z danych. 1h - Przykłady zastosowań procesu pozyskiwania wiedzy z danych: Zakres zastosowań procesu pozyskiwania wiedzy z danych. Przykład zastosowania procesu pozyskiwania wiedzy w firmie branży ubezpieczeniowej. 1h - Test zaliczeniowy: Test 10 otwartych pytań: 5 pytań problemowych oraz 5 pytań teoretycznych. Laboratorium 15h: 1h - Poznanie i przygotowanie zbiorów źródłowych danych pod kątem projektu hurtowni danych: Przygotowanie 3 różnych źródeł operacyjnych pod kątem ich wspólnej integracji w modelu danych hurtowni. Sprawdzenie jakości danych źródłowych. 1h - Implementacja struktur hurtowni: Implementacja hurtowni danych w modelu gwiazdy. 1h - Ekstrakcja danych ze zbiorów źródłowych: Tworzenie połączenia ekstrakcyjnego pomiędzy danymi źródłowymi a bazą danych hurtowni. 1h - Transformacja i ładowanie danych do struktur hurtowni: Przekształcenie danych do postaci właściwej dla modelu danych hurtowni. Ładowanie danych do modelu danych hurtowni. 1h - Implementacja i generowanie kostek OLAP: Definiowanie struktur kostek wielowymiarowych OLAP. Generowanie danych w kostkach wielowymiarowych OLAP. 1h - Projekt analizy przetwarzania analitycznego danych na bieżąco: Przygotowanie pakietu analiz OLAP. 1h - Przetwarzanie analityczne danych na bieżąco: Realizacja analiz OLAP według przygotowanego projektu. 1h - Analiza wyników przetwarzania analitycznego danych na bieżąco: Analiza otrzymanych wyników i zamieszczenie ich w raporcie zaliczeniowym. 1h - Projekt analizy eksploracji danych: Zaprojektowanie modelu eksploracji danych. 1h - Implementacja struktur tablicy eksploracji danych: Przygotowanie projektu zbioru źródłowego dla modelu eksploracji danych. 1h - Ekstrakcja, transformacja i ładowanie danych ze zbiorów źródłowych do tablicy eksploracji danych: Generowanie zbioru źródłowego dla modelu eksploracji danych. 1h - Eksploracja danych: Implementacja modelu eksploracji danych. 1h - Analiza wyników eksploracji danych: Ewaluacja modelu. Poszukiwanie modelu suboptymalnego. 1h - Opracowanie wyników projektu laboratoryjnego: Opracowanie wyników wszystkich zrealizowanych ćwiczeń laboratoryjnych w raporcie końcowym. 1h - Rozliczenie wyników projektu laboratoryjnego: Prezentacja wyników końcowych zrealizowanych podczas ćwiczeń laboratoryjnych.
Metody oceny:
Wykład – projekt wykonywany w grupach 2-osobowych oraz test, składający się z 10 otwartych pytań, sprawdzający wiedzę teoretyczną. Laboratorium – projekt wykonywany w grupach 2-osobowych, rozliczany na podstawie przygotowanego raportu końcowego.
Egzamin:
Literatura:
Literatura obowiązkowa: • Jarke M., Lenzerini M., Vassiliou Y., Vassiliadis P. - Hurtownie danych. Podstawa organizacji i funkcjonowania. WSiP, Warszawa, 2003. • Poe V., Klauer P., Brobst S. - Tworzenie hurtowni danych. WNT, Warszawa, 2000. • Todman Ch. - Projektowanie hurtowni danych. WNT, Warszawa, 2003. Literatura zalecana: • Inmon W. H. - Building the Data Warehouse. 4th Edition, John Wiley & Sons, 2005. • Kimball R., Ross M., Thornthwaite W., Mundy J., Becker B. - The Data Warehouse Lifecycle Toolkit. 2nd Edition: Practical Techniques for Building Data Warehouse and Business Intelligence Systems. John Wiley & Sons, 2008. • Inmon W.H., Strauss D., Neushloss G. - DW 2.0: The Architecture for the Next Generation of Data Warehousing. Morgan Kaufmann, 2008. Oprogramowanie: • Sybase Power Designer, oraz do wyboru: • SAS Data Integration Studio, SAS OLAP Cube Studio, SAS Enterprise Guide, SAS Enterprise Miner, • SYBASE IQ, • MS SQL Server Enterprise Edition.
Witryna www przedmiotu:
Uwagi:

Efekty uczenia się