Nazwa przedmiotu:
Synteza reguł decyzyjnych
Koordynator przedmiotu:
Krzysztof MALINOWSKI, Andrzej KARBOWSKI
Status przedmiotu:
Fakultatywny ograniczonego wyboru
Poziom kształcenia:
Studia II stopnia
Program:
Informatyka
Grupa przedmiotów:
Przedmioty techniczne - podstawowe
Kod przedmiotu:
SRD
Semestr nominalny:
1 / rok ak. 2015/2016
Liczba punktów ECTS:
5
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
Wykład prowadzony jest w wymiarze 2 godz. w tygodniu. Łącznie udział w wykładzie (30 godz.) i przygotowanie się do egzaminu (45 godz.) wymagają od studenta 75 godzin pracy w semestrze. Ćwiczenia laboratoryjne w liczbie czterech wymagają łącznie 60 godzin pracy studenta, w tym 16 godz. udziału w zajęciach zorganizowanych oraz po 8 godzin przeznaczonych na przygotowanie się do każdego z ćwiczeń (2 godz.) oraz opracowanie wyników, wykonanie sprawozdania i zaliczenie (6 godz.). Czyni to łącznie 56 godzin pracy w semestrze. Łączny nakład pracy studenta: 131 godzin, odpowiadający 5 punktom ECTS.
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
Wykład prowadzony jest w wymiarze 2 godz. w tygodniu, stąd 30 godzin w semestrze. Zajęcia w laboratorium obejmują 16 godzin pracy z udziałem nauczyciela oraz 4 godziny przeznaczone na zaliczenie ćwiczeń po złożeniu sprawozdań. Czyni to łącznie 50 godzin pracy na zajęciach wymagających bezpośredniego udziału nauczyciela akademickiego. Stąd można przypisać 2 punkty ECTS
Język prowadzenia zajęć:
polski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
Ćwiczenia laboratoryjne w liczbie czterech wymagają łącznie 60 godzin pracy studenta, w tym 16 godz. udziału w zajęciach zorganizowanych oraz po 8 godzin przeznaczonych na przygotowanie się do każdego z ćwiczeń (2 godz.) oraz opracowanie wyników, wykonanie sprawozdania i zaliczenie (6 godz.). Czyni to łącznie 56 godzin pracy w semestrze. Stąd można przypisać 2 punkty ECTS
Formy zajęć i ich wymiar w semestrze:
  • Wykład30h
  • Ćwiczenia0h
  • Laboratorium30h
  • Projekt0h
  • Lekcje komputerowe0h
Wymagania wstępne:
Podstawy Optymalizacji oraz ogólnowydziałowe przedmioty z zakresu matematyki
Limit liczby studentów:
48
Cel przedmiotu:
- przedstawienie zagadnień dotyczących projektowania optymalnych i uproszczonych reguł i mechanizmów decyzyjnych w zastosowaniach do zarządzania lub sterowania systemami: zadania syntezy optymalnej, parametryzowane reguły decyzyjne, układy z powtarzana optymalizacją decyzji oraz układy uczące się, - nauka formułowania i rozwiązywania zadań optymalnej syntezy przy pomocy rodziny metod programowania dynamicznego, - nauka projektowania reguł i mechanizmów decyzyjnych wykorzystujących podejścia uproszczone, w tym optymalizację parametryczną oraz powtarzaną optymalizację decyzji z wykorzystaniem prognoz wielkości i wejść swobodnych (niesterowanych).
Treści kształcenia:
Treść wykładu 1. Zadanie syntezy optymalnej reguły (optymalnego prawa sterowania) w warunkach niepewności na skończonym horyzoncie czasu, formułowanie zadania, pierwotne i wtórne wskaźniki jakości, modele niepewności, zadanie syntezy stochastycznej, zadanie syntezy minimaksowej. 2. Metodyka i możliwości rozwiązania zadania syntezy optymalnej w układzie zamkniętym, dla skończonej liczby etapów decyzyjnych (skończony horyzont działania), z pełnym i niezakłóconym pomiarem stanu; metoda programowania dynamicznego; przykłady zadań optymalnej syntezy i ich rozwiązań, w tym zadanie liniowo-kwadratowe. 3. Zadania syntezy optymalnych reguł decyzyjnych dla nieskończonej liczby etapów (nieskończony horyzont działania): wskaźnik jakości z uwzględnieniem dyskonta (zadanie z dyskontem), wskaźnik w postaci wartości średniej kosztu i inne. 4. Rozwiązanie zadania z dyskontem, warunki istnienia rozwiązania, równanie Bellmana, metody wyznaczania stacjonarnej reguły decyzyjnej w przypadku skończonej liczby wartości stanu. 5. Optymalna synteza reguł decyzyjnych w przypadku niepełnego i zakłóconego pomiaru stanu; algorytm programowania dynamicznego, statystyki wystarczające, zagadnienie filtracji i estymacji stanu. Efekt dualny i efekt ostrożności, własność separowalności. Zadanie liniowo-kwadratowo-gaussowskie (LQG). 6. Praktyczne sposoby podejmowania decyzji operacyjnych w warunkach niepewności: parametryzowane reguły decyzyjne o danej postaci, sterowanie i zarządzanie z powtarzaną optymalizacją decyzji, układy warstwowe. 7. Sposoby konstrukcji parametryzowanych reguł decyzyjnych: wykorzystanie reguł liniowych, sztucznych sieci neuronalnych oraz zbiorów rozmytych. Układy uczące się. 8. Bieżące podejmowanie decyzji (sterowanie) w oparciu o powtarzaną optymalizację w układzie otwartym oraz w oparciu o powtarzaną syntezę wykorzystującą uproszczony model niepewności, w tym model w postaci prognoz wielowariantowych. 9. Przykłady współczesnych zastosowań reguł decyzyjnych do zarządzania (sterowania operacyjnego). Warstwowe układy decyzyjne, układ sterowania procesem technologicznym i zagadnienie wyboru wielkości regulowanych. Zakres laboratorium Laboratorium składa się z 6 ćwiczeń, realizowanych w zespołach 2-osobowych, podczas których studenci rozwiązują praktyczne zadania optymalnej syntezy z dziedziny ekonomii, sterowania systemami wodno-gospodarczymi, zarządzania sieciami teleinformatycznymi. Ważną częścią każdego ćwiczenia jest samodzielna implementacja algorytmu optymalizacyjnego oraz weryfikacja poprawności, na drodze wielokrotnej symulacji sterowania, w układzie zamkniętym, dla różnych przebiegów zakłóceń. Program laboratorium został pomyślany tak, by jego uczestnicy opanowali wszystkie podstawowe schematy decyzyjne oraz metody obliczeniowe, w tym: klasyczny algorytm stochastycznego programowania dynamicznego w zadaniach z horyzontem skończonym, algorytmy kolejnych przybliżeń oraz iteracji polityki w zadaniach nieliniowych z horyzontem nieskończonym, metodologię LQG w wersji standardowej oraz rozszerzonej (uwzględnienie nieliniowości modelu oraz wskaźnika jakości), zastosowanie metod gradientowych optymalizacji trajektorii sterowań (wraz z rozwiązaniem równania sprzężonego) w podstawowych wersjach sterowania predykcyjnego z kilkoma scenariuszami zakłóceń. Podczas zajęć w laboratorium wykorzystywane jest środowisko Matlab oraz jego dwie biblioteki: Optimization oraz Control Toolbox.
Metody oceny:
Oceny punktowe z ćwiczeń laboratoryjnych obejmujące przygotowanie i wykonanie ćwiczenia. Ocena indywidualnego ćwiczenia od 0 do 12 + 2 za zaliczenie wszystkich 4 ćwiczeń. Łączna liczba punktów 50, do zaliczenia wymagane 26 lub więcej punktów. Egzamin obejmujący rozwiązanie zadań rachunkowych oraz odpowiedzi na pytania. Ocena od 0 do 50 punktów. Egzamin uważany jest za zdany po uzyskaniu 26 lub więcej punktów. W razie potrzeby przeprowadzany jest uzupełniający egzamin ustny. Zaliczenie przedmiotu wymaga zaliczenia laboratorium i zdania egzaminu. Oceny końcowe wystawiane są zgodnie z ogólnie przyjętą skalą, w szczególności ocena 3 (dst) po uzyskaniu 52 do 60 punktów.
Egzamin:
tak
Literatura:
1. Krzysztof Malinowski i Andrzej Karbowski, Synteza Mechanizmów Decyzyjnych, E-book, Kopipol/OKNO PW, 2007. 2. Dimitri P. Bertsekas, Dynamic Programming and Optimal Control, Vols. I and II, Athena Scientific, 1995, (3rd Edition Vol. I, 2005, 3rd Edition Vol. II, 2007), wybrane fragmenty (lektura nieobowiązkowa) 3. Instrukcje do 4 ćwiczeń laboratoryjnych
Witryna www przedmiotu:
https://studia.elka.pw.edu.pl/priv/11Z/SRD.A/
Uwagi:

Efekty uczenia się

Profil ogólnoakademicki - wiedza

Efekt Wpisz opis
Student, który zaliczył przedmiot, ma wiedzę z zakresu podstawowych zagadnień dotyczących formułowania zadań syntezy optymalnej i syntezy uproszczonej mechanizmów i reguł decyzyjnych dla wieloetapowych procesów wymagających podejmowania decyzji w oparciu o dopływającą informację. W szczególności: ma wiedzę w zakresie metod służących do rozwiązywania zadań syntezy w różnych sytuacjach: skończonej lub nieskończonej liczby etapów, pełnej lub niepełnej informacji o aktualnym stanie procesu, probabilistycznego lub nieprobabilistycznego opisu wielkości swobodnych. Ma wiedzę w zakresie budowy i strojenia parametryzowanych reguł decyzyjnych oraz struktur i układów z powtarzaną optymalizacją decyzji.
Weryfikacja: egzamin, wykonanie ćwiczeń laboratoryjnych
Powiązane efekty kierunkowe: K_W09
Powiązane efekty obszarowe: T2A_W03

Profil ogólnoakademicki - umiejętności

Efekt
Student, który zaliczył przedmiot potrafi: formułować i rozwiązywać proste zadania syntezy optymalnej dla wieloetapowego procesu zarządzania bądź sterowania; projektować, programować i stroić parametryzowane reguły decyzyjne; projektować i badać układy z powtarzaną optymalizacją decyzji.
Weryfikacja: egzamin, wykonanie ćwiczeń laboratoryjnych
Powiązane efekty kierunkowe: K_U12, K_U13
Powiązane efekty obszarowe: T2A_U17, T2A_U18

Profil ogólnoakademicki - kompetencje społeczne

Efekt
Student, który zaliczył przedmiot potrafi pracować w zespole
Weryfikacja: ocena przebiegu ćwiczeń laboratoryjnych
Powiązane efekty kierunkowe: K_K01
Powiązane efekty obszarowe: T2A_K06