- Nazwa przedmiotu:
- Synteza mechanizmów decyzyjnych
- Koordynator przedmiotu:
- dr hab. inż. Andrzej Karbowski
- Status przedmiotu:
- Fakultatywny ograniczonego wyboru
- Poziom kształcenia:
- Studia II stopnia
- Program:
- Informatyka
- Grupa przedmiotów:
- Przedmioty specjalnościowe
- Kod przedmiotu:
- SMDUZ
- Semestr nominalny:
- 3 / rok ak. 2017/2018
- Liczba punktów ECTS:
- 5
- Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
- 120 - 30 godzin wykładów, 30 godzin ćwiczeń projektowych, liczonych w mierze tradycyjnej oraz około 60 godzin pracy własnej
- Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
- 3
- Język prowadzenia zajęć:
- polski
- Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
- 2
- Formy zajęć i ich wymiar w semestrze:
-
- Wykład30h
- Ćwiczenia0h
- Laboratorium0h
- Projekt30h
- Lekcje komputerowe0h
- Wymagania wstępne:
- Matematyka wyższa na poziomie studiów technicznych I stopnia
- Limit liczby studentów:
- 30
- Cel przedmiotu:
- Celem wykładu jest przedstawienie zagadnień oraz algorytmów dotyczących projektowania optymalnych i uproszczonych reguł i mechanizmów decyzyjnych w zastosowaniach do zarządzania lub sterowania systemami: i) zadania syntezy optymalnej, parametryzowane reguły decyzyjne, układy z powtarzana optymalizacją decyzji oraz układy uczące się, ii) nauka formułowania i rozwiązywania zadań optymalnej syntezy przy pomocy rodziny metod programowania dynamicznego, iii) nauka projektowania reguł i mechanizmów decyzyjnych wykorzystujących podejścia uproszczone, w tym optymalizację parametryczną oraz powtarzaną optymalizację decyzji z wykorzystaniem prognoz wielkości i wejść swobodnych (niesterowanych).
Celem projektu jest opanowanie przez studentów podstawowych schematów decyzyjnych oraz metod obliczeniowych, zwłaszcza algorytmu dyskretnego stochastycznego programowania dynamicznego dla zadań z horyzontem skończonym i nieskończonym (wersja z dyskontem).
- Treści kształcenia:
- Treść wykładu 1. Zadanie syntezy optymalnej reguły (optymalnego prawa sterowania) w warunkach niepewności na skończonym horyzoncie czasu, formułowanie zadania, pierwotne i wtórne wskaźniki jakości, modele niepewności, zadanie syntezy stochastycznej, zadanie syntezy minimaksowej. 2. Metodyka i możliwości rozwiązania zadania syntezy optymalnej w układzie zamkniętym, dla skończonej liczby etapów decyzyjnych (skończony horyzont działania), z pełnym i niezakłóconym pomiarem stanu; metoda programowania dynamicznego; przykłady zadań optymalnej syntezy i ich rozwiązań, w tym zadanie liniowo-kwadratowe. 3. Zadania syntezy optymalnych reguł decyzyjnych dla nieskończonej liczby etapów (nieskończony horyzont działania): wskaźnik jakości z uwzględnieniem dyskonta (zadanie z dyskontem), wskaźnik w postaci wartości średniej kosztu i inne. 4. Rozwiązanie zadania z dyskontem, warunki istnienia rozwiązania, równanie Bellmana, metody wyznaczania stacjonarnej reguły decyzyjnej w przypadku skończonej liczby wartości stanu. 5. Optymalna synteza reguł decyzyjnych w przypadku niepełnego i zakłóconego pomiaru stanu; algorytm programowania dynamicznego, statystyki wystarczające, zagadnienie filtracji i estymacji stanu. Efekt dualny i efekt ostrożności, własność separowalności. Zadanie liniowo-kwadratowo-gaussowskie (LQG). 6. Praktyczne sposoby podejmowania decyzji operacyjnych w warunkach niepewności: parametryzowane reguły decyzyjne o danej postaci, sterowanie i zarządzanie z powtarzaną optymalizacją decyzji, układy warstwowe. 7. Sposoby konstrukcji parametryzowanych reguł decyzyjnych: wykorzystanie reguł liniowych, sztucznych sieci neuronalnych oraz zbiorów rozmytych. Układy uczące się. 8. Bieżące podejmowanie decyzji (sterowanie) w oparciu o powtarzaną optymalizację w układzie otwartym oraz w oparciu o powtarzaną syntezę wykorzystującą uproszczony model niepewności, w tym model w postaci prognoz wielowariantowych. 9. Przykłady współczesnych zastosowań reguł decyzyjnych do zarządzania (sterowania operacyjnego). Warstwowe układy decyzyjne, układ sterowania procesem technologicznym i zagadnienie wyboru wielkości regulowanych.
Wykładowi towarzyszy projekt. Składa się on z 2 części (zadania na horyzoncie skończonym i nieskończonym) , w ramach których studenci rozwiązują praktyczne zadania optymalnej syntezy z dziedziny ekonomii, sterowania systemami wodno-gospodarczymi, zarządzania sieciami teleinformatycznymi. Ważną składnikiem każdej z części jest samodzielna implementacja algorytmu optymalizacyjnego oraz weryfikacja poprawności na drodze wielokrotnej symulacji sterowania w układzie zamkniętym dla różnych przebiegów zakłóceń. Projekt jest realizowany w środowisku Freemat (jest to darmowy klon Matlaba).
- Metody oceny:
- Oceny punktowe z dwóch zadań projektowych. Ocena indywidualnego zadania od 0 do 25 punktów. Łączna liczba punktów 50, do zaliczenia wymagane 26 lub więcej punktów. Egzamin obejmujący rozwiązanie zadań rachunkowych oraz odpowiedzi na pytania. Ocena od 0 do 50 punktów. Egzamin uważany jest za zdany po uzyskaniu 26 lub więcej punktów. W razie potrzeby przeprowadzany jest uzupełniający egzamin ustny. Zaliczenie przedmiotu wymaga zaliczenia projektu i zdania egzaminu. Oceny końcowe wystawiane są zgodnie z ogólnie przyjętą skalą, w szczególności ocena 3 (dst) po uzyskaniu 52 do 60 punktów.
- Egzamin:
- tak
- Literatura:
- 1. Krzysztof Malinowski i Andrzej Karbowski, Synteza Mechanizmów Decyzyjnych, E-book, Kopipol/OKNO PW, 2007.
2. Dimitri P. Bertsekas, Dynamic Programming and Optimal Control, Vols. I and II, Athena Scientific, 1995, (3rd Edition Vol. I, 2005, 4rd Edition Vol. II, 2012), wybrane fragmenty (lektura nieobowiązkowa)
- Witryna www przedmiotu:
- https://red.okno.pw.edu.pl/witryna/wybor_przedmiotu.php?sub_ed=1027
- Uwagi:
Efekty uczenia się
Profil praktyczny - wiedza
- Efekt T2P_W01, T2P_W02, T2P_W03, T2P_W04, T2P_W07
- Znajomość mechanizmów zapewniających osiągnięcie najlepszych z możliwych efektów działania konkretnego układu dynamicznego działającego w warunkach niepewnośc i ryzyka na bazie danego modelu formalnego.
Weryfikacja: Poprzez zastosowanie abstrakcyjnych algorytmów w konkretnych zadaniach praktycznych rozwiązywanych numerycznie.
Powiązane efekty kierunkowe:
Powiązane efekty obszarowe:
Profil praktyczny - umiejętności
- Efekt T2P_U03, T2P_U07, T2P_U08, T2P_U09, T2P_U11, T2A_U15, T2P_U16, T2P_U17, T2P_U18, T2P_U19
- Umiejętność klasyfikacji zadania z konkretnej dziedziny, zwłaszcza pod względem zastosowanego modelu niepewności (stochastyczna, typu przynależności do zbioru, prognoza, ew. wielowariantowa), rodzaju horyzontu (skończony, nieskończony), typu wskaźników jakości, a następnie opracowania pełnego modelu formalnego, doboru właściwej metody obliczeniowej i rozwiązania na maszynie cyfrowej.
Weryfikacja: Zmierzone w serii realizacji (symulacji) wskaźniki jakości, dokładniej ich wartość średnia (w przypadku stochastycznego modelu zakłóceń) lub maksymalna (w przypadku modelu typu przynależności do zbioru) w stosunku do wartości odnośnego wskaźnika otrzymanej podczas obliczeń, tzn. syntezy mechanizmu decyzyjnego.
Powiązane efekty kierunkowe:
Powiązane efekty obszarowe:
Profil praktyczny - kompetencje społeczne
- Efekt T2P_K02, T2P_K04, T2P_K05, T2P_K06, T2P_K07
- Pamiętanie przy opracowywaniu pewnych regulacji w życiu społecznym o konieczności weryfikacji po jakimś czasie zgodności ich efektów z oczekiwanymi. Jeśli jej nie ma, należy je wyznaczyć ponownie. Jednocześnie w przypadkach zadań, w których trudno jest stworzyć ścisły model formalny, należy zastosować podejścia "miękkie", tzw. inteligentne - np. rozmyte, neuronowe, zakładające automatyczne uczenie się systemu.
Weryfikacja: W czasie, gdy uczestnicy zajęć osiągną w życiu zawodowym lub społecznym pozycję związaną z opracowywaniem regulacji dla podlegających im podwładnych, społeczności lokalnych, poprzez ocenę czy wprowadzone zmiany przyniosły oczekiwane, pozytywne efekty.
Powiązane efekty kierunkowe:
Powiązane efekty obszarowe:
Profil ogólnoakademicki - wiedza
- Efekt SMD_W1
- Poznanie metod projektowania optymalnych i uproszczonych reguł i mechanizmów decyzyjnych w zastosowaniach do zarządzania lub sterowania systemami: zadania syntezy optymalnej, parametryzowane reguły decyzyjne, układy z powtarzana optymalizacją decyzji oraz układy uczące się,
Weryfikacja: EGZAMIN Sprawdzenie przyswojenia części teoretycznej. Ma charakter pisemny z ewentualnym uzupełnieniem ustnym w razie potrzeby.
Powiązane efekty kierunkowe:
K2_W03, K2_W06, K2_W08
Powiązane efekty obszarowe:
T2A_W04, T2A_W04, T2A_W07, T2A_W08
Profil ogólnoakademicki - umiejętności
- Efekt SMD_U1
- Umiejętność formułowania i rozwiązywania zadań optymalnej syntezy przy pomocy rodziny metod programowania dynamicznego, Umiejętność projektowania reguł i mechanizmów decyzyjnych wykorzystujących podejścia uproszczone, w tym optymalizację parametryczną oraz powtarzaną optymalizację decyzji z wykorzystaniem prognoz wielkości i wejść swobodnych (niesterowanych).
Weryfikacja: EGZAMIN i PROJEKT (napisanie dwóch programów w języku Matlab wyznaczających optymalne polityki decyzyjne w zadaniu optymalizacji z horyzontem skończonym /wskaźnik Bolzy/ oraz nieskończonym /wskaźnikiem jest suma kosztów/zysków etepowych z dyskontem/ oraz weryfikujących je na drodze symulacyjnej).
Powiązane efekty kierunkowe:
K2_U02, K2_U03, K2_U06, K2_U07, K2_U15, K1_U02, K1_U03
Powiązane efekty obszarowe:
T2A_U02, T2A_U03, T2A_U09, T2A_U10, T2A_U19, T2A_U07, T2A_U08
Profil ogólnoakademicki - kompetencje społeczne
- Efekt SMD_K1
- Uświadomienie, że przy podejmowaniu decyzji obowiązujących przez wiele etapów w warunkach ryzyka kluczowe znaczenie ma sprzężenie zwrotne. Pewne reguły decyzyjne lub programy sterowania wyznaczone dla założonych prognoz mają wartość i poprawiają funkcjonowanie systemu wtedy, gdy przyjęto wystarczająco dobry model dynamiki oraz niepewności, w przeciwnym wypadku procedura powinna być ponowiona.
Weryfikacja: Pozycja absolwenta studiów w życiu zawodowym i społecznym, uznanie jego autorytetu i kompetencji.
Powiązane efekty kierunkowe:
K2_K01, K2_K02, K2_K04, K2_K05
Powiązane efekty obszarowe:
T2A_K06, T2A_K02, T2A_K04, T2A_K05