- Nazwa przedmiotu:
- Synteza reguł decyzyjnych
- Koordynator przedmiotu:
- Krzysztof MALINOWSKI, Andrzej KARBOWSKI
- Status przedmiotu:
- Fakultatywny ograniczonego wyboru
- Poziom kształcenia:
- Studia I stopnia
- Program:
- Informatyka
- Grupa przedmiotów:
- Przedmioty techniczne
- Kod przedmiotu:
- SRD
- Semestr nominalny:
- 7 / rok ak. 2012/2013
- Liczba punktów ECTS:
- 5
- Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
- 151
- Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
- Język prowadzenia zajęć:
- polski
- Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
- Formy zajęć i ich wymiar w semestrze:
-
- Wykład30h
- Ćwiczenia0h
- Laboratorium30h
- Projekt0h
- Lekcje komputerowe0h
- Wymagania wstępne:
- Podstawy Optymalizacji oraz ogólnowydziałowe przedmioty z zakresu matematyki
- Limit liczby studentów:
- 48
- Cel przedmiotu:
- - przedstawienie zagadnień dotyczących projektowania optymalnych i uproszczonych reguł i mechanizmów decyzyjnych w zastosowaniach do zarządzania lub sterowania systemami: zadania syntezy optymalnej, parametryzowane reguły decyzyjne, układy z powtarzana optymalizacją decyzji oraz układy uczące się,
- nauka formułowania i rozwiązywania zadań optymalnej syntezy przy pomocy rodziny metod programowania dynamicznego,
- nauka projektowania reguł i mechanizmów decyzyjnych wykorzystujących podejścia uproszczone, w tym optymalizację parametryczną oraz powtarzaną optymalizację decyzji z wykorzystaniem prognoz wielkości i wejść swobodnych (niesterowanych).
Ang.
- presentation of problems in design of optimal and suboptimal decision policies and rules with applications to management of control systems: optimal control design problems, parametric decision rules, structures with repetitive optimization of decisions, learning systems,
- learning formulating and solving optimal decision/control problems using methods of dynamic programming family,
- learning design of rules and decision policies based on suboptimal approaches, including parametric optimization and repetitive optimization of decisions with the use of forecasts of uncontrolled inputs.
- Treści kształcenia:
- Treść wykładu
1. Zadanie syntezy optymalnej reguły (optymalnego prawa sterowania) w warunkach niepewności na skończonym horyzoncie czasu, formułowanie zadania, pierwotne i wtórne wskaźniki jakości, modele niepewności, zadanie syntezy stochastycznej, zadanie syntezy minimaksowej.
2. Metodyka i możliwości rozwiązania zadania syntezy optymalnej w układzie zamkniętym, dla skończonej liczby etapów decyzyjnych (skończony horyzont działania), z pełnym i niezakłóconym pomiarem stanu; metoda programowania dynamicznego; przykłady zadań optymalnej syntezy i ich rozwiązań, w tym zadanie liniowo-kwadratowe.
3. Zadania syntezy optymalnych reguł decyzyjnych dla nieskończonej liczby etapów (nieskończony horyzont działania): wskaźnik jakości z uwzględnieniem dyskonta (zadanie z dyskontem), wskaźnik w postaci wartości średniej kosztu i inne.
4. Rozwiązanie zadania z dyskontem, warunki istnienia rozwiązania, równanie Bellmana, metody wyznaczania stacjonarnej reguły decyzyjnej w przypadku skończonej liczby wartości stanu.
5. Optymalna synteza reguł decyzyjnych w przypadku niepełnego i zakłóconego pomiaru stanu; algorytm programowania dynamicznego, statystyki wystarczające, zagadnienie filtracji i estymacji stanu. Efekt dualny i efekt ostrożności, własność separowalności. Zadanie liniowo-kwadratowo-gaussowskie (LQG).
6. Praktyczne sposoby podejmowania decyzji operacyjnych w warunkach niepewności: parametryzowane reguły decyzyjne o danej postaci, sterowanie i zarządzanie z powtarzaną optymalizacją decyzji, układy warstwowe.
7. Sposoby konstrukcji parametryzowanych reguł decyzyjnych: wykorzystanie reguł liniowych, sztucznych sieci neuronalnych oraz zbiorów rozmytych. Układy uczące się.
8. Bieżące podejmowanie decyzji (sterowanie) w oparciu o powtarzaną optymalizację w układzie otwartym oraz w oparciu o powtarzaną syntezę wykorzystującą uproszczony model niepewności, w tym model w postaci prognoz wielowariantowych. 9. Przykłady współczesnych zastosowań reguł decyzyjnych do zarządzania (sterowania operacyjnego).
Warstwowe układy decyzyjne, układ sterowania procesem technologicznym i zagadnienie wyboru wielkości regulowanych.
Zakres laboratorium
Laboratorium składa się z 6 ćwiczeń, realizowanych w zespołach 2-osobowych, podczas których studenci rozwiązują praktyczne zadania optymalnej syntezy z dziedziny ekonomii, sterowania systemami wodno-gospodarczymi, zarządzania sieciami teleinformatycznymi. Ważną częścią każdego ćwiczenia jest samodzielna implementacja algorytmu optymalizacyjnego oraz weryfikacja poprawności, na drodze wielokrotnej symulacji sterowania, w układzie zamkniętym, dla różnych przebiegów zakłóceń.
Program laboratorium został pomyślany tak, by jego uczestnicy opanowali wszystkie podstawowe schematy decyzyjne oraz metody obliczeniowe, w tym: klasyczny algorytm stochastycznego programowania dynamicznego w zadaniach z horyzontem skończonym, algorytmy kolejnych przybliżeń oraz iteracji polityki w zadaniach nieliniowych z horyzontem nieskończonym, metodologię LQG w wersji standardowej oraz rozszerzonej (uwzględnienie nieliniowości modelu oraz wskaźnika jakości), zastosowanie metod gradientowych optymalizacji trajektorii sterowań (wraz z rozwiązaniem równania sprzężonego) w podstawowych wersjach sterowania predykcyjnego z kilkoma scenariuszami zakłóceń. Podczas zajęć w laboratorium wykorzystywane jest środowisko Matlab oraz jego dwie biblioteki: Optimization oraz Control Toolbox.
- Metody oceny:
- Oceny punktowe z ćwiczeń laboratoryjnych obejmujące przygotowanie i wykonanie ćwiczenia. Ocena indywidualnego ćwiczenia od 0 do 12 + 2 za zaliczenie wszystkich 4 ćwiczeń. Łączna liczba punktów 50, do zaliczenia wymagane 26 lub więcej punktów.
Egzamin obejmujący rozwiązanie zadań rachunkowych oraz odpowiedzi na pytania. Ocena od 0 do 50 punktów. Egzamin uważany jest za zdany po uzyskaniu 26 lub więcej punktów. W razie potrzeby przeprowadzany jest uzupełniający egzamin ustny.
Zaliczenie przedmiotu wymaga zaliczenia laboratorium i zdania egzaminu. Oceny kończowe wystawiane są zgodnie z ogólnie przyjętą skalą, w szczegolności ocena 3 (dst) po uzyskaniu 52 do 60 punktów.
- Egzamin:
- tak
- Literatura:
- 1. Krzysztof Malinowski i Andrzej Karbowski, Synteza Mechanizmów Decyzyjnych, E-book, Kopipol/OKNO PW, 2007.
2. Dimitri P. Bertsekas, Dynamic Programming and Optimal Control, Vols. I and II, Athena Scientific, 1995, (3rd Edition Vol. I, 2005, 3rd Edition Vol. II, 2007), wybrane fragmenty (lektura nieobowiązkowa)
3. Instrukcje do 4 ćwiczeń laboratoryjnych
- Witryna www przedmiotu:
- https://studia.elka.pw.edu.pl/priv/11Z/SRD.A/
- Uwagi:
Efekty uczenia się
Profil ogólnoakademicki - wiedza
- Efekt Wpisz opis
- ma wiedzę w zakresie budowy i strojenia parametryzowanych reguł decyzyjnych oraz struktur i układów z powtarzaną optymalizacją decyzji.
Weryfikacja: egzamin, testy wstępne do ćwiczeń laboratoryjnych
Powiązane efekty kierunkowe:
K_W22
Powiązane efekty obszarowe:
T1A_W03
Profil ogólnoakademicki - umiejętności
- Efekt Wpisz opis
- projektować i badać układy z powtarzaną optymalizacją decyzji
Weryfikacja: egzamin, wykonanie ćwiczeń laboratoryjnych
Powiązane efekty kierunkowe:
K_U25
Powiązane efekty obszarowe:
T1A_U09, T1A_U10
Profil ogólnoakademicki - kompetencje społeczne
- Efekt Wpisz opis
- Student, który zaliczył przedmiot potrafi pracować w zespole
Weryfikacja: ocena przebiegu ćwiczeń laboratoryjnych
Powiązane efekty kierunkowe:
K_K02, K_K03
Powiązane efekty obszarowe:
T1A_K02, T1A_K03