Nazwa przedmiotu:
Synteza reguł decyzyjnych
Koordynator przedmiotu:
Krzysztof MALINOWSKI, Andrzej KARBOWSKI
Status przedmiotu:
Fakultatywny ograniczonego wyboru
Poziom kształcenia:
Studia I stopnia
Program:
Informatyka
Grupa przedmiotów:
Przedmioty techniczne
Kod przedmiotu:
SRD
Semestr nominalny:
6 / rok ak. 2018/2019
Liczba punktów ECTS:
5
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
Wykład prowadzony jest w wymiarze 2 godz. w tygodniu. Łącznie udział w wykładzie (30 godz.) i przygotowanie się do egzaminu (45 godz.) wymagają od studenta 75 godzin pracy w semestrze. Ćwiczenia laboratoryjne w liczbie czterech wymagają łącznie 60 godzin pracy studenta, w tym 16 godz. udziału w zajęciach zorganizowanych oraz po 8 godzin przeznaczonych na przygotowanie się do każdego z ćwiczeń (2 godz.) oraz opracowanie wyników, wykonanie sprawozdania i zaliczenie (6 godz.). Czyni to łącznie 56 godzin pracy w semestrze. Łączny nakład pracy studenta: 131 godzin, odpowiadający 5 punktom ECTS.
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
Wykład prowadzony jest w wymiarze 2 godz. w tygodniu, stąd 30 godzin w semestrze. Zajęcia w laboratorium obejmują 16 godzin pracy z udziałem nauczyciela oraz 4 godziny przeznaczone na zaliczenie ćwiczeń po złożeniu sprawozdań. Czyni to łącznie 50 godzin pracy na zajęciach wymagających bezpośredniego udziału nauczyciela akademickiego. Stąd można przypisać 2 punkty ECTS
Język prowadzenia zajęć:
polski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
Ćwiczenia laboratoryjne w liczbie czterech wymagają łącznie 60 godzin pracy studenta, w tym 16 godz. udziału w zajęciach zorganizowanych oraz po 8 godzin przeznaczonych na przygotowanie się do każdego z ćwiczeń (2 godz.) oraz opracowanie wyników, wykonanie sprawozdania i zaliczenie (6 godz.). Czyni to łącznie 56 godzin pracy w semestrze. Stąd można przypisać 2 punkty ECTS
Formy zajęć i ich wymiar w semestrze:
  • Wykład30h
  • Ćwiczenia0h
  • Laboratorium30h
  • Projekt0h
  • Lekcje komputerowe0h
Wymagania wstępne:
Podstawy Optymalizacji oraz ogólnowydziałowe przedmioty z zakresu matematyki
Limit liczby studentów:
48
Cel przedmiotu:
- przedstawienie zagadnień dotyczących projektowania optymalnych i uproszczonych reguł i mechanizmów decyzyjnych w zastosowaniach do zarządzania lub sterowania systemami: zadania syntezy optymalnej, parametryzowane reguły decyzyjne, układy z powtarzana optymalizacją decyzji oraz układy uczące się, - nauka formułowania i rozwiązywania zadań optymalnej syntezy przy pomocy rodziny metod programowania dynamicznego, - nauka projektowania reguł i mechanizmów decyzyjnych wykorzystujących podejścia uproszczone, w tym optymalizację parametryczną oraz powtarzaną optymalizację decyzji z wykorzystaniem prognoz wielkości i wejść swobodnych (niesterowanych). Ang. - presentation of problems in design of optimal and suboptimal decision policies and rules with applications to management of control systems: optimal control design problems, parametric decision rules, structures with repetitive optimization of decisions, learning systems, - learning formulating and solving optimal decision/control problems using methods of dynamic programming family, - learning design of rules and decision policies based on suboptimal approaches, including parametric optimization and repetitive optimization of decisions with the use of forecasts of uncontrolled inputs.
Treści kształcenia:
Treść wykładu 1. Zadanie syntezy optymalnej reguły (optymalnego prawa sterowania) w warunkach niepewności na skończonym horyzoncie czasu, formułowanie zadania, pierwotne i wtórne wskaźniki jakości, modele niepewności, zadanie syntezy stochastycznej, zadanie syntezy minimaksowej. 2. Metodyka i możliwości rozwiązania zadania syntezy optymalnej w układzie zamkniętym, dla skończonej liczby etapów decyzyjnych (skończony horyzont działania), z pełnym i niezakłóconym pomiarem stanu; metoda programowania dynamicznego; przykłady zadań optymalnej syntezy i ich rozwiązań, w tym zadanie liniowo-kwadratowe. 3. Zadania syntezy optymalnych reguł decyzyjnych dla nieskończonej liczby etapów (nieskończony horyzont działania): wskaźnik jakości z uwzględnieniem dyskonta (zadanie z dyskontem), wskaźnik w postaci wartości średniej kosztu i inne. 4. Rozwiązanie zadania z dyskontem, warunki istnienia rozwiązania, równanie Bellmana, metody wyznaczania stacjonarnej reguły decyzyjnej w przypadku skończonej liczby wartości stanu. 5. Optymalna synteza reguł decyzyjnych w przypadku niepełnego i zakłóconego pomiaru stanu; algorytm programowania dynamicznego, statystyki wystarczające, zagadnienie filtracji i estymacji stanu. Efekt dualny i efekt ostrożności, własność separowalności. Zadanie liniowo-kwadratowo-gaussowskie (LQG). 6. Praktyczne sposoby podejmowania decyzji operacyjnych w warunkach niepewności: parametryzowane reguły decyzyjne o danej postaci, sterowanie i zarządzanie z powtarzaną optymalizacją decyzji, układy warstwowe. 7. Sposoby konstrukcji parametryzowanych reguł decyzyjnych: wykorzystanie reguł liniowych, sztucznych sieci neuronalnych oraz zbiorów rozmytych. Układy uczące się. 8. Bieżące podejmowanie decyzji (sterowanie) w oparciu o powtarzaną optymalizację w układzie otwartym oraz w oparciu o powtarzaną syntezę wykorzystującą uproszczony model niepewności, w tym model w postaci prognoz wielowariantowych. 9. Przykłady współczesnych zastosowań reguł decyzyjnych do zarządzania (sterowania operacyjnego). Warstwowe układy decyzyjne, układ sterowania procesem technologicznym i zagadnienie wyboru wielkości regulowanych. Zakres laboratorium Laboratorium składa się z 6 ćwiczeń, realizowanych w zespołach 2-osobowych, podczas których studenci rozwiązują praktyczne zadania optymalnej syntezy z dziedziny ekonomii, sterowania systemami wodno-gospodarczymi, zarządzania sieciami teleinformatycznymi. Ważną częścią każdego ćwiczenia jest samodzielna implementacja algorytmu optymalizacyjnego oraz weryfikacja poprawności, na drodze wielokrotnej symulacji sterowania, w układzie zamkniętym, dla różnych przebiegów zakłóceń. Program laboratorium został pomyślany tak, by jego uczestnicy opanowali wszystkie podstawowe schematy decyzyjne oraz metody obliczeniowe, w tym: klasyczny algorytm stochastycznego programowania dynamicznego w zadaniach z horyzontem skończonym, algorytmy kolejnych przybliżeń oraz iteracji polityki w zadaniach nieliniowych z horyzontem nieskończonym, metodologię LQG w wersji standardowej oraz rozszerzonej (uwzględnienie nieliniowości modelu oraz wskaźnika jakości), zastosowanie metod gradientowych optymalizacji trajektorii sterowań (wraz z rozwiązaniem równania sprzężonego) w podstawowych wersjach sterowania predykcyjnego z kilkoma scenariuszami zakłóceń. Podczas zajęć w laboratorium wykorzystywane jest środowisko Matlab oraz jego dwie biblioteki: Optimization oraz Control Toolbox.
Metody oceny:
Oceny punktowe z ćwiczeń laboratoryjnych obejmujące przygotowanie i wykonanie ćwiczenia. Ocena indywidualnego ćwiczenia od 0 do 12 + 2 za zaliczenie wszystkich 4 ćwiczeń. Łączna liczba punktów 50, do zaliczenia wymagane 26 lub więcej punktów. Egzamin obejmujący rozwiązanie zadań rachunkowych oraz odpowiedzi na pytania. Ocena od 0 do 50 punktów. Egzamin uważany jest za zdany po uzyskaniu 26 lub więcej punktów. W razie potrzeby przeprowadzany jest uzupełniający egzamin ustny. Zaliczenie przedmiotu wymaga zaliczenia laboratorium i zdania egzaminu. Oceny kończowe wystawiane są zgodnie z ogólnie przyjętą skalą, w szczegolności ocena 3 (dst) po uzyskaniu 52 do 60 punktów.
Egzamin:
tak
Literatura:
1. Krzysztof Malinowski i Andrzej Karbowski, Synteza Mechanizmów Decyzyjnych, E-book, Kopipol/OKNO PW, 2007. 2. Dimitri P. Bertsekas, Dynamic Programming and Optimal Control, Vols. I and II, Athena Scientific, 1995, (3rd Edition Vol. I, 2005, 3rd Edition Vol. II, 2007), wybrane fragmenty (lektura nieobowiązkowa) 3. Instrukcje do 4 ćwiczeń laboratoryjnych
Witryna www przedmiotu:
https://usosweb.usos.pw.edu.pl/kontroler.php?_action=katalog2/przedmioty/pokazPrzedmiot&prz_kod=103B-INSID-ISP-SRD
Uwagi:

Efekty uczenia się

Profil ogólnoakademicki - wiedza

Charakterystyka SRD_W01
ma wiedzę w zakresie metod służących do rozwiązywania zadań syntezy w różnych sytuacjach: skończonej lub nieskończonej liczby etapów, pełnej lub niepełnej informacji o aktualnym stanie procesu, probabilistycznego lub nieprobabilistycznego opisu wielkości swobodnych,
Weryfikacja: egzamin, testy wstępne do ćwiczeń laboratoryjnych
Powiązane charakterystyki kierunkowe: K_W22
Powiązane charakterystyki obszarowe: I.P6S_WG
Charakterystyka SRD_W02
ma wiedzę w zakresie budowy i strojenia parametryzowanych reguł decyzyjnych oraz struktur i układów z powtarzaną optymalizacją decyzji.
Weryfikacja: egzamin, testy wstępne do ćwiczeń laboratoryjnych
Powiązane charakterystyki kierunkowe: K_W22
Powiązane charakterystyki obszarowe: I.P6S_WG
Charakterystyka SRD_W03
Student, który zaliczył przedmiot, ma wiedzę z zakresu podstawowych zagadnień dotyczących formułowania zadań syntezy optymalnej i syntezy uproszczonej mechanizmów i reguł decyzyjnych dla wieloetapowych procesów wymagających podejmowania decyzji w oparciu o dopływającą informację,
Weryfikacja: egzamin, wykonanie ćwiczeń laboratoryjnych
Powiązane charakterystyki kierunkowe: K_W22
Powiązane charakterystyki obszarowe: I.P6S_WG

Profil ogólnoakademicki - umiejętności

Charakterystyka SRD_U01
projektować i badać układy z powtarzaną optymalizacją decyzji
Weryfikacja: egzamin, wykonanie ćwiczeń laboratoryjnych
Powiązane charakterystyki kierunkowe: K_U25
Powiązane charakterystyki obszarowe: I.P6S_UW, III.P6S_UW.2.o
Charakterystyka SRD_U02
formułować i rozwiązywać proste zadania syntezy optymalnej dla wieloetapowego procesu zarządzania bądź sterowania;
Weryfikacja: egzamin, wykonanie ćwiczeń laboratoryjnych
Powiązane charakterystyki kierunkowe: K_U25
Powiązane charakterystyki obszarowe: I.P6S_UW, III.P6S_UW.2.o
Charakterystyka SRD_U03
projektować, programować i stroić parametryzowane reguły decyzyjne
Weryfikacja: egzamin, wykonanie ćwiczeń laboratoryjnych
Powiązane charakterystyki kierunkowe: K_U25
Powiązane charakterystyki obszarowe: I.P6S_UW, III.P6S_UW.2.o
Charakterystyka SRD_U04
Student, który zaliczył przedmiot potrafi formułować modele do rozwiązania zadań
Weryfikacja: ocena ćwiczeń laboratoryjnych
Powiązane charakterystyki kierunkowe: K_U09, K_U25
Powiązane charakterystyki obszarowe: I.P6S_UU, I.P6S_UW, III.P6S_UW.2.o
Charakterystyka SRD_U05
Student, który zaliczył przedmiot potrafi pracować w zespole
Weryfikacja: ocena ćwiczeń laboratoryjnych
Powiązane charakterystyki kierunkowe: K_UK03
Powiązane charakterystyki obszarowe: I.P6S_UO