Katalog ECTS - Politechnika Warszawska

Drukuj Eksport do pliku (MS Word)

Nazwa przedmiotu:

Synteza reguł decyzyjnych

Koordynator przedmiotu:

Krzysztof MALINOWSKI, Andrzej KARBOWSKI

Status przedmiotu:

Fakultatywny ograniczonego wyboru

Poziom kształcenia:

Studia I stopnia

Program:

Informatyka

Grupa przedmiotów:

Przedmioty techniczne

Kod przedmiotu:

SRD

Semestr nominalny:

6 / rok ak. 2015/2016

Liczba punktów ECTS:

Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:

Wykład prowadzony jest w wymiarze 2 godz. w tygodniu. Łącznie udział w wykładzie (30 godz.) i przygotowanie się do egzaminu (45 godz.) wymagają od studenta 75 godzin pracy w semestrze. Ćwiczenia laboratoryjne w liczbie czterech wymagają łącznie 60 godzin pracy studenta, w tym 16 godz. udziału w zajęciach zorganizowanych oraz po 8 godzin przeznaczonych na przygotowanie się do każdego z ćwiczeń (2 godz.) oraz opracowanie wyników, wykonanie sprawozdania i zaliczenie (6 godz.). Czyni to łącznie 56 godzin pracy w semestrze. Łączny nakład pracy studenta: 131 godzin, odpowiadający 5 punktom ECTS.

Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:

Wykład prowadzony jest w wymiarze 2 godz. w tygodniu, stąd 30 godzin w semestrze. Zajęcia w laboratorium obejmują 16 godzin pracy z udziałem nauczyciela oraz 4 godziny przeznaczone na zaliczenie ćwiczeń po złożeniu sprawozdań. Czyni to łącznie 50 godzin pracy na zajęciach wymagających bezpośredniego udziału nauczyciela akademickiego. Stąd można przypisać 2 punkty ECTS

Język prowadzenia zajęć:

polski

Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:

Ćwiczenia laboratoryjne w liczbie czterech wymagają łącznie 60 godzin pracy studenta, w tym 16 godz. udziału w zajęciach zorganizowanych oraz po 8 godzin przeznaczonych na przygotowanie się do każdego z ćwiczeń (2 godz.) oraz opracowanie wyników, wykonanie sprawozdania i zaliczenie (6 godz.). Czyni to łącznie 56 godzin pracy w semestrze. Stąd można przypisać 2 punkty ECTS

Formy zajęć i ich wymiar w semestrze:

Wykład30h
Ćwiczenia0h
Laboratorium30h
Projekt0h
Lekcje komputerowe0h

Wymagania wstępne:

Podstawy Optymalizacji oraz ogólnowydziałowe przedmioty z zakresu matematyki

Limit liczby studentów:

Cel przedmiotu:

- przedstawienie zagadnień dotyczących projektowania optymalnych i uproszczonych reguł i mechanizmów decyzyjnych w zastosowaniach do zarządzania lub sterowania systemami: zadania syntezy optymalnej, parametryzowane reguły decyzyjne, układy z powtarzana optymalizacją decyzji oraz układy uczące się, - nauka formułowania i rozwiązywania zadań optymalnej syntezy przy pomocy rodziny metod programowania dynamicznego, - nauka projektowania reguł i mechanizmów decyzyjnych wykorzystujących podejścia uproszczone, w tym optymalizację parametryczną oraz powtarzaną optymalizację decyzji z wykorzystaniem prognoz wielkości i wejść swobodnych (niesterowanych). Ang. - presentation of problems in design of optimal and suboptimal decision policies and rules with applications to management of control systems: optimal control design problems, parametric decision rules, structures with repetitive optimization of decisions, learning systems, - learning formulating and solving optimal decision/control problems using methods of dynamic programming family, - learning design of rules and decision policies based on suboptimal approaches, including parametric optimization and repetitive optimization of decisions with the use of forecasts of uncontrolled inputs.

Treści kształcenia:

Treść wykładu 1. Zadanie syntezy optymalnej reguły (optymalnego prawa sterowania) w warunkach niepewności na skończonym horyzoncie czasu, formułowanie zadania, pierwotne i wtórne wskaźniki jakości, modele niepewności, zadanie syntezy stochastycznej, zadanie syntezy minimaksowej. 2. Metodyka i możliwości rozwiązania zadania syntezy optymalnej w układzie zamkniętym, dla skończonej liczby etapów decyzyjnych (skończony horyzont działania), z pełnym i niezakłóconym pomiarem stanu; metoda programowania dynamicznego; przykłady zadań optymalnej syntezy i ich rozwiązań, w tym zadanie liniowo-kwadratowe. 3. Zadania syntezy optymalnych reguł decyzyjnych dla nieskończonej liczby etapów (nieskończony horyzont działania): wskaźnik jakości z uwzględnieniem dyskonta (zadanie z dyskontem), wskaźnik w postaci wartości średniej kosztu i inne. 4. Rozwiązanie zadania z dyskontem, warunki istnienia rozwiązania, równanie Bellmana, metody wyznaczania stacjonarnej reguły decyzyjnej w przypadku skończonej liczby wartości stanu. 5. Optymalna synteza reguł decyzyjnych w przypadku niepełnego i zakłóconego pomiaru stanu; algorytm programowania dynamicznego, statystyki wystarczające, zagadnienie filtracji i estymacji stanu. Efekt dualny i efekt ostrożności, własność separowalności. Zadanie liniowo-kwadratowo-gaussowskie (LQG). 6. Praktyczne sposoby podejmowania decyzji operacyjnych w warunkach niepewności: parametryzowane reguły decyzyjne o danej postaci, sterowanie i zarządzanie z powtarzaną optymalizacją decyzji, układy warstwowe. 7. Sposoby konstrukcji parametryzowanych reguł decyzyjnych: wykorzystanie reguł liniowych, sztucznych sieci neuronalnych oraz zbiorów rozmytych. Układy uczące się. 8. Bieżące podejmowanie decyzji (sterowanie) w oparciu o powtarzaną optymalizację w układzie otwartym oraz w oparciu o powtarzaną syntezę wykorzystującą uproszczony model niepewności, w tym model w postaci prognoz wielowariantowych. 9. Przykłady współczesnych zastosowań reguł decyzyjnych do zarządzania (sterowania operacyjnego). Warstwowe układy decyzyjne, układ sterowania procesem technologicznym i zagadnienie wyboru wielkości regulowanych. Zakres laboratorium Laboratorium składa się z 6 ćwiczeń, realizowanych w zespołach 2-osobowych, podczas których studenci rozwiązują praktyczne zadania optymalnej syntezy z dziedziny ekonomii, sterowania systemami wodno-gospodarczymi, zarządzania sieciami teleinformatycznymi. Ważną częścią każdego ćwiczenia jest samodzielna implementacja algorytmu optymalizacyjnego oraz weryfikacja poprawności, na drodze wielokrotnej symulacji sterowania, w układzie zamkniętym, dla różnych przebiegów zakłóceń. Program laboratorium został pomyślany tak, by jego uczestnicy opanowali wszystkie podstawowe schematy decyzyjne oraz metody obliczeniowe, w tym: klasyczny algorytm stochastycznego programowania dynamicznego w zadaniach z horyzontem skończonym, algorytmy kolejnych przybliżeń oraz iteracji polityki w zadaniach nieliniowych z horyzontem nieskończonym, metodologię LQG w wersji standardowej oraz rozszerzonej (uwzględnienie nieliniowości modelu oraz wskaźnika jakości), zastosowanie metod gradientowych optymalizacji trajektorii sterowań (wraz z rozwiązaniem równania sprzężonego) w podstawowych wersjach sterowania predykcyjnego z kilkoma scenariuszami zakłóceń. Podczas zajęć w laboratorium wykorzystywane jest środowisko Matlab oraz jego dwie biblioteki: Optimization oraz Control Toolbox.

Metody oceny:

Oceny punktowe z ćwiczeń laboratoryjnych obejmujące przygotowanie i wykonanie ćwiczenia. Ocena indywidualnego ćwiczenia od 0 do 12 + 2 za zaliczenie wszystkich 4 ćwiczeń. Łączna liczba punktów 50, do zaliczenia wymagane 26 lub więcej punktów. Egzamin obejmujący rozwiązanie zadań rachunkowych oraz odpowiedzi na pytania. Ocena od 0 do 50 punktów. Egzamin uważany jest za zdany po uzyskaniu 26 lub więcej punktów. W razie potrzeby przeprowadzany jest uzupełniający egzamin ustny. Zaliczenie przedmiotu wymaga zaliczenia laboratorium i zdania egzaminu. Oceny kończowe wystawiane są zgodnie z ogólnie przyjętą skalą, w szczegolności ocena 3 (dst) po uzyskaniu 52 do 60 punktów.

Egzamin:

tak

Literatura:

1. Krzysztof Malinowski i Andrzej Karbowski, Synteza Mechanizmów Decyzyjnych, E-book, Kopipol/OKNO PW, 2007. 2. Dimitri P. Bertsekas, Dynamic Programming and Optimal Control, Vols. I and II, Athena Scientific, 1995, (3rd Edition Vol. I, 2005, 3rd Edition Vol. II, 2007), wybrane fragmenty (lektura nieobowiązkowa) 3. Instrukcje do 4 ćwiczeń laboratoryjnych

Witryna www przedmiotu:

https://studia.elka.pw.edu.pl/priv/11Z/SRD.A/

Uwagi:

Efekty uczenia się

Profil ogólnoakademicki - wiedza

Efekt Wpisz opis: ma wiedzę w zakresie budowy i strojenia parametryzowanych reguł decyzyjnych oraz struktur i układów z powtarzaną optymalizacją decyzji.
Weryfikacja: egzamin, testy wstępne do ćwiczeń laboratoryjnych
Powiązane efekty kierunkowe: K_W22
Powiązane efekty obszarowe: T1A_W03

Profil ogólnoakademicki - umiejętności

Efekt Wpisz opis: projektować i badać układy z powtarzaną optymalizacją decyzji
Weryfikacja: egzamin, wykonanie ćwiczeń laboratoryjnych
Powiązane efekty kierunkowe: K_U25
Powiązane efekty obszarowe: T1A_U09, T1A_U10

Profil ogólnoakademicki - kompetencje społeczne

Efekt Wpisz opis: Student, który zaliczył przedmiot potrafi pracować w zespole
Weryfikacja: ocena przebiegu ćwiczeń laboratoryjnych
Powiązane efekty kierunkowe: K_K03
Powiązane efekty obszarowe: T1A_K03

PolitechnikaWarszawskaKatalogECTS

Efekty uczenia się

Profil ogólnoakademicki - wiedza

Profil ogólnoakademicki - umiejętności

Profil ogólnoakademicki - kompetencje społeczne

Politechnika
Warszawska
Katalog
ECTS