Księgarnia Techniczna

Katalog » INFORMATYKA » Politechnika Warszawska
Wyszukiwarka


Zaawansowane wyszukiwanie
Wydawnictwo
Wybierz kategorię
Towar dnia
39,50 zł
Podgląd zamówienia

Aby sprawdzić status zamówienia Wpisz jego unikalny numer
Informacje o produkcie:
Kliknij aby zobaczyć zdjęcie w oryginalnej wielkości
Systemy adaptacyjne i uczące się
Dostępność: jest na magazynie sklepu - wysyłka w 24h.
Dostępna ilość: 2
Autor
ISBN
978-83-7207-826-1
Liczba stron
194
Oprawa
miękka
Format
B5
Rok wydania
2009
Język
polska
  Cena:

Ilość

przechowalnia

19,00 zł

Tematem niniejszego skryptu są mechanizmy adaptacji aplikowane w systemach tworzonych przez człowieka. Ogólnym celem adaptacji tego rodzaju jest poprawa działania systemu w trakcie jego działania. Często nie jest możliwe zaprojektowanie systemu funkcjonującego w sposób optymalny natychmiast po uruchomieniu. W tej sytuacji optymalizacja funkcji systemu w trakcie jego działania może być pożyteczna.

Ogólny schemat sytuacji, w której pojawia się problem adaptacji (uczenia się) dyskutowany w niniejszym skrypcie przedstawia rysunek 1. Punktem wyjścia jest pewien system dynamiczny: może być to urządzenie wraz ze środowiskiem, w którym działa lub „światek”, na który oddziałuje pewien program komputerowy. Przez decydenta należy rozumieć sterownik urządzenia lub (pod)program komputerowy. Na podstawie stanu systemu generuje on decyzje, którymi na ten system oddziałuje, np. powoduje podejmowanie przez urządzenie pewnych działań. Problem polega na tym, że nie można z góry zdefiniować dobrych reguł decyzyjnych dla decydenta z jednego lub kilku spośród następujących powodów:

  • Dynamika systemu jest nieznana czyli nie wiadomo w jaki sposób na jego stan wypływają aplikowane decyzje,

  • Dynamika systemu jest znana w sposób niepełny/niedokładny,

  • Dynamika systemu jest na tyle skomplikowana, że projektowanie decydenta staje się bardzo kosztowne.


Narzucającym się w takiej sytuacji rozwiązaniem jest wyposażenie decydenta w możliwość adaptacji lub uczenia się na podstawie interakcji z systemem dynamicznym.

Ostatnim elementem powyższego schematu jest arbiter. Spełnia on dwie funkcje. Po pierwsze stanowi interfejs między parą decydent – system dynamiczny a człowiekiem, który jest użytkownikiem tej pary. Po drugie, arbiter ocenia skutki działania decydenta. Zwykłe zadanie decydenta, polega na tym, aby w sekwencji decyzji osiągnąć pewne cele. Arbiter nie musi wiedzieć jakie decyzje prowadzą do tego celu ale musi umieć rozpoznawać moment, w którym cel zostaje osiągnięty.

Spis treści

  1. Wprowadzenie

    1. Przykłady zagadnień, w których pojawia się potrzeba adaptacji i uczenia się

    2. Cel skryptu i poruszane zagadnienia

    3. Trzy dziedziny składające się na zawartość skryptu

    4. Adaptacja i uczenie się jako droga do inteligentnego zachowania się maszyn i programów


Aproksymacja funkcji i podstawowe mechanizmy adaptacji

  1. Liniowa aproksymacja funkcji

    1. Aproksymatory i zagadnienie aproksymacji

    2. Aproksymacja liniowa i rekurencyjne najmniejsze kwadraty

    3. Własności statystyczne rekurencyjnych najmniejszych kwadratów


  1. Nieliniowa aproksymacja funkcji i sieci neuronowe

    1. Perceptron wielowarstwowy

    2. Iteracyjna optymalizacja i aproksymacja stochastycznej

    3. Uczenie się przy użyciu aproksymacji stochastycznej

    4. Zagadnienie dostrajania parametru kroku

    5. Zagadnienia praktyczne związane z używaniem sieci neuronowych w systemach uczących się


Uczenie się przez wzmacnianie

  1. Podstawy

    1. Proces Decyzyjny Markowa

    2. Algorytmy Q-Learning i SARSA

    3. Rozszerzenie algorytmów Q-Learning i sarsa do ciągłych przestrzeni stanów i decyzji


  1. Optymalizacja stochastycznego wyboru

    1. Parametryzowane rozkłady prawdopodobieństwa

    2. Algorytm REINFORCE punktowy

    3. Stacjonarna polityka decyzyjna

    4. Algorytm REINFORCE statyczny

    5. Algorytm REINFORCE epizodyczny


  1. Algorytm Aktor – Krytyk

    1. Aktor i Krytyk

    2. TD (λ)


  1. Aktor – Krytyk z kompatybilną aproksymacją

    1. Optymalizacja średniej nagrody

    2. Gradient polityki

    3. Aktor – Krytyk z kompatybilną aproksymacją

    4. Naturalny Aktor – Krytyk

    5. Dyskonto: ograniczenie wariancji estymatora gradientu


  1. Wielokrotne przetwarzanie obserwacji

    1. Algorytm Q-Learning z powtarzaniem doświadczenia

    2. Próbkowanie ważnościowe

    3. Algorytm Aktor – Krytyk z powtarzaniem doświadczenia

    4. Optymalizacja estymatora wskaźnika jakości


Sterowanie adaptacyjne

  1. Obiekty dynamiczne

    1. Wstęp

    2. Liniowe obiekty SISO

    3. Dyskretna aproksymacja obiektów o ciągłej dynamice


  1. Stabilność i funkcja Lapunowa

    1. Ogólna postać typowego schematu adaptacji

    2. Stabilność

    3. Funkcja Lagunowa

    4. Stabilność w kontekście funkcji Lagunowa


  1. Schematy adaptacji dla obiektów liniowych z obserwowalnym stanem

    1. Liniowy obiekt SISO pierwszego rzędu

    2. Uogólnienie

    3. Obiekty liniowe wyższych rzędów


  1. Zaawansowane schematy adaptacji

    1. Obiekty o nieliniowej dynamice

    2. Obiekty z nieobserowalnymi pochodnymi stanu


  1. Samostrojące się regulatory

    1. Dynamika liniowo parametryzowana

    2. Liniowe najmniejsze kwadraty w czasie ciągłym

    3. Najmniejsze kwadraty z wykładniczym zapominaniem

    4. Adaptacyjny dobór współczynnika zapominania


Synteza

  1. Pozostałe podejścia

    1. Stochastyczne sterowanie adaptacyjne

    2. Aproksymowane programowanie dynamiczne


  1. Podsumowanie

    1. Uczenie się przez wzmacnianie

    2. Sterownie adaptacyjne


Dodatek


A Probabilistyka


B Dowody

Galeria
Opinia o książce
Ocena
Inni klienci kupujący ten produkt zakupili również
Kulesza Zbigniew Sławomir, Mystkowski Arkadiusz, Siemieniako Franciszek
1. WSTĘPNE INFORMACJE DOTYCZĄCE PROGRAMU MATLAB I SIMULINK 2. PRZYKŁADY SYMULACJI ELEMENTÓW I UKŁADÓW AUTOMATYKI 3. ĆWICZENIA DO SAMODZIELNEGO ROZWIĄZANIA 4. ZADANIA KONTROLNE
Domachowski Zygfryd, Ghaemi M. Hossein
Układy automatyki zastosowane w okrętownictwie w ogólnym pojęciu nie różnią się od innych układów automatyki. Specyfika tej dziedziny automatyki wiąże się jednak ze środowiskiem, w którym okrętowe układy automatyki działają, ponieważ warunki otoczenia morskiego zdecydowanie różnią się od warunków panujących na lądzie lub w powietrzu. Wraz z rozwojem automatyki i jej zastosowania w różnych obszarach techniki, a także potrzeb opracowania zdalnych, autonomicznych...
Celmerowski Andrzej
W skrypcie omówiono podstawowe zagadnienia modelowania i stymulacji układów, ze szczególnym uwzględnieniem układów technicznych. Główny nacisk położono na techniki budowy modeli, świadomie ograniczając się do układów dyskretnych.
Giergiel Józef, Szybicki Dariusz
Podręcznik System Lima w robotyce obejmuje część wykładów oraz ćwiczeń laboratoryjnych. Podręcznik jest opracowany na podstawie własnych badań oraz prac przejściowych i dyplomowych prowadzonych przez autorów na kie¬runkach: automatyka i robotyka oraz mechatronika studiów stacjonarnych na wydziałach mechanicznych.
Zapytaj o szczegóły
Imię i nazwisko:
E-mail:
Twoje pytanie:
Wpisz kod widoczny na obrazku:
weryfikator
Informacje
Przechowalnia - Pamiętaj

Podgląd ulubionych książek
PRZECHOWALNIA


Koszyk
Twój koszyk jest pusty
Bezpieczeństwo danych - SSL

Strona chroniona
certyfikatem SSL

Zabezpiecza CERTUM

Najczęściej oglądane
31,00 zł
56,00 zł
32,00 zł
97,00 zł
40,00 zł
37,00 zł
34,50 zł
20,00 zł
23,00 zł
29,00 zł
31,00 zł
14,00 zł
98,00 zł
20928582
księgarnia techniczna | podręczniki akademickie | podstawy konstrukcji | polsl | politechnika świętokrzyska | mechatronika | wykłady | politechnika warszawska

| Lose Klamm | Odżywki, suplementy | Centrum Reklamy i Informacji | antykwariat internetowy |

PolskaStrefa - rozwiązania dla sklepów internetowych Ogłoszenia

© Księgarnia Techniczna. Wszelkie Prawa Zastrzeżone. All Rights Reserved.