dizertační práce

Využití opakovaně posilovaného učení pro řízení čtyřnohého robotu

Text práce 7.26 MB Příloha 25.85 MB Teze 2.02 MB

Autor práce: Ing. Vít Ondroušek, Ph.D.

Ak. rok: 2011/2012

Vedoucí: prof. RNDr. Ing. Tomáš Březina, CSc.

Oponenti: Oponent bude zobrazen po zveřejnění jeho hodnocení.

Abstrakt:

Disertační práce je zaměřena na využití opakovaně posilovaného učení pro řízení chůze čtyřnohého robotu. Hlavním cílem je předložení adaptivního řídicího systému kráčivého robotu, který budem schopen plánovat jeho chůzi pomocí algoritmu Q-učení. Tohoto cíle je dosaženo komplexním návrhem třívrstvé architektury založené na paradigmatu DEDS. Předkládané řešení je vystavěno na návrhu množiny elementárních reaktivních chování. Prostřednictvím simultáních aktivací těchto elementů je vyvozena množina kompozitních řídicích členů. Obě množiny zákonů řízení jsou schopny operovat nejen na rovinném, ale i v členitém terénu. Díky vhodné diskretizaci spojitého stavového prostoru je sestaven model všechn možných chování robotu pod vlivem aktivací uvedených základních i složených řídicích členů. Tento model chování je využit pro nalezení optimálních strategií řízení robotu prostřednictvím schématu Q-učení. Schopnost řídicí jednotky je ukázána na řešení tří komplexních úloh: rotace robotu, chůze robotu v přímém směru a chůze po nakloněné rovině. Tyto úlohy jsou řešeny prostřednictvím prostorových dynamických simulací čtyřnohého kráčivého robotu se třemi stupni volnosti na každou z noh. Výsledné styly chůze jsou vyhodnoceny pomocí kvantitativních standardizovaných ukazatelů. Součástí práce jsou videozáznamy verifikačních experimentů ukazující činnost elementárních a kompozitních řídicích členů a  výsledné naučené styly chůze robotu.

Klíčová slova:

kráčivý robot, kráčivá chůze, Q-učení, posilované učení

Termín obhajoby

26.9.2011

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znakmkaPznamka

Průběh obhajoby

Téma DP a použité metody řešení náleží mezi zcela soudobou problematiku teorie řízení inteligentních robotů. Navržená možnost řízení využitím posilovaného učení byla optimalizována na chůzi čtyřnohého robotu a ověřena na modelu 3 režimů chůze na základě vypracování SW zabezpečení dynamických simulací kráčení pro různé způsoby chůze.

Jazyk práce

čeština

Fakulta

Ústav

Studijní obor

Inženýrská mechanika (D-IME)