Klára Ponczová, 29. 12. 20
Jednou z nejzásadnějších překážek, které stojí v cestě masivnímu rozšíření robotů, je jejich neschopnost rychle se přizpůsobovat novým podmínkám. Stačí vyměnit povrch za takový, na který nejsou zvyklí a… spadnou. To se však možná už brzy změní! Díky novému přístupu k jejich učení, díky kterému mezi sebou dokáží předem naprogramované expertní dovednosti vhodně kombinovat. To jim umožní zvládat pohyb po nejrůznějších površích a překonávat i nenaučené překážky.
Ať už jde o montování aut nebo hraní stolního tenisu, roboti umístění do dobře připraveného prostředí, nás lidi dovedou svými dovednostmi v ledasčem porazit. Ale hoďte jim jinak zakřivený míček, než na jaký jsou naprogramovaní a budou… nahraní. Stačí se podívat na některou z úsměvných kompilací, ve kterých se nejšpičkovější světoví roboti kácí k zemi, když jsou vystaveni pro ně dosud nepřekonatelným překážkám, jako je písek, schody nebo práh u dveří.
Nenaprogramoval si? Pak neumím.
Důvodem, proč by v dnešním světě plném neočekávaných překážek současní roboti daleko nedošli, je ten, že algoritmy, které je ovládají, jsou designovány ručně. Když pak musí řešit situaci, se kterou designér nepočítal, což je v běžném provozu prakticky běžná věc, nemají k dispozici žádný nástroj, pomocí kterého by na ni mohli adekvátně zareagovat.
Rychlý vývoj umělé inteligence (AI) však nabízí potenciální řešení. Totiž nechat roboty naučit se překážky samy překonávat spíš než spoléhat na ručně kódované pokyny. Obzvláště slibně se tváří přístup takzvaného "hluboko posilovaného učení“ kdy robot interaguje se svým okolí prostřednictvím metody pokus omyl a je odměňován za provádění správných akcí. Po několika opakováních pak dokáže pomocí této zpětné vazby zjistit, jak dokázat daný úkol sám splnit.
Potřeba enormního množství dat
Jenže takový přístup vyžaduje zpracování ohromného množství dat ke splnění sebejednoduššího úkolu. A většina úkolů, ke kterým bychom roboty chtěli v budoucnu používat, zahrnuje takových úkolů desítky ne-li stovky. Jenom k obyčejnému doručení balíčku je potřeba naučit se, jak objekt uchopit, zvednout, jak se pohybovat, vyznat se v ulicích a nakonec balíček někomu předat… a to je jen základní výčet. Učení robota všem těmto dílčím úkonům současně je nesmírně složité a daleko tomu co zvládne většina současných AI systémů.
Proto se většina experimentů zaměřených na vývoj robotů věnuje spíše jejich zdokonalování v jedné konkrétní dovednosti než jejich učení. Někteří se samozřejmě pokusili vytrénovat AI v několika dovednostech a poté použít zastřešující systém, který by mi mezi těmito expertními subsystémy uměl přepínat. Jenže pořád šlo jen o připravené dovednostní kombinace naprogramované k řešení známých výzev, ne takové, které by samy zvládly čelit výzvám novým.
Vědět, co kdy použít a jak to zkombinovat
Na základě těchto výzkumů však vědci nyní vytvořili nový systém umělé inteligence, který mezi sebou dovede propojit expertní subsystémy designované k plnění specifických úloh.
Autoři tento přístup zjednodušeně přirovnávají k učení se, jak hrát fotbal. Začnete tím, že se naučíte jednotlivé dovednosti jako je driblování, přihrávka nebo střelba. Jakmile je zvládnete, můžete je pak chytře kombinovat, abyste zvládali dynamičtější situace ve skutečné hře.
Této technice strojového učení se odborně říká multi-expertní architektura učení (MELA) a spočívá v dvoustupňovém přístupu k tréninku. Vědci nejprve použili počítačovou simulaci k trénování dvou neuronových sítí k provádění dvou oddělených úkonů: klusu a zotavení se z pádu. Následně použily naučené modely těchto dvou sítí jako základ pro osm dalších neuronových sítí zaměřených na konkrétnější motorické dovednosti, jako je převrácení se nebo otočení doleva či doprava. Těchto osm „expertních sítí“ bylo rozvíjeno současně s „vstupní sítí“, která je učena tomu, aby dokázala tyto expertní dovednosti vhodně kombinovat k vyřešení výzvy. Vstupní síť tedy expertní dovednosti spíš syntetizovala, než aby mezi nimi jednotlivě přepínala.
Čtyřnohý robot
Po procvičování algoritmu v simulaci jej vědci nahráli do čtyřnohého robota a podrobili testu jak uvnitř, tak venku. Robot, který vypadá trochu jako přerostlý brouk, se dokázal rychle přizpůsobovat obtížným povrchům, jako je štěrk nebo oblázky a dobře se vyrovnával s tím, když byl opakovaně shazován a vždy se postavil zpátky na nohy.
Ještě potrvá, než se tento přístup bude dát použít pro komerčně využitelné roboty. V rámci multi-expertní architektury učení v současné době nelze do robota zaintegrovat vizuální vnímání nebo schopnost doteku. Celá architektura se jednoduše spoléhá pouze na zpětnou vazbu z kloubů robota, které jí dají vědět, co se kolem něj děje.
I přesto však tento nový přístup k robotickému učení ukazuje na slibný způsob, jak z multi-expertních robotů udělat víc než jen součet jejich jednotlivých dovedností. Takže to vypadá, že nás smích nad jejich neohrabaností, brzy přejde.
Tento článek je chráněn pomocí blockchainové služby Mytitle.