20 Červenec 2005

xerox.jpgSmysluplná konverzace s roboty či palubním počítačem, která byla desetiletí jedním ze základních prvků literatury science fiction, se stává skutečnostní díky spolupráci vědců z Amesova výzkumného centra NASA a odborníků společnosti Xerox. Koncem června vyústila spolupráce NASA a Xeroxu v představení pokročilého systému pro hlasové ovládání počítačových systémů na 25. výročním setkání Asociace pro počítačovou lingvistiku. Cílem systému, který nese označení Clarissa, je usnadnit astronautům jejich každodenní pracovní úkoly na palubě International Space Station (ISS).

„Clarissa je plně hlasem ovládaný virtuální asistent posádky, který astronautům umožňuje plně se věnovat zadaným úkolům za pomoci hlasových příkazů,“ představuje Clarissu Beth Ann Hockey, vedoucí týmu, který tento systém v laboratořích Amesova výzkumného centra vyvíjí.

Astronauti během svého pobytu na Mezinárodní vesmírné stanici vykonávají přibližně 12 000 úkonů, které zahrnují například údržbu systémů pro podporu života, kontrolu skafandrů, vědecké experimenty nebo pravidelné zdravotní prohlídky. Clarissa přitom reaguje na hlasové povely členů posádky a nahlas předčítá instrukce potřebné pro bezchybné plnění připravených úkolů.

„Jen si zkuste provést analýzu vzorku vody za současného sledování podrobného manuálu na počítačové obrazovce, když se vznášíte v mikrogravitačním poli,“ upozorňuje na problémy pobytu ve vesmíru astronaut Michael Fincke, který se nedávno vrátil z šestiměsíčního pobytu na ISS. „Možnost mluvit na počítač, naslouchat podrobným instrukcím a mít volné ruce pro plnění potřebných úkolů nám poskytne komfort srovnatelný s přítomností dalšího člena posádky.“

NASA jako základní požadavek na hlasem ovládaný počítačový systém vesmírné stanice označila jeho neustálou připravenost přijímat a reagovat na povely. Původní verze Clarissy se pokoušela zpracovat veškerou komunikaci v prostoru vesmírné stanice včetně rozhovorů mezi jednotlivými členy posádky, ale tento přístup vedl k problémům při rozlišování mezi skutečnými příkazy směřujícími k palubnímu počítači a běžnou konverzací.

NASA se proto v roce 2004 obrátila na Jeana-Michela Renderse z evropské vývojové laboratoře Xeroxu s návrhem možné spolupráce na řešení tohoto problému. Zástupci NASA přitom doufali, že zkušenost Xeroxu se strojovým učením, lingvistikou a zpracováním textu pomohou zvýšit přesnost systému Clarissa při rozpoznávání příkazů v rámci sledování všech hlasových projevů astronautů.

„NASA si přála systém, který bude připraven reagovat na příkazy bez toho, aby musel být aktivován nějakým speciálním klíčovým slovem,“ vysvětluje Renders. „Proto nebylo možné využít „startrekovského“ řešení v podobě oslovení systému specifickým výrazem před zadáním příkazu. Museli jsme vylepšit schopnost systému automaticky rozlišovat mezi příkazy a konverzací.“

Technologie, kterou Renders použil pro splnění požadavků NASA, je také používána v Xeroxu pro zvýšenou přesnost kategorizace výsledků při rozpoznávání obsahu tištěných dokumentů a textových souborů. Technologie Xeroxu umožňuje systému Clarissa přesněji analyzovat každou větu. Clarrisa umí rozpoznat jednotlivá slova, ale také kompletní věty a slova v kontextu a dokáže reagovat na velké množství příkazů vyjádřených různým způsobem. Celý systém rozpoznávání řeči nyní zpracovává jednotlivá slova ve větě, definuje pravděpodobnost, podle které jsou jednotlivý slova správně identifikována, a následně aplikuje složitý algoritmus se schopností učit se na základě již získaných informací. Tento algoritmus vyhodnocuje jednotlivé fragmenty komunikace a rozhoduje, zda jde nebo nejde o příkaz podobně, jako antispamové systémy rozhodují, zda jde o legitimní zprávy nebo nevyžádanou reklamní poštu. Tento přístup výrazně zvyšuje schopnost systému odhalit rozdíl mezi příkazy zadávanými systému a běžnou komunikací uživatelů tohoto systému.

Vylepšení, která do Clarissy implementoval Xerox, podle Renderse snížila chybovost systému o více než polovinu. Clarissa v aktuálním stádiu vývoje podporuje rozpoznání 75 různých příkazů, které mohou být zadány prostřednictvím 260 slov. V plánu je další rozšiřování počtu dostupných příkazů a slovníku výrazů, na které Clarissa umí reagovat. „Některé příkazy jsou opravdu jednoduché, ale další jsou naopak poměrně složité,“ vysvětluje vedoucí projektu v laboratořích NASA Beth Ann Hockey. „Často jen řeknete ‚další‘ nebo ‚přejdi na krok osm‘. Ale někdy také potřebujete říct něco jako ‚v 10:25 zruš nastavený alarm‘ nebo ‚přejdi na ověřovací režim u kroků tři až čtrnáct‘.“

„Spolupráce s Xeroxem na vývoji systému Clarissa ukazuje výhody, které nabízí partnerství mezi výzkumnými ústavy,“ dodává Beth Ann Hockey, vedoucí vývojového týmu NASA. První využití systému ve vesmíru se odehrálo 27. června, kdy výcvik se systémem Clarissa absolvoval na palubě Mezinárodní vesmírné stanice astronaut John Phillips. Test systému byl úspěšný a nyní probíhá jeho vyhodnocování pracovníky NASA, kteří rozhodnou o harmonogramu implementace hlasově ovládaného počítačového systému do běžného vybavení ISS a dalších projektů.