Skupina Speech@FIT dosáhla v minulých týdnech významného úspěchu. Její systém pro automatickou identifikaci jazyka (language identification - LID) se v NIST-evaluacích NIST-LRE-2005 umístil jako druhý v kategorii 30-sekundových řečových segmentů a byl nejlepší ve kategoriích 10- a 3-sekundových segmentů v konkurenci 12 průmyslových a akademických laboratoří z celého světa. Úkolem LID je detekovat, v jakém jazyce byl namluven určitý řečový segment. Tuto technologii lze v komerční sféře použít např. pro přepínání hovorů na operátory v call-centrech, tísňová čísla a podobně. Její hlavní využití je ovšem v bezpečnostní oblasti.
Systém vytvořený členy Speech@FIT - Pavlem Matějkou, Lukášem Burgetem a Petrem Schwarzem - kombinuje dva přístupy známé v literatuře jako akustický a fonotaktický:Akustická LID určuje příslušnost k jazyku přímo na základě parametrů odvozených z řečového signálu. Pro NIST evaluaci vylepšila naše skupina existující technologie o diskriminativní trénování akustických modelů, které zlepšuje separaci mezi jazyky.
Fonotaktická LID je založena na před-zpracování řeči pomocí fonémového rozpoznávače - ten ji přepíše na řetězec nebo orientovaný graf s fonémy. Na těchto jsou pak trénovány "jazykové" modely (language models - LM) zachycující statistiky výskytu dvojic a trojic fonémů. Naše skupina v této oblasti jako první použila tzv. anti-modelů, které rovněž zpřesňují diskriminaci mezi cílovými jazyky.
NIST (National Institute of Standards and Technology), který je agenturou vlády USA, pořádá každoročně evaluace různých technologií zpracování řeči jako je rozpoznávání, identifikace mluvčího, strojový překlad, atd. Před evaluací je známa pouze metodologie vyhodnocení výsledků, v některých případech je k disposici tzv. "development" data-set, na kterém mají participující laboratoře možnost ověřit si své algoritmy. Vlastní evaluace probíhá v přesně daném čase (obvykle 2 týdny), na jehož začátku obdrží participanti Fedexem neznámá data, do konce soutěžního období pak musí odeslat do NIST výsledky. NIST je pak vyhodnotí a následuje workshop konaný v USA, kde jsou vyhlášeny výsledky a diskutovány technologie použité v jednotlivých systémech.
Letošní NIST-LRE evaluace byla první, které se skupina Speech@FIT zúčastnila sama za sebe (v letošním roce jsme se ještě účastnili evaluací systémů pro rozpoznávání meetingů, to však bylo společně s partnery projektu AMI). Máme radost, že tato první samostatná účast FITu v NIST evaluacích byla korunována úspěchem. Děkujeme všem, kteří Pavla Matějku, Lukáše Burgeta a Petra Schwarze v "bezespánkových 14 dnech" (24/10-7/11) podporovali.
http://www.fit.vutbr.cz