04 Březen 2009
T+T 1-2/2009

Vědci z Fakulty informatiky Masarykovy univerzity vyvinuli novou metodu netextového vyhledávání obrázků.

Tato technologie získala prestižní cenu IBM Shared University Research. Součástí ceny je dar v podobě hardwarového vybavení, díky němuž je demonstrační verze zpřístupněna široké veřejnosti na adrese http://mufin.fi.muni.cz/imgsearch/.

Všechny běžně používané metody vyhledávají na základě porovnávání podobnosti textových popisů, neumí však porovnávat samotné obsahy souborů. V případě obrázků, ale i audio či video souborů je vyhledávání omezeno pouze na slovní popisky a komentáře, což může výrazně snížit úspěšnost vyhledávání. Nová technologie pod názvem MUFIN (Multi-Feature Indexing Network) je založená na porovnávání obsahu datových objektů prostřednictvím jejich vlastností.
„Z obrázku vyextrahujeme určité vlastnosti, jako je barevné spektrum, textura nebo rozložení tvarů. Na základě takto analyzovaných vlastností pak program určí pro každý obrázek bod ve vícedimenzionálním prostoru a porovnává jeho vzdálenost s ostatními. Čím blíže jsou tyto body, tím podobnější si budou i k nim přiřazené obrázky,“ vysvětlil řešitel projektu Pavel Zezula z Fakulty informatiky Masarykovy univerzity.
Novou technologii je možné využít také v biologii pro hledání podobných DNA sekvencí, v oblasti biometrických měření pro porovnávání otisků prstů nebo rozpoznávání obličejů či ve zpracování geografických dat. Software lze použít také pro integraci a čištění dat, např. při vyhledávání přebytečných kopií a odhalování plagiátů.
Na vývoji této technologie pracuje tým informatiků z Masarykovy univerzity pod vedením Pavla Zezuly od roku 2004. K zásadnímu rozvoji však došlo v posledních dvou letech v rámci mezinárodního projektu vedeného Výzkumnou laboratoří IBM v Haifě.. „Spolupráce mezi Masarykovou univerzitou a společností IBM je velmi provázaná a v průběhu let vznikla řada projektů, jež významně rozšířily působnost společnosti IBM v oblasti akademické sféry v České republice. Projekt vizuálního podobnostního vyhledávání přináší jedinečnou technologii s možností široké aplikace,“ řekl Jan Kleindienst, manažer výzkumné a vývojové laboratoře řečových technologií IBM ČR.
Díky spolupráci s IBM a darovanému hardwarovému vybavení bude možné zmnohonásobit počet porovnávaných obrázků a rozšířit výzkum podobnostního hledání do dalších aplikačních oblastí.