Výzkumní pracovníci z Ústavu formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy se do pomoci uprchlíkům z válkou zmítané Ukrajiny zapojili po svém a v rekordním čase vyvinuli automatický překladač mezi češtinou a ukrajinštinou. Ten je veřejně přístupný, jeho cílem je pomoci překonat jazykovou bariéru a usnadnit vzájemný kontakt.
Překladač je výsledkem hackathonu, který se uskutečnil před několika dny. Cílem bylo vyvinout rychle potřebný nástroj, jenž by ukrajinským uprchlíkům umožnil komunikovat s českou státní správou, tuzemskými ubytovateli, školami či třeba potenciálními zaměstnavateli. Hackathonu se účastnili výzkumníci z matfyzu a desítka externistů. Z jejich úsilí nakonec vzešla zjednodušená webová stránka, která umožňuje automatický překlad textu z ukrajinštiny do češtiny i obráceně.
„Předběžné výsledky testů ukazují, že kvalita ukrajinsko-českého překladu je vyšší než například u systému Google Translate, a to zejména díky novým metodám strojového učení, které původně vznikly pro česko-anglický překlad,“ tvrdí tvůrci česko-ukrajinského překladače. Další výhodou pražského systému je, že na rozdíl od jiných volně dostupných online systémů nepoužívá angličtinu jako mezikrok, ale překládá mezi češtinou a ukrajinštinou přímo.
Uživatelé překladače jsou také osloveni, zda souhlasí, aby jejich text byl anonymně uložen v Ústavu formální a aplikované lingvistiky, a posloužil tak k dalšímu zdokonalení sytému překladu mezi češtinou a ukrajinštinou.
Ústav formální a aplikované lingvistiky se zabývá strojovým překladem již více než 50 let. Za tu dobu se postupně měnily metody a přístupy, překlad byl vylepšen pomocí tzv. neuronových sítí. Tento poslední model překladu se nazývá CUBBITT a je dostupný pro několik dvojic jazyků ve výzkumné infrastruktuře LINDAT/CLARIAH-CZ pro výzkumníky, firmy i veřejnost. V současné době se pracuje na sběru dat i pro další jazyky a zároveň na nových metodách tak, aby se kvalita překladu i nadále zlepšovala.