APVV-15-0517
Automatické titulkovanie audiovizuálneho obsahu pre osoby so sluchovým postihnutím
Málokto z počujúcich ľudí si uvedomuje, že získavanie informácií z televízneho vysielania je jedným zo základných problémov skupiny osôb so sluchovým postihnutím. V súčasnosti však pre túto skupinu osôb neexistuje rovnocenný prístup k obsahu televízneho vysielania tak, ako je to v prípade počujúceho obyvateľstva. V zmysle poslednej právnej úpravy (Zákon č. 373/2013 Z.z. z 20.10.2013) je vysielateľ povinný zabezpečiť multimodálny prístup k programovej službe tak, aby v digitálnom vysielaní bolo najmenej 50% všetkých vysielaných programov sprevádzaných otvorenými alebo skrytými titulkami, ktoré korešpondujú s dejom vysielaného programu. Podobne, aj v prípade vysielateľa s licenciou to musí byť najmenej 10%. Európska federácia nedoslýchavých osôb presadzuje v krajinách EÚ myšlienku rozšíriť do roku 2020 ponuku titulkovaných programov na úroveň 100%. Dosiahnuť stanovený cieľ na Slovensku v súčasnom ponímaní titulkovania audiovizuálneho obsahu by pre vysielateľa znamenalo vynaložiť neúmerne veľa finančných prostriedkov, vzhľadom na to, že zhotovenie otvorených a skrytých titulkov podlieha namáhavému manuálnemu prepisu hovoreného slova do textu školenými pracovníkmi s následnou úpravou stanovenou požiadavkami podľa vyhlášky Ministerstva kultúry SR. Ekonomicky rentabilné môže byť použitie technológie automatického rozpoznávania plynulej reči a aplikovanie moderných princípov a metód z oblasti rečových technológií pri automatickom prepise hovoreného slova do textu. Hlavným cieľom predkladaného návrhu projektu je aplikovaný výskum v oblasti spracovania prirodzenej reči a jazyka a vývoj špeciálne prispôsobeného pilotného systému na automatické titulkovanie audiovizuálneho obsahu v slovenčine na báze automatického rozpoznávania plynulej reči s veľkým slovníkom. Výsledky predkladaného aplikovaného výskumu budú základom vývoja systémových riešení (vo forme softvérovej aplikácie alebo služby) na automatické titulkovanie audiovizuálneho obsahu v slovenskom jazyku.
Projekt rieši vysoko aktuálny problém v oblasti automatického rozpoznávania plynulej reči s veľkým slovníkom z celosvetového pohľadu s aplikáciou pre slovenský jazyk. Hlavným cieľom predkladaného návrhu projektu je aplikovaný výskum v oblasti spracovania prirodzenej reči a jazyka a vývoj špeciálne prispôsobeného systému na automatické titulkovanie audiovizuálneho obsahu v slovenčine na báze automatického rozpoznávania plynulej reči s veľkým slovníkom, ktorý je určený najmä pre osoby so sluchovým postihnutím. Nevyhnutným predpokladom pre dosiahnutie tohto cieľa je realizácia a naplnenie nasledovných špecifických cieľov projektu:
systematický zber, spracovanie a anotácia korpusu nových rečových a textových dát z hľadiska rôznorodosti rečníkov, klasifikácie témy, štýlu rečového prejavu, a vplyvu akustického prostredia, s cieľom dobudovania už existujúcich akustických a textových databáz a postupnej aktualizácie a adaptácie systému na automatické rozpoznávanie plynulej reči s veľkým slovníkom do oblasti spravodajstva a televíznych novín
návrh a implementácia systému na automatické rozpoznávanie reči umiestneného na výkonnom výpočtovom serveri s postupnou adaptáciou jeho komponentov (akustických modelov, jazykových modelov a slovníkov) pre potreby automatického titulkovania audiovizuálneho obsahu živého televízneho vysielania v slovenskom jazyku
aplikovaný výskum a implementácia pokročilých metód adaptácie akustického modelu na pohlavie a hlas rečníka a jazykového modelu na tému a štýl prejavu rečníka s možnosťou dynamickej zmeny slovníka a jeho aktualizácie na pravidelnej báze
komplexná evaluácia pomocou rôznych scenárov nasadenia systému v špecifických podmienkach simulujúcich reálne prostredie s cieľom vyhodnotiť vplyv navrhnutých metód a postupov na presnosť automatického prepisu v úlohe automatického titulkovania audiovizuálneho obsahu v slovenskom jazyku
Doterajšie dlhoročné odborné a praktické skúsenosti s vyššie spomenutými metódami, princípmi a postupmi, ktoré vyústili nielen do početných publikácií, ale aj do výskumu, návrhu a vývoja viacerých aplikácií v oblasti automatického rozpoznávania plynulej reči s veľkým slovníkom, zaručujú plynulú nadväznosť pri prechode zo základného výskumu do novej aplikačnej oblasti (spravodajstvo, diskusné relácie, šport a i.), a zároveň predurčujú riešiteľský kolektív realizovať stanovené ciele projektu v definovaných časových horizontoch podľa harmonogramu riešenia projektu. Výsledky aplikovaného výskumu budú základom vývoja systémových riešení (vo forme softvérovej aplikácie resp. služby) na automatické titulkovanie audiovizuálneho obsahu v slovenskom jazyku, poskytovaných pre osoby so sluchovým postihnutím.
Zodpovedný riešiteľ, FEI TUKE
Profesor, FEI TUKE
Odborný asistent, FEI TUKE
Odborný asistent, FEI TUKE
Odborný asistent, FEI TUKE
Výskumný pracovník, FEI TUKE
Výskumný pracovník, FEI TUKE
Výskumný pracovník, FEI TUKE
Doktorand, FEI TUKE
Doktorand, FEI TUKE
Doktorand, FEI TUKE
Spoluriešiteľ, ÚI SAVBA
Výskumný pracovník, ÚI SAVBA
Výskumný pracovník, ÚI SAVBA
Výskumný pracovník, ÚI SAVBA
Výskumný pracovník, ÚI SAVBA
Doktorand, FEL UNIZA
Docent, FF UKF Nitra