Porovnání automatických generátorů titulků - buďte bezbariéroví

Je velké usnadnění práce, nechat si titulky k videu na Youtube a dalších sítích, komplet vygenerovat umělou inteligencí, avšak zatím to titulky moc nejsou. Spíše se získá text bez psaní, z něhož je třeba titulky vyrobit ručně.

---začátek osvěty---
Podle mě není možné, vžít se do situace člověka s postižením, pokud ono postižení jeden sám nezažije. Vydržíte celý film v televizoru s vypnutým zvukem? A to je pouze 90 minut. A co třeba 20 let a jen čtení veškeré komunikace a pořadů v televizoru etc. (prostě celý den tuny textu)?

A titulky nepoužívají pouze lidé s postižením sluchu, ale hodně i ti, kteří slyší. Například je zcela běžně spuštěn televizor bez zvuku a s titulky tam, kde je hluk (hlučná restaurace, letištní hala), nebo naopak musí být ticho a zvuk televizoru/videa je vypnutý (čekárna u lékaře), nebo se nechce zvukem rušit (při jízdě MHD, případně spící v okolí), nebo nejsou zdatní v jazyce a porovnávají mluvenou a psanou formu.

Ve Velké Británii před časem proběhl průzkum agentury Ofcom, mediálního regulátora, který zjistil, že ze 7,5 milionu lidí, kteří používají televizní titulky, 6 milionů nemá vůbec žádnou poruchu sluchu."

Článek BBC z roku 2006 http://news.bbc.co.uk/2/hi/uk_news/magazine/4862652.stm---konec osvěty---

 

Mnozí autoři videí, si vůbec neuvědomují důležitost titulků. K takovým videím píši všelijaké osvětové komentáře. Ale až snad po pěti letech takového usilovného osvětového komentování, mi nedávno došlo, že i když má autor vůli své video titulky opatřit, neví jak, nebo se mu nechce (případně nemůže) přepisovat třeba 5 minut mluvy na svém výukovém videu.

Otestoval jsem tedy několik generátorů titulků, které jsou bezplatně k použití a u všech je to tak, jak jednou trefně někomu napsala Mgr. Věra Strnadová (předsedkyně odborné komise pro skryté titulky při ASNEP), když viděla čtyřřádkové „titulky“ s počtem znaků 150-230 na jednom řádku pod videem: „Výborně! Text už máte, tak ještě z něj udělat titulky.“

Největší problémy vidím dva. První v tom, že generátory jedou „doplna počet znaků na řádku“, přičemž třeba na Youtube mají v přehrávači poloviční počet a ten z toho udělá čtyřřádkový titulek. A kdyby to tak nebylo, bude mít řádek 90 znaků, což čte pouze masochista.

Tento text nemá za cíl popisovat tvorbu titulků a jejich zákonitosti, nicméně občas něco zmíním. Takže:
Počet znaků na řádku u internetových videí, maximálně 42 znaků, včetně interpunkce a mezer.

Druhý a dost závažný problém spočívá v nepřirozeném zalamování textu. Je potřeba, zalamovat za interpunkčním znaménkem, nebo před předložkami a spojkami. Rovněž je dobré dodržovat nový mluvčí = nový titulek.

A hlavně, kromě předchozího, dodržovat tzv. „větné celky“ Např. dvouslovné názvy (Velká Bíteš) na jednom řádku u sebe a nikdy na dvou (poslední a první slovo řádků). Nebo dokonce poslední slovo titulku a první slovo nového a další specifika jazyka, které tyto generátory ignorují.

Co se týče „zdatnosti“ v převodu mluvy na text, tak jsou víceméně stejné. Přijde mi to všechno, co jsem zkusil, jako od jednoho stroje („závodně lil“), jen jiný kabátek. Rozdíl je právě v přátelskosti prostředí a v možnostech nastavení. Ostatně posuďte sami. Do všech jsem dal stejné video, kde mluví tři postavy. Ale většinou je na vašem videu pouze jeden hlas a odpadá tak rozlišování postav, nebo i složitější úprava řádků. Všechny generátory udělaly víceméně stejné chyby a na 4 z nich jsem se zaměřil.

Kapwing

Ten jediný, neudělal předlouhé řádky. Nicméně stejně nejsou dobré viz třeba konec titulku „Richard“ a v dalším „Genzer“, místo u sebe.

 

generátor titulků Kapwing

Transkriptor

Má pěkné uživatelské rozhraní a poslal mi na e-mail i odkaz na stažení vygenerovaného textu“.

generátor titulků Transkriptor

VEED.IO

Titulky nejdou zdarma stáhnout v *.srt (to ani o předchozích), jde však vytvořit video s titulky „napevno“ a s vodoznakem.

generátor titulků VEED.IO

Webcaptioner

Na titulky (např. na Youtube) ho nastavit neumím. Důležité však je, že přepisuje řeč v reálném čase, takže jej používám nejvíce (u videí, podcastů, videohovorů) a právě na získání textu pro titulky.

generátor textu a titulků webcaptioner

Whisper

Opravdu velmi „sparťanská záležitost“. Ovládá se z příkazového řádku (na obrázku je vidět ten příkaz “…!whisper… …large…“), jelikož to celé jede v programovacím jazyku Python.
Ale je to celé úplně zadarmiko.

Lepší jsou však titulky

Do jakéhokoli textového editoru, vložím vygenerovaný text.

Textový editor PSPad

Nastavím si konec řádku na 42 (na obrázku sice je 44, ale 42 jsem nepřelezl). Tady platí ono „méně je více“. Rozdělím řádky a opravím chyby,

Zarážka konce řádků

spustím SubtitleEdit, naimportuji jako prostý text ze schránky.

editor titulků SubtitleEdit

Důležité je v pravé části nastavit, co s tím má SubtitleEdit udělat. Například, aby titulky opatřil časovou značkou,

editor titulků SubtitleEdit

A je to. K titulkům si nahraji video, abych to mohl zkontrolovat a případně doladit. U Dolito jsem musel označit všechny titulky (ctrl+A) a posunout jim čas o 3 vteřiny později (roletka synchronizace).

Rozlišujte mluvčí

Pokud ve videu mluví více postav, je dobré, dělat uvozovací pomlčku u dalšího mluvčího viz „–Tak ten včerejší…“) a vůbec nejlepší je, rozlišit mluvčí barvami. Používají se čtyři. Žlutá, bílá, tyrkysová a zelená,
Avšak 98 % internetových přehrávačů různé barvy mluvčích ignoruje a vše je jednou barvou, tak alespoň ty uvozovací pomlčky.
Kdybych dělal titulky k tomuto videu, udělal bych moderátora tyrkysovou, Genzera žlutou a Suchánka bílou.

———————————————
Autor článku: Ladislav Kratochvíl
zcela ohluchlý ve svých 40 letech, v roce 2003,
bezbariérové titulky,
autor a provozovatel webu zabývajícím se postižením sluchu kochlear.cz.
zakladatel a moderátor facebookové skupiny Skryté titulky – (televize, videa, DVD)redaktor portálu Helpnet (monitoring médií),
a nadšený uživatel strojového rozpoznání mluvy
(přednášky „Už vím co říkáte, i když vás neslyším“).
——————————————— 

Nominujte autora do ankety Bloger roku

Autor: Ztlumeno | pondělí 26.6.2023 7:56 | karma článku: 8,79 | přečteno: 1630x