To si takhle dávám dohromady samply a zvuky pro svůj další scratchovací soubor, se kterým si pak na gramofonech vydržím blbnout celé týdny a potřeboval bych ještě několik těch libozvučných robotických hlasů, jaké používali například U96 ve svém hitu Das Boot. Původně jsem si chtěl ty robotické hlášky jako „1 2 3 techno„, „emergency„, nebo „system activated“ vystříhat přímo ze skladby, ale byly by tam slyšet také melodie a beaty na pozadí, což nepotřebuji.
Přeci nemůže být takový problém si v dnešní době vygenerovat svoje vlastní hlasové vzorky, když je všude tolik hardwarových syntetizérů, vocodérů, programů, plug-inů a aplikací pro vytváření hlasové syntézy. Už i na starém 8-mi bitovém ZX Spectru jsem míval program Kecálek ne nepodobný tomu z Rumburaka (KCK 4 bylo ZX Spectrum převlečené za sálový počítač, jen to HUBERO KORORO daboval skutečný člověk), který takovou hlasovou syntézu s charakteristickým robotickým zabarvením skvěle zvládal. Dokonce i vybrané produkty od Microsoftu disponují předčítáním textu a ve svém počítači jistě najdete nějaký takový program, možná o tom ani nevíte. V repozitáři Linxu se mi nabízí hned několik takových aplikací a pro Windows jich bude od dalších vývojářů jistě několikanásobně více. Stačí se jen správně zeptat svého oblíbeného vyhledávače.
Co když ale nechci nic kupovat, stahovat, instalovat a nastavovat? Vždyť online nástrojů pro hlasovou syntézu (voice synthesis) musí být strašná spousta. A taky že je, jenže je tu takový menší problém.
Respektive z pokroku se stal problém.
Některé syntetické hlasy jsou už dnes tak věrné a uvěřitelné, že když hledáte takový robotický 20 let starý hlas, jako od zmiňovaných U96, tak narazíte.
Dnešní hlasové syntetizátory dokáží generovat mužský, ženský i dětský hlas nejrůznějších tónin, rychlostí, zabarvení i přízvuků. Některé aplikace na věrnosti a srozumitelnosti umělého hlasu dbají dokonce tolik, že úplně zapomněli na staré romantické computerické chrapláky. Je to pochopitelné, protože tyto aplikace slouží hlavně pro zrakově postižené a hendikepované uživatele, kteří se čtením textu na obrazovce mají problém a nechávají si vybraný text předčítat počítačem. Tady na dokonalé výslovnosti a srozumitelnosti stojí a padá celá aplikace.
A co když ještě vidím a slyším docela dobře a chci si jen vygenerovat několik robotických vět pro pobavení a vlastní potřebu? S takto nenáročným požadavkem mi jistě postačí i nějaká online zkušební verze. Zde se vesměs u každé aplikace jedná o funkční a v něčem částečně omezené demo. Pro komplexnější a pokročilejší softwarové řešení je potřeba některý z nabízených programů zakoupit.
Pojďme se tedy podívat, co nám internet v oblasti free aplikací a nástrojů pro hlasovou syntézu nabízí:
Demo Cepstral Voices – Cepstral® se nezabývají ničím jiným, než hlasovými bankami, zařízeními a udělátky v nejrůznějších jazycích a zvukových podobách. Na jejich stránkách si můžete vyzkoušet toto online demo, které vámi zadaný text přeříká některý z dvou desítek typů hlasů, zvolit si můžete rychlost předčítání, tóninu i aplikovat efekt, který obsahuje i robotické zabarvení, ale stále to není to, co hledám.
IVONA Text-to-Speech – Další syntetické hlasy, které jsou tak věrné, že u některých vět můžete nabýt dojmu, že to mluví skutečný člověk a že jednotlivé nahrané hlásky z vaší věty neposkládal počítač, ale že na druhé straně sedí živý speaker. Robotický efekt se ale opět nekoná.
Acapela Text to Speech Demo – Acapela je docela slušná sbírka mnoha světových jazyků v ucházející kvalitě. Nesmí mezi nimi chybět ani naše kvalitní česká Eliška.
AT&T Labs Natural Voices® – Text-to-Speech Demo je další hlasové demo nabízející vedle UK a US angličtiny také německé, francouzské a italské hlasy. Syntéza mívá problémy s výslovností u některých slov a celkově působí trochu uměle, přesto ani zde ten pořádný robotický hlas nenajdete.
Festival Text-to-Speech – Rozšířená verze známých a docela kvalitních hlasových syntéz. Opět si můžete vybrat ze ženských nebo mužských hlasů se skotským, anglickým, nebo americkým přízvukem, roboty tu bohužel také nevedou.
Oddcast – Pravděpodobně nejosobitější Text-to-Speech demo, na které jsem narazil a navíc umí i hlas české Zuzany. Při správném kombinování dostupných hlasů a efektů můžete získat třeba hlas podobný GLaDOS z hry Portal, nebo při troše fantazie i hlas Nanosuit z Crysis.
ReadTheWords.com – Další personifikovaná featura pro předčítání textu. Bohužel zdarma jsou k dispozici pouze jeden mužský a jeden ženský hlas, ostatní se zpřístupní až po přihlášení.
Translate and Speak – Jedna z mála předčítacích aplikací, která vám zadaný text nejen přečte, ale i přeloží do jednoho z deseti světových jazyků. Skvělý pomocník, když se učíte například japonsky.
Podobných hlasových aplikací jsou na internetu desítky, v krátkosti už jen odkazem některé z nich, protože si jsou vesměs podobné jak hlasovými bankami, tak i intonací. Text2speech, vozme.com, případně ispeech.org, kde je potřeba registrace, ale můžete tak využít nástroj, který z článků na vašem blogu vygeneruje audio podcast… Žádná z uvedených aplikací ovšem nenabízí vytoužený robotický hlas.
Jako schopný nástroj pro moje potřeby se tváří js aplikace MARY Web Client, která ovšem zrovna ten audio výstup nemá dokonale vyřešen a momentálně vyhazuje Internal server error…
Pomalu začínám propadat zoufalství, že na internetu neexistuje online hlasová syntéza, která by byla alespoň trochu podobná té, kterou používá například Stephen Hawking. Nechci nic stahovat, instalovat, ani se nechci nikde registrovat. Chci si vygenerovat pár jednoduchých vět v angličtině robotickým hlasem, nic víc. Většina linků, které údajně vedou na další takové online aplikace, jsou nefunkční nebo vyžadují registraci. Nezbývá mi tedy nic jiného, než se spokojit s tím, co je a dodatečně si to upravit v tom, co mám (tutoriálů, jak upravit hlas např. v Audacity, je na internetu spousta).
UPDATE 2019: Nakonec tu mám přesně to, co hledám! Stačí se poohlédnout po retro webech a stránka https://simulationcorner.net/ má v seznamu retro gadgetů i tu správnou osumdesátkovou hlasovou syntézu S. A. M. – Software Automatic Mouth
Na závěr můžu dodat ještě pěkný historický přehled hlasové syntézy na blindfriendly.cz .
Hlasová syntéza je docela věda a jak sami můžete vidět (a slyšet), nabízí se skoro na každém rohu. Promlouvá k nám na každém nádraží, z telefonních automatů nebo v nejrůznějších AI palikacích a přesto jsou oldschoolové kompijutrové hlasy nedostatkovým zbožím. Znovu se tak potvrzuje, že při honbě za technicky dokonalými a moderními vynálezy se zapomíná na staré a dobré zařízení, které sice technicky nejsou na špici a leckdo by se nad nimi dnes pousmál, ale zpravidla slouží mnohem lépe a efektivněji, než ty nejnovější krámy, které mají x nových funkcí navíc a vlastně je ani nepotřebujeme…
Hodně zajímavý, díky.
Ta IVONA je dokonalá… téměř.
Tady ještě nedávno fungovala obstojná syntéza řeči v češtině s libovolnou délkou textu.. bohužel služba poslední dobou nefunguje jak dřív a zvukové výstupy se mě nepřehrávají.
Každopádně díky za seznam! Bude se hodit
Super článek, ale jak je to s programy, které umí číst text česky?
Děkuji Mirka
Co se týká češtiny prozatím jsem nenašel kvalitnější než-li je CIT reader… Až na tu cenu, super :-)
..hele, narazil jsem na tenhle článek náhodou, bažíc víceméně po tom samým co Ty, ale z jinejch důvodů, to co jsem hledal jsem tady sice nenašel, nicméně k tomu Tomu tvýmu kýženýmu robotickýmu hlasu – stačí jakákoliv zadarmiko demoverze FL Studia od verze 9 vejš – neumožní Ti to sice ukládat projekty, nicméně exportovat mp3, wavky a tak dále jo (a doufat, že Ti to v průběhu práce nespadne :) …prostě tu výchozí zvukovou stopu dragneš na časovou osu, a pak už na ní jen zkusmo aplikuješ jeden z desítek zvukovejch filtrů a dalších desítek jeich presetů, a vážně se královsky bavíš – když v tom chvíli povrtáš, můžou z toho vylýzt FAKT nehorázný hovaďárny, a robotickej hlas je to nejmenší :D ..hlavní výhodou je, že FLko je dělaný fakt pro lamy, a já třeba lama jsem, přesto v něm úspěšně už mnoho let plnohodnotně zvučím svoji regulerní kapelu (která je paradoxně hardcorová, takže žádná electrovoicy fakt nepotřebuju) – a to, že to nevylezlo z regulerního studia bys na výslednejch nahrávkách fakt nepoznal…ono teda FLko i samo o sobě obsahuje nějakej vlastní „text to speech“, ale ten je celkem na houby – zní to jak z dob ZX Spectra…doporučil bych samozřejmě placenou verzi, kterou používám já – potom si tam samozřejmě nahraješ cokoliv, jakkoliv potřebuješ a uděláš si s tím cokoliv potřebuješ…pořád zastávám názor, že reálnej hlas je reálnej hlas a ještě chvíli ho nic nenahradí :)
..jo, teď koukám, že odpovídám na topic starej pět let, no nic :)
To ničemu nevadí. Dík za názor. V článku se ale řeší aplikace na internetu, tedy ty, které nemusíš instalovat do svého počítače a můžeš je užívat téměř kdekoli…