This site uses cookies.
Some of these cookies are essential to the operation of the site,
while others help to improve your experience by providing insights into how the site is being used.
For more information, please see the ProZ.com privacy policy.
Milan Condak Local time: 19:49 anglais vers tchèque
Dec 26, 2022
Na YouTube se vyskytují česká videa zpravidla bez titulků. Existují ale výjimky. U některých videí jsou přepisy a také ručně vytvořené titulky. Výjimečně se vyskytuje přepis a titulky nejsou zapnuté.
AI (Artificial Inteligence) je nástroj na dekódování lidské řeči a jejich převod na písmo.
Vývojáři a programátoři zpravidla používají programovací jazyk Python. AI používává jazykový model, což je sada souborů. Model obsahuje buď data... See more
Na YouTube se vyskytují česká videa zpravidla bez titulků. Existují ale výjimky. U některých videí jsou přepisy a také ručně vytvořené titulky. Výjimečně se vyskytuje přepis a titulky nejsou zapnuté.
AI (Artificial Inteligence) je nástroj na dekódování lidské řeči a jejich převod na písmo.
Vývojáři a programátoři zpravidla používají programovací jazyk Python. AI používává jazykový model, což je sada souborů. Model obsahuje buď data pouze pro jeden jazyk nebo více jazyků. Modely jsou buď malé nebo velké. Malé modely fungují rychle, ale nepřesně. Když malý model potřebuje na přepis 1 jednotku času, tak největší model potřebuje 32 jednotek času.
Pro češtinu je nyní k dispozici malý model Vosk. Modely Whisper mají pět velikostí. Modely jsou buď pro angličtinu nebo pro více než sto jazyků. Vícejazyčný model obsahuje různé množství dat jednotlivých jazyků. Pro kvalitní přepis češtiny potřebuji velký a pomalý model.
Běžný uživatel používá PC s Windows, takže potřebuje SW spustitelný ve Windows a modely, které SW může využívat. SW Whisper používá tyto modely.
Uživatelům jsou k dispozici zdarma. Všechno mi fungovalo až do okamžiku, kdy jsem chtěl přepsat řeč delší než 30 minut. Chtěl jsem přepsat 47 minut. Whisper s modelem "large.bin" vytvořil 500 titulků a do zbývajících 300 titulků umístil stejný text. Zjistil jsem, že SW uloží data do souboru titulků až po ukončení procesu. Když proces zpracoval 28 minut nahrávky byla RAM 32GB z 95% plná a swapovala data na harddisk. Na dobrý přepis bych potřeboval 48GB nebo 64GB. Problém jsem vyřešil rozdělením souboru na dva menší. Místo výsledkých titulků jsem použil pro import do SE prostý text vytvořený ze dvou souborů SRT.
Jeden vývojář nabízí program Buzz, který využívá modely Whisperu. Tento autor provozuje web https://freesubtitles.ai/ . Můžete si vyzkoušet sami a nepřesnosti opravit.
Video jsem nahrál na web, vybral češtinu a model "base". Po zpracování jsem stáhl titulky ve všech dostupných formátech. Video se zobrazenými titulky jsem si mohl zobrazit.
Na webu zůstal protokol a informace a zpracovaném videu:
Aucun modérateur n'est spécifiquement affecté à ce forum Pour rapporter des violations des règles du site ou pour obtenir de l'aide, veuillez contacter l'équipe du site »
Pastey is an innovative desktop application that bridges the gap between human expertise and artificial intelligence. With intuitive keyboard shortcuts, Pastey transforms your source text into AI-powered draft translations.
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!
The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.