Moje třetí vlna AI- umělé inteligence - ASR Auteur du fil: Milan Condak
|
Moje třetí vlna AI- umělé inteligence
Programy AI v mém PC s MS Windows:
a) Nejprve jsem si nainstaloval Model pro rozpoznávání písma, které je obsažené v obrázcích, tj. OCR. Program se jmenuje TesserAct. (10. července 2021) Nyní jej většinou samostatně nepoužívám. Je součástí programů s vlastním grafickým uživatelským prostředím. Většinou používám v balíku PDF24.
b) potom jsem si nainstaloval strojový překladač OP... See more Moje třetí vlna AI- umělé inteligence
Programy AI v mém PC s MS Windows:
a) Nejprve jsem si nainstaloval Model pro rozpoznávání písma, které je obsažené v obrázcích, tj. OCR. Program se jmenuje TesserAct. (10. července 2021) Nyní jej většinou samostatně nepoužívám. Je součástí programů s vlastním grafickým uživatelským prostředím. Většinou používám v balíku PDF24.
b) potom jsem si nainstaloval strojový překladač OPUS-CAT pro překládání z češtiny a do češtiny v OmegaT (24. července 2021);
c) Na YouTube jsou velmi často anglické titulky. České titulky jsou pouze na některých kanálech, které spravují lidé, kteří umí titulky vytvořit.
Státní svátek 28. října 2022 jsem oslavil tím, že jsem si nainstaloval do SubtitleEdit 3.6.8 model Vosk/Kaldi pro přepis české řeči do titulků SRT. Vyzkoušel jsem na pěti stažených videích. Ještě mi zbývá otestovat Whisper, který má také položku v menu SubtitleEditu. Teoretici funkci nazývají ASR (Automatic Speech Recognition).
Milan
[Edited at 2022-10-29 10:41 GMT] ▲ Collapse | | | Milan Condak Local time: 20:26 anglais vers tchèque AUTEUR DU FIL Editace titulků se zvukem | Oct 30, 2022 |
Milan Condak wrote:
...nainstaloval do SubtitleEdit 3.6.8 model Vosk/Kaldi pro přepis české řeči do titulků SRT.
Na videa s titulky jsem se díval v prohlížeči VLC. Všechno fungovalo. Automatický přepis není dokonalý (dokonalé jsou pouze přeslechy) a když ASR ví, že nerozumí, vloží tam slůvko [unk]. Často ASR neví, že nerozumí a v textu jsou zcela nesprávná slova (jako v MT).
ASR pravděpodobně vypnulo v SubtitleEditu 3.6.8 zvuk. Pro editaci titulků se zvukem používám starší verzi SE 3.6.4.
Na přepis české řeči ve svém PC jsem čekal více než deset let. Jsem šťasten, že jsem se dočkal.
Milan | | | Milan Condak Local time: 20:26 anglais vers tchèque AUTEUR DU FIL První moje video je cizí nahrávka s automatickými českými titulky | Dec 7, 2022 |
Dnes jsem zveřejnil první video na YouTube
https://youtu.be/VDGPhdphgTA
Do videa z přednášky z roku 2019 jsem vypálil české titulky vytvořené automaticky programem Whisper s vícejazyčným modelem "large.bin". Modely Audio do textu by měly fungovat v programu Subtitle Edit.
Whisper mi zatím v mém pracovním PC nefunguje. Nepodařilo se nám zjistit proč.
... See more Dnes jsem zveřejnil první video na YouTube
https://youtu.be/VDGPhdphgTA
Do videa z přednášky z roku 2019 jsem vypálil české titulky vytvořené automaticky programem Whisper s vícejazyčným modelem "large.bin". Modely Audio do textu by měly fungovat v programu Subtitle Edit.
Whisper mi zatím v mém pracovním PC nefunguje. Nepodařilo se nám zjistit proč.
Titulky z programu Vosk jsou u této nahrávky nepoužitelné.
Milan ▲ Collapse | | | Milan Condak Local time: 20:26 anglais vers tchèque AUTEUR DU FIL Mám nové PC pro ASR a ASRPE | Dec 19, 2022 |
Milan Condak wrote:
Whisper mi zatím v mém pracovním PC nefunguje. Nepodařilo se nám zjistit proč.
Program Whisper v mém pracovním PC nefungoval, protože měl nainstalovaný processor I7 navržený v roce 2012. Program Whisper používá příkazy, které zpracovávají procesory navržené po roce 2013.
V novém PC (dnes sestaveném) mi nefungoval model large.bin, který stáhl SubtitleEdit (SE). Nahradil jsem jej dříve staženým modelem.
large.bin 3 094 623 691 07.12.2022 19:27 dříve stažený = funguje
large.bin 2 147 470 636 19.12.2022 22:22 dnes stažený z programu SubtitleEdit = nefunguje
První zkušenosti:
HUDBA - nahrál jsem na mobil dětský sbor zpívající koledy; před rozpoznáváním řeči je vhodné použít program, který ze zvuku extrahuje pouze řeč (potlačí hudbu).
HLASITOST - na základě křivky zvuku v SE je vhodné zvuk před rozpoznáváním zesílit nebo zeslabit.
Post Editace: ani přepis s modelem "large" není perfektní. Vygenerovaný SRT přejmenuji na W.SRT (přepisem programem Whisper) nebo na V.SRT (přepisem programem Vosk). Opravy ukládám do souboru CS.SRT (dělám pouze přepisy české řeči).
ASRPE = Automatic Speech Recognition Post Editing. Opravený text může být přeložen do jiných jazyků.
Milan | |
|
|
Milan Condak Local time: 20:26 anglais vers tchèque AUTEUR DU FIL Buzz pro přepis bez SubtitleEdit | Jan 7, 2023 |
Milan Condak wrote:
Post Editace: ani přepis s modelem "large" není perfektní. Vygenerovaný SRT přejmenuji na W.SRT (přepisem programem Whisper) ... programem Vosk).
Přepisy s malým modelem Vosk jsou méně přesné a již je nedělám.
Jako uživatel Windows sleduji aplikace, které fungují s Whisperem ve Windows.
a) Nejprve jsem spouštěl přepis řeči do titulků z Subtitle Editu. Proces se zastavil po dosažení 100% z 32 GB RAM.
b) Potom jsem spouštěl Whisper z příkazového řádku a v okně jsem viděl přepisovaný text. Pokud bylo v RAM nějaké místo a přepis nebyl zcela hotový, mohl jsem obsah okna zkopírovat do textového souboru a nepřepsanou část videa přepsat dodatečně.
c) Od 4. ledna používám program Buzz. Ve verzi 0.7.0 e mi podařilo stáhnout modely, se kterými Buzz pracuje.
Autor programu Buzz, David Mbugua, stejný den zveřejnil video, které jsem objevil včera.
https://www.youtube.com/watch?v=2NDwOoV62-k
What's new in Buzz v0.7.0
Video je dostatečně názorné, takže nemusím SW popisovat. Buzz má minimalistické rozhraní. Je možno přepisovat řeč, kterou snímá mikrofon nebo přepsat soubory (zvukové nebo video).
Kromě balíku SW, který má velikost 1GB je nutno stáhnout modely, které jsou přibližně stejně velké jako dříve uvedené modely. Vzhledem k horečnému vývoji a upgradům používám verzi, která se neinstaluje, ale pouze rozbalí na vybrané místo. Buzz lépe využívá RAM mého PC.
Přepsaný text je možno uložit jako TXT, SRT nebo VTT.
Milan
[Edited at 2023-01-07 23:05 GMT] | | | Milan Condak Local time: 20:26 anglais vers tchèque AUTEUR DU FIL Buzz je lépe napsaný SW | Jan 8, 2023 |
Milan Condak wrote:
Whisper mi zatím v mém pracovním PC nefunguje. Nepodařilo se nám zjistit proč.
Whisper v SubtitleEdit ani samostatné verze Whisperu pro Windows
a) nefungovaly v PC bez procesoru, který nepodporoval AVX1 a AVX2;
b) v průběhu zpracování se neuvolňovala paměť v RAM.
Buzz je jiný software, který pracuje s původními mnohojazyčnými modely pro Whisper.
Buzz funguje i v mém původním PC a v 16 GB RAM je dostatek volného místa.
Správce souborů ale vykazuje vysokou spotřebu elektrické energie, která je v novém PC v normálních mezích.
Buzz nezpracovává signál z mikrofonů připojených konektorem přes zvukovou kartu; zpracovává vstupní signál z mikrofonu webové kamery, která má USB. Určitě zpracovává signál i z jiných USB mikrofonů.
Milan | | | Aucun modérateur n'est spécifiquement affecté à ce forum Pour rapporter des violations des règles du site ou pour obtenir de l'aide, veuillez contacter l'équipe du site » Moje třetí vlna AI- umělé inteligence - ASR Anycount & Translation Office 3000 | Translation Office 3000
Translation Office 3000 is an advanced accounting tool for freelance translators and small agencies. TO3000 easily and seamlessly integrates with the business life of professional freelance translators.
More info » |
| Wordfast Pro | Translation Memory Software for Any Platform
Exclusive discount for ProZ.com users!
Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value
Buy now! » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |