Kompenzace Za Znamení Zvěrokruhu
Nastavitelnost C Celebrity

Zjistěte Kompatibilitu Znamení Zodiac

Nejlepší nástroje pro automatický přepis pro novináře

Technika A Nástroje

Siri právě bylo šest let. Alexe byly právě tři roky. Pokud se můžeme zeptat našich telefonů na počasí v Albuquerque a přinutit plastový válec v našich obývacích pokojích, aby nahlas četl Washington Post, proč stále přepisujeme rozhovory ručně?

No, ukázalo se, že vlastně ani nemusíme. Nástroje pro automatický přepis jsou na trhu již nějakou dobu a konečně jsou dobré. Nahrání zvuku nebo videa na web a získání poměrně komplexního přepisu nyní trvá jen několik minut a pár dolarů.

Ale jako všechny nástroje jsou některé lepší než jiné. Testovali jsme (nebo se pokusili otestovat – o tom později) osm nejoblíbenějších přepisovacích nástrojů zaměřených na novináře, včetně Dračí diktát , Šťastný Scribe , oPřepsat , rekordně , Rev , Sonix , Trint a YouTube. Každý nástroj jsme prošli řadou reálných scénářů a experimentovali s tím, jak si každý z nich vedl oproti běžnému použití novináře.

I když žádný z nástrojů nebyl dokonalý, jeden převyšoval ostatní jako nejlepší v kategorii.

Náš výběr
Díky kombinaci přesnosti, funkcí a snadného použití je Trint nejlepší volbou pro automatický přepis pro novináře. I když to nebyl nejpřesnější, nejbohatší ani nejlevnější nástroj, který jsme vyzkoušeli, jeho nástroje pro úpravu přepisů a schopnost zapadnout trochu hladčeji do pracovního postupu novináře mu pomáhají překonat své konkurenty. Přečtěte si proč.

Pokus
Jak uvidíte, míra přesnosti těchto nástrojů je nízká. To proto, že jsme se je ze všech sil snažili zmást.

Za prvé, abychom odráželi širokou škálu lidí, hlasů a přízvuků, nahráli jsme naši ukázku zvuku se čtyřmi účastníky. Zahrnovaly:

  • Alexios Mantzarlis , Poynterova fakulta a ředitel International Fact-Checking Network, který pochází z Říma a popsal sám sebe, jako by měl pískání a „nějaká zábavná slova, která mísí britský, italský a zvláštní americký přízvuk“
  • sladké kytice , programový manažer pro International Fact-Checking Network, který do Poynteru přišel v září z Mexico City
  • Kristen Hareová , reportérka z Poynter, která si myslí, že zní „trochu jako z údolí“, když se poslouchá na nahrávkách
  • Já, a přestože Kristen řekla, že mám „byvolí přízvuk“, myslím, že můj sklon mumlat, mluvit příliš rychle a přeskakovat části slov se pravděpodobně ukazuje jako náročnější na přepis (Nahrávání sebe sama v očekávání, že budete přepisováni, jasně vede k malému sebevědomí odraz.)

Kristen se k nám připojila přes Google Hangouts/YouTube Live ( zveřejnění: grant od Google News Lab částečně financuje mou pozici ), před kterými většina automatických přepisovacích nástrojů otevřeně varuje. Zdá se, že zvuk z telefonu nebo videochatu je pro ně obecně obtížně zvládnutelný.

Abychom algoritmy ještě více mučili, četli jsme také pasáže mnohem rychlejším tempem, než obvykle mluvíme, Dulce a Alexios mluvili různými cizími jazyky (italsky, španělsky, francouzsky a řecky), vyslovili jsme co nejvíce vlastních podstatných jmen (Apalachicola , Michael Oreskes a různé řecké ostrovy, abychom jmenovali alespoň některé, byli kreativní s Urban Dictionary (a portmanteau Paula Manaforta a hrubé slovo popisující stav jeho právní situace) a mluvili spolu s určitou frekvencí.

Nahráli jsme náš 14minutový test v Poynterově studiu webináře a byli jsme přerušeni zvukem alespoň jednoho hlasitého letadla nad námi (o pár bloků dál je letiště), zásahovým vozidlem a křikem Kristenina telefonu.

Zvuk jsme nahráli třemi způsoby:

  • S Zoom H4nPro ruční mikrofon, umístěný mezi námi
  • S mým iPhone 6S Plus, pomocí aplikace Recordly k nahrávání, umístěného vedle Zoomu
  • Se soukromým YouTube Live, a tak se k nám Kristen přidala

Poté jsme nahráli zvuk do každého nástroje a sledovali, jak dlouho každému trvalo přepis. Výsledné přepisy jsme normalizovali pomocí aplikace Microsoft Word, odstranili jsme časová razítka a zajistili, aby jména mluvčích byla shodná. Jako kontrolu jsem zvuk přepsal sám (pomocí oTranscribe) a poté jsem jej několikrát poslouchal, abych zkontroloval celkovou přesnost. Vyzkoušeli jsme také Rev, placenou službu, která spíše než algoritmy používá lidské přepisovače, abychom viděli, jak se to srovnává.

Vyzkoušeli jsme různé nástroje pro porovnávání dokumentů, abychom zjistili, který funguje nejlépe Copyscape jako nejzdravější možnost. Porovnali jsme přepisy generované nástroji a službami se 100% správným, který jsem vytvořil pomocí oTranscribe.

Několik dodatečných poznámek:

  • Zvuk ze Zoomu se ukázal jako nejkvalitnější, proto jsme jej používali pro většinu testů. Zdá se, že aplikace Recordly nepřijímá zvuk nahraný z jiných zdrojů, takže to je jedna výjimka z tohoto procesu. Také jsme nenahráli zvuk Zoom na YouTube, místo toho jsme se spoléhali na zvuk ze záznamu YouTube Live. Srovnání jablek a pomerančů činí tento experiment méně než vědeckým, ale více v souladu s tím, jak by novináři tyto nástroje skutečně používali v reálném světě.
  • Ačkoli je to populární nástroj, nemohli jsme testovat Dragon Dictation, protože nefunguje na iOS 11. Tuto recenzi aktualizujeme, jakmile a pokud jeho vývojář tento problém opraví.
  • Než jsme testovali, neoslovili jsme žádnou z těchto společností, takže nedošlo k žádnému zvláštnímu zpracování nebo konečnému zpracování přepisů. Trint, Sonix a Recordly nabízejí omezené volné minuty pro nové uživatele, takže jsme je využili pro experiment. Pro Happy Scribe jsme použili kreditní kartu kolegy nereportéra a o Poynterovi jsme se nezmínili, protože jsem si v minulosti dopisoval s jeho zakladateli. A zaplatili jsme plnou cenu za Revův lidský přepis. Služba titulků YouTube a oTranscribe jsou vždy zdarma.
  • Existuje mnohem, mnohem více nástrojů pro automatický přepis, které jsme do této recenze nezahrnuli. Snažili jsme se zaměřit na ty, na které se nás novináři ptali. Pokud si myslíte, že jsme jeden nespravedlivě přeskočili, dejte nám vědět a my recenzi aktualizujeme.

Kvalita přepisu (vítěz: Happy Scribe)

Diagram přesnosti

Zdá se, že lidé znepokojení povstáním umělé inteligence mají ještě alespoň několik let na přípravu, protože jediná služba lidského přepisu, kterou jsme testovali, překonala automatické přepisy s velkým náskokem.

Rev si vysloužil 82procentní hodnocení přesnosti, přičemž lidský překladatel většinou nedokázal zachytit cizí jazyky (což je, abych byl fér, samostatná služba), pár vlastních podstatných jmen, nějaké přeslechy, pár slangových slov a kousky mumlání. I když ostatní nástroje většinou tyto věci postrádaly, lidští přepisovatelé v Revu alespoň zaznamenali věci jako „[neslyšitelné]“ a „[přeslechy]“ a „[cizí jazyk]“, což byly užitečné zástupné symboly pro pozdější opravy.

I s chybějícími bity je přepis Rev zcela čitelný a koherentní. Pokud jste nebyli poblíž na úvodní konverzaci, mohli byste získat jádro toho, o čem jsme mluvili, pouhým přečtením.

Dalším nejpřesnějším přepisem byl YouTube. Web pro hostování videa automaticky vytvořil titulky pro naše živé video na YouTube, které byly přesné na 72 procent. Ale i při pouhých 10procentním poklesu celkové kvality je přepis výrazně hůře čitelný než Rev, protože YouTube neposkytuje žádnou interpunkci ani segmentaci reproduktorů. Titulky existují jako masivní blok textu. Bez spárování se zvukem by bylo téměř nemožné, aby někdo, kdo nebyl součástí konverzace, našemu rozhovoru porozuměl.

Nabídka YouTube má i další nevýhody, ale o těch si povíme, až se dostaneme k funkcím.

Happy Scribe se v našem experimentu ukázal jako nejpřesnější specializovaný nástroj pro transkripci mimo člověka s 62procentní přesností. Nástroj na své nahrávací stránce varuje, že „vyhýbejte se silnému hluku na pozadí, „vyhýbejte se silným přízvukům“, „vyhýbejte se Skype a telefonickým rozhovorům“ a „mikrofon držte blízko reproduktoru“, což vše jsme poslušně ignorovali.

Přepis je téměř přesný v místech, kde jsem mluvil, zvláště když tam nebyly žádné přeslechy a nepoužíval jsem vlastní podstatná jména, ale docela jsem měl problémy s přepisem Dulce, Kristen a Alexiose. Někde to rozbilo různé řečníky do nových odstavců, ale na jiných to selhalo. Celkový přepis kolísá mezi zcela koherentním na některých místech a bizarně nekoherentním na jiných, například když Alexios přepsal: „Dovolte mi otevřít Urban Dictionary a můžeme si některé z nich projít“ jako „Myslím, že i v městském slovníku jsou si dívky blízké. .“

Trint nabídl podobné výsledky s 61procentní přesností. Na mnoha stejných místech se to pokazilo, zápolilo se s akcenty, zvukem z YouTube a sekcemi s přeslechy nebo tichým mluvením. Nebylo to však přepsáno přesně stejným způsobem jako Happy Scribe. Věta Urban Dictionary shora se objevila jako „Myslím tím, že i v městském slovníku to můžeme projít“.

Celkově je Trintův přepis o něco snazší číst než Happy Scribe, protože lépe rozlišuje řečníky a rozděluje je do nových odstavců. Není to dokonalé, ale když to funguje, dodává to hodně jasnosti.

Sonix se ukázal jako další nejpřesnější na 50 procent. Sonix fungoval o něco lépe než Happy Scribe a Trint, když jeden reproduktor mluvil nahlas. Zdálo se však, že jakékoli množství přeslechů, hluku na pozadí nebo dokonce smíchu – všechny věci, které se pravděpodobně objeví při použití nástroje v reálném světě – jej mátlo více než ostatní. Zachytila ​​větu Urban Dictionary jako „otevřít v městském slovníku a můžeme si některé z nich projít“.

Stejně jako ostatní nástroje se Sonix snažil rozdělit reproduktory do různých odstavců, ale zdálo se, že je na tom o něco hůř.

Recordly byl nejméně přesný z nástrojů automatického přepisu, s přesností 48 procent. Zachytila ​​větu Urban Dictionary jako „nechte mě otevřít ten městský slovník a můžeme. Projděte si některé,“ což není špatné, ale tento kus textu není reprezentativní pro zbytek přepisu. Stejně jako YouTube je přepis Recordly jedním obrovským blokem textu. Na rozdíl od YouTube přidává interpunkci, i když méně často a s nižší přesností než ostatní nástroje.

Přepis Recordly je nejméně užitečný mimo kontext.

Celkově nejlepší přepis vyšel z mé vlastní ruky s oTranscribe. Rev se ukázal jako nejlepší přepis, který jsem sám přepisovat nemusel. Ale toto je přehled nástrojů pro automatický přepis a v této kategorii Happy Scribe jen stěží překonal Trinta, aby se dostal na vrchol.

Vlastnosti (vítěz: Sonix)
Některé věci se zdají být průmyslovými standardy nástrojů pro automatický přepis. Schopnost přehrávat nahraný zvuk je samozřejmostí. Všechny nástroje umožňují uživatelům exportovat přepisy v různých formátech.

Nástroje založené na prohlížeči (což znamená všechny kromě Recordly) nabízejí také společnou sadu. Všechny umožňují uživatelům klikat na různé body v textu a přeskočit přímo na danou část nahrávky. Všechny mají možnost přehrávat zvuk pomaleji (pomocí klávesových zkratek nebo si pohrávat s nastavením), ručně upravovat přepisy, nahrávat video kromě zvuku a ukládat přepisy pro pozdější použití.

Trint jde o krok dále a nabízí vizualizovaný průběh zvuku ve spodní části přepisu, který mohou uživatelé libovolně přeskakovat. Má také vestavěné nástroje pro vyhledání a nahrazení, zvýraznění nebo přeškrtnutí textu. Uživatelé mohou do nástroje přidat seznam řečníků a ke každému odstavci připojit jejich jméno. Má také praktickou funkci pro odeslání přepisu e-mailem jedním kliknutím.

Sonix obsahuje všechny tyto nástroje (kromě interaktivního průběhu) a několik dalších. Nejužitečnější jsou „barvy spolehlivosti“, které přiřazují různé barvy slovům, o kterých si Sonix není tak jistý; hodnotitel kvality zvuku, který vám řekne, jak si je Sonix jistý svým přepisem; a automatizovaná identifikace mluvčích, beta funkce, která se pokouší identifikovat různé mluvčí a přiřadit jim ID.

V našem testu Sonix identifikoval pouze dva různé reproduktory, takže tento nástroj potřebuje nějakou práci, ale je stále nesmírně užitečný.

Je rekordní, že jediná aplikace (pouze pro iOS) ze skupiny nabízí nejméně funkcí. Je to v podstatě rekordní zážitek. Přepis je dodáván ve formátu podobném vestavěné aplikaci Apple pro poznámky s omezenou funkcí úprav. Umožňuje také uživatelům exportovat zvuk nebo text do jiné aplikace.

Ačkoli funkce Trint najít a nahradit a křivky jsou užitečné při opravách přepisů, funkce Sonix dodávají procesu přepisu zásadní transparentnost. A přestože beta identifikace reproduktorů není zcela spolehlivá, je to ambiciózní nástroj, který by se odsud měl jen zlepšovat.

Načasování (Vítěz: Happy Scribe, Trint a rekordně)

časový diagram

Zde svítí automatický přepis. Všechny nástroje poskytly přepis za méně minut, než je délka zvukového souboru, který jsme odeslali. Rozdíl mezi Happy Scribe (pět minut), Trint (šest minut) a Recordly (šest minut) byl zanedbatelný, ale Sonix to trvalo o něco déle (11 minut). (Aktualizace: Zástupce společnosti Sonix se obrátil, aby řekl, že jeho rychlost je v souladu s ostatními nástroji, když je funkce identifikace reproduktoru vypnutá.) V reálném světě by to mohl být zásadní rozdíl, zejména u delších přepisů.

YouTube je zde trochu záhadou. U tohoto přepisu trvalo jen několik minut, než se automatické titulky objevily. V minulých zkušenostech jsme zjistili, že doba, po kterou se objeví, se může značně lišit. Vzhledem k tomu, že YouTube není ve skutečnosti určeno k použití tímto způsobem, nejsme si jisti, jak dlouho to obvykle trvá.

Trvalo asi čtyři hodiny a 15 minut, než Revovi přepisovatelé dokončili svůj přepis. Trvalo mi asi polovinu toho, než jsem to udělal sám s oTranscribe, ale ne bez několika přestávek, Spotify's Hluboké zaměření seznam skladeb a dva galony kávy.

Cena (vítěz: rekordně)

nákladový diagram

Nemůžete porazit bezplatné (YouTube, oTranscribe), ale pokud jde o specializované nástroje pro automatický přepis, náklady se velmi liší. Chcete-li určit nejlepší cenu, musíte zvážit, jak často budete nástroj používat.

Sonix je nejdražší, se základním plánem začínajícím na 15 dolarech měsíčně plus 8 dolarech za každou hodinu přepsaného zvuku. Nástroj však nabízí výraznou slevu 33 procent za placení ročně místo měsíčně.

Trint také nabízí plány začínající na 15 USD za hodinu za přepisy s platbou během nahrávání nebo 40 USD měsíčně za až tři hodiny přepsaného zvuku. Další přepisy stojí jen severně od 13 USD za hodinu.

Happy Scribe stojí paušálních 10 centů za minutu nahraného zvuku. Pro méně matematicky založené typy je to 6 USD za hodinu.

Za skromné ​​2 dolary za hodinu, s první hodinou zdarma, je Recordly zdaleka nejlevnější možností automatického přepisu.

Není překvapením, že lidské přepisovače v Rev stojí více než ostatní nástroje. Přepis našeho 13minutového klipu stál 14 USD a za časová razítka jsme zaplatili o 3,50 USD více. Přesto nás nízké relativní náklady na hodiny práce nutí přemýšlet, kde na světě jsou přepisovatelé Revu a jak dobře jsou kompenzováni.

Snadné použití (vítěz: Trint)
Žádný z těchto nástrojů není náročný na použití. Do každého nahrajete soubor (nebo s ním nahrajete zvuk, v případě Recordly) a po nějaké době vám pošle odkaz na upravitelný přepis.

Trint dělá velký krok nad rámec nahrávání souborů a přijímá zvuk nebo video z různých zdrojů, včetně Dropboxu, Disku Google a FTP, a dokonce umožňuje uživatelům pouze zadat odkaz. To je mezi námi testovanými nástroji jedinečné. Trint také před zahájením nahrávání položí několik užitečných otázek týkajících se hluku na pozadí, přeslechů a dalších. Neopraví záznam, ale je užitečným uzlem UX, který uživatele učí, jak v budoucnu nahrávat lépe přepisovatelný zvuk.

Happy Scribe, Rev, Sonix a Trint posílají e-maily, když je přepis připraven, takže není třeba sedět a zírat na obrazovku.

Sečteno a podtrženo
Není to nejlevnější, ani to není celkově nejpřesnější dostupná možnost přepisu, ale Trint vyhrál jako nejlepší všestranný nástroj z těch, které jsme testovali.

Společnost, která je jen něco málo přes rok stará a získala finance od Knight Foundation (odmítnutí odpovědnosti: Poynter také přijímá financování od Knight) a iniciativa Digital News Initiative společnosti Google nabízí nejlepší celkovou kombinaci funkčnosti, přesnosti a snadného použití.

Pouze funkce automatického titulkování YouTube, která dosáhla 72procentní přesnosti, dopadla výrazně lépe než Trint při přepisu řízeném algoritmem. YouTube však není určen pro typ přepisu, který novináři potřebují každý den, a nenabízí žádný typ funkcí úprav.

Přestože mladý startup Happy Scribe dopadl v našich testech přesnosti o něco lépe s 62procentní sazbou a jeho cena je přibližně třetinová oproti Trintu, postrádá mnoho dalších funkcí, díky kterým je Trint užitečný. Schopnost nahrávat z mnoha zdrojů, vyhledávat a nahrazovat text a identifikace mluvčího jsou malé, ale důležité nástroje pracovního postupu. Pokud hledáte jen rychlý a špinavý přepis, Happy Scribe může být tou správnou cestou.

A i když je pravda, že jeho 61 procent má k dokonalosti daleko, naše testy byly o něco obtížnější než většina použití v reálném světě.

Vyzkoušeli jsme také Rev, lidskou překladatelskou službu, a oTranscribe, která nabízí užitečné nástroje pro novináře k samostatnému přepisu zvuku. Při přepisu zvuku za 1 dolar za minutu jsme zjistili, že Rev je příliš drahý pro běžného novináře. A přestože byl oTranscribe užitečný, neřeší nudu a čas při přepisování.

S ohledem na typická použití je Trint nejlepším všestranným automatickým přepisovým nástrojem pro novináře.

Oprava: Dříve jsme informovali, že Sonix ne nabídka najít a nahradit nástroj, ale ve skutečnosti to dělá. Omlouváme se za to, že to chybí.

Zjistěte více o žurnalistických nástrojích s Try This! — Nástroje žurnalistiky. Zkuste to! je napájen Google News Lab . To je také podporováno Americký tiskový institut a John S. a James L. Knight Foundation