Rozpoznawanie mowy - oprogramowanie MP3 na tekst [zamknięte]


16

Szukam niezależnego od głośników programu (komercyjnego lub bezpłatnego), który umożliwiłby mi transkrypcję plików MP3 zawierających nagrania mowy (zwłaszcza podcasty) na tekst. Chciałem wypróbować Dragon Naturally Speaking, ale wygląda na to, że obsługuje tylko transkrypcję własnych nagrań mowy. Jakie są alternatywy?


Komentarz Avi: Nie wierzę, że to możliwe - niezależny od mówcy
Ivo Flipse

jaki system operacyjny?
studiohack

Windows lub Linux.
pako

Odpowiedzi:


7

Dragon Naturally Speaking zaimportuje pliki mp3 i spróbuje je transkrybować. Preferuje dostrojenie rozpoznawania głosu do poszczególnych głośników, ale wykonuje dobrą robotę bez strojenia. Prawdopodobnie najlepiej by było, gdyby Twoje głośniki podcastów brzmiały jak Tom Brokaw.


2
Próbowałem Dragon Naturally Speaking, ale wykonało okropną robotę dla podcastów z nieznanymi głośnikami. Działało to całkiem dobrze z moim własnym głosem po treningu programu.
pako

1
Czy może również importować inne pliki audio i transkrybować je?
Larry Morries

4

Jednym z możliwych rozwiązań byłoby przesłanie filmu na YouTube i wypróbowanie automatycznych napisów, które można włączyć ... nie jest jeszcze zbyt dokładne, ale można pobrać plik z napisami i edytować go samodzielnie, jeśli to pomoże ... jako w przypadku problemów związanych z prawami autorskimi / piractwem możesz ustawić film jako prywatny w swoim profilu, jeśli to w ogóle możliwe?


1
@studioback: Czy ta metoda Youtube ma zastosowanie tylko do własnego wideo, a nie do przesłanych przez innych?
StackExchange dla wszystkich

1
@Tim: tak naprawdę jest dla obu.
studiohack

1
@studiohack: Jak to zrobić w przypadku filmów przesłanych przez innych? Mam na myśli, bez pobierania i przesyłania jako własnych filmów?
StackExchange dla wszystkich

1
W większości filmów na dole znajduje się ikona CC, kliknij ją, a następnie automatyczna transkrypcja ...
studiohack


2

Ostrzegam przed wypróbowaniem Dragon Naturally Speaking - napisałem kilka skryptów na moim jailbreakowanym iPhonie, aby skopiować / przekonwertować wszystkie pliki poczty głosowej z mojego telefonu do folderu na komputerze i uruchomiłem przeciwko nim usługę transkrypcji Dragon Naturally Speaking.

Rezultat uruchomienia transkrypcji na plikach z różnymi głośnikami był absolutnie bezużyteczny. Wypróbowałem niektóre alternatywy typu open source, ale rozpoznawanie głosu niezależne od głośników nadal wydaje się ograniczone do bardzo małych słowników.


1

Używam http://www.voicebase.com z podcastem i filmami w języku angielskim i działa bardzo dobrze. Jest bezpłatny przez 50 godzin audio.

Możesz pobrać transkrypcję audio na rtf, srt lub pdf.

Możesz pobrać transkrypcje maszynowe około 10-15 minut po przesłaniu, a czasem wcześniej.



Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.