Dobre rozwiązanie zamiany tekstu na mowę dla systemu Windows [zamknięte]


9

Korzystam z systemu Windows 7 i wiem, że ma on możliwość odczytu tekstu w moich aplikacjach, ale szukam dobrego narzędzia do zapisywania fragmentów tekstu jako pliku wav lub mp3. Być może jest już wbudowany w system operacyjny, ale sprytnie ukryty. Wiem, że mogę napisać program do wywołania interfejsu API, co jest moim następnym krokiem, jeśli nie ma jeszcze dobrego rozwiązania.

Naprawdę podoba mi się jakość systemu AT&T , ale ma on dość poważne ograniczenia w używaniu produkowanego MP3. Chciałbym użyć ich w moim podcastu.

Internet jest również OK, o ile łatwo tworzy dość nieobciążone (domena publiczna lub Creative Commons) Wav, MP3 lub inny standardowy plik audio. Oczywiście wolę wolne lub otwarte oprogramowanie od komercyjnego, ale nie jest to wymagane.

Odpowiedzi:


4

Próbowałem espeak , Festival i MaryTTS . Wszystkie generują w większości zrozumiałe głosy, ale nie są zbyt naturalne. Nawet przy dodatkowym pobieraniu głosu dla tych systemów (np. Mbrola, CMU Arctic) głosy nie są tak świetne.

Głosy IVONA są najlepsze, jakie do tej pory słyszałem. Dają ci 30-dniowe bezpłatne demo, które wystarczy, jeśli masz jednorazowe zadanie do wykonania. Potem są jak 45 USD za głos. Amazon właśnie kupił firmę, abyś wiedział, że jest solidny ( http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/ ).

Współpracują z interfejsem SAPI Microsoft, co oznacza, że ​​głosy są dostępne dla każdego programu, który je obsługuje (np. Adobe Reader). Używam ich z programem Text To Wav , który jest przydatny do masowej konwersji plików tekstowych do plików wave.

Edytować

Właściwie po prostu przeczytaj ponownie swoje pytanie i myślę, że do użytku nieosobowego (np. Podcasty) cena jest prawdopodobnie znacznie wyższa dla IVONA. W takim razie powiedziałbym, że sprawdź MaryTTS.


Właśnie wysłuchałem MaryTTS i to robi wrażenie na szczycie espeak i festiwalu.
2013 r. O

MaryTTS ma świetne głosy i jest również darmowy.
Jim McKeeth

Wygląda na to, że syntezator mowy dla głosów Ivona do użytku na komputerze jest teraz zapewniany przez TextAloud
użytkownik

6

eSpeak jest darmowym i otwartym oprogramowaniem i oferuje wszystko, czego potrzebujesz.

Może działać jako program wiersza poleceń do odczytywania tekstu z pliku lub ze standardowego wejścia.
Dostępna jest również wersja biblioteki współużytkowanej.

* Obejmuje różne brzmienia, których cechy można zmienić.
* Może generować mowę jako plik WAV.
* SSML (Speech Synthesis Markup Language) jest obsługiwany (niekompletny),
  a także HTML.
* Kompaktowy rozmiar. Program i jego dane, w tym wiele języków,
  w sumie około 1 MB.
* Może tłumaczyć tekst na kody fonemów, dzięki czemu można go dostosować jako front
  koniec dla kolejnego silnika syntezy mowy.
* Potencjał dla innych języków. Kilka z nich obejmuje różne etapy
  postępu. Pomoc ze strony rodzimych użytkowników tych lub innych języków to
  mile widziana.
* Dostępne są narzędzia programistyczne do tworzenia i dostrajania danych fonemów.
* Napisane w C ++.

Chociaż eSpeak wydaje się interesujący, może naprawdę skorzystać z przewodnika „Szybki start”. Dzięki za napiwek. Będę z tym pracował.
Jim McKeeth

+1 dla eSpeak. Długo szukałem aplikacji do tego. Dziękuję Panu!
Axxmasterr
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.