Jak korzystać z rozpoznawania głosu używanego przez system Android na Ubuntu?


16

Jeśli opracowuję aplikację na Androida korzystającą z TTS i rozpoznawania głosu, które biblioteki są używane do tego samego rozpoznawania głosu i mowy w systemie Ubuntu?

Zakładam, że wypowiadam się za tekstem na mowę, ale nie jestem pewien, która biblioteka rozpoznawania głosu i system słownikowy / uczenia się / kalibracji jest używany do rozpoznawania głosu.

Chcę udostępnić aplikację na Ubuntu Desktop.
a także przetestuj go poza emulatorem


sprawdź to, ale nie ma istotnej odpowiedzi
devav2

@ devav2 dzięki za wysiłek, ale tak naprawdę nie związany. logowanie głosowe i który zestaw narzędzi do rozpoznawania głosu jest używany na Androidzie (i jeśli jest dostępny w Ubuntu) to dwie zupełnie różne rzeczy.
RobotHumans,

Prawdopodobnie będziesz musiał dokładnie dowiedzieć się, jakich bibliotek używa Android w innym miejscu, a następnie wróć tutaj i zapytaj, jak z nich korzystać w Ubuntu. Jeśli nie możesz go znaleźć w dokumentacji Androida , mogą pomóc entuzjaści Androida lub przepełnienie stosu .
ændrük

Nie jestem pewien, czy chcesz go używać z Androidem, ale Festival / festvox brzmi o wiele mniej robotycznie niż espeak. Jeśli chodzi o rozpoznawanie mowy, może pomóc en.wikipedia.org/wiki/… .
Adam

Cóż, espeak jest teraz standardem na pulpicie Ubuntu ... więc nie dodano żadnej zależności. Z drugiej strony, płatne paczki z cepstralu nie są przerażająco drogie i graniczą ze skeksi.
RobotHumans

Odpowiedzi:



1
  1. Rozpoznawanie głosu przez androidy opiera się na połączeniu internetowym, ponieważ serwer ma obszerną bazę danych wzorców głosu. (Myślę)

    • Komputery nie są jeszcze bardzo dobre w rozpoznawaniu głosu, więc potrzebujesz ogromnej bazy danych z dużą ilością głosów, aby komputer mógł się do nich odwoływać i lepiej rozumieć słowa. (Przynajmniej przestudiowałem to)

    • Dlatego nie możesz używać go offline.

  2. Możesz jednak użyć rozpoznawania głosu do pisania za pomocą obejścia

    • Poprzez utworzenie połączenia zdalnego pulpitu / vnc i bezpośredniego

    • lub za pomocą zdalnej aplikacji klawiatury.

Chrome może używać rozpoznawania głosu do wyszukiwania, a wraz z rozszerzeniem może służyć do wypełniania danych w terenie. ale o ile wiem, to wszystko.

i to wszystko co wiem.


Rozumiem, że rozpoznawanie głosu wymaga korpusu do nauki słów wykraczających poza prostą fonetykę i słowniki (więc można wymazać dopasowania, gdy się nie wymawia). Nie mam nic przeciwko wymaganiu połączenia z Internetem, jeśli jest ono użyteczne.
RobotHumans

0

Być może używasz CMU Sphinx, można go użyć jako zestawu narzędzi do rozwijania rozpoznawania mowy zarówno w systemie Linux, jak i Android: CMU Sphinx

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.