Piszę program, który potrzebuje DUŻO słów w języku angielskim. Próbuję znaleźć plik słownika zawierający wiele słów. Czy ktoś wie o dobrym źródle? Próbowałem wielu źródeł, ale wydaje się, że nie mają.
Piszę program, który potrzebuje DUŻO słów w języku angielskim. Próbuję znaleźć plik słownika zawierający wiele słów. Czy ktoś wie o dobrym źródle? Próbowałem wielu źródeł, ale wydaje się, że nie mają.
Odpowiedzi:
A co /usr/share/dict/words
z dowolnym systemem uniksowym? Ile słów mówimy? Jak OED-Unabridged?
cat /usr/share/dict/words > words.txt
wszystkie rzeczy !
sudo apt-get install wbritish
W przypadku pliku .txt słownika angielskiego można użyć słownika niestandardowego .
Możesz także wygenerować listę aspell lub listę słów z własnymi ustawieniami.
Możesz także zajrzeć na http://wordlist.sourceforge.net/
Tylko angielskie słowa: http://www.math.sjsu.edu/~foster/dictionary.txt
Zobacz także:
95 (insane)
3 (seldom used)
Strip
daje około 675 000 słów.
http://www.math.sjsu.edu/~foster/dictionary.txt
350 000 słów
Bardzo późno, ale może być przydatny dla innych.
Istnieje również WordNet . Format plików danych jest dobrze udokumentowany.
Użyłem go do zbudowania biblioteki słowników do osadzenia dla programistów iOS ( www.lexicontext.com ), a także w jednej z moich aplikacji.
@ Przyszli poszukiwacze: możesz użyć aspell do sprawdzenia słownika, ma on powiązania w Ruby i Pythonie. To znacznie uprości twoją pracę.