Muszę przeczytać plik tekstowy pod kątem słowa i zwrócić jego znaczenie. Każdy inny format pliku również będzie działał.
Muszę przeczytać plik tekstowy pod kątem słowa i zwrócić jego znaczenie. Każdy inny format pliku również będzie działał.
Odpowiedzi:
Projekt Gutenberg udostępnia Unabridged English Dictionary Webstera oraz wiele innych dzieł literackich należących do domeny publicznej. Właściwie wygląda na to, że mają kilka wersji słownika z prawami autorskimi z różnych lat. Ten, który podlinkowałem, ma prawa autorskie 2009. Możesz przejrzeć witrynę i zbadać różne wersje słownika Webstera.
user1247808 ma dobre łącze z: wget -c
http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip
Jeśli to nie wystarczy dla Ciebie:
http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz (zaktualizowany adres URL z sugestii Michaela Kropata)
Chociaż ta nazwa pliku się zmienia, będziesz chciał znaleźć najnowszy ... który okazuje się być po prostu dużym (bardzo dużym) plikiem tekstowym.
sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sql
aby zastąpić przestarzałą składnię przed uruchomieniem jej w wersji 5.0+ MySQL
Nie wiem, czy jest za późno, ale pomyślałem, że pomoże to komuś innemu.
Bardzo chciałem tego samego ... w końcu to znalazłem.
Może nie jest idealny, ale dla mnie jest odpowiedni (dla mojej małej aplikacji słownikowej).
http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip
Nie jest to plik zrzutu, ale plik skryptowy MYSQL .sql
Słowa znajdują się w tabeli WN_SYNSET, a słownik / znaczenie w tabeli WN_GLOSS
Here are some files related to natural language and chatterbot projects that we are making available to the public
sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sql
aby działał w najnowszym MySQL
Sprawdź, czy te bezpłatne zasoby odpowiadają Twoim potrzebom -