Do eksperymentów chcielibyśmy użyć Emoji osadzonego w wielu tweetach jako podstawowych danych o prawdzie / treningu do prostej ilościowej analizy wrażliwości. Tweety są zwykle zbyt nieustrukturyzowane, aby NLP działało dobrze.
W każdym razie w Unicode 6.0 jest 722 Emoji, a prawdopodobnie kolejne 250 zostanie dodanych w Unicode 7.0.
Czy istnieje baza danych (jak np. SentiWordNet), która zawiera adnotacje o nich?
(Zauważ, że SentiWordNet również dopuszcza niejednoznaczne znaczenia. Rozważ np. Zabawne , co nie jest po prostu pozytywne: „to smakuje zabawnie” prawdopodobnie nie jest pozytywne ... to samo ;-)
na przykład. Ale nie sądzę, że jest to trudniejsze dla Emoji niż dla zwykłych słów ...)
Ponadto, jeśli masz doświadczenie w stosowaniu ich do analizy nastrojów, chętnie się o tym dowiemy.