Istnieje kilka zasobów na Wikipedii, ale naprawdę trzeba mieć szczęście, aby mieć domenę, która jest zwykłym waniliowym angielskim słowem, wystarczająco powszechnym, aby się tutaj pojawić.
Możesz użyć narzędzia do generowania literówek słów kluczowych lub czegoś podobnego, a następnie mozolnie wprowadzić każde z nich do Google - co ironicznie spróbuje naprawić pisownię - a następnie użyj „wyszukaj zamiast {wersja z błędną pisownią}” i sprawdź, ile wyszukiwań wyniki otrzymane dla tego konkretnego błędu ortograficznego:
Pokazuje wyniki dla traktatu
Zamiast tego wyszukaj tretise
To daje około 117 000 wyników dla „tretise” vs. 17 800 000 wyników dla „traktat”. Masz teraz pojęcie, jak często ten błąd ortograficzny występuje w całym Internecie! Możesz więc faworyzować błędy pisowni, które występują częściej w prawdziwym świecie.
Być może co najważniejsze, znalazłem też te strony:
http://how-to-spell.net/treatise
Jak przeliterować traktat?
Prawidłowo: traktat .
Typowe błędy ortograficzne: tretise - 100%
Który najwyraźniej nie korzystania z rzeczywistych danych!
Zebraliśmy odsetki błędów w pisowni z prawie 15 423 252 sesji sprawdzania pisowni na stronie internetowej spellchecker.net (styczeń 2010 - czerwiec 2012).
Najlepiej byłoby, gdyby Google udostępniło dane dotyczące błędów ortograficznych, ponieważ podejrzewam, że ma o wiele więcej danych ... ale nie jestem pewien, czy są skłonne je udostępnić, być może uważają automatyczną korektę pisowni błędnie wpisanych wyszukiwanych słów jako przewaga konkurencyjna.
Byłoby wspaniale, gdyby tak zrobili!