Pracuję nad aplikacją, która pomoże ludziom uczyć się angielskiego jako drugiego języka. Zweryfikowałem, że zdania pomagają w nauce języka, zapewniając dodatkowy kontekst. Zrobiłem to, przeprowadzając małe badanie w klasie 60 uczniów.
Wydobrałem z Wikipedii ponad sto tysięcy zdań na różne angielskie słowa (w tym 800 słów Barronsa i 1000 najczęstszych angielskich słów)
Całe dane są dostępne na https://buildmyvocab.in
Aby zachować jakość treści, odfiltrowałem zdania dłuższe niż 160 znaków, ponieważ mogą być trudne do zrozumienia.
W następnym kroku chcę być w stanie zautomatyzować proces sortowania tych treści w kolejności łatwej do zrozumienia. Ja sam nie mówię po angielsku. Chcę wiedzieć, jakich funkcji mogę użyć do oddzielenia łatwych zdań od trudnych.
Czy uważasz, że to jest możliwe?