Usuwam słowa stop z tekstu, z grubsza używając tego kodu
Mam następujące
$ cat file
file
types
extensions
$ cat stopwords
i
file
types
grep -vwFf stopwords file
Oczekuję wyniku:
extensions
ale dostaję (myślę, że niepoprawny)
file
extensions
To tak, jakby słowo filezostało pominięte w pliku stopwords. Teraz tutaj jest nieco cool: gdybym zmodyfikować plik odrzucanych słów, zmieniając jedno słowo / literę ina pierwszej linii, do jakiegokolwiek innego ASCII litery oprócz f, i, l, e, a następnie to samo polecenie grep daje mi inny i prawidłowego wyniku extensions.
Co tu się dzieje i jak to naprawić?
Używam grep (BSD grep) 2.5.1-FreeBSD na bash dla systemu Mac OSX GNU, wersja 4.4.12 (1)
iwzorca na drugi zamiast pierwszego wzorca w stopwordspliku również zmienia zachowanie.
grepani z GNU grep3.1.
-xprzełącznika do wyrażenia regularnego wiersza zamiast-wsłowa? Myślę jednak, że-Fzmiana anuluje którekolwiek z nich lub odwrotnie.