Mam plik tekstowy w nieznanym lub mieszanym kodowaniu. Chcę zobaczyć wiersze zawierające sekwencję bajtów, która jest niepoprawna UTF-8 (przez przesłanie pliku tekstowego do jakiegoś programu). Odpowiednio chcę odfiltrować wiersze, które są poprawne UTF-8. Innymi słowy, szukam .grep [notutf8] Idealne rozwiązanie byłoby przenośne, krótkie i możliwe do uogólnienia w stosunku do …
Muszę okresowo uruchamiać polecenie, które zapewnia, że niektóre pliki tekstowe są przechowywane w trybie Linux. Niestety dos2unixzawsze modyfikuje plik, co zepsułoby znaczniki czasu pliku i folderu i spowodowało niepotrzebne zapisy. Skrypt, który piszę jest w języku Bash, więc wolałbym odpowiedzi oparte na Bash.
Plik wejściowy 1 to: dog 123 4335 cat 13123 23424 deer 2131 213132 bear 2313 21313 Daję dopasowaniu wzór z other file(jak dog 123 4335z pliku 2). Dopasowuję wzór linii dog 123 4335i po wydrukowaniu wszystkich linii bez linii dopasowania, mój wynik to: cat 13123 23424 deer 2131 213132 bear …
Pracuję z plikami CSV i czasami muszę szybko sprawdzić zawartość wiersza lub kolumny z wiersza polecenia. W wielu przypadkach cut, head, taili przyjaciół zrobi pracy; Jednak cięcie nie może łatwo poradzić sobie w sytuacjach takich jak "this, is the first entry", this is the second, 34.5 Tutaj pierwszy przecinek jest …
Mam kilka .htmplików, które otwierają się w Gedit bez żadnego ostrzeżenia / błędu, ale kiedy otwieram te same pliki Jedit, ostrzega mnie przed nieprawidłowym kodowaniem UTF-8 ... Metatag HTML stwierdza „charset = ISO-8859-1”. Jedit zezwala na listę zastępczych kodowań i listę automatycznych detektorów kodowania (obecnie „BOM XML-PI”), więc mój bezpośredni …
Chcę przekonwertować .txtpliki .pdf. Używam tego: ls | while read ONELINE; do convert -density 400 "$ONELINE" "$(echo "$ONELINE" | sed 's/.txt/.pdf/g')"; done Ale to powoduje jeden „błąd” - jeśli w pliku tekstowym jest bardzo długa linia, nie jest ona zawijana. Wprowadź tekst Wyjście PDF - Byłoby również świetnie, gdyby wyjściowy …
Używam sed do szybkiego usuwania linii o określonej pozycji jako sed '1d' sed '5d' Ale co, jeśli chcę usunąć ostatni wiersz pliku i nie znam liczby wierszy (wiem, że mogę to zrobić za pomocą wckilku innych sztuczek). Obecnie za pomocą obejścia tego problemu headi w tailpołączeniu z nim wc. Jakieś …
Czy istnieje prosty sposób na zamianę / ocenę zmiennych środowiskowych w pliku? Powiedzmy, że mam plik config.xmlzawierający: <property> <name>instanceId</name> <value>$INSTANCE_ID</value> </property> <property> <name>rootPath</name> <value>/services/$SERVICE_NAME</value> </property> ...itp. Chcę zastąpić $INSTANCE_IDw pliku wartością INSTANCE_IDzmiennej środowiskowej $SERVICE_NAMEwartością SERVICE_NAMEenv var. Nie będę z góry wiedział, które zmienne środowiskowe są potrzebne (a raczej nie chcę …
Czasami dostaję listę rozdzielanych tabulatorami wejściowymi, która nie jest na przykład całkiem wyrównana var1 var2 var3 var_with_long_name_which_ruins_alignment var2 var3 Czy istnieje prosty sposób, aby wyrównać je? var1 var2 var3 var_with_long_name_which_ruins_alignment var2 var3
Jak mogę zastąpić wszystkie nowe linie spacją oprócz ostatniej nowej linii. Mogę zastąpić wszystkie znaki nowej linii spacją, trale jak mogę to zrobić z pewnymi wyjątkami?
Mam plik z około 30 000 000 wierszy (Radius Accounting) i muszę znaleźć ostatnie dopasowanie dla danego wzorca. Komenda: tac accounting.log | grep $pattern daje to, czego potrzebuję, ale jest zbyt wolne, ponieważ system operacyjny musi najpierw odczytać cały plik, a następnie wysłać go do potoku. Potrzebuję więc czegoś szybkiego, …
Czy istnieje sposób na komentowanie / odkomentowanie skryptu powłoki / config / ruby za pomocą wiersza poleceń? na przykład: $ comment 14-18 bla.conf $ uncomment 14-18 bla.conf spowoduje to dodanie lub usunięcie #wpisu bla.confw trybie online 14do 18. Zwykle używam sed, ale muszę znać zawartość tych wierszy, a następnie wykonać …
Próbuję usunąć niektóre znaki z pliku (UTF-8). Używam trdo tego celu: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Plik zawiera niektóre obce znaki (np. „Латвийская” lub „àé”). trwydaje się ich nie rozumieć: traktuje je jako inne niż alfa i również je usuwa. Próbowałem zmienić niektóre ustawienia regionalne: LC_CTYPE=C LC_COLLATE=C tr -cs …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.