Jak zamienić spacje na tabulatory w Linuksie w danym pliku tekstowym?
Odpowiedzi:
UNEXPAND(1) User Commands UNEXPAND(1)
NAME
unexpand - convert spaces to tabs
SYNOPSIS
unexpand [OPTION]... [FILE]...
DESCRIPTION
Convert blanks in each FILE to tabs, writing to standard output. With
no FILE, or when FILE is -, read standard input.
Mandatory arguments to long options are mandatory for short options
too.
-a, --all
convert all blanks, instead of just initial blanks
--first-only
convert only leading sequences of blanks (overrides -a)
-t, --tabs=N
have tabs N characters apart instead of 8 (enables -a)
-t, --tabs=LIST
use comma separated LIST of tab positions (enables -a)
--help display this help and exit
--version
output version information and exit
. . .
STANDARDS
The expand and unexpand utilities conform to IEEE Std 1003.1-2001
(``POSIX.1'').
Myślę, że możesz spróbować z awk
awk -v OFS="\t" '$1=$1' file1
lub SED, jeśli wolisz
sed 's/[:blank:]+/,/g' thefile.txt > the_modified_copy.txt
lub nawet tr
tr -s '\t' < thefile.txt | tr '\t' ' ' > the_modified_copy.txt
lub uproszczona wersja roztworu tr zasugerowanego przez Sama Bisbee
tr ' ' \\t < someFile > someFile
tr ' ' \\t < someFile > someFile
ls -l | sed "s/ \+/ /g"
awk -v OFS="\t" '$1=$1' file1
Zauważyłem, że jeśli masz początek wiersza o numerze 0 (np 0 1 2
), wówczas linia zostanie pominięta z wyniku.
Korzystanie z Perla :
perl -p -i -e 's/ /\t/g' file.txt
perl -p -i -e 's/\t/ /g' *.java
s/ {4}/
konwertowałem wcięcia z 4 spacjami na tabulatory.
lepsze polecenie tr :
tr [:blank:] \\t
Spowoduje to wyczyszczenie danych wyjściowych polecenia powiedzmy unzip -l do dalszego przetwarzania za pomocą grep, cut itp.
na przykład,
unzip -l some-jars-and-textfiles.zip | tr [:blank:] \\t | cut -f 5 | grep jar
tr [:blank:] \\t
Pobierz i uruchom następujący skrypt, aby rekurencyjnie konwertować miękkie karty na twarde w zwykłych plikach tekstowych.
Umieść i uruchom skrypt z wnętrza folderu zawierającego zwykłe pliki tekstowe.
#!/bin/bash
find . -type f -and -not -path './.git/*' -exec grep -Iq . {} \; -and -print | while read -r file; do {
echo "Converting... "$file"";
data=$(unexpand --first-only -t 4 "$file");
rm "$file";
echo "$data" > "$file";
}; done;
Możesz także użyć astyle
. Uważam, że jest całkiem przydatny i ma też kilka opcji:
Tab and Bracket Options:
If no indentation option is set, the default option of 4 spaces will be used. Equivalent to -s4 --indent=spaces=4. If no brackets option is set, the
brackets will not be changed.
--indent=spaces, --indent=spaces=#, -s, -s#
Indent using # spaces per indent. Between 1 to 20. Not specifying # will result in a default of 4 spaces per indent.
--indent=tab, --indent=tab=#, -t, -t#
Indent using tab characters, assuming that each tab is # spaces long. Between 1 and 20. Not specifying # will result in a default assumption of
4 spaces per tab.`
Jeśli mówisz o zastąpieniu wszystkich kolejnych spacji w wierszu tabulatorem, to tr -s '[:blank:]' '\t'
.
[root@sysresccd /run/archiso/img_dev]# sfdisk -l -q -o Device,Start /dev/sda
Device Start
/dev/sda1 2048
/dev/sda2 411648
/dev/sda3 2508800
/dev/sda4 10639360
/dev/sda5 75307008
/dev/sda6 96278528
/dev/sda7 115809778
[root@sysresccd /run/archiso/img_dev]# sfdisk -l -q -o Device,Start /dev/sda | tr -s '[:blank:]' '\t'
Device Start
/dev/sda1 2048
/dev/sda2 411648
/dev/sda3 2508800
/dev/sda4 10639360
/dev/sda5 75307008
/dev/sda6 96278528
/dev/sda7 115809778
Jeśli mówisz o zamianie wszystkich białych znaków (np. Spacja, tabulator, nowa linia, itp.) To tr -s '[:space:]'
.
[root@sysresccd /run/archiso/img_dev]# sfdisk -l -q -o Device,Start /dev/sda | tr -s '[:space:]' '\t'
Device Start /dev/sda1 2048 /dev/sda2 411648 /dev/sda3 2508800 /dev/sda4 10639360 /dev/sda5 75307008 /dev/sda6 96278528 /dev/sda7 115809778
Jeśli mówisz o naprawianiu pliku uszkodzonego na karcie, użyj expand
i unexpand
jak wspomniano w innych odpowiedziach.
Spowoduje to zastąpienie kolejnych spacji jedną spacją (ale nie tabulatorem).
tr -s '[:blank:]'
Spowoduje to zastąpienie kolejnych spacji tabulatorem.
tr -s '[:blank:]' '\t'
-c
to zastępuje kolejne znaki, które nie są spacjami.
tr
lubsed
.