W Javie mam taki łańcuch:
" content ".
Czy String.trim()
usunie wszystkie spacje po tych stronach, czy tylko po jednym miejscu z każdej?
W Javie mam taki łańcuch:
" content ".
Czy String.trim()
usunie wszystkie spacje po tych stronach, czy tylko po jednym miejscu z każdej?
Odpowiedzi:
Zwraca : kopię tego ciągu z usuniętymi początkowymi i końcowymi białymi znakami lub ten ciąg, jeśli nie ma wiodącego ani końcowego odstępu.
~ Cytat z dokumentacji Java 1.5.0
(Ale dlaczego po prostu tego nie spróbowałeś i sam się nie przekonałeś?)
Chararacter.isWhitespace
to prawdą, ale nie o to chodzi przez „
trim
, isWhiteSpace
itp, lub omówienie niejasności w docs Java; jest to prosta odpowiedź na konkretne pytanie zadane powyżej - tj. czy trim
metoda usuwa pojedynczą spację czy wiele spacji?
Z kodu źródłowego (zdekompilowany):
public String trim()
{
int i = this.count;
int j = 0;
int k = this.offset;
char[] arrayOfChar = this.value;
while ((j < i) && (arrayOfChar[(k + j)] <= ' '))
++j;
while ((j < i) && (arrayOfChar[(k + i - 1)] <= ' '))
--i;
return (((j > 0) || (i < this.count)) ? substring(j, i) : this);
}
Te dwa while
, które widzisz, oznaczają, że wszystkie znaki, których Unicode znajduje się poniżej znaku spacji, na początku i na końcu, zostaną usunięte.
W razie wątpliwości napisz test jednostkowy:
@Test
public void trimRemoveAllBlanks(){
assertThat(" content ".trim(), is("content"));
}
Uwaga : oczywiście test (dla JUnit + Hamcrest) nie kończy się niepowodzeniem
Jedną rzeczą, na którą należy zwrócić uwagę, jest to, że String.trim ma osobliwą definicję „białych znaków”. Nie usuwa białych znaków Unicode, ale usuwa również znaki sterujące ASCII, których nie można uważać za białe znaki.
Ta metoda może być używana do przycinania białych znaków z początku i końca łańcucha; w rzeczywistości przycina również wszystkie znaki sterujące ASCII.
Jeśli to możliwe, możesz chcieć użyć metody StringUtils.strip () firmy Commons Lang, która również obsługuje białe znaki Unicode (i jest również bezpieczna dla wartości null).
Zobacz API dla klasy String:
Zwraca kopię ciągu z pominięciem wiodących i końcowych białych znaków.
Usunięto odstępy po obu stronach:
Zauważ, że trim()
nie zmienia instancji String, zwróci nowy obiekt:
String original = " content ";
String withoutWhitespace = original.trim();
// original still refers to " content "
// and withoutWhitespace refers to "content"
W oparciu o dokumentację Java , która znajduje się tutaj , .trim()
zastępuje znak „\ u0020”, który jest powszechnie znany jako biały znak.
Ale zwróć uwagę, że '\ u00A0' ( SPACJA BEZ PRZERW w Unicode
) jest również postrzegana jako biała spacja i.trim()
NIE spowoduje jej usunięcia. Jest to szczególnie powszechne w HTML.
Aby go usunąć, używam:
tmpTrimStr = tmpTrimStr.replaceAll("\\u00A0", "");
Przykład tego problemu został omówiony tutaj .
Przykład trim()
usuwania spacji w Javie :
public class Test
{
public static void main(String[] args)
{
String str = "\n\t This is be trimmed.\n\n";
String newStr = str.trim(); //removes newlines, tabs and spaces.
System.out.println("old = " + str);
System.out.println("new = " + newStr);
}
}
WYNIK
old =
This is a String.
new = This is a String.
Z dokumentacji java (źródło klasy String),
/**
* Returns a copy of the string, with leading and trailing whitespace
* omitted.
* <p>
* If this <code>String</code> object represents an empty character
* sequence, or the first and last characters of character sequence
* represented by this <code>String</code> object both have codes
* greater than <code>'\u0020'</code> (the space character), then a
* reference to this <code>String</code> object is returned.
* <p>
* Otherwise, if there is no character with a code greater than
* <code>'\u0020'</code> in the string, then a new
* <code>String</code> object representing an empty string is created
* and returned.
* <p>
* Otherwise, let <i>k</i> be the index of the first character in the
* string whose code is greater than <code>'\u0020'</code>, and let
* <i>m</i> be the index of the last character in the string whose code
* is greater than <code>'\u0020'</code>. A new <code>String</code>
* object is created, representing the substring of this string that
* begins with the character at index <i>k</i> and ends with the
* character at index <i>m</i>-that is, the result of
* <code>this.substring(<i>k</i>, <i>m</i>+1)</code>.
* <p>
* This method may be used to trim whitespace (as defined above) from
* the beginning and end of a string.
*
* @return A copy of this string with leading and trailing white
* space removed, or this string if it has no leading or
* trailing white space.
*/
public String trim() {
int len = count;
int st = 0;
int off = offset; /* avoid getfield opcode */
char[] val = value; /* avoid getfield opcode */
while ((st < len) && (val[off + st] <= ' ')) {
st++;
}
while ((st < len) && (val[off + len - 1] <= ' ')) {
len--;
}
return ((st > 0) || (len < count)) ? substring(st, len) : this;
}
Zauważ, że po pobraniu start i length wywołuje metodę podciągową klasy String.
trim()
usunie wszystkie początkowe i końcowe spacje. Ale pamiętaj: Twój ciąg nie jest zmieniany. trim()
zwróci zamiast tego nową instancję ciągu.
Jeśli dane wejściowe typu String to:
String a = " abc ";
System.out.println(a);
Tak, wynik będzie brzmiał „abc”; Ale jeśli dane wejściowe typu String to:
String b = " This is a test "
System.out.println(b);
Wynik będzie This is a test
taki, że przycinanie usuwa tylko spacje przed pierwszym znakiem i po ostatnim znaku w ciągu i ignoruje spacje wewnętrzne. To jest fragment mojego kodu, który nieznacznie optymalizuje wbudowaną String
metodę trim, usuwając spacje wewnętrzne i usuwając spacje przed i po pierwszym i ostatnim znaku w ciągu. Mam nadzieję, że to pomoże.
public static String trim(char [] input){
char [] output = new char [input.length];
int j=0;
int jj=0;
if(input[0] == ' ' ) {
while(input[jj] == ' ')
jj++;
}
for(int i=jj; i<input.length; i++){
if(input[i] !=' ' || ( i==(input.length-1) && input[input.length-1] == ' ')){
output[j]=input[i];
j++;
}
else if (input[i+1]!=' '){
output[j]=' ';
j++;
}
}
char [] m = new char [j];
int a=0;
for(int i=0; i<m.length; i++){
m[i]=output[a];
a++;
}
return new String (m);
}
.trim()
w System.out.println(a);
?
Jedną bardzo ważną rzeczą jest to, że ciąg złożony w całości z „białych spacji” zwróci pusty ciąg.
if a string sSomething = "xxxxx"
, gdzie x
oznacza białe spacje, sSomething.trim()
zwróci pusty ciąg.
jeśli a string sSomething = "xxAxx"
, gdzie x
oznacza białe spacje, sSomething.trim()
zwróci A
.
jeśli sSomething ="xxSomethingxxxxAndSomethingxElsexxx"
, sSomething.trim()
wróci SomethingxxxxAndSomethingxElse
zauważyć, że liczba x
między słowami jest nie zmieniona.
Jeśli chcesz, aby zgrabny łańcuch w pakietach został połączony trim()
z wyrażeniem regularnym, jak pokazano w tym poście: Jak usunąć zduplikowane białe znaki w ciągu za pomocą Javy? .
Porządek nie ma znaczenia dla wyniku, ale trim()
najpierw byłby bardziej wydajny. Mam nadzieję, że to pomoże.
Javadoc for String zawiera wszystkie szczegóły. Usuwa spacje (spacje, tabulatory itp.) Z obu końców i zwraca nowy ciąg.
Jeśli chcesz sprawdzić, jak zadziała jakaś metoda, możesz skorzystać z BeanShell . Jest to język skryptowy zaprojektowany tak, aby był jak najbliżej Javy. Mówiąc ogólnie, jest to interpretowane jako Java z pewnymi udogodnieniami. Inną opcją tego rodzaju jest język Groovy . Oba te języki skryptowe zapewniają wygodną pętlę Read-Eval-Print znaną z języków interpretowanych. Możesz więc uruchomić konsolę i po prostu wpisać:
" content ".trim();
"content"
Rezultat zobaczysz po naciśnięciu Enter
(lub Ctrl+R
w konsoli Groovy).
String formattedStr=unformattedStr;
formattedStr=formattedStr.trim().replaceAll("\\s+", " ");
trim()
już robi to, co repkaceAll()
by zrobił, gdyby zostało mu coś do zrobienia.