Szczerze mówiąc, wyrażenia regularne nie są najlepszym pomysłem na tego typu analizowanie. Opublikowane przez Ciebie wyrażenie regularne prawdopodobnie będzie dobrze działać w prostych przypadkach, ale jeśli sprawy staną się bardziej złożone, będziesz mieć ogromne problemy (z tego samego powodu, dla którego nie możesz niezawodnie przeanalizować HTML za pomocą wyrażeń regularnych). Wiem, że prawdopodobnie nie chcesz tego słyszeć. Wiem, że tego nie robiłem, gdy zadawałem pytania tego samego typu, ale analizowanie ciągów znaków stało się dla mnie O WIELE bardziej niezawodne, gdy przestałem używać wyrażeń regularnych do wszystkiego.
jTopas to NIESAMOWITY tokenizer, który bardzo ułatwia ręczne pisanie parserów (MOCNIE sugeruję użycie jtopa zamiast standardowych bibliotek skanera java / etc ..). Jeśli chcesz zobaczyć jtopas w akcji, oto kilka parserów, które napisałem przy użyciu jTopas do parsowania tego typu pliku
Jeśli analizujesz pliki XML, powinieneś używać biblioteki parsera xml. Nie rób tego sam, chyba że robisz to tylko dla przyjemności, istnieje wiele sprawdzonych opcji
[]
nawiasy kwadratowe, które są metaznakami w wyrażeniu regularnym.