Próbuję zbudować zestaw danych na kilku plikach dziennika jednego z naszych produktów.
Różne pliki dziennika mają własny układ i własną zawartość; Z powodzeniem pogrupowałem je razem, pozostał tylko jeden krok ...
Rzeczywiście, „wiadomości” dziennika są najlepszą informacją. Nie mam wyczerpującej listy wszystkich tych wiadomości, a kodowanie na podstawie tych kodów jest złym pomysłem, ponieważ ta lista może się zmieniać każdego dnia.
Chciałbym oddzielić tekst identyfikujący od tekstu wartości (na przykład: „Załadowany plik XXX” staje się (identyfikacja: „Załadowany plik”, wartość: „XXX”)). Niestety, ten przykład jest prosty, aw prawdziwym świecie istnieją różne układy, a czasem wiele wartości.
Myślałem o użyciu jądra łańcuchów, ale jest on przeznaczony do klastrowania ... i cluseting nie ma tu zastosowania (nie znam liczby różnych typów komunikatów i chociaż to by było za dużo).
Masz jakiś pomysł?
Dzięki za pomoc.
PS: Dla programistów może to być łatwiejsze do zrozumienia. Powiedzmy, że kod zawiera jako logi printf („blabla% s”, „xxx”) -> Chciałbym mieć oddzielne „blabla” i „xxx”