Pytania otagowane jako parsing

Analizowanie (nie) ustrukturyzowanych danych w celu przekształcenia ich w ustrukturyzowany, znormalizowany format.


5
Czy oddzielne testy parsowania i leksykacji są dobrą praktyką w przypadku kombinacji parserów?
Kiedy zacząłem używać parseratorów, moją pierwszą reakcją było poczucie wyzwolenia z czegoś, co wydawało się sztuczną różnicą między analizą składniową a leksyką. Nagle wszystko zaczęło się przetwarzać! Ostatnio jednak natknąłem się na ten post na codereview.stackexchange ilustrujący kogoś przywracającego to rozróżnienie. Na początku myślałem, że to z ich strony głupie, …

2
Czy kompilatory wykorzystują wielowątkowość w celu skrócenia czasu kompilacji?
Jeśli dobrze pamiętam kurs mojego kompilatora, typowy kompilator ma następujący uproszczony zarys: Analizator leksykalny skanuje (lub wywołuje funkcję skanowania) kod źródłowy znak po znaku Ciąg znaków wejściowych jest sprawdzany pod kątem poprawności ze słownikiem leksemów Jeśli leksem jest ważny, jest on następnie klasyfikowany jako token, któremu odpowiada Analizator składni sprawdza …

3
Ogólny projekt parsera plików w Javie przy użyciu wzorca strategii
Pracuję nad produktem, w którym jednym z modułów jest parsowanie plików XML i zrzucanie wymaganej zawartości do bazy danych. Mimo że obecnym wymaganiem jest tylko parsowanie plików XML, chcę zaprojektować mój moduł analizujący w taki sposób, aby w przyszłości mógł obsługiwać dowolny rodzaj plików. Powodem takiego podejścia jest to, że …
14 java  design  parsing  xml 

5
Wymyślanie tokenów dla leksera
Piszę parser dla utworzonego przeze mnie języka znaczników (piszę w Pythonie, ale to nie jest tak naprawdę istotne w przypadku tego pytania - w rzeczywistości, jeśli wydaje się to złym pomysłem, chętnie zaproponuję lepszą ścieżkę) . Czytam o parserach tutaj: http://www.ferg.org/parsing/index.html i pracuję nad napisaniem leksera, który, jeśli dobrze rozumiem, …
14 python  parsing  lexer 

2
Jaki jest najprostszy przykład wyjaśniający różnicę między drzewami parsowania a drzewami abstrakcyjnej składni?
O ile mi wiadomo, analizator składni tworzy drzewo analizujące, a następnie odrzuca je. Może jednak wyskoczyć z abstrakcyjnego drzewa składni, z którego podobno korzysta kompilator. Mam wrażenie, że zarówno parsowanie, jak i abstrakcyjne drzewo składniowe są tworzone pod etapem analizy. Czy ktoś mógłby wyjaśnić, dlaczego są one różne?
14 parsing  trees 

5
testy jednostkowe dla parsera csv
Jakich testów należy użyć do testowania jednostkowego analizatora składni csv? Mam prosty parser csv w języku C # i chcę mieć pewność, że mam dobry zasięg testu wszystkich wspólnych (i nietypowych) przypadków krawędzi. Jakie testy należy zastosować, aby zidentyfikować potencjalne problemy i przypadki graniczne?
14 testing  parsing 


5
Jak najlepiej zarządzać tworzeniem wydań kodu open source z poufnego kodu badawczego mojej firmy?
Moja firma (nazwijmy je Acme Technology) ma bibliotekę około tysiąca plików źródłowych, które pierwotnie pochodziły od jej grupy badawczej Acme Labs, inkubowanej przez kilka lat w grupie programistów, a ostatnio udostępniono garstce klientów pod nieujawnianie. Acme przygotowuje się do wydania około 75% kodu społeczności open source. Pozostałe 25% zostanie wydanych …

6
Jaki jest najprostszy format pliku konfiguracyjnego czytelnego dla człowieka? [Zamknięte]
Zamknięte . To pytanie jest oparte na opiniach . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby można było na nie odpowiedzieć faktami i cytatami, edytując ten post . Zamknięte 5 lat temu . Aktualny plik konfiguracyjny wygląda następująco: mainwindow.title = 'test' mainwindow.position.x = 100 mainwindow.position.y = …

2
Trwałe przetwarzanie przetworzonego języka naturalnego
Niedawno zacząłem eksperymentować z przetwarzaniem języka naturalnego (NLP) przy użyciu CoreNLP Stanforda i zastanawiam się, jakie są standardowe sposoby przechowywania analizowanych danych NLP dla czegoś takiego jak aplikacja do eksploracji tekstu? Jednym ze sposobów, który moim zdaniem może być interesujący, jest przechowywanie dzieci jako listy sąsiedztwa i dobre wykorzystanie zapytań …

3
Jak określić gramatykę dla analizatora składni?
Programuję od wielu lat, ale jednym z zadań, które wciąż zajmuje mi wyjątkowo dużo czasu, jest określenie gramatyki parsera, a nawet po tym nadmiernym wysiłku nigdy nie jestem pewien, czy gramatyka, którą wymyśliłem, jest dobra ( przez jakąkolwiek rozsądną miarę „dobra”). Nie oczekuję, że istnieje algorytm automatyzujący proces określania gramatyki, …

2
W kategoriach laika, czym jest rekurencja?
Według jednej strony na code.google.com „lewą rekurencję” definiuje się następująco: Lewa rekurencja odnosi się tylko do każdego rekurencyjnego nieterminala, który, gdy tworzy sentymentalną formę zawierającą się, ta nowa kopia sama pojawia się po lewej stronie reguły produkcji. Wikipedia oferuje dwie różne definicje: Jeśli chodzi o gramatykę bezkontekstową, nieterminalny r jest …

3
Jakie problemy pojawiają się podczas pracy z komunikatami HL7?
Testuję produkt dla firm opieki zdrowotnej i pracujemy z komunikatami HL7. Widziałem ludzi jęczących na inne pytanie dotyczące problemów z HL7, ale nie wspominając o szczegółach. Czy ktoś może mi dać jakieś wyobrażenie o tym, jakich problemów lub klas problemów powinniśmy szczególnie szukać? Do analizowania używamy dobrze używanych bibliotek. Jeśli …
12 testing  parsing  hl7 

2
język z dwoma operatorami binarnymi o tym samym priorytecie, lewostronny i prawostronny
Czy istnieje programowania (lub skrypty) język (lub jakiś specyficzny język domeny) o dwóch operatorów binarnych opli oprod samego pierwszeństwa przy oplczym lewy asocjacyjne i oprbycia prawym asocjacyjne? (Nie mogę znaleźć takiego przykładu, ale próbuję napisać parser na tyle ogólny, aby poradził sobie z tym dziwnym przypadkiem) Jak parsowane byłyby wyrażenia …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.