Ostatnio dowiedziałem się, że użycie wyrażenia regularnego do parsowania kodu HTML strony internetowej w celu uzyskania potrzebnych danych nie jest najlepszym rozwiązaniem. Więc moje pytanie jest proste: co zatem jest najlepszym / najbardziej wydajnym i ogólnie stabilnym sposobem na uzyskanie tych danych? Powinienem zauważyć, że: Brak interfejsów API Nie ma …
Zawsze uważałem, że XML jest nieco kłopotliwy w przetwarzaniu. Nie mówię o implementacji analizatora składni XML: mówię o używaniu istniejącego analizatora opartego na strumieniu, takiego jak analizator składni SAX, który przetwarza węzeł XML według węzła. Tak, naprawdę łatwo jest nauczyć się różnych interfejsów API dla tych parserów, ale kiedy patrzę …
Potrzebuję narzędzia (do użytku domowego), które sformatuje kod SQL (SQL Server / MySQL). Istnieją różne narzędzia innych firm i strony internetowe, które to robią, ale nie dokładnie tak, jak tego potrzebuję. Chcę więc napisać własne narzędzie, które będzie pasować do moich potrzeb. Pierwsze pytanie, czy istnieje jakikolwiek standard lub konwencja …
Czy wymagała tego zmiana języka lub jakiś praktyczny powód, dla którego Bison nie był już odpowiedni ani optymalny? Widziałem na Wikipedii , że się zmieniły, odnosząc się do informacji o wersji GCC 3.4 i GCC 4.1 . Te informacje o wersji zawierają: Ręcznie napisany parser C ++ z rekurencyjnym pochodzeniem …
Zastanawiam się nad użyciem gramatyki GPL Bison do własnego kompilatora. Czy gramatyka „zainfekuje” mój parser tak, że musi być open source? Gramatyka - pod względem - wkład żubra to GPL.
Jest to część serii pytań, które koncentrują się na siostrzanym projekcie Abstraction Project, którego celem jest wyodrębnienie pojęć używanych w projektowaniu języka w formie ram. Projekt siostrzany nazywa się OILexer, który ma na celu skonstruowanie analizatora składni z plików gramatycznych, bez użycia wstrzykiwania kodu do dopasowań. Niektóre inne strony związane …
Szukam informacji i teorii na temat podejścia do tematu leksykalnego. Powiedzmy, że mam kolekcję ciągów, które mogą być tylko jednym zdaniem lub potencjalnie wieloma zdaniami. Chciałbym przeanalizować te ciągi znaków i wydrzeć najważniejsze słowa, być może z wynikiem, który wskazuje, jak prawdopodobne jest to słowo. Spójrzmy na kilka przykładów tego, …
Ostatnio dobrze się bawiłem, badając rozwój parserów językowych w kontekście ich dopasowania do hierarchii Chomsky'ego. Jaki jest dobry (nie teoretyczny) przykład gramatyki kontekstowej?
Chcę stworzyć prostą, sprawdzoną koncepcję aplikacji (REPL), która pobiera liczbę, a następnie przetwarza polecenia na tym numerze. Przykład: zaczynam od 1. Następnie piszę „ add 2”, daje mi 3. Następnie piszę „ multiply 7”, daje mi 21. Następnie chcę wiedzieć, czy jest liczbą pierwszą, więc piszę „ is prime” (na …
Próbuję znaleźć lepsze rozwiązanie do tworzenia parsera niektórych znanych formatów plików, takich jak: EDIFACT i TRADACOMS . Jeśli nie znasz tych standardów, sprawdź ten przykład z Wikipedii: Poniżej znajduje się przykład komunikatu EDIFACT wykorzystanego do odpowiedzi na żądanie dostępności produktu: - UNA:+.? ' UNB+IATB:1+6XPPC+LHPPC+940101:0950+1' UNH+1+PAORES:93:1:IA' MSG+1:45' IFT+3+XYZCOMPANY AVAILABILITY' ERC+A7V:1:AMD' IFT+3+NO …
Właśnie czytałem stronę Wikipedii dotyczącą WebAssembly i napisano: „ WebAssembly jest… zaprojektowany tak, aby był szybszy w analizie niż JavaScript ”, co skłoniło mnie do zastanowienia się, co sprawia, że określony język lub format danych jest szybszy do analizy niż inne i jakie są algorytmy parsowania używany?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.