Pytania otagowane jako parsing

8
Automatyczne parsowanie tekstu cytatu w odniesieniach akademickich
Czy istnieje oprogramowanie (lub pseudo-kod), które może automatycznie skanować fragment tekstu (wklejonego do narzędzia lub czytać z .doc / .pdf) i identyfikować dane cytowania przy użyciu standardowych formatów? Dane zostaną następnie podzielone na pola składowe i wyeksportowane w formacie XML, CSV lub innym formacie danych strukturalnych. Patrzyłem na cb2Bib, ale …


3
Zaimportuj dane Json do Excela
Mam plik tekstowy w formacie json i chcę go przeczytać w programie Excel. Bardzo uproszczony przykład pliku json ma następującą strukturę: { [ { 'a': 10, 'b': 20 }, { 'a': 20, 'b': 22 }, { 'a': 11, 'b': 24 } ] } Chcę przekonwertować go do programu Excel, w …


1
Zliczanie powiela linie ze strumienia
Obecnie analizuję dzienniki apache za pomocą tego polecenia: tail -f /opt/apache/logs/access/gvh-access_log.1365638400 | grep specific.stuff. | awk '{print $12}' | cut -d/ -f3 > ~/logs Dane wyjściowe to lista domen: www.domain1.com www.domain1.com www.domain2.com www.domain3.com www.domain1.com W innym terminalu uruchamiam to polecenie: watch -n 10 'cat ~/logs | sort | uniq -c …



0
Czy słowo kluczowe może znajdować się w tablicy Adnotacji PDF?
Parser JHOVE dla PDF, który utrzymuję, czasami znajdzie obiekt niebędący słownikiem w tablicy Annots w pliku PDF . Zgodnie z sekcją 8.4.1 specyfikacji PDF tablica Annots zawiera „tablicę słowników adnotacji”. W przypadku, na który patrzę teraz, istnieje słowo kluczowe „Adnotacja” zamiast słownika. Czy jest to nieprawidłowy plik PDF, czy w …
1 pdf  parsing 


1
Analizowanie określonych adresów URL z lokalnego pliku HTML
Chcę przeanalizować niektóre adresy URL z zapisanego pliku HTML za pomocą prostego skryptu / komendy bash, aby móc je pobrać za pomocą wgetpóźniejszych plików. Do tej pory mam: awk 'BEGIN{ RS="<a *href *= *\""} NR>2 {sub(/".*/,"");print; }' index.html >> url-list.txt który zapisuje każdy link znajdujący się w moim pliku HTML …


1
Jak parsować dane z wnętrza tagu za pomocą Applescript?
Jak parsować dane z wnętrza tagu za pomocą Applescript? Wiem, że Applescript ma words 3 thru -2 of myTextVariableskładnię - ale jak mam go użyć, aby mieć pewność, że otrzymuję tylko This is my textz poniższych tagów? <p>This is my text</p> lub <p class="new">This is my text</p> lub <h1>This is …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.