Zrobiłem scrape strony internetowej dla projektu konwersji. Chciałbym zrobić kilka statystyk dotyczących rodzajów plików tam zawartych - na przykład 400 .html
plików, 100 .gif
itd. Jak to łatwo zrobić? To musi być rekurencyjne.
Edycja: Ze skryptem opublikowanym przez maxschelpzig mam problemy z architekturą strony, którą zeskrobałem. Niektóre pliki mają *.php?blah=blah&foo=bar
różne argumenty, dlatego wszystkie są traktowane jako unikalne. Tak więc rozwiązanie należy uznać *.php*
za tego samego typu, że tak powiem.