Zrobiłem scrape strony internetowej dla projektu konwersji. Chciałbym zrobić kilka statystyk dotyczących rodzajów plików tam zawartych - na przykład 400 .htmlplików, 100 .gifitd. Jak to łatwo zrobić? To musi być rekurencyjne.
Edycja: Ze skryptem opublikowanym przez maxschelpzig mam problemy z architekturą strony, którą zeskrobałem. Niektóre pliki mają *.php?blah=blah&foo=barróżne argumenty, dlatego wszystkie są traktowane jako unikalne. Tak więc rozwiązanie należy uznać *.php*za tego samego typu, że tak powiem.