Za pomocą przeglądarki internetowej (IE lub Chrome) mogę zapisać stronę internetową (.html) za pomocą Ctl-S, sprawdzić ją w dowolnym edytorze tekstu i zobaczyć dane w formacie tabeli. Jedna z tych liczb, które chcę wyodrębnić, ale dla wielu, wielu stron internetowych, zbyt wiele do zrobienia ręcznie. Więc chciałbym użyć WGET, aby pobierać te strony jedna po drugiej, i napisać inny program do parsowania pliku .html i pobrania żądanej liczby. Ale plik .html zapisany przez WGET przy użyciu tego samego adresu URL co przeglądarka nie zawiera tabeli danych. Dlaczego nie? To tak, jakby serwer wykrył, że żądanie pochodzi od WGET, a nie z przeglądarki internetowej, i dostarcza szkieletową stronę internetową bez tabeli danych. Jak mogę uzyskać dokładnie tę samą stronę internetową za pomocą WGET? - Dzięki!
WIĘCEJ INFORMACJI:
Przykład adresu URL, który próbuję pobrać, to: http://performance.morningstar.com/fund/performance-return.action?t=ICENX®ion=usa&culture=en-US, gdzie ciąg ICENX jest symbolem giełdowym funduszu inwestycyjnego , które zmienię na dowolny z wielu różnych symboli giełdowych. Spowoduje to pobranie tabeli danych podczas przeglądania w przeglądarce, ale tabeli danych brakuje, jeśli jest pobierana za pomocą WGET.