Jak sprawdzić, kiedy konkretny adres URL został po raz pierwszy zaindeksowany przez Google? Wolę rozwiązanie, które działa nawet w przypadku adresów URL konkurencji, które nie są własnością mnie.
Jak sprawdzić, kiedy konkretny adres URL został po raz pierwszy zaindeksowany przez Google? Wolę rozwiązanie, które działa nawet w przypadku adresów URL konkurencji, które nie są własnością mnie.
Odpowiedzi:
Aby poznać wiek adresu URL, możesz kliknąć ten link, zastępując www.example.com
go odpowiednim adresem URL:
https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl
Na przykład, oto wynik z Google dla witryny Meta Stack Overflow :
W przeciwnym razie maszyna Wayback jest również dobrym rozwiązaniem, ale z mojego doświadczenia jest mniej precyzyjna.
.fr
na .com
.
www
również w tym czasie, pokazuje wynik dla daty, Dec 1, 2014
która jest bardzo aktualną datą, która nie może być wiekiem adresu URL. Czy szukam niepoprawnie? czy coś brakuje?
Zistoloen znalazł sposób, aby Google wyświetlił datę pierwszego zaindeksowania treści strony. Dodaję to również do mojej odpowiedzi, ponieważ myślę, że mogę to wyjaśnić jaśniej.
W wynikach wyszukiwania Google wyświetli datę wykrycia treści znajdującej się na stronie.
Jeśli strona zostanie zaktualizowana o nową treść, Google również zaktualizuje tę datę. Jest to raczej data „po raz pierwszy zaindeksował tę treść”, a nie data „po raz pierwszy zindeksował ten adres URL”.
Pamięć podręczna Google dla strony pokazuje, kiedy strona była ostatnio indeksowana. Możesz zobaczyć, że strona główna Stack Exchange została ostatnio zindeksowana dzisiaj:
Inną opcją jest użycie maszyny Wayback z Archiwum Internetowego . To pokazuje, jak strona wyglądała w przeszłości. Możesz dowiedzieć się, kiedy strony zostały po raz pierwszy opublikowane. Zarówno Google, jak i Archiwum Internetowe indeksują się i korzystają ze strony wkrótce po jej opublikowaniu.
bing.com
. Przepraszam, jeśli się mylę?
Może nie być sposobu, aby dowiedzieć się, kiedy dowolna strona internetowa została po raz pierwszy zaindeksowana przez Google - z pewnością nie wiem, jak to zrobić. Możliwe, że Google po prostu nie przechowuje tych informacji, ponieważ nie ma prawdziwego powodu, dla którego musiałyby to robić. Poza tym, nawet jeśli przechowują te informacje, tak naprawdę nie mają szczególnego powodu, aby udostępniać je osobom trzecim.
(Jeśli jest to Twoja strona i masz dostęp do starych dzienników dostępu do serwera, jest to łatwe - wystarczy przeszukać dzienniki podczas pierwszej wizyty Googlebota na tej stronie. Ale w przeciwnym razie nie będzie sposobu, aby się upewnić.)
W każdym razie metoda opisana przez Zistoloena i Stephena Ostermillera w ich odpowiedziach zasadniczo nie ujawnia daty pierwszego zaindeksowania określonego adresu URL przez Google. Pokazuje raczej datę, w której Google uważa, że treść pod adresem URL została opublikowana lub ostatnia aktualizacja, i często opiera się na mniej lub bardziej wiarygodnych próbach „wąchania” dat przez samą treść strony.
W tym filmie Matt Cutts z Google krótko omawia sposób wyboru tych dat. Dla wygody przepisałem odpowiedni fragment filmu (w przybliżeniu od 2:09 do 2:22) poniżej:
„... często zobaczysz datę, tak jak ją wywnioskujemy, lub kiedy ją zobaczyliśmy, za każdym razem, gdy zaindeksowaliśmy tę stronę lub jeśli znajdziemy ją gdzieś na stronie i możemy ją wyodrębnić, Zobaczę to na samym początku fragmentu. ”
W przypadku stron takich jak posty na blogach, strony wiki lub pytania dotyczące wymiany stosów, na których witryna z oprogramowaniem automatycznie zgłasza dokładną datę utworzenia / modyfikacji na samej stronie, data podana przez Google prawdopodobnie będzie zgodna. Jednak w przypadku innych typów stron funkcja wyszukiwania danych Google musi pracować ciężej i nie zawsze działa prawidłowo (cokolwiek „właściwe” może oznaczać w tym kontekście).
W szczególności daty te są zasadniczo bezużyteczne do określania, jak dawno strona została zaindeksowana , z dwóch powodów:
Jeśli strona została niedawno zmodyfikowana, a data modyfikacji jest widoczna na stronie, Google może uznać ją za „datę” strony, nawet jeśli modyfikacja była całkowicie trywialna.
Na przykład ta dość stara strona wiki (która została najpierw zaindeksowana w Archive.org w 2003 r. ) Jest obecnie oznaczona przez Google datą 10 listopada 2014 r. - datą ostatniej edycji, jak pokazano na dole strony. Zmiana, która nastąpiła w tym dniu? Wystarczy usunąć pojedynczy link z dołu strony.
I odwrotnie, Google wydaje się chętnie przyjmować bardzo stare „daty publikacji”, jeśli znajdzie je na stronie - nawet te, które poprzedzają uruchomienie World Wide Web .
Na przykład ta strona w starym konkursie programistycznym jest datowana przez Google na 15 września 1986 r. - w rzeczywistości datę wydarzenia opisaną na stronie. Podobnie ta strona dokumentująca strajk studencki w 1970 r. Jest datowana przez Google na 10 maja 1970 r. (Data zeskanowania dokumentów na stronie), a jeszcze bardziej absurdalnie, ta strona podręcznika systemu Linux jest datowana przez Google na 4 listopada , 1989 (losowa przykładowa data użyta na stronie).
Możesz znaleźć wiele innych takich przykładów, korzystając z niestandardowego wyszukiwania zakresu dat opisanego przez Stephena i Zistoloena, ale ustawiając górny koniec zakresu na, powiedzmy, 6 sierpnia 1991 roku .