Czy warto zwracać 410
zamiast, 404
gdy jakaś strona zostanie trwale usunięta? W tym filmie Matt Cutts mówi, że Google traktuje je tak samo, ale czy istnieją inne powody, aby je wdrożyć 410
(oprócz poprawności technicznej)?
Czy warto zwracać 410
zamiast, 404
gdy jakaś strona zostanie trwale usunięta? W tym filmie Matt Cutts mówi, że Google traktuje je tak samo, ale czy istnieją inne powody, aby je wdrożyć 410
(oprócz poprawności technicznej)?
Odpowiedzi:
W naszej witrynie wdrożyliśmy ostatnio 410 błędów dla stron, które zostały trwale usunięte. Mamy około 40 milionów stron w indeksie Google i Googlebot indeksuje je 2 milionami żądań dziennie.
Po wyczyszczeniu naszej bazy danych wykryliśmy dużą liczbę błędów 404, które pojawiały się w błędach indeksowania w Narzędziach dla webmasterów. Kiedy zmieniliśmy na 410 statusów zamiast 404, liczba błędów dziennie zmniejszyła się o połowę, podczas gdy łączna liczba wykonanych żądań pozostała na tym samym poziomie. Więc to bardziej skutecznie indeksuje strony dziennie. Wygląda na to, że strony o statusie 404 są indeksowane wiele razy, zanim zostaną całkowicie usunięte z indeksu.
Powiedziałbym więc, że tak, zdecydowanie warto użyć 410 tam, gdzie jest to właściwe, aby utrzymać budżet Google Crawl.
Na tym świecie jest więcej niż Google. 410 jednoznacznie informuje bota, że plik zniknął. 404 nie. Trwały bot może wciąż próbować znaleźć 404 w nieskończoność, podczas gdy może przestać próbować znaleźć 410 natychmiast, co uczyniłoby twój serwer bardzo szczęśliwym.
Poza tym, że istnieje więcej wyszukiwarek niż Google, nie ma również powodu, aby zakładać, że Google nigdy nie zmieni sposobu, w jaki traktują 410 odpowiedzi. Rzeczywiście wydaje się, że już się to wydarzyło: informacje, które Matt Cutts cytuje w filmie, pochodzą z 2007 roku, podczas gdy ten post z 2009 roku autorstwa Johna Mu na forach Google dla webmasterów mówi inaczej:
„Śledziłem sprawę 404 vs 410 z zespołem tutaj. Jak wspomnieli inni tutaj i gdzie indziej, ogólnie traktowaliśmy ich tak samo w przeszłości.
Jednak po przyjrzeniu się, jak webmasterzy używają ich w praktyce, traktujemy teraz kod wynikowy HTTP 410 jako „bardziej trwały” niż 404. Jeśli więc masz absolutną pewność, że strona już nie istnieje i nigdy więcej nie będzie istnieć, użycie 410 byłoby prawdopodobnie dobrą rzeczą. ”
Wygląda więc na to, że Google rzeczywiście traktuje 410 odpowiedzi inaczej niż 404.
Z mojego doświadczenia wynika, że Google nie rozumie 410 kodów błędów.
Jakiś czas temu zmieniłem pełną witrynę, więc wszystkie stare adresy URL to „410 Gone”. Nie mogę użyć przekierowań 301, ponieważ nie ma bezpośredniego związku z nowym adresem URL.
Użyłem a, .htaccess
aby powiedzieć Google, że stare adresy URL zniknęły, ale wciąż mówi mi, że w mojej witrynie jest OGROMNA liczba błędów 404. Sprawdziłem adresy URL w raporcie błędu indeksowania i wszystkie mają 410, a nie 404, jak to stwierdza.
Na tym świecie jest więcej niż Google.
Cytowany za prawdę. Biorąc pod uwagę twoje wymaganie, aby poinformować boty (i prawdopodobnie również ludzi), że strona została trwale usunięta , faktycznie wybrałbym301
przekierowanie do strony wyjaśniającej (jeśli to konieczne), dlaczego treść została usunięta, lub zabrałem bota / użytkownika powrót do strony indeksu.
Mniej znane kody błędów HTTP zwykle nie są tak dobrze obsługiwane, zrozumiałe ani wdrażane we wszystkich obszarach, więc ogólnie trzymam się tych, które mają zapewnić oczekiwane i, mam nadzieję, płynne przeglądanie.
Wybór opcji zależy od tego, ile żądań wciąż przychodzi w przypadku (obecnie) brakującej zawartości.