Jeśli nie chcę ustawiać żadnego specjalnego zachowania, czy jest w porządku, jeśli nie przejmuję się plikiem robots.txt?
A może brak jednego może być szkodliwy?
Jeśli nie chcę ustawiać żadnego specjalnego zachowania, czy jest w porządku, jeśli nie przejmuję się plikiem robots.txt?
A może brak jednego może być szkodliwy?
Odpowiedzi:
Brak pliku robots.txt nie będzie szkodliwy. Ze strony internetowej robotstxt.org :
Aby umożliwić wszystkim robotom pełny dostęp
Klient użytkownika: *
Zabroń:(lub po prostu utwórz pusty plik „/robots.txt” lub nie używaj go wcale)
Jednak nawet jeśli nie podajesz niczego w pliku robots.txt, jest to dobry sposób na poinformowanie wyszukiwarek o lokalizacji mapy witryny XML . Możesz to zrobić, dodając wiersz u góry pliku robots.txt, który wygląda mniej więcej tak:
Mapa strony: http://www.example.com/sitemap-host1.xml
Należy również pamiętać, że jego brak spowoduje utworzenie 404 wpisów w dziennikach internetowych.
Jeśli nie masz pliku „robots.txt”, w dzienniku błędów pojawi się 404 plików, co może być pewnego rodzaju irytacją, podobnie jak w przypadku braku favicon.
robots.txt
plik, który dodatkowo będzie rzadziej pobierany z powodu wyszukiwarek stosujących odpowiednią kontrolę pamięci podręcznej HTTP .
Myślę, że to ma być OK, w przeciwnym razie ogromne połacie internecie byłoby un-indeksowane przez roboty internetowe.
Nie robots.txt
jest robots.txt
prawie tak samo jak „zezwalaj na indeksowanie przez wszystkich” prawie z definicji.
Cóż, ponieważ robots.txt
zawiera adres mapy witryny , brak jej jest potencjalnie szkodliwy.