Mam podkatalog, który chciałbym ukryć przed robotami indeksującymi wyszukiwarki.
Jednym ze sposobów jest skorzystanie robots.txt
z katalogu głównego serwera (standardowy sposób). Jednak każdy, kto zna adres URL witryny i ma podstawową wiedzę o sieci, może uzyskać dostęp do zawartości pliku robots.txt i dostrzec niedozwolone katalogi.
Pomyślałem, jak tego uniknąć, ale nie jestem pewien, czy zadziała.
Niech X
będzie nazwą podkatalogu, który chcę wykluczyć. Jednym ze sposobów, aby zatrzymać indeksujące indeksowania X
katalogu i jednocześnie, aby trudniej kogoś do zidentyfikowania X
katalog z korzenia robots.txt
, jest dodanie robots.txt
w X
katalogu zamiast katalogu głównego.
Jeśli zastosuję się do tego rozwiązania, mam następujące pytania:
- Czy roboty indeksujące znajdą to
robots.txt
w podkatalogu? (biorąc pod uwagę, żerobots.txt
już istnieje, a także w katalogu głównym) Jeśli
robots.txt
znajduje się wX
podkatalogu, to czy powinienem używać ścieżek względnych czy bezwzględnych ?:User-agent: * Disallow: /X/
lub
User-agent: * Disallow: /