Aktualizacja : następujące działa, drukuje <meta name="robots" content="noindex,follow" />
w sekcji nagłówka wszystkich stron, do których można uzyskać dostęp za pomocą ścieżki rozpoczynającej się od comment
. Ma to obejść fakt, że strona taka jak komentarz / 3 wewnętrznie przenosi węzeł / nid jako argumenty, jak jmarkel wskazał powyżej.
<?php
function metarobots_comment_help() {
$url_components = explode('/', request_uri());
if ($url_components[1] == 'comment') {
$elements = array(
'#tag' => 'meta',
'#attributes' => array(
'name' => 'robots',
'content' => 'noindex,follow',
),
);
drupal_add_html_head($elements, 'robots');
}
}
Za pomocą pomocnego komentarza na temat funkcji arg .
Mamy nadzieję, że w końcu zostanie to rozwiązane przez moduł Meta Tags - pojawiło się żądanie funkcji , ale nie jest jeszcze jasne, czy autor modułu chce to wesprzeć.
[Mój poprzedni komentarz] Chciałem tylko dodać, że użycie robots.txt nie jest odpowiedzią - jak już zauważyłeś, linki wciąż pojawiają się w wynikach wyszukiwania pomimo użycia Disallow: /comment
. Jest to oczekiwane, ponieważ robots.txt mówi botowi, aby nie indeksował tych stron, ale nie informuje Google, aby go nie indeksował. Jak wyjaśniono w SEOmoz Robots.txt i Meta Robots Najlepsze praktyki dotyczące optymalizacji pod kątem wyszukiwarek :
W większości przypadków meta roboty o parametrach „noindex, follow” powinny być stosowane jako sposób ograniczenia przeszukiwania lub indeksowania.
Blokuj przy użyciu pliku Robots.txt - informuje silniki, że nie powinny indeksować podanego adresu URL, ale informuje je, że mogą zachować stronę w indeksie i wyświetlić ją w wynikach.
Blokuj za pomocą Meta NoIndex - informuje silniki, które mogą odwiedzić, ale nie mogą wyświetlać adresu URL w wynikach. (Jest to zalecana metoda) Tak więc naprawdę potrzebujesz metatagu noindex, którego szukasz.
robots.txt
pliku?