Chciałbym zablokować bota za pomocą IIS. Za pomocą Apache możesz dodać polecenie do pliku .htaccess, jak opisano tutaj . Jak mam to osiągnąć za pomocą IIS 7.5?
Aktualizacja
Oprócz odpowiedzi poniżej, istnieje wiele metod, które odkryłem od czasu opublikowania tego pytania:
- Opcja skanowania adresu URL wymieniona w zaakceptowanej odpowiedzi.
- Zdefiniuj regułę filtrowania żądań (przykład poniżej)
- Zdefiniuj regułę przepisywania adresów URL (przykład poniżej)
Żądaj reguły filtrowania
<system.webServer>
<security>
<requestFiltering>
<filteringRules>
<filteringRule name="BlockSearchEngines" scanUrl="false" scanQueryString="false">
<scanHeaders>
<clear />
<add requestHeader="User-Agent" />
</scanHeaders>
<appliesTo>
<clear />
</appliesTo>
<denyStrings>
<clear />
<add string="YandexBot" />
</denyStrings>
</filteringRule>
</filteringRules>
</requestFiltering>
</security>
[...]
</system.webServer>
Reguła przepisywania adresów URL
<rule name="RequestBlockingRule1" patternSyntax="Wildcard" stopProcessing="true">
<match url="*" />
<conditions>
<add input="{HTTP_USER_AGENT}" pattern="YandexBot" />
</conditions>
<action type="CustomResponse" statusCode="403" statusReason="Forbidden: Access is denied." statusDescription="Get Lost." />
</rule>
W ostatnim projekcie skończyłem z opcją 2, ponieważ jest ona skoncentrowana na bezpieczeństwie i oparta na zintegrowanym skanowaniu adresów URL wbudowanym w IIS 7.