Tähän kysymykseen on jo annettu vastauksia :
Kommentit
- Baidu käyttäytyy usein melko hyvin. On mahdollista, että koska Baidu on japanilainen / kiinalainen hakukone, lähinnä Kiinasta, jotkut kaavimet käyttävät agentin nimeä ja joutuvat roistoksi. Tämä voi olla mitä näet. Muuten minun on tutkittava asiaa tarkemmin.
Vastaa
Voit yrittää estää tiettyjä IP-osoitteita .htaccess-tiedostossa. Löydät alueet täältä .
Robots.txt-tiedostossa voit lisätä myös seuraavat
User-agent: Baiduspider User-agent: baiduspider User-agent: Baiduspider+ User-agent: Baiduspider-video User-agent: Baiduspider-image Disallow: /
Jos käytät myös välimuistilaajennuksia tai CDN-tiedostoa, muista tyhjentää kaikki välimuistisi.
Kommentit
- Vain ensimmäiset
User-agent: Baiduspider
pitäisi olla välttämättömiä estämään kaikki Baidu-hämähäkit (" tapauskohtainen alimerkkikatsaus " " -standardin mukaisesti " ja Baidu tiettävästi tukee " vakio "). Ja tämä on mainittu Baidu-ohjeissa . Voi kuitenkin kestää päiviä, ennen kuin hämähäkki noutaa muutoksen arvoonrobots.txt
Vastaa
Luulen, että uudelleenkirjoitussääntösi ongelma on OR
-lippu. Tämä lippu tarkoittaa yleensä sitä, että toinen uudelleenkirjoitustila on tulossa. Sinulla on vain yksi ehto.
Tässä on sivusto , joka tarjoaa samanlaisen säännön BaiduSpiderin estämiseksi hieman erilaisella syntaksilla:
RewriteEngine On RewriteCond %{HTTP_USER_AGENT} ^Baiduspider.* [NC] RewriteRule .* - [F]