Baiduspider indeksoi sivustoani, vaikka robots.txt kieltäisi sitä, miten voin estää sen? [kaksoiskappale]

Tähän kysymykseen on jo annettu vastauksia :

Kommentit

  • Baidu käyttäytyy usein melko hyvin. On mahdollista, että koska Baidu on japanilainen / kiinalainen hakukone, lähinnä Kiinasta, jotkut kaavimet käyttävät agentin nimeä ja joutuvat roistoksi. Tämä voi olla mitä näet. Muuten minun on tutkittava asiaa tarkemmin.

Vastaa

Voit yrittää estää tiettyjä IP-osoitteita .htaccess-tiedostossa. Löydät alueet täältä .

Robots.txt-tiedostossa voit lisätä myös seuraavat

User-agent: Baiduspider User-agent: baiduspider User-agent: Baiduspider+ User-agent: Baiduspider-video User-agent: Baiduspider-image Disallow: / 

Jos käytät myös välimuistilaajennuksia tai CDN-tiedostoa, muista tyhjentää kaikki välimuistisi.

Kommentit

  • Vain ensimmäiset User-agent: Baiduspider pitäisi olla välttämättömiä estämään kaikki Baidu-hämähäkit (" tapauskohtainen alimerkkikatsaus " " -standardin mukaisesti " ja Baidu tiettävästi tukee " vakio "). Ja tämä on mainittu Baidu-ohjeissa . Voi kuitenkin kestää päiviä, ennen kuin hämähäkki noutaa muutoksen arvoon robots.txt

Vastaa

Luulen, että uudelleenkirjoitussääntösi ongelma on OR -lippu. Tämä lippu tarkoittaa yleensä sitä, että toinen uudelleenkirjoitustila on tulossa. Sinulla on vain yksi ehto.

Tässä on sivusto , joka tarjoaa samanlaisen säännön BaiduSpiderin estämiseksi hieman erilaisella syntaksilla:

RewriteEngine On RewriteCond %{HTTP_USER_AGENT} ^Baiduspider.* [NC] RewriteRule .* - [F] 

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *