A Baiduspider akkor is feltérképezi a webhelyemet, ha azt a robots.txt tiltja. Hogyan akadályozhatom meg? [duplicate]

Erre a kérdésre már itt vannak válaszok :

megjegyzések

  • Baidu gyakran elég jól viselkedik. Lehetséges, hogy mivel a Baidu japán / kínai keresőmotor főként Kínából származik, egyes kaparók az ügynök nevét használják és szélhámosak. Lehet, hogy ezt látja. Ellenkező esetben ezt tovább kell vizsgálnom.

Válasz

Megpróbálhatja blokkolni az adott IP-címeket a .htaccess fájlban. A tartományokat itt találja .

A robots.txt fájlban a következőket is hozzáadhatja

User-agent: Baiduspider User-agent: baiduspider User-agent: Baiduspider+ User-agent: Baiduspider-video User-agent: Baiduspider-image Disallow: / 

Ha gyorsítótár-bővítményeket vagy CDN-t is használ, ne felejtse el törölni az összes gyorsítótárat.

Megjegyzések

  • Csak az első User-agent: Baiduspider -re lehet szükség az összes Baidu pók blokkolásához (" egy esetre érzéketlen szubsztrátum " a " szabvány szerint " és Baidu állítólag támogatja a " standard "). Ez pedig a Baidu súgójában szerepel. Néhány napig azonban eltarthat, amíg a pók felveszi a módosítást robots.txt

Válasz

Úgy gondolom, hogy az átírási szabály problémája az OR zászló. Ez a zászló általában azt jelenti, hogy jön egy második átírási feltétel. Csak egy feltételed van.

Itt van egy webhely , amely hasonló szabályt nyújt a BaiduSpider blokkolásához, kissé eltérő szintaxissal:

RewriteEngine On RewriteCond %{HTTP_USER_AGENT} ^Baiduspider.* [NC] RewriteRule .* - [F] 

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük