URLs verwijderen uit Google Search Engine

Ik heb zoveel dingen gebruikt, zoals het verzoek om URLs te verwijderen en de paginas enz. Te verwijderen, maar de fouten worden nog steeds weergegeven in mijn webmasterhulpprogrammas.

Hoe kan ik de URLs volledig van Google verwijderen?

Antwoord

U kunt : Verwijder een pagina of site uit de zoekresultaten van Google , maar het duurt even voordat deze effect heeft.

Reacties

  • Ik ‘ heb de verwijdering van de directory aangevraagd via het Webmasters-paneel, hoe lang duurt het om door te gaan? I ‘ heb ook een directory niet toegestaan via het robots.txt-bestand.

Answer

Over het algemeen kunt u “t. Maar er zijn enkele opties.

Een optie is om de paginas volledig van uw server te verwijderen en ervoor te zorgen dat ze reageren met 404-fouten.

Een andere optie is om de robots.txt -bestand om te voorkomen dat Google de inhoud crawlt. Dit zal zeker voorkomen dat nieuwe paginas worden geïndexeerd, maar het kan even duren voordat bestaande paginas niet meer verschijnen.

Een laatste optie is om de noindex metatag.

Zie voor details de Google-pagina over dit onderwerp: http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=164734

Antwoord

Het korte antwoord in de context van praktisch zijn: je kunt “t .

Wat u kunt doen, is links verwijderen die ernaar verwijzen en ervoor zorgen dat de paginas reageren met een 404-statuscode, en wanneer Google ziet dat de paginas niet meer bestaan ze “zullen ze uiteindelijk uit de resultaten verwijderen.

Reacties

  • Dat moet 410 Gone zijn en niet 404 Not Found

Antwoord

Als uw site paginas heeft die zijn geïndexeerd in Google, dat u wilt verwijderen, is de eerste stap het wijzigen van uw site. U kunt de paginas verwijderen, Googlebot blokkeren om ze te bekijken of er een tag in opnemen die Google vertelt ze niet te indexeren.

  • 410 Gone – Door de paginas met een 410-status te verwijderen, kan Googlebot ze uit de index verwijderen zodra ze de volgende keer worden gecrawld .
  • 404 niet gevonden – Googlebot verwijdert de volgende 404 URLs na een respijtperiode van 24 dagen kruipen s hen.
  • noindex-tag – Als de pagina nog steeds beschikbaar is op de site, maar zou moeten niet worden geïndexeerd, neem dan <meta name="robots" content="noindex"> op in de sectie <head>. Google verwijdert het uit de index wanneer het het de volgende keer crawlt.
  • Wachtwoordbeveiliging – Beschermen de informatie door een login of wachtwoord te vereisen om er toegang toe te krijgen. Google kan de URL in dit geval indexeren, maar het kan de inhoud niet indexeren.
  • Disallow in robots.txt – Je kunt Googlebot blokkeren voor het crawlen van paginas door Disallow: /mypage toe te voegen aan robots.txt. Google indexeert gewoonlijk geen paginas die het niet kan crawlen en het indexeert hun inhoud nooit. Google kan de URL echter soms zonder fragment in de zoekresultaten weergeven :

    voer hier de beschrijving van de afbeelding in

    Als u de pagina heeft verwijderd of een noindex -tag, is het belangrijk dat u Googlebot de pagina laat crawlen. Als u crawlen ook niet toestaat in robots.txt , kan Googlebot niet zien dat uw pagina verwijderd. Sta geen paginas in robots.txt toe als u ook een andere methode uit deze lijst heeft geïmplementeerd.

Bij al deze methoden moet Googlebot retourneer en crawl de paginas voordat ze worden verwijderd. Dit proces kan een paar maanden duren , vooral voor veel paginas die niet erg populair. Als u het proces wilt versnellen, log dan in op Google Search Console en gebruik de functie Fetchen als Google voor elke URL. Houd er rekening mee dat dit een handmatig proces is met een quotum van tien ophaalacties per dag, dus het werkt niet voor een groot aantal URLs.

Google heeft ook een URLs verwijderen tool in Search Console die tijdelijk URLs of directories van Google 90 dagen kan verwijderen. U kunt deze tool gebruiken om URLs snel uit zoekresultaten te verwijderen voordat Googlebot de kans krijgt om ze te crawlen.

Zelfs nadat URLs zijn verwijderd uit de zoekresultaten van Google, kan Google de URLs nog steeds weergeven als fouten in Google Search Console. Zolang Google links naar URLs vindt, kunnen ze worden weergegeven als crawlfouten nadat ze de 404- of 410-status hebben.Dit is volkomen normaal en zal de andere paginas op uw site helemaal geen pijn doen. Zie wat Googles John Mueller te zeggen heeft over crawlfouten voor meer informatie .

Antwoord

Er zijn twee manieren om URLs van Google Search Engine te verwijderen

1e is

Als u uw pagina niet in Google wilt crawlen, moet u de Google-webmasterhulpprogrammas gebruiken Verwijderings-URL-tool om verwijdering aan te vragen Hier is de manier.

  • Log in op uw webmasterhulpprogramma
  • ga naar siteconfiguratie
  • ga naar crawlertoegang
  • ga naar het tabblad Crawler-toegang
  • plaag je URL in een nieuw verwijderingsverzoek

na een paar dagen zal je url uit de zoekmachine worden verwijderd en kan het niet crawlen.

2e

Als uw site inhoud bevat, hoeft u niet wilt dat Google of andere zoekmachines toegang krijgen, gebruik dan een robots.txt en verbied de map van die webpagina.

u kunt een van de bovenstaande stappen gebruiken om URLs uit Google Search Engine te verwijderen

Answer

Ten eerste heeft Google een geweldig geheugen. Dus zelfs als u erin slaagt Google ertoe te brengen uw URLs uit hun index te verwijderen, zullen ze die URLs in de toekomst opnieuw opvragen. Uw aanpak moet rekening houden met beide.

Ik “raad u aan deze stappen te doorlopen

  1. Gebruik Google Zoeken Consoles Removals Tool om te voorkomen dat Google uw URLs opduikt. Dit is een handmatig verzoek dat u indient bij Google, waardoor de URLs meestal binnen 24 uur (maar vaak eerder) worden verborgen onder de TEMPORARILY REMOVE URL. Houd er rekening mee dat dit alleen betekent dat Google uw URLs 180 dagen verbergt, ze zijn nog niet echt verdwenen (we zullen kom daar later op terug).
  2. Zorg ervoor dat u alle caches die Google heeft voor uw URLs wist door het tweede tabblad CLEAR CACHED URL in de Removals Tool van Google Search Console te gebruiken . Na het afhandelen van stap 1 en 2, zal Google je URLs niet meer tonen, inclusief cacheversies.
  3. Nu, uit je bericht, heb ik vastgesteld dat je de paginas al hebt verwijderd. Dus in dat geval “is het het beste om ervoor te zorgen dat u de 410 Gone statuscode retourneert in plaats van een 404 Not Found. De 410 Gone stuurt een veel sterker signaal naar Google dat ze de URL uit hun index moeten verwijderen. Dit is beter dan een 404 Not Found te retourneren, omdat die vaak per ongeluk gebeurt.
  4. Verwijder alle interne links, inkomende omleidingen en inkomende canonicals naar de paginas die je wilt verwijderen. Je moet stoppen met het verzenden van signalen die aangeven dat een URL moet worden gecrawld (en mogelijk geïndexeerd) naar Google.
  5. Om gemakkelijk te controleren of Google al uw hints oppikt, maakt u een XML-sitemap met alle URLs die u wilt verwijderen en verzendt u deze in Google Search Console. Verwijder de XML-sitemap nadat Google alle geïndexeerde URLs heeft verwijderd.

Wat te vermijden

Pas geen robots.txt-richtlijnen toe om Google zover te krijgen dat deze URLs uit hun index verwijdert, want als ze de inhoud al hebben geïndexeerd, zal het erg lang duren voordat ze om de URLs uit hun index te verwijderen. Ze zullen ook “niet in staat zijn om uw 410 Gone op te halen, omdat u hen er geen toegang toe hebt gegeven.

Ook voor nieuwe paginas die toegankelijk zouden moeten zijn voor bezoekers, is het niet aan te raden om te voorkomen dat Google ze indexeert via de robots.txt. Het is het beste om de Noindex Robots-instructie te gebruiken (via de HTML-bron of via de X-Robots-Tag HTTP-header).

Interessant is dat Google adviseert om de robots.txt te gebruiken om ze naar afbeeldingen uit hun index verwijderen.

Meer informatie over het verwijderen van URLs

Als u zich verder wilt verdiepen in het verwijderen van URLs van Google, heb ik het verwijderingsproces voor deze situatie en verschillende andere zeer gedetailleerd gedocumenteerd in: https://www.contentkingapp.com/academy/google-remove-urls/ .

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *