Jeg har brugt så mange ting som anmodning om fjernelse af webadresse og slettet siderne osv., Men stadig vises fejlene i mine webmasterværktøjer.
Hvordan kan jeg fjerne webadresserne fuldstændigt fra Google?
Svar
Du kan : Fjern en side eller et websted fra Googles søgeresultater , men det vil tage et stykke tid, før det påvirker.
Kommentarer
- I ‘ har anmodet om fjernelse af biblioteket via webmastervinduet, hvor lang tid tager det at gå igennem? I ‘ har også tilladt en mappe via robots.txt-filen.
Svar
Generelt kan du ikke t. Men der er nogle muligheder.
En mulighed er at fjerne siderne helt fra din server og sørge for, at de reagerer med 404-fejl.
En anden er at bruge robots.txt
-fil for at forhindre Google i at gennemgå indholdet. Dette forhindrer helt sikkert nye sider i at blive indekseret, men det kan tage et stykke tid, før eksisterende sider ikke længere vises.
En sidste mulighed er at bruge noindex
metatag.
For detaljer, se Googles side om dette emne: http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=164734
Svar
Det korte svar i sammenhæng med at være praktisk: du kan “t .
Hvad du kan gøre er at fjerne links, der peger på dem, og sørg for, at siderne svarer med en 404-statuskode, og når Google ser, at siderne ikke længere eksisterer de vil til sidst rense dem for resultater.
Kommentarer
- Det burde være
410 Gone
ikke404 Not Found
Svar
Hvis dit websted har sider indekseret i Gooogle, du vil fjerne det første trin er at ændre dit websted. Du kan enten fjerne siderne, forhindre Googlebot i at se dem eller inkludere et tag i dem, der beder Google om ikke at indeksere dem.
- 410 Borte – Fjernelse af siderne med en 410-status gør det muligt for Googlebot at fjerne dem fra indekset, så snart det næste gennemgår dem .
- 404 ikke fundet – Googlebot fjerner 404 webadresser efter en 24-frist, når den næste kravle s dem.
- noindex-tag – Hvis siden stadig er tilgængelig på webstedet, men skulle ikke indekseres, inkluder
<meta name="robots" content="noindex">
i sektionen<head>
. Google fjerner det fra indekset, næste gang det gennemsøger det. - Adgangskodebeskyttelse – Beskyt oplysningerne ved at kræve et login eller en adgangskode for at få adgang til dem. Google kan indeksere URLen i dette tilfælde, men den kan ikke indeksere indholdet.
-
Tillad i robots.txt – Du kan blokere Googlebot for at gennemgå sider ved at tilføje
Disallow: /mypage
i robots.txt. Google indekserer normalt ikke sider, det kan ikke crawle og det indekserer aldrig deres indhold. Google kan dog nogle gange vise webadressen i søgeresultaterne uden noget uddrag :Hvis du har fjernet siden eller tilføjet en
noindex
-tag er det vigtigt, at du tillader Googlebot at gennemgå siden. Hvis du også ikke tillader crawling i robots.txt , vil Googlebot ikke kunne se, at din side skal være fjernet. Tillad ikke sider i robots.txt hvis du også har implementeret en anden metode fra denne liste.
Med alle disse metoder skal Googlebot returner og gennemgå siderne, før de fjernes. Denne proces kan tage et par måneder , især for mange sider, der ikke er meget populær. Hvis du vil fremskynde processen, skal du logge ind på Google Search Console og bruge funktionen Hent som Google til hver URL. Bemærk at dette er en manuel proces med en kvote på ti hentninger om dagen, så det fungerer ikke for et stort antal webadresser.
Google har også en Fjern webadresser værktøj i Search Console, der kan midlertidigt fjerne webadresser eller mapper fra Google i 90 dage. Du kan bruge dette værktøj til hurtigt at fjerne webadresser fra søgeresultaterne, før Googlebot har en chance for at gennemgå dem.
Selv efter at webadresser er fjernet fra Googles søgeresultater, viser Google muligvis stadig webadresserne som fejl i Google Search Console. Så længe Google finder links til webadresser, vises de muligvis som crawlfejl, efter at de har status 404 eller 410.Dette er helt normalt og vil overhovedet ikke skade de andre sider på dit websted. Se hvad Googles John Mueller siger om crawlfejl for at få flere oplysninger .
Svar
Der er to måder at fjerne webadresser fra Google Søgemaskine
Første er
Hvis du ikke vil gennemgå din side i google, så du skal bruge google webmasterværktøj” s Fjernelses-URL-værktøj for at anmode om fjernelse Her er det vejen
- Log ind på dit webmasterværktøj
- gå til Webstedskonfiguration
- gå til Crawleradgang
- gå til fanen Crawleradgang
- skadedyr din URL i ny anmodning om fjernelse
efter få dage slettes din url fra søgemaskinen og kan ikke crawl.
2.
Hvis dit websted har indhold, behøver du ikke ønsker, at Google eller andre søgemaskiner skal have adgang, bruge en robots.txt og ikke tillade mappen på den webside.
Du kan bruge et af ovenstående trin til at fjerne webadresser fra Google-søgemaskine
Svar
Først og fremmest fik Google en god hukommelse. Så selvom det lykkes dig at få Google til at droppe dine webadresser fra deres indeks, vil de anmode om disse webadresser i fremtiden igen. Din tilgang skal tage højde for begge dele.
Jeg vil råde dig til at gennemgå disse trin
- Brug Google-søgning Konsolens værktøj til fjernelse for at forhindre Google i at surfe på dine webadresser. Dette er en manuel anmodning, som du arkiverer til Google, som normalt får webadresserne skjult inden for 24 timer (men ofte hurtigere) under
TEMPORARILY REMOVE URL
. Bemærk, at dette kun betyder, at Google skjuler dine webadresser i 180 dage, de “er ikke rigtig væk endnu (vi” vil kom til det senere). - Sørg for at rydde alle cacher, som Google har til dine webadresser, ved at bruge den anden fane
CLEAR CACHED URL
på Google Search Consoles værktøj til fjernelse . Efter håndtering af trin 1 og 2 viser Google ikke dine webadresser længere, inklusive cachelagrede versioner. - Nu fra dit indlæg finder jeg ud af, at du allerede har fjernet siderne. Så i så fald er det bedst at sørge for at returnere
410 Gone
statuskoden i stedet for en404 Not Found
.410 Gone
sender et meget stærkere signal til Google om, at de skal fjerne URLen fra deres indeks. Dette er bedre end at returnere en404 Not Found
, fordi de ofte er utilsigtede. - Fjern eventuelle interne links, indgående omdirigeringer og indgående kanoniske til de sider, du vil fjerne. Du skal stoppe med at sende signaler, der indikerer, at en webadresse skal crawles (og muligvis indekseres) til Google.
- For nemt at overvåge, om Google henter alle dine tip, skal du oprette et XML-sitemap, der viser alle de webadresser, du ønsker, og sende det i Google Search Console. Fjern XML-sitemap, efter at Google “har slettet alle webadresser fra dets indekserede.
Hvad skal man undgå
Undgå at anvende robots.txt-direktiver for at få Google til at fjerne webadresser fra deres indeks, for hvis de “allerede har indekseret indholdet, tager det virkelig lang tid for dem for at slippe webadresserne ud af deres indeks. De kan ikke hente din 410 Gone
, fordi du forhindrede dem i at få adgang til den.
Også for nye sider, der skal være tilgængelige for besøgende, anbefales det ikke at forhindre Google i at indeksere det gennem robots.txt. Det er bedst at bruge Noindex Robots-direktivet (enten gennem HTML-kilden eller gennem X-Robots-Tag
HTTP-header).
Interessant Google rådgiver sig om at bruge robots.txt for at få dem til slip billeder fra deres indeks.
Lær mere om fjernelse af URL
Hvis du vil grave nærmere ind i at fjerne webadresser fra Google, har jeg dokumenteret fjernelsesprocessen for denne situation og flere andre i detaljer i: https://www.contentkingapp.com/academy/google-remove-urls/ .