He utilizado muchas cosas como la solicitud de eliminación de URL y borré las páginas, etc., pero aún así los errores se muestran en mis herramientas para webmasters.
¿Cómo puedo eliminar las URL por completo de Google?
Responder
Puede : Elimina una página o un sitio de los resultados de búsqueda de Google , pero pasará un tiempo antes de que surta efecto.
Comentarios
- Yo ‘ he solicitado la eliminación del directorio a través del panel de webmasters, ¿cuánto tiempo se tarda en hacerlo? I ‘ también rechazamos un directorio a través del archivo robots.txt.
Respuesta
En general, no puede «t. Pero hay algunas opciones.
Una opción es eliminar las páginas de su servidor por completo y asegurarse de que respondan con errores 404.
Otra es usar robots.txt
para evitar que Google rastree el contenido. Sin duda, esto evitará que se indexen páginas nuevas, pero es posible que las páginas existentes tarden un tiempo en dejar de aparecer.
Una última opción es utilizar noindex
metaetiqueta.
Para obtener más información, consulte la página de Google sobre este tema: http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=164734
Respuesta
La respuesta corta en el contexto de ser práctico: puede «t .
Lo que puede hacer es eliminar los enlaces que apuntan a ellos y asegurarse de que las páginas respondan con un código de estado 404, y cuando Google vea que las páginas ya no existen. eventualmente los eliminarán de los resultados.
Comentarios
- Eso debería ser
410 Gone
no404 Not Found
Responder
Si su sitio tiene páginas indexadas en Gooogle que desea eliminar, el primer paso es cambiar su sitio. Puede eliminar las páginas, impedir que Googlebot las vea o incluir una etiqueta en ellas que le indique a Google que no las indexe.
- 410 desaparecido : la eliminación de las páginas con un estado 410 permite al robot de Google eliminarlas del índice tan pronto como las rastree. .
- 404 no encontrado : Googlebot eliminará las URL 404 después de un período de gracia de 24 cuando vuelva gatear
- etiqueta noindex : si la página todavía está disponible en el sitio, pero debería no estar indexado, incluya
<meta name="robots" content="noindex">
en la sección<head>
. Google lo eliminará del índice la próxima vez que lo rastree. - Protección con contraseña – Proteger la información solicitando un nombre de usuario o contraseña para acceder a ella. Google puede indexar la URL en este caso, pero no podrá indexar el contenido.
-
No permitir en robots.txt : puede bloquear el robot de Google para que no rastree páginas agregando
Disallow: /mypage
en robots.txt. Google no suele indexar páginas que no puede rastrear. y nunca indexa su contenido. Sin embargo, Google a veces puede mostrar la URL en los resultados de búsqueda sin ningún fragmento :Si eliminó la página o agregó un
noindex
, es importante que permita que Googlebot rastree la página. Si también deshabilita el rastreo en robots.txt , Googlebot no podrá ver que su página debe ser remoto. No rechace páginas en robots.txt si también ha implementado otro método de esta lista.
Con todos estos métodos, Googlebot tiene que regresar y rastrear las páginas antes de que se eliminen. Este proceso puede tardar un par de meses , especialmente para muchas páginas que no son muy popular. Si desea acelerar el proceso, inicie sesión en Google Search Console y use la función Explorar como Google para cada URL. Tenga en cuenta que este es un proceso manual con una cuota de diez recuperaciones por día, por lo que no funcionará para una gran cantidad de URL.
Google también tiene una Eliminar URL herramienta en Search Console que puede eliminar temporalmente URL o directorios de Google durante 90 días. Puede utilizar esta herramienta para eliminar las URL de los resultados de búsqueda rápidamente antes de que el robot de Google tenga la oportunidad de rastrearlas.
Incluso después de que se eliminen las URL de los resultados de búsqueda de Google, Google puede seguir mostrando las URL como errores en Google Search Console. Siempre que Google encuentre enlaces a URL, pueden aparecer como errores de rastreo después de que tengan el estado 404 o 410.Esto es completamente normal y no afectará en absoluto a las demás páginas de su sitio. Consulte lo que John Mueller de Google tiene que decir sobre los errores de rastreo para obtener más información. .
Respuesta
Hay dos formas de eliminar URL del motor de búsqueda de Google
El primero es
Si no desea rastrear su página en Google, debe utilizar las herramientas para webmasters de Google. Herramienta de eliminación de URL para solicitar su eliminación Aquí está la forma
- Inicie sesión en su herramienta para webmasters
- vaya a Configuración del sitio
- vaya a Acceso del rastreador
- vaya a la pestaña de acceso del rastreador
- inserte su URL en una nueva solicitud de eliminación
después de unos días, su URL se eliminará del motor de búsqueda y no podrá crawl.
2nd
Si su sitio tiene contenido, no desea que Google u otros motores de búsqueda accedan, utilice un archivo robots.txt y no permita la carpeta de esa página web.
Puede utilizar uno de los pasos anteriores para eliminar las URL del motor de búsqueda de Google
Respuesta
En primer lugar, Google tiene una gran memoria. Entonces, incluso si logra que Google elimine sus URL de su índice, volverá a solicitar esas URL en el futuro. Su enfoque debe tener en cuenta ambos.
Le aconsejo que siga estos pasos
- Utilice Búsqueda de Google Console «s Removals Tool para evitar que Google muestre sus URL. Esta es una solicitud manual que presenta a Google, que generalmente oculta las URL dentro de las 24 horas (pero a menudo antes), bajo
TEMPORARILY REMOVE URL
. Tenga en cuenta que esto solo significa que Google oculta sus URL durante 180 días, pero aún no se han acceder a eso más tarde). - Asegúrese de borrar cualquier caché que Google tenga para sus URL, utilizando la segunda pestaña
CLEAR CACHED URL
en la Herramienta de eliminación de Google Search Console . Después de manejar los pasos 1 y 2, Google ya no mostrará sus URL, incluidas las versiones en caché. - Ahora, por su publicación, deduzco que ya eliminó las páginas. Entonces, en ese caso, es mejor asegurarse de devolver el código de estado
410 Gone
en lugar de un404 Not Found
. El410 Gone
envía una señal mucho más fuerte a Google de que deben eliminar la URL de su índice. Esto es mejor que devolver un404 Not Found
porque a menudo son accidentales. - Elimine los enlaces internos, las redirecciones entrantes y los canónicos entrantes a las páginas que desea eliminar. Debe dejar de enviar señales que indiquen que una URL debe ser rastreada (y potencialmente indexada) en Google.
- Para monitorear fácilmente si Google está captando todas sus sugerencias, cree un mapa del sitio XML que enumere todas las URL que desea que desaparezcan y envíelo en Google Search Console. Elimine el mapa del sitio XML después de que Google elimine correctamente todas las URL de su indexado.
Qué evitar
Evite aplicar directivas de robots.txt para intentar que Google elimine las URL de su índice, porque si «ya indexaron el contenido, les llevará mucho tiempo». para eliminar las URL de su índice. Tampoco podrán captar su 410 Gone
porque les impidió acceder a él.
También para las páginas nuevas que deberían ser accesibles para los visitantes, no se recomienda evitar que Google las indexe a través del archivo robots.txt. Es mejor usar la directiva Noindex Robots (ya sea a través de la fuente HTML o a través de X-Robots-Tag
encabezado HTTP).
Curiosamente, Google recomienda utilizar el archivo robots.txt para que eliminar imágenes de su índice.
Más información sobre la eliminación de URL
Si desea profundizar más en la eliminación de URL de Google, he documentado el proceso de eliminación para esta situación y varias otras con gran detalle en: https://www.contentkingapp.com/academy/google-remove-urls/ .