Un usuario preguntó 👇
Hola, quiero bloquear los archivos PDF para que no busquen en Google y tengo una respuesta, pero no estoy seguro de dónde colocarlos. ¿Puedes enviarme paso a paso? Para obtener instrucciones, verifique la respuesta a continuación.
P: ¿Cómo puedo evitar que mis archivos PDF aparezcan en los resultados de búsqueda? o si ya lo hacen, ¿cómo puedo eliminarlos? R: La forma más sencilla de evitar que los documentos PDF aparezcan en los resultados de búsqueda es agregar una etiqueta de X-Robots: noindex en el encabezado HTTP que se usa para entregar el archivo. Si ya están indexados, se publicarán con el tiempo si usa X-Robot-Tag con la guía noindex.
Todo lo mejor
(@stodorovic)
Hace 1 año, 10 meses
Relacionado con su problema anterior: https://wordpress.org/support/topic/google-search-results-documents/
Debería crear un nuevo artículo en .htaccess con sus reglas personalizadas. Es más fácil para usted si lo agrega al principio antes de otras reglas. Algo como esto:
# BEGIN My custom rules
<FilesMatch ".pdf$">
Header set X-Robots-Tag "noindex, noarchive, nosnippet"
</FilesMatch>
# END My custom rules
Después de esto, debe verificar un par de archivos pdf y confirmar que se envía un encabezado (puede usarlos https://httpstatus.io/).
Si lo desea, puede eliminar manualmente las URL del índice de Google para acelerar el proceso: https://support.google.com/websearch/answer/6349986?hl=es
Para ver los archivos indexados, utilice esta consulta en google: ext: pdf sitio: sudominio.com
Intenté hacer un resumen rápido. Espero haber respondido a tu pregunta.
(@wordmatej)
Hace 1 año, 10 meses
Muchas gracias por tu linda respuesta.
Voy a ver.
Todo lo mejor
(@stodorovic)
Hace 1 año, 10 meses
Veo algo más que podría emitirse (se generan índices de directorio: / wp-content / uploads / 20nn / nn /). Debe agregar esto a .htaccess:
Options -Indexes
No verifiqué todos los detalles, pero podría ayudar a reducir la cantidad de enlaces a archivos PDF.
(@wordmatej)
Hace 1 año, 10 meses
Hola,
Finalmente logré insertar la regla en .htaccess.
Luego me registré https://httpstatus.io/. Agregué un enlace desde la página de inicio y el formulario de enlace del archivo .pdf y muestra lo mismo, con índice, verifique el enlace de la imagen:
http://www.ntkbelakrajina.si/wp-content/uploads/2019/03/httpstatus.png
¿Está bien o no?
Todo lo mejor
(@stodorovic)
Hace 1 año, 10 meses
Lo siento sin mucha demora. Por ejemplo, solo tomé una captura de pantalla (haga clic en la flecha azul para expandir los datos): Debería ver el encabezado ‘X-Robots-Tag’ para los archivos pdf (por ejemplo). Entonces, los encabezados se agregan correctamente. Otra posible pregunta es: ¿podría el robot de Google averiguar estos «índices» y deberías eliminar estos índices. Ejemplo de .htaccess:
# BEGIN My custom rules
Options -Indexes
<FilesMatch ".pdf$">
Header set X-Robots-Tag "noindex, noarchive, nosnippet"
</FilesMatch>
# END My custom rules
Enviará 403 para índices de directorio. Hará poco para mejorar la seguridad y evitar que los motores de búsqueda recuperen URL no deseadas de los documentos. Si uno quiere indexar imágenes / documentos, los motores de búsqueda los encontrarán en el contenido del sitio web.
(@wordmatej)
Hace 1 año, 10 meses
Saša Mór,
ahora veo que .pdf no tiene índice. Si tengo alguna pregunta con respecto a las imágenes no indexadas, le informaré.
Muchas gracias y todo lo mejor
(@ pcosta88)
Hace 1 año, 10 meses
Hola, podemos ver que se ha resuelto el problema básico. Cerraremos esta pregunta. Si tiene cualquier otra pregunta, por favor cree contenido nuevo.
(@wordmatej)
Hace 1 año, 10 meses
ok, tx ok.
¿Solucionó tu problema??
0 / 1