Pregunta sobre Yoast SEO de Wordpress:

Yoast – archivos PDF – noindex – HTTP HEADER

Un usuario preguntó 👇

Hola, quiero bloquear los archivos PDF para que no busquen en Google y tengo una respuesta, pero no estoy seguro de dónde colocarlos. ¿Puedes enviarme paso a paso? Para obtener instrucciones, verifique la respuesta a continuación.

P: ¿Cómo puedo evitar que mis archivos PDF aparezcan en los resultados de búsqueda? o si ya lo hacen, ¿cómo puedo eliminarlos? R: La forma más sencilla de evitar que los documentos PDF aparezcan en los resultados de búsqueda es agregar una etiqueta de X-Robots: noindex en el encabezado HTTP que se usa para entregar el archivo. Si ya están indexados, se publicarán con el tiempo si usa X-Robot-Tag con la guía noindex.

Todo lo mejor

(@stodorovic)

Hace 1 año, 10 meses

Relacionado con su problema anterior: https://wordpress.org/support/topic/google-search-results-documents/

Debería crear un nuevo artículo en .htaccess con sus reglas personalizadas. Es más fácil para usted si lo agrega al principio antes de otras reglas. Algo como esto:

# BEGIN My custom rules
<FilesMatch ".pdf$">
Header set X-Robots-Tag "noindex, noarchive, nosnippet"
</FilesMatch>
# END My custom rules

Después de esto, debe verificar un par de archivos pdf y confirmar que se envía un encabezado (puede usarlos https://httpstatus.io/).

Si lo desea, puede eliminar manualmente las URL del índice de Google para acelerar el proceso: https://support.google.com/websearch/answer/6349986?hl=es

Para ver los archivos indexados, utilice esta consulta en google: ext: pdf sitio: sudominio.com

Intenté hacer un resumen rápido. Espero haber respondido a tu pregunta.

(@wordmatej)

Hace 1 año, 10 meses

Muchas gracias por tu linda respuesta.

Voy a ver.

Todo lo mejor

(@stodorovic)

Hace 1 año, 10 meses

Veo algo más que podría emitirse (se generan índices de directorio: / wp-content / uploads / 20nn / nn /). Debe agregar esto a .htaccess:

Options -Indexes

No verifiqué todos los detalles, pero podría ayudar a reducir la cantidad de enlaces a archivos PDF.

(@wordmatej)

Hace 1 año, 10 meses

Hola,

Finalmente logré insertar la regla en .htaccess.

Luego me registré https://httpstatus.io/. Agregué un enlace desde la página de inicio y el formulario de enlace del archivo .pdf y muestra lo mismo, con índice, verifique el enlace de la imagen:
http://www.ntkbelakrajina.si/wp-content/uploads/2019/03/httpstatus.png

¿Está bien o no?

Todo lo mejor

(@stodorovic)

Hace 1 año, 10 meses

Lo siento sin mucha demora. Por ejemplo, solo tomé una captura de pantalla (haga clic en la flecha azul para expandir los datos): Debería ver el encabezado ‘X-Robots-Tag’ para los archivos pdf (por ejemplo). Entonces, los encabezados se agregan correctamente. Otra posible pregunta es: ¿podría el robot de Google averiguar estos «índices» y deberías eliminar estos índices. Ejemplo de .htaccess:

# BEGIN My custom rules
Options -Indexes
<FilesMatch ".pdf$">
Header set X-Robots-Tag "noindex, noarchive, nosnippet"
</FilesMatch>
# END My custom rules

Enviará 403 para índices de directorio. Hará poco para mejorar la seguridad y evitar que los motores de búsqueda recuperen URL no deseadas de los documentos. Si uno quiere indexar imágenes / documentos, los motores de búsqueda los encontrarán en el contenido del sitio web.

(@wordmatej)

Hace 1 año, 10 meses

Saša Mór,

ahora veo que .pdf no tiene índice. Si tengo alguna pregunta con respecto a las imágenes no indexadas, le informaré.

Muchas gracias y todo lo mejor

(@ pcosta88)

Hace 1 año, 10 meses

Hola, podemos ver que se ha resuelto el problema básico. Cerraremos esta pregunta. Si tiene cualquier otra pregunta, por favor cree contenido nuevo.

(@wordmatej)

Hace 1 año, 10 meses

ok, tx ok.

¿Solucionó tu problema??

0 / 1

Deja una respuesta 0

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *