Pregunta sobre Blackhole for Bad Bots de Wordpress:

Wayback Machine Archive.org

Un usuario preguntó 👇

En la descripción de tus plugins, mencionas …

… Blackhole solo afecta a los robots malos: los usuarios humanos nunca ven el enlace oculto y los buenos bots obedecen las reglas de los robots en primer lugar.

Quiero bloquear Archive.org Wayback Machine.

Aparentemente, los bots de Archive’org (ia_archiver y archive.org_bot) han dejado de cumplir con los archivos robots.txt desde finales de 2017. Desde 2015/2016 he bloqueado Archive.org/Wayback Machine para que no difunda mis sitios y archive. Pero en algún momento a fines de 2017, dejaron de cumplir con mi archivo robots.txt y rastrearon y archivaron todos mis sitios. Los correos electrónicos formales para eliminar mis sitios no regresaron. He tenido las siguientes entradas en mi archivo robots.txt durante años y solían funcionar …

User-agent: archive.org_bot
Disallow: /

User-agent: ia_archiver
Disallow: /

Pero ya no funcionan. La semana pasada, agregué las siguientes metaetiquetas a mi sitio …

<meta name="ia_archiver" content="noindex,nofollow,noarchive">
<meta name="archive.org_bot" content="noindex,nofollow,noarchive">

… y eso tampoco parece estar funcionando.

Entonces, dado que archive.org ya no parece ceder a los archivos robots.txt, ¿su plugin bloqueará / atrapará los bots ia_archiver y archive.org_bot? Esto es lo que busco.

(@especial K)

Hace 2 años, 1 mes

Deseando ayudar:

“¿Su plugin bloqueará / interceptará ia_archiver y los bots archive.org_bot? «

Sí, pero solo si siguen la conexión del agujero negro oculto. Alternativamente, puede agregar / bloquear manualmente usando la versión pro.

Por favor, avíseme si puedo proporcionar más información, dispuesto a ayudarme.

Lanzador de hilos

(@toolsavvy)

Hace 2 años, 1 mes

Alternativamente, puede agregar / bloquear manualmente usando la versión pro.

Interesante. ¿Cómo funciona exactamente eso en la versión Pro? Quiero decir, ¿tengo que usar todas las direcciones IP utilizadas por archive.org para usar sus bots para prohibir manualmente los bots de archive.org con la versión Pro?

(@especial K)

Hace 2 años, 1 mes

Sí, todo está basado en IP. Si quieres saber más sobre la versión Pro puedes Contáctame directamente (los foros de WordPress.org aquí son solo para plugins gratuitos).

En cuanto al bloqueo basado en agentes de usuario, no he visto un plugin que pueda hacerlo, aunque podría ser posible como una característica en uno de los populares plugins de seguridad de tipo «todo en uno». Aunque no lo comprobé.

Todo lo que necesita es una forma rápida y eficaz de bloquear ia_archiver, siempre puede agregar una regla a su sitio o configuración .htaccess. Por ejemplo, para los servidores Apache con mod_rewrite habilitado, estas dos líneas detendrán todo / todo el acceso a ia_archiver:

RewriteCond %{HTTP_USER_AGENT} (ia_archiver) [NC]
RewriteRule . - [F,L]

Otras reglas similares disponibles para otros servidores (por ejemplo, Nginx). Por lo tanto, es seguro que se pueden bloquear los agentes de usuario que desee.

¿Solucionó tu problema??

0 / 0

Deja una respuesta 0

Tu dirección de correo electrónico no será publicada.