Mucha gente sospecha que estos robots son parte del esfuerzo de una empresa de inteligencia artificial para recopilar datos de entrenamiento de páginas web. Para 2025, los robots de IA representó una parte importante del tráfico web totalque rastrean Internet en busca de textos y otra información para alimentar a personas ávidas de datos grandes modelos de lenguaje.
Pero existen algunas diferencias clave entre estos robots chinos y otros robots de IA. En primer lugar, simplemente hay muchos más. King dice en su sitio web que el tráfico de China y Singapur representa el 22% del tráfico total, mientras que todos los demás robots de IA representan menos del 10% combinados.
La mayoría de las empresas líderes en inteligencia artificial identifican claramente sus bots ante los operadores de sitios web, lo que también hace que sea más fácil bloquearlos. Los laboratorios de inteligencia artificial de vanguardia “no están tan interesados en eludir” las reglas de bloqueo de bots, dice Brent Maynard, director senior de tecnología y estrategia de seguridad de la empresa de infraestructura de Internet Akamai. Dice que las empresas de inteligencia artificial a menudo sólo empiezan a intentar disfrazar sus bots después de que un sitio web cierra. Sin embargo, esta ola de bots chinos se ha disfrazado de usuarios humanos normales desde el principio e incluso ha eludido las reglas comunes de bloqueo de bots, dijeron a WIRED varios propietarios de sitios web.
Además de las empresas de inteligencia artificial, existen otras empresas incentivadas a explorar Internet, incluidos los rastreadores de búsqueda y las empresas de recopilación de información.
Costos crecientes y datos sesgados
La buena noticia, al menos por ahora, es que los bots no parecen tener un propósito explícitamente malicioso. No se les ha vinculado públicamente con ningún ciberataque y no parecen estar buscando vulnerabilidades. Pero la falta de un motivo claro también aumenta la confusión.
A algunos propietarios de sitios web les preocupa que los robots estén escaneando materiales protegidos por derechos de autor sin permiso. Otros dicen que el aumento los ha obligado a pagar más por el ancho de banda a medida que el tráfico de bots desplaza a los usuarios humanos, o a invertir en herramientas de prevención más sofisticadas. Las visitas también distorsionan el análisis del tráfico, distorsionando los informes sobre quién visita realmente sus sitios.
Pero los mayores impactos los sienten las personas que obtienen ingresos atrayendo clics en los anuncios de sus sitios web. “Esto está destruyendo mis estrategias de AdSense”, dice Quintero, dueño del blog paranormal, “porque están diciendo [your website is] sólo visitado por bots, por lo que su contenido no es algo valioso para el espectador. Como resultado, los anunciantes pueden considerar que sitios como el suyo son menos deseables y Google los penaliza.
Soluciones improvisadas
Muchas personas se han quejado del problema del bot de IA de China en los canales de soporte en línea durante los últimos meses o han enviado mensajes al respecto directamente a sus proveedores de alojamiento web. Pero hasta ahora todavía hay pocas respuestas concretas.
Contactado por WIRED, WordPress reconoció que ha recibido informes en los últimos meses de que algunos de sus sitios están experimentando un aumento en el tráfico de robots sospechosos o raspadores de IA. “Los sitios de WordPress siempre han tenido una excelente estructura que los hace fáciles de encontrar e indexar por los motores de búsqueda. Estas mismas características los hacen fácilmente rastreables. [by] La IA también”, dijo la compañía en un correo electrónico sin firmar. Google, Cloudflare y Squarespace no respondieron a las solicitudes de comentarios.
















