En San Francisco, parece OpenClaw está en todas partes. Incluso, potencialmente, en algunos lugares para los que no fue diseñado. De acuerdo a publicaciones en redes socialesla gente parece estar usando el virus Herramientas de IA para raspar sitios web y acceder a información, incluso cuando esos sitios web han tomado medidas explícitas contra los robots.

Una de las formas en que lo hacen es a través de una herramienta de código abierto llamada Scrapling, diseñada para evitar sistemas anti-bot como llamarada de nube Torniquete. Mientras que Scrapling, que fue construido con Pitóntrabaja con varios tipos de Agentes de IAA los usuarios de OpenClaw parece gustarles especialmente el software. El lunes, publicaciones virales que promocionaban Scrapling como herramienta para usuarios de OpenClaw comenzaron a difundirse en X. Desde su lanzamiento, Scrapling se ha descargado más de 200.000 veces.

“Sin detección de bots. Sin mantenimiento del selector. Sin pesadillas de Cloudflare”, se lee en una publicación viral esta semana sobre la herramienta de código abierto. “OpenClaw le dice a Scrapling qué extraer. Scrapling se encarga del sigilo”.

Cloudflare no está entusiasmado. La empresa ya ha bloqueado versiones anteriores de Scrapling, ya que los usuarios de Scrapling software de código abierto Seguí intentando eludir las protecciones anti-raspado. Esta semana, la compañía estaba trabajando en un parche para la última versión de Scrapling. “Nosotros hacemos cambios y ellos hacen cambios”, dice Dane Knecht, director de tecnología de Cloudflare. Dice que el conjunto de datos del sitio web de la empresa y su capacidad para rastrear tendencias le dieron la ventaja.

“Ya hemos recibido la señal de que están empezando a adquirir mayor capacidad para eludirnos”, afirma Knecht. “El equipo de ingenieros de operaciones de seguridad ya había estado trabajando en un nuevo conjunto de mediaciones”.

Se entrenaron grandes modelos de lenguaje en el corpus de Internet, y el proceso implicó mucho scraping. En cierto modo, los usuarios de Scrapling están siguiendo los pasos de los constructores de modelos originales, pero a una escala más individualizada.

En los últimos años, los propietarios de sitios web han intentado implementar protecciones anti-bot adicionales, ya sea para bloquear software como Scrapling o para encontrar una manera de ganar dinero con los bots que intentan acceder a sus sitios web. Por su parte, Cloudflare ha estado trabajando horas extras para seguir bloqueando bots cada vez más potentes que intentan eludir estas protecciones.

Cloudflare ofrece a sus clientes herramientas adicionales que bloquean los rastreadores de IA a menos que los bots paguen por el acceso. En menos de un año, la empresa reclamos han bloqueado 416 mil millones de intentos de scraping no solicitados.

“No sabía en lo que me estaba metiendo”

A medida que Scrapling ha ganado impulso en los últimos días, cifrado Los entusiastas capitalizaron la atención lanzando un $Scrapling memecoin. Karim Shoair, quien afirma ser el único desarrollador de Scrapling, publicó sobre memecoin en X (estas publicaciones han sido eliminadas desde entonces). Después de que el precio se disparó durante unas cinco horas, $Scrapling rápidamente cayó por un precipicio cuando los usuarios vendieron sus apuestas. “Un montón de estafadores”, dice un comentario en el sitio web Pump.Fun que aloja la moneda.

“No sabía en qué me estaba metiendo cuando la gente creó esa moneda y yo la respaldé”, dijo Shoair, en un mensaje directo a WIRED. “Pero una vez que lo supe, no quería ninguna asociación con ello y el dinero que retiré antes se destinará a obras de caridad, no me beneficiaré de ninguna manera. O tal vez simplemente lo dejaré en vano”.

A raíz de este evento, la cuenta comunitaria no oficial GitHub Projects, que tiene más de 300.000 seguidores en X, eliminó sus publicaciones de esta semana destacando el software de código abierto de Scrapling y pareció distanciarse del proyecto. “No apoyamos, promovemos ni participamos en criptoactivos, ofertas de tokens, actividades comerciales o recaudación de fondos basada en criptomonedas”, dijo en una publicación a última hora del lunes.

Dejando a un lado las incursiones criptográficas, la mayoría de los líderes de software siguen viendo a los agentes y las herramientas autónomas de IA como el futuro de la web. Incluso Knecht de Cloudflare, cuyo trabajo incluye bloquear los robots para que no realicen scraping no consensuado, quiere construir un mundo donde los humanos y los agentes se beneficien de los datos en línea y se respeten los deseos de los propietarios de sitios web. “Veo un camino a seguir para una Internet que sea amigable tanto para los agentes como para los humanos”, afirma.


Esta es una edición de Will Knight Boletín del laboratorio de IA. Leer boletines anteriores aquí.

Fuente