A pesar de que se habla cada vez más de un futuro en el que gran parte del trabajo humano será automatizado por la IA, una de las ironías de este auge tecnológico actual es lo obstinadamente dependiente que sigue siendo de los humanos, específicamente el proceso de entrenamiento de modelos de IA utilizando el aprendizaje reforzado a partir de la retroalimentación humana (RLHF).
En su forma más simple, RLHF es un sistema de tutoría: después de entrenar a una IA con datos seleccionados, todavía comete errores o parece robótica. Luego, los laboratorios de IA contratan proveedores de servicios humanos en masa para evaluar y calificar los resultados de un nuevo modelo a medida que se entrena, y el modelo aprende de sus calificaciones, ajustando su comportamiento para ofrecer resultados con calificaciones más altas. Este proceso es aún más importante a medida que la IA se expande para producir resultados multimedia como video, audio e imágenes, que pueden tener medidas de calidad más subjetivas y matizadas.
Históricamente, este proceso de tutoría ha sido un enorme dolor de cabeza logístico y una pesadilla de relaciones públicas para las empresas de IA, que dependen de redes fragmentadas de proveedores de servicios extranjeros y conjuntos de etiquetas estáticas en centros geográficos específicos de bajos ingresos. considerado por los medios como salario bajo – incluso explorador. También es ineficiente: requiere que los laboratorios de IA esperen semanas o meses para recibir un solo lote de comentarios, lo que ralentiza el progreso del modelo.
Ahora ha surgido una nueva startup para hacer el proceso mucho más eficiente: RápidoLa plataforma efectivamente “gamifica” RLHF, impulsando estas tareas de revisión en todo el mundo a casi 20 millones de usuarios de aplicaciones populares, incluidas Duolingo o Candy Crush, en forma de tareas de revisión breves y opcionales que pueden elegir completar en lugar de mirar anuncios móviles, y los datos se envían instantáneamente a un laboratorio de IA encargado.
Como se compartió con VentureBeat en un comunicado de prensa, esta plataforma permite a los laboratorios de inteligencia artificial “iterar modelos casi en tiempo real”, acortando significativamente los plazos de desarrollo en comparación con los métodos tradicionales.
El CEO y fundador Jason Corkill dijo en el mismo comunicado que Rapidata hace que “el juicio humano esté disponible a escala global y casi en tiempo real, abriendo un futuro donde los equipos de IA pueden ejecutar ciclos de retroalimentación constantes y construir sistemas que evolucionan todos los días en lugar de cada ciclo de lanzamiento”.
Rapidata trata a RLHF como una infraestructura de alta velocidad y no como un problema de mano de obra. Hoy, la compañía nos anunció exclusivamente en VentureBeat su surgimiento con una ronda inicial de $ 8,5 millones codirigida por Canaan Partners e IA Ventures, con la participación de Acequia Capital y BlueYard, para escalar su enfoque único de datos humanos bajo demanda.
La conversación de pub que construyó una nube humana
La génesis de Rapidata no nació en una sala de juntas, sino en una mesa tomando unas cervezas. Cuando Corkill era estudiante en ETH Zurich y trabajaba en robótica y visión por computadora, se encontró con el obstáculo al que eventualmente se enfrenta todo ingeniero de inteligencia artificial: el cuello de botella en la anotación de datos.
“Específicamente, he estado trabajando en robótica, inteligencia artificial y visión por computadora durante algunos años, estudié en ETH aquí en Zurich y siempre me sentí frustrado con la anotación de datos”, recordó Corkill en una entrevista reciente. “Siempre que necesitabas humanos o anotaciones de datos humanos, era como si tu proyecto se detuviera, porque hasta entonces, podías avanzar simplemente presionando noches más largas. Pero cuando necesitabas anotaciones humanas a gran escala, tenías que acudir a alguien y esperar unas semanas”.
Frustrados por este retraso, Corkill y sus cofundadores se dieron cuenta de que el modelo de trabajo existente para la IA estaba fundamentalmente roto para un mundo que se movía a la velocidad de la informática moderna. Si bien la informática está creciendo exponencialmente, la fuerza laboral humana tradicional, limitada por la incorporación manual, la contratación regional y los ciclos de pago lentos, no lo está. Rapidata nació de la idea de que el juicio humano podría entregarse como un servicio distribuido globalmente y casi instantáneo.
Tecnología: convertir las huellas digitales en datos de formación
La principal innovación de Rapidata reside en su método de distribución. En lugar de contratar anotadores a tiempo completo en regiones específicas, Rapidata aprovecha la economía de atención que existe en el mundo de las aplicaciones móviles. Al asociarse con aplicaciones de terceros como Candy Crush o Duolingo, Rapidata ofrece a los usuarios una opción: ver un anuncio tradicional o dedicar unos segundos a brindar retroalimentación a un modelo de IA.
“A los usuarios se les pregunta: ‘Oye, ¿preferirías, en lugar de ver anuncios y que las empresas te compren los ojos de esta manera, preferirías escribir algunos datos y dar tu opinión?’”, explicó Corkill. Según Corkill, entre el 50% y el 60% de los usuarios optan por la tarea de comentarios en lugar de un anuncio de vídeo tradicional.
Este enfoque de “inteligencia colectiva” permite a los equipos de IA aprovechar un grupo demográfico global y diverso a una escala sin precedentes.
La red global: Actualmente, Rapidata llega a entre 15 y 20 millones de personas.
Paralelismo masivo: La plataforma puede procesar 1,5 millones de notas humanas en una sola hora.
Velocidad: Los ciclos de retroalimentación que antes tomaban semanas o meses se reducen a horas o incluso minutos.
Control de calidad: La plataforma crea perfiles de confianza y experiencia para los encuestados a lo largo del tiempo, garantizando que los jueces humanos más relevantes respondan las preguntas complejas.
Anonimato: Si bien se realiza un seguimiento de los usuarios mediante identificaciones anónimas para garantizar la coherencia y la confiabilidad, Rapidata no recopila identidades personales, lo que mantiene la privacidad y optimiza la calidad de los datos.
RLHF online: pasando a la GPU
El salto tecnológico más significativo que está permitiendo Rapidata es lo que Corkill describe como “RLHF en línea”. Tradicionalmente, la IA se entrena en lotes desconectados: se entrena el modelo, se detiene, se envían datos a humanos, se esperan semanas para recibir etiquetas y luego se reanuda. Esto crea un “círculo” de información que a menudo carece de nuevas contribuciones humanas.
Rapidata traslada este juicio directamente al ciclo de formación. Como su red es muy rápida, pueden integrarse mediante API directamente con las GPU que ejecutan el modelo.
“Siempre hemos tenido la idea del aprendizaje por refuerzo para la retroalimentación humana… hasta ahora, siempre había que hacerlo en lotes”, dijo Corkill. “Ahora, si llegas hasta el final, tenemos algunos clientes en los que, debido a que somos muy rápidos, podemos estar directamente, básicamente, en el proceso, como en el procesador de la GPU correcta, y la GPU calcula algo de salida y puede solicitarnosla inmediatamente de forma distribuida. ‘Oh, necesito, necesito, necesito que un humano vea esto’. Recibo la respuesta y aplico esta pérdida, que hasta ahora no ha sido posible”.
Actualmente, la plataforma admite alrededor de 5500 personas por minuto y proporciona comentarios en vivo para modelos que se ejecutan en miles de GPU. Esto evita el “pirateo de modelos de recompensa”, en el que dos modelos de IA se engañan entre sí en un circuito de retroalimentación, basando el entrenamiento en matices humanos reales.
Producto: Resolviendo el gusto y el contexto global
A medida que la IA va más allá del simple reconocimiento de objetos hacia los medios generativos, los requisitos para el etiquetado de datos han evolucionado desde el etiquetado objetivo hasta la curación subjetiva “basada en el gusto”. Ya no se trata sólo de “¿es un gato?” sino “¿es convincente esta síntesis de voz?” o “¿cuál de estos dos resúmenes parece más profesional?”
Lily Clifford, directora ejecutiva de la startup de inteligencia artificial de voz Rime, señala que Rapidata ha sido transformadora para probar modelos en contextos del mundo real. “Anteriormente, recopilar comentarios significativos significaba reunir proveedores y encuestas segmento por segmento, o país por país, lo cual no era escalable”, dijo Clifford. Con Rapidata, Rime puede llegar al público adecuado, ya sea en Suecia, Serbia o Estados Unidos, y ver cómo se desempeñan los modelos en flujos de trabajo reales de clientes en días, no en meses.
“La mayoría de los modelos son objetivamente correctos, pero estoy seguro de que has recibido correos electrónicos que parecen, ya sabes, no auténticos, ¿verdad?” Corkill señaló. “Puedes oler un correo electrónico de IA, puedes oler una imagen o un vídeo de IA, inmediatamente te queda claro… estos modelos todavía no se sienten humanos y necesitas retroalimentación humana para lograrlo”.
Cambio económico y operativo
Desde una perspectiva operativa, Rapidata se posiciona como una capa de infraestructura que elimina la necesidad de que las empresas administren sus propias operaciones de anotaciones personalizadas. Al proporcionar una red escalable, la empresa está reduciendo la barrera de entrada para los equipos de IA que anteriormente luchaban con el costo y la complejidad de los circuitos de retroalimentación tradicionales.
Jared Newman de Canaan Partners, quien dirigió la inversión, sugiere que esta infraestructura es esencial para la próxima generación de IA. “Todo despliegue serio de IA depende del juicio humano en algún momento del ciclo de vida”, dijo Newman. “A medida que los modelos pasen de tareas basadas en la experiencia a una selección basada en el gusto, la demanda de retroalimentación humana escalable crecerá dramáticamente”.
Un futuro de uso humano
Si bien la atención se centra actualmente en los laboratorios de modelado del Área de la Bahía, Corkill ve un futuro en el que los propios modelos de IA se convertirán en los principales clientes del juicio humano. A esto lo llama “uso humano”.
Según esta visión, la IA de un diseñador de automóviles no solo generaría un vehículo genérico; podría llamar programáticamente a Rapidata para preguntar a 25.000 personas en el mercado francés qué piensan sobre una estética específica, repetir esos comentarios y perfeccionar su diseño en cuestión de horas.
“La sociedad cambia constantemente”, señaló Corkill, refiriéndose a la tendencia hacia el uso de la IA para simular el comportamiento humano. “Si simulas una sociedad ahora, la simulación será estable y tal vez refleje la nuestra durante unos meses, pero luego cambia por completo, porque la sociedad ha cambiado y se ha desarrollado de una manera completamente diferente”.
Al crear una forma programática y distribuida de acceder al poder del cerebro humano en todo el mundo, Rapidata se está posicionando como la interconexión vital entre el silicio y la sociedad. Con 8,5 millones de dólares en nueva financiación, la compañía planea actuar de manera agresiva para garantizar que a medida que la IA crezca, el elemento humano ya no sea un cuello de botella sino un recurso en tiempo real.















