El jueves, el Instituto Laude anunció su primer lote de subvenciones Slingshotscuyo objetivo es “promover la ciencia y la práctica de la inteligencia artificial”.
Diseñado como un acelerador para investigadores, el programa Slingshots está destinado a proporcionar recursos que no estarían disponibles en la mayoría de los entornos académicos, ya sea financiación, potencia informática o soporte de ingeniería y productos. A cambio, los destinatarios se comprometen a producir algún producto final, ya sea una startup, una base de código abierto u otro tipo de artefacto.
La cohorte inicial consta de 15 proyectos, con especial atención al difícil problema de la evaluación de la IA. Algunos de esos proyectos resultarán familiares para los lectores de TechCrunch, incluidos el punto de referencia de codificación de línea de comandos Terminal Bench y la última versión de el proyecto de larga duración ARC-AGI.
Otros adoptan un nuevo enfoque ante un problema de evaluación de larga data. Formula Code, creado por investigadores de Caltech y UT Austin, tiene como objetivo producir una evaluación de la capacidad de los agentes de IA para optimizar el código existente, mientras que BizBench, con sede en Columbia, propone un punto de referencia integral para los “agentes de IA de cuello blanco”. Otras subvenciones exploran nuevas estructuras para el aprendizaje por refuerzo o la compresión de modelos.
Banco SWE El cofundador John Boda Yang también forma parte de la cohorte, como líder del nuevo proyecto CodeClash. Inspirado por el éxito de SWE-Bench, CodeClash evaluará el código a través de un marco dinámico basado en la competencia, que Yang espera que
“Creo que la gente que continúa evaluando los principales puntos de referencia de terceros impulsa el progreso”, dijo Yang a TechCrunch. “Estoy un poco preocupado por un futuro en el que los puntos de referencia se vuelvan específicos de las empresas”.
















