Operai reclama el rendimiento de las medallas de oro en una prestigiosa competencia de matemáticas, se produce el drama

Opadai anunció que su modelo de razonamiento inédito ganó el oro en el Olimpiada Matemática Internacional (OMI), encendiendo un drama feroz en el mundo de las matemáticas competitivas.
Mientras que la mayoría de los estudiantes de secundaria disfrutan felizmente de un descanso de la escuela y la tarea, los mejores estudiantes de matemáticas de todo el mundo trajeron su juego A al Imo, considerado la competencia de matemáticas más prestigiosa. AI Labs también compitió con sus LLMS, y un modelo inédito de OpenAI logró un puntaje de alto nivel para ganar una medalla de oro, según el investigador Alexander Wei, quien compartió las noticias en X.
Este tweet no está disponible actualmente. Puede estar cargando o ha sido eliminado.
El modelo Operai sacó a cinco problemas correctos, ganando un puntaje digno de la medalla de oro de 35 de 42 puntos. “Para cada problema, tres ex medallistas de la OMI calificaron independientemente la prueba presentada del modelo, con puntajes finalizados después de un consenso unánime”, según Wei. Los problemas son desafíos de álgebra y precálculo que requieren un pensamiento creativo por parte de la competencia. Entonces, para que los LLM puedan razonar a través de pruebas largas y complejas es un logro impresionante.
Sin embargo, el momento del anuncio está siendo criticado por eclipsar los resultados de los competidores humanos. Según los informes, la OMI solicitó a los laboratorios de IA que trabajaban oficialmente con la organización que verificaba los resultados para esperar una semana antes de hacer cualquier anuncio, para evitar robar el trueno de los niños. Eso es según una publicación X de Mikhail Samin, quien dirige la organización sin fines de lucro del Instituto de Seguridad y Seguridad de AI. Operai dijo que no cooperaron formalmente con la OMI para verificar sus resultados y, en su lugar, trabajaron con matemáticos individuales para verificar independientemente sus puntajes, por lo que no estuvo en cuenta con ningún tipo de acuerdo. Mashable envió un mensaje directo a Samin en X para comentarios.
Velocidad de luz mashable
Pero el chisme es que este organistas frotó de la manera incorrecta, quienes pensaron que era “grosero” e “inapropiado” para que OpenAi haga esto. Todo esto es rumores, basado en rumores de Samin, que también publicó una captura de pantalla de un comentario similar de alguien llamado Joseph Myers, presumiblemente el dos veces medallista de oro de la OMI. Mashable contactó a Myers para hacer comentarios, pero no ha confirmado públicamente la autenticidad de la captura de pantalla.
Este tweet no está disponible actualmente. Puede estar cargando o ha sido eliminado.
En respuesta, el investigador de Operai Noam Brown dicho Publicaron los resultados después de la ceremonia de cierre de la OMI, en honor a la solicitud de un organizador de la OMI. Brown también dijo que Operai no estaba en contacto con IMO, lo que sugiere que no hicieron ningún acuerdos sobre anunciar los resultados más tarde.
Este tweet no está disponible actualmente. Puede estar cargando o ha sido eliminado.
Mientras tanto, Google Deepmind hizo Cooperar con la OMI, y anunció esta tarde que una “versión avanzada de Gemini con profundo piense oficialmente logre[d] Estándar de la medalla de oro en la Olimpiada Matemática Internacional “Según el anuncioEl modelo de Deepmind fue “oficialmente calificado y certificado por los coordinadores de la OMI utilizando los mismos criterios que para las soluciones de los estudiantes”. Lea en esa declaración tanto o tan poco como desee, pero el momento apenas es coincidente.
Este tweet no está disponible actualmente. Puede estar cargando o ha sido eliminado.
Otros pueden seguir el Amas de casa realespero el decoro adecuado de las competiciones de matemáticas de élite es el alto drama para el que vivimos.
Divulgación: Ziff Davis, empresa matriz de Mashable, presentó en abril una demanda contra OpenAI, alegando que infringió los derechos de autor de Ziff Davis en la capacitación y la operación de sus sistemas de IA.