Los diferentes laboratorios de IA tienen diferentes prioridades. OpenAI se ha centrado tradicionalmente en los usuarios consumidores, por ejemplo, mientras que su rival Anthropic tiende a apuntar a las empresas. Recientemente descubrimos que la xAI de Elon Musk ha estado poniendo especial énfasis en la orientación de los videojuegos.

El viernes, Grace Kay de Business Insider publicó un informe detallado y completo sobre xAIla startup de IA recientemente adquirido por SpaceXcon especial énfasis en cómo Musk está haciendo la vida difícil a los empleados. Pero esta anécdota en particular llamó la atención:

En un caso del año pasado, el lanzamiento de un modelo se retrasó varios días porque Musk no estaba contento con la forma en que el chatbot respondió a preguntas detalladas sobre el videojuego “Baldur’s Gate”, según personas familiarizadas con el asunto. Dijeron que se retiró a ingenieros superiores de otros proyectos para mejorar las respuestas antes del lanzamiento.

Por supuesto, se puede imaginar la frustración de cualquier ingeniero respetado y experimentado que se presenta a trabajar pensando que abordará problemas de conocimientos fundamentales y de inteligencia de máquinas, sólo para desviarse y ayudar a un hombre de 54 años a superar su videojuego. Pero la anécdota plantea una pregunta aún más apremiante: ¿Musk terminó adquiriendo las habilidades de juego que quería?

Para responder a esa pregunta, nuestro entusiasta residente de los juegos de rol Ram Iyer Reunimos un conjunto de cinco preguntas generales sobre Baldur’s Gate, que comparamos con xAI y los tres modelos principales en una especie de cuasi punto de referencia que decidí llamar Banco Baldur.

En aras de la transparencia periodística, he hecho públicas todas las transcripciones de los chats, para que puedas verlas aquí: Grok, Chat GPT, Claudioy Mellizos.

Primero, la buena noticia: Grok realmente proporciona muy buena información. Sus respuestas estaban un poco densas en la jerga de los jugadores – “salvar-escoria” en lugar de salvar y “DPS” en lugar de daño – pero las respuestas fueron útiles y estaban bien informadas, siempre y cuando supieras de qué estabas hablando. A Grok también le encantan las mesas y teoríaque es más o menos lo que cabría esperar.

Hay muchas guías de Baldur’s Gate por ahí y los modelos a menudo se inspiraron en las mismas, por lo que las mayores diferencias fueron estilísticas. ChatGPT prefiere listas con viñetas y fragmentos de oraciones, mientras que a Gemini le encantan audaz palabras importantes.

Evento tecnológico

Boston, Massachusetts
|
9 de junio de 2026

La mayor sorpresa fue Claude, que estaba especialmente preocupado por darme información que arruinara mi experiencia de juego. Cuando pregunté sobre buenas composiciones para fiestas, terminé la guía diciendo “no te estreses demasiado y simplemente toca lo que te parezca divertido”. ¡Gracias Claudio!

Es importante tener en cuenta que ésta es un área temática que conocemos (gracias a Informes de Business Insider) que xAI se centró específicamente en lograr la paridad. Por lo tanto, no debemos darle demasiada importancia al hecho de que después del sprint informado, el consejo de Grok resultó ser el mismo que el de los otros modelos. Aún así, es bueno saber que xAI puede hacer que funcione si lo intenta.

Fuente