Pratyush Kumar, cofundador de Sarvam AI, junto con el primer ministro Narendra Modi durante la inauguración de la India AI Impact Expo en Bharat Mandapam en Nueva Delhi. Crédito de la foto: PMO a través de PTI Photo
Unos meses después de que el gobierno sindical anunciara que India crearía su propio modelo de lenguaje grande (LLM) como ChatGPT y DeepSeek, Sarvam AI, con sede en Bengaluru, presentó dos modelos de lenguaje en la AI Impact Summit aquí el miércoles (18 de febrero de 2026). Llamados Vikram, los modelos serán de código abierto, dijo Pratyush Kumar, cofundador de Sarvam.
Lo más destacado del día 3 de la Cumbre de IA de la India 2026
Kumar los presentó en un discurso durante el Simposio de Investigación de IA de la cumbre. Ambos modelos, dijo, superaron a otros modelos comparables de todo el mundo en los puntos de referencia de la industria.
Entrenar un modelo de lenguaje grande es un proceso computacional y que requiere muchas habilidades, que a veces implica millones de dólares de trabajo invertido por unidades de procesamiento de gráficos (GPU) que trabajan juntas en centros de datos. En cambio, el Ministerio de Electrónica y Tecnología de la Información ha enfatizado la inferencia (el acto de consultar realmente un modelo entrenado) en lugar de la capacitación. Sin embargo, en el período posterior al lanzamiento del LLM chino DeepSeek R1, el ministro de TI, Ashwini Vaishnaw, dijo que una empresa india también podría formar un LLM.

Sarvam contó con la ayuda de inversores privados como Peak XV y Khosla Ventures, que en conjunto invirtieron más de 50 millones de dólares en la empresa. También subvencionó el acceso a GPU en el marco del programa informático común IndiaAI Mission.
Uno de los principales objetivos de los modelos ha sido mejorar los idiomas indios, que no funcionan muy bien en la mayoría de los modelos de IA debido a la relativa escasez de contenido de texto disponible en idiomas indios que podría usarse para entrenar modelos. El Sr. Kumar hizo una demostración, traduciendo contenido del inglés a idiomas indios.
El lanzamiento de los tan esperados modelos (un modelo de 35 mil millones de parámetros y otro de 105 mil millones de parámetros) se considera un hito para el desarrollo de la IA en la India.
Aún no se han puesto a disposición del público. Un mensaje en el sitio web de Sarvam indica que una función de chat estará disponible “pronto”.
Publicado – 18 de febrero de 2026, 10:31 p. m. IST














