Inicio Técnica Una empresa de Bengaluru revela dos modelos de lenguaje de inteligencia artificial

Técnica

Una empresa de Bengaluru revela dos modelos de lenguaje de inteligencia artificial

Por

18 febrero 2026

Pratyush Kumar, cofundador de Sarvam AI, junto con el primer ministro Narendra Modi durante la inauguración de la India AI Impact Expo en Bharat Mandapam en Nueva Delhi. Crédito de la foto: PMO a través de PTI Photo

Unos meses después de que el gobierno sindical anunciara que India crearía su propio modelo de lenguaje grande (LLM) como ChatGPT y DeepSeek, Sarvam AI, con sede en Bengaluru, presentó dos modelos de lenguaje en la AI Impact Summit aquí el miércoles (18 de febrero de 2026). Llamados Vikram, los modelos serán de código abierto, dijo Pratyush Kumar, cofundador de Sarvam.

Kumar los presentó en un discurso durante el Simposio de Investigación de IA de la cumbre. Ambos modelos, dijo, superaron a otros modelos comparables de todo el mundo en los puntos de referencia de la industria.

Entrenar un modelo de lenguaje grande es un proceso computacional y que requiere muchas habilidades, que a veces implica millones de dólares de trabajo invertido por unidades de procesamiento de gráficos (GPU) que trabajan juntas en centros de datos. En cambio, el Ministerio de Electrónica y Tecnología de la Información ha enfatizado la inferencia (el acto de consultar realmente un modelo entrenado) en lugar de la capacitación. Sin embargo, en el período posterior al lanzamiento del LLM chino DeepSeek R1, el ministro de TI, Ashwini Vaishnaw, dijo que una empresa india también podría formar un LLM.

Sarvam contó con la ayuda de inversores privados como Peak XV y Khosla Ventures, que en conjunto invirtieron más de 50 millones de dólares en la empresa. También subvencionó el acceso a GPU en el marco del programa informático común IndiaAI Mission.

Uno de los principales objetivos de los modelos ha sido mejorar los idiomas indios, que no funcionan muy bien en la mayoría de los modelos de IA debido a la relativa escasez de contenido de texto disponible en idiomas indios que podría usarse para entrenar modelos. El Sr. Kumar hizo una demostración, traduciendo contenido del inglés a idiomas indios.

El lanzamiento de los tan esperados modelos (un modelo de 35 mil millones de parámetros y otro de 105 mil millones de parámetros) se considera un hito para el desarrollo de la IA en la India.

Aún no se han puesto a disposición del público. Un mensaje en el sitio web de Sarvam indica que una función de chat estará disponible “pronto”.

Publicado – 18 de febrero de 2026, 10:31 p. m. IST

Fuente

Una empresa de Bengaluru revela dos modelos de lenguaje de inteligencia artificial

Últimas noticias

Los niños lesionados por el NHS pueden reclamar daños y perjuicios...

El Qwen 3.5 397B-A17 de Alibaba supera a su modelo más...

Trump: No delatéis a Diego García

Cloud Report es el boletín impreso de Crossing Guard sobre “buenos...

Reseña de la película: Una hipnótica y agotadora rave en el...

Arsenal v Lovaina: Campeonato femenino – en vivo | Campeonato femenino

Antiguo cementerio de Palmer Lake en Larkspur, Colorado

AirDrop de Apple ahora funciona con más teléfonos Pixel

Intel recurre a Copilot Studio de Microsoft para obtener soporte para...

Agencia libre de la NFL 2026: principal objetivo de reunión para...

La sensación de estar más cerca.

Sunita Ahuja reacciona ante la supuesta aventura del actor Vinay Anand,...

Ocho muertos confirmados, seis sobrevivieron cerca de Tahoe después de la...

Vuelo de Delta regresa al aeropuerto tras disturbios entre pasajeros

Categoría