Los sistemas de agentes y la búsqueda empresarial dependen de una sólida recuperación de datos que funcione de manera eficiente y precisa. El proveedor de bases de datos MongoDB cree que es el más nuevo incrustar plantillas ayudar a abordar la disminución de la calidad de la recuperación a medida que más sistemas de IA entran en producción.

A medida que los sistemas agentic y RAG entran en producción, la calidad de la recuperación emerge como un punto silencioso de falla, uno que puede socavar la precisión, el costo y la confianza del usuario, incluso cuando los modelos en sí funcionan bien.

La compañía ha lanzado cuatro nuevas versiones de su modelos de incorporación y reclasificación. Voyage 4 estará disponible en cuatro modos: voyage-4 incrustado, voyage-4-large, voyage-4-lite y voyage-4-nano.

MongoDB dijo que la incorporación del Voyage-4 sirve como modelo de propósito general; MongoDB considera que Voyage-4-large es su modelo principal. El Voyage-4-lite se centra en tareas que requieren baja latencia y menores costos, y el Voyage-4-nano está destinado a entornos de prueba y desarrollo más locales o para la recuperación de datos en el dispositivo.

Voyage-4-nano es también el primer modelo abierto de MongoDB. Todos los modelos están disponibles a través de una API y en la plataforma MongoDB Atlas.

La compañía dijo que los modelos superan a modelos similares de Google y Cohere en el punto de referencia RTEB. abrazando la cara Referencia RTEB sitúa al Voyage 4 como principal modelo de incorporación.

“Incrustar modelos es una de esas opciones invisibles que realmente pueden hacer o deshacer las experiencias de IA”, dijo Frank Liu, gerente de producto de MongoDB, en una sesión informativa. “Si lo hace mal, los resultados de su búsqueda parecerán bastante aleatorios y superficiales, pero si lo hace bien, de repente parecerá que su aplicación comprende a sus usuarios y sus datos”.

Añadió que el objetivo de los modelos Voyage 4 es mejorar la recuperación de datos del mundo real, que a menudo colapsa cuando los oleoductos RAG y agentes entran en producción.

MongoDB también lanzó un nuevo modelo de incrustación multimodal, voyage-multimodal-3.5, que puede manejar documentos que incluyen texto, imágenes y video. Este modelo vectoriza datos y extrae significado semántico de tablas, gráficos, figuras y diapositivas que normalmente se encuentran en documentos comerciales.

Cuestiones de constitución de empresas

Para las empresas, un sistema de agentes es tan bueno como su capacidad para recuperar de manera confiable la información correcta en el momento adecuado. Este requisito se vuelve más difícil a medida que las cargas de trabajo escalan y las ventanas de contexto se fragmentan.

Varios proveedores de modelos apuntan a esta capa de IA del agente. de google Modelo de incrustación de Géminis cubierto las tablas de clasificación integradas y Cohere lanzó su Incorporar 4 modelos multimodales.que procesa documentos de más de 200 páginas. Mistral dijo que su modelo de incrustación de codificación, Incorporación CodestralSupera a Cohere, Google e incluso a Voyage Code 3 de MongoDB. MongoDB sostiene que el rendimiento de referencia por sí solo no aborda la complejidad operativa que enfrentan las empresas en la producción.

MongoDB dijo que muchos clientes han descubierto que sus pilas de datos no pueden manejar cargas de trabajo con reconocimiento del contexto y de recuperación intensiva en producción. La compañía dijo que está viendo una mayor fragmentación, ya que las empresas tienen que reunir diferentes soluciones para conectar bases de datos con un modelo de recuperación o reclasificación. Para ayudar a los clientes que no quieren soluciones fragmentadas, la empresa ofrece sus modelos a través de una única plataforma de datos, Atlas.

La apuesta de MongoDB es que la recuperación ya no pueda tratarse como una colección suelta de los mejores componentes. Para que los actores empresariales trabajen de manera confiable a escala, la incorporación, reclasificación y estratificación de datos deben operar como un sistema totalmente integrado en lugar de una pila unida.

Fuente