La creación de sistemas de recuperación de generación aumentada (RAG) para agentes de IA a menudo implica el uso de múltiples capas y tecnologías para datos estructurados, vectores e información gráfica. En los últimos meses, también ha quedado cada vez más claro que los sistemas de inteligencia artificial de agentes necesitan memoria, a veces denominada memoria contextual, para funcionar de manera efectiva.

La complejidad y sincronización de tener diferentes capas de datos para permitir el contexto pueden generar problemas de rendimiento y precisión. Es un desafío que SurrealDB busca resolver.

SurrealDB lanzó el martes la versión 3.0 de su base de datos homónima junto con una extensión Serie A de 23 millones de dólares, lo que eleva la financiación total a 44 millones de dólares. La empresa adoptó un enfoque arquitectónico diferente para bases de datos relacionales como PostgreSQL, bases de datos vectoriales nativas como Pinecone o una base de datos de gráficos como Neo4j. El equipo de ingeniería de OpenAI Recientemente detalló cómo escaló Postgres a 800 millones de usuarios. usar réplicas de lectura, un enfoque que funciona para cargas de trabajo con mucha lectura. SurrealDB adopta un enfoque diferente: almacena la memoria del agente, la lógica empresarial y los datos multimodales directamente en la base de datos. En lugar de sincronizar varios sistemas, la búsqueda de vectores, el recorrido de gráficos y las consultas relacionales se ejecutan de forma transaccional en un único motor Rust nativo que mantiene la coherencia.

“La gente ejecuta DuckDB, Postgres, Snowflake, Neo4j, Quadrant o Pinecone todos juntos y luego se preguntan por qué no pueden obtener una buena precisión en sus agentes”, dijo el CEO y cofundador Tobie Morgan Hitchcock a VentureBeat. “Es porque tienen que enviar cinco consultas diferentes a cinco bases de datos diferentes que sólo tienen el conocimiento o el contexto con el que están tratando”.

La arquitectura ha resonado entre los desarrolladores, con 2,3 millones de descargas y 31.000 estrellas de GitHub hasta la fecha para la base de datos. Según Hitchcock, las implementaciones existentes abarcan dispositivos de vanguardia en automóviles y sistemas de defensa, motores de recomendación de productos para los principales minoristas de Nueva York y tecnologías de publicación de anuncios Android.

Memoria de IA agente integrada en la base de datos

SurrealDB almacena la memoria del agente como relaciones gráficas y metadatos semánticos directamente en la base de datos, no en el código de la aplicación ni en capas de caché externas.

El sistema de complementos Surrealism en SurrealDB 3.0 permite a los desarrolladores definir cómo los agentes construyen y consultan esta memoria; la lógica se ejecuta dentro de la base de datos con garantías transaccionales, no en el middleware.

Esto es lo que esto significa en la práctica: cuando un agente interactúa con datos, crea gráficos de contexto que vinculan entidades, decisiones y conocimiento del dominio, como registros de bases de datos. Estas relaciones se pueden consultar a través de la misma interfaz SurrealQL utilizada para la búsqueda de vectores y datos estructurados. Un agente que pregunta sobre un problema de un cliente puede desplazarse a través de conexiones gráficas hasta incidentes pasados ​​relacionados, obtener incrustaciones de vectores de casos similares y unir datos estructurados de clientes, todo en una sola consulta transaccional.

“La gente ya no quiere almacenar sólo los datos más recientes”, dijo Hitchcock. “Quieren almacenar todos estos datos. Quieren analizar y hacer que la IA comprenda y analice todos los datos de una organización durante los últimos dos años, porque eso le informa a su modelo, a su agente de IA sobre el contexto, sobre la historia y, por lo tanto, puede proporcionar mejores resultados”.

En qué se diferencia la arquitectura de SurrealDB de las pilas RAG tradicionales

Los sistemas RAG tradicionales consultan bases de datos según los tipos de datos. Los desarrolladores escriben consultas separadas para búsqueda de similitud de vectores, recorrido de gráficos y uniones relacionales, y luego combinan los resultados en el código de la aplicación. Esto crea retrasos en la sincronización a medida que las consultas van y vienen entre sistemas.

Por el contrario, Hitchcock explicó que SurrealDB almacena datos como documentos codificados en binario con relaciones gráficas incrustadas directamente junto a ellos. Una sola consulta a través de SurrealQL puede recorrer relaciones de gráficos, realizar búsquedas de similitud de vectores y unir registros estructurados sin salir de la base de datos.

Esta arquitectura también afecta cómo funciona la coherencia a escala: cada nodo mantiene la coherencia transaccional, incluso a una escala de más de 50 nodos, dijo Hitchcock. Cuando un agente escribe un nuevo contexto en el nodo A, una consulta en el nodo B ve inmediatamente esta actualización. Sin caché, sin réplicas de lectura.

“Muchos de nuestros casos de uso, muchas de nuestras implementaciones son donde los datos se actualizan constantemente y las relaciones, el contexto, la comprensión semántica o las conexiones gráficas entre esos datos deben actualizarse constantemente”, dijo. “Así que no hay caché. No hay réplicas de lectura. En SurrealDB, todo es transaccional”.

Qué significa esto para la TI empresarial

“Es importante decir que SurrealDB no es la mejor base de datos para cada tarea. Me encantaría decir que lo somos, pero no lo es. Y no puede serlo”, dijo Hitchcock. “Si solo necesita analizar petabytes de datos y nunca actualizar esos datos, entonces será mejor que utilice almacenamiento de objetos o una base de datos en columnas. Si solo está tratando con búsqueda de vectores, entonces puede usar una base de datos de vectores como Quadrant o Pinecone, y eso será suficiente”.

El punto de inflexión se produce cuando se necesitan varios tipos de datos juntos. El beneficio práctico se muestra en los cronogramas de desarrollo. Lo que solía llevar meses construir mediante la orquestación de múltiples bases de datos ahora puede lanzarse en días, dijo Hitchcock.

Fuente