La revolución del aprendizaje profundo tiene un curioso punto ciego: la hoja de cálculo. Si bien los modelos de lenguaje grande (LLM) han dominado los matices de la prosa humana y los generadores de imágenes han conquistado la pantalla digital, los datos estructurados y relacionales que sustentan la economía global (las filas y columnas de los sistemas ERP, CRM y libros de contabilidad) han sido hasta ahora tratados como un formato de archivo similar a un texto más, o PDF.

Esto hizo que las empresas predijeran los resultados comerciales utilizando el típico proceso de ciencia de datos personalizado, que requiere mucha mano de obra, de ingeniería de funciones manual y algoritmos clásicos de aprendizaje automático que son anteriores al aprendizaje profundo moderno.

Pero ahora Fundamentaluna empresa de inteligencia artificial con sede en San Francisco cofundada por ex alumnos de DeepMind, es lanzado hoy con $255 millones en financiamiento total para llenar este vacío.

Saliendo del secreto, la compañía está lanzando NEXUS, un modelo tabular grande (LTM) diseñado para tratar los datos comerciales no como una simple secuencia de palabras, sino como una red compleja de relaciones no lineales.

La tecnología: más allá de la lógica secuencial

La mayoría de los modelos de IA actuales se basan en lógica secuencial: predicen la siguiente palabra en una oración o el siguiente píxel en un cuadro.

Sin embargo, los datos empresariales son inherentemente no secuenciales. El riesgo de pérdida de clientes no es sólo un cronograma; es una intersección multidimensional de la frecuencia de las transacciones, el sentimiento de respaldo de los boletos y los cambios económicos regionales. Los LLM existentes luchan con esto porque no se adaptan bien a las limitaciones de tamaño y dimensionalidad de las tablas a escala empresarial.

“Los datos más valiosos del mundo se encuentran en tablas y hasta ahora no ha habido un buen modelo de referencia creado específicamente para comprenderlos”, afirmó Jeremy Fraenkel, director ejecutivo y cofundador de Fundamental.

En una entrevista reciente con VentureBeat, Fraenkel enfatizó que aunque el mundo de la IA está obsesionado con el texto, el audio y el video, las tablas siguen siendo la modalidad más importante para las empresas. “Los LLM realmente no pueden manejar muy bien este tipo de datos”, explicó, “y las empresas actualmente dependen de algoritmos de aprendizaje automático muy antiguos para hacer predicciones”.

NEXUS se entrenó en miles de millones de conjuntos de datos tabulares del mundo real utilizando Amazon SageMaker HyperPod. A diferencia de los modelos tradicionales XGBoost o Random Forest, que requieren que los científicos de datos definan manualmente las características (las variables específicas que el modelo debe observar), NEXUS está diseñado para ingerir tablas sin procesar directamente.

Identifica patrones latentes en columnas y filas que los analistas humanos pueden pasar por alto, leyendo efectivamente el lenguaje oculto de la cuadrícula para comprender las interacciones no lineales.

La trampa de la tokenización

La razón principal por la que los LLM tradicionales fallan con los datos tabulares es la forma en que procesan los números. Fraenkel explica que los LLM tokenizan números de la misma manera que tokenizan palabras, dividiéndolas en partes más pequeñas. “El problema es que a los números se les aplica lo mismo. En general, las tablas son todas numéricas”, observó Fraenkel. “Si tienes un número como 2,3, el ‘2’, el ‘.’ y ‘3’ se ven como tres fichas diferentes. Básicamente, esto significa que se pierde la comprensión de la distribución de números. No es como una calculadora; No siempre obtienes la respuesta correcta porque el modelo no comprende el concepto de números de forma nativa”.

Además, los datos tabulares son invariantes en el orden de una manera que el lenguaje no lo es. Fraenkel utiliza un ejemplo de atención sanitaria para ilustrar: “Si les doy una tabla con cientos de miles de pacientes y les pido que predigan cuál de ellos tiene diabetes, no debería importar si la primera columna es la altura y la segunda el peso, o viceversa”.

Si bien los LLM son muy sensibles al orden de las palabras en un mensaje, NEXUS está diseñado para comprender que cambiar las posiciones de las columnas no debería afectar la predicción subyacente.

Operando en la capa predictiva

Integraciones recientes de alto perfil como Claude de Anthropic aparece directamente en Microsoft Excelsugirió que los LLM ya están resolviendo tablas.

Sin embargo, Fraenkel distingue el trabajo de Fundamental por operar en una capa fundamentalmente diferente: la capa predictiva. “Lo que están haciendo es esencialmente en la capa de fórmula: las fórmulas son texto, son como código”, dijo. “No intentamos permitirle crear un modelo financiero en Excel. Le ayudamos a hacer un pronóstico”.

NEXUS está diseñado para decisiones en una fracción de segundo en las que un humano no está al tanto, como un proveedor de tarjetas de crédito que determina si una transacción es fraudulenta en el momento en que la desliza.

Si bien herramientas como Claude pueden resumir una hoja de cálculo, NEXUS está diseñado para predecir la siguiente línea, ya sea una falla en el equipo en una fábrica o la probabilidad de que un paciente sea readmitido en un hospital.

Arquitectura y disponibilidad

La propuesta de valor central de Fundamental es reducir radicalmente el tiempo de obtención de información. Tradicionalmente, construir un modelo predictivo podía llevar meses de trabajo manual.

“Hay que contratar un ejército de científicos de datos para construir todos estos canales de datos para procesarlos y limpiarlos”, explicó Fraenkel. “Si faltan valores o datos inconsistentes, su modelo no funcionará. Debe crear estos canales para cada caso de uso”.

Fundamental Claims NEXUS reemplaza todo este proceso manual con una sola línea de código. Debido a que el modelo ha sido entrenado previamente en mil millones de tablas, no requiere el mismo nivel de capacitación específica para tareas o ingeniería de características que los algoritmos tradicionales.

A medida que Fundamental pasa de su fase sigilosa a un mercado más amplio, lo hace con una estructura empresarial diseñada para evitar la fricción tradicional de la adopción de software empresarial.

La compañía ya ha conseguido múltiples contratos de siete cifras con organizaciones Fortune 100, una hazaña facilitada por una arquitectura estratégica de comercialización en la que Amazon Web Services (AWS) actúa como vendedor registrado en AWS Marketplace.

Esto permite a los líderes empresariales comprar e implementar NEXUS utilizando créditos de AWS existentes, tratando efectivamente la inteligencia predictiva como una utilidad estándar junto con la computación y el almacenamiento. Para los ingenieros encargados de la implementación, la experiencia es de alto impacto pero de baja fricción; NEXUS opera a través de una interfaz basada en Python en una capa puramente predictiva en lugar de conversacional.

Los desarrolladores conectan tablas sin procesar directamente en el modelo y etiquetan columnas objetivo específicas (como la probabilidad de incumplimiento crediticio o la puntuación de riesgo de servicio) para activar la predicción. Luego, el modelo devuelve regresiones o clasificaciones directamente a la pila de datos de la empresa, funcionando como un motor silencioso y de alta velocidad para la toma de decisiones automatizada en lugar de un asistente basado en chat.

Retos sociales: más allá de los resultados financieros

Si bien las implicaciones comerciales de la previsión de la demanda y de los precios son claras, Fundamental destaca el beneficio social de la inteligencia predictiva.

La empresa destaca áreas clave en las que NEXUS puede prevenir resultados catastróficos mediante la identificación de señales ocultas en datos estructurados.

Al analizar datos de sensores y registros de mantenimiento, NEXUS puede predecir fallas como la corrosión de las tuberías. La empresa señala la crisis del agua en Flint, que costó más de mil millones de dólares en reparaciones, como un ejemplo en el que el seguimiento predictivo podría haber evitado una contaminación potencialmente mortal.

De manera similar, durante la crisis de COVID-19, la escasez de EPP costó a los hospitales 323 mil millones de dólares en un solo año. Fundamental sostiene que al utilizar datos epidemiológicos y de producción, NEXUS puede predecir la escasez de 4 a 6 semanas antes del pico de demanda, desencadenando una producción de emergencia a tiempo para salvar vidas.

En el frente climático, NEXUS tiene como objetivo proporcionar pronósticos de inundaciones y sequías de 30 a 60 días, como las inundaciones de 2022 en Pakistán, que causaron daños por valor de 30 mil millones de dólares.

Finalmente, el modelo se está utilizando para predecir los riesgos de reingreso hospitalario mediante el análisis de la demografía de los pacientes y los determinantes sociales. Como afirma la empresa: “Una madre soltera que trabaja en dos trabajos no debería regresar a la sala de emergencias porque no pudimos predecir que necesitaría atención de seguimiento”.

Rendimiento versus latencia

En el mundo empresarial, la definición de mejor varía según el sector. Para algunos, es velocidad; para otros, es pura precisión.

“En términos de latencia, depende del caso de uso”, explica Fraenkel. “Si eres un investigador que intenta comprender qué medicamentos administrar a un paciente en África, la latencia no importa tanto. Estás tratando de tomar una decisión más precisa que podría terminar salvando tantas vidas como sea posible”.

Por el contrario, para un banco o un fondo de cobertura, incluso un aumento marginal en la precisión se traduce en un valor enorme.

“Aumentar la precisión de las previsiones en medio punto porcentual equivale a miles de millones de dólares para un banco”, afirma Fraenkel. “Para diferentes casos de uso, la magnitud del aumento porcentual cambia, pero podemos lograr que obtenga un mejor rendimiento del que tiene actualmente”.

Una visión ambiciosa recibe un amplio apoyo

La Serie A de 225 millones de dólares, liderada por Oak HC/FT con la participación de Salesforce Ventures, Valor Equity Partners y Battery Ventures, indica una firme creencia de que los datos tabulares son la próxima gran frontera.

Inversores ángeles notables, incluidos líderes de Perplexity, Wiz, Brex y Datadog, validan aún más el pedigrí de la empresa.

Annie Lamont, cofundadora y socia gerente de Oak HC/FT, expresó el sentimiento: “Es difícil exagerar la importancia del modelo de Fundamental: los datos estructurados y relacionales aún no han visto los beneficios de la revolución del aprendizaje profundo”.

Fundamental se está posicionando no sólo como otra herramienta de IA, sino como una nueva categoría de IA empresarial. Con un equipo de aproximadamente 35 personas con sede en San Francisco, la empresa se está alejando de la era de los modelos personalizados y acercándose a la era de los modelos de escritorio básicos.

“Estos algoritmos tradicionales han sido los mismos durante los últimos 10 años; no están mejorando”, afirmó Fraenkel. “Nuestros modelos continúan mejorando. Estamos haciendo lo que hizo ChatGPT con texto con tablas”.

Asociación con AWS

A través de una asociación estratégica con Amazon Web Services (AWS), NEXUS se integra directamente en el panel de AWS. Los clientes de AWS pueden implementar el modelo utilizando sus créditos e infraestructura existentes. Fraenkel describe esto como un “acuerdo único” y señala que Fundamental es una de las dos únicas empresas de inteligencia artificial que ha establecido una asociación tan profunda y multifacética con Amazon.

Uno de los obstáculos más importantes para la IA empresarial es la privacidad de los datos. Las empresas a menudo no están dispuestas a transferir datos confidenciales a una infraestructura de terceros.

Para resolver esto, Fundamental y Amazon lograron una importante hazaña de ingeniería: la capacidad de implementar modelos totalmente cifrados (tanto arquitectura como pesos) directamente en el propio entorno del cliente. “Los clientes pueden estar seguros de que sus datos estarán con ellos”, afirmó Fraenkel. “Somos la primera, y actualmente la única, empresa en desarrollar una solución de este tipo”.

La aparición de Fundamental es un intento de redefinir el sistema operativo para las decisiones empresariales. Si NEXUS funciona como se anuncia (abordando el fraude financiero, los precios de la energía y las interrupciones de la cadena de suministro con un modelo único y generalizado) marcará el momento en que la IA finalmente aprenda a leer las hojas de cálculo que realmente manejan el mundo. El poder de predecir ya no consiste en mirar lo que pasó ayer; se trata de descubrir el lenguaje oculto de las tablas para determinar qué pasará mañana.

Fuente