Técnica
DeepMind: los modelos de video como VEO 3 podrían convertirse en modelos de Fundación de Propósito General para Vision, como LLM para Text, utilizando razonamiento de “cadena de marcos” de disparo cero (Simon Willison/Simon Willison’s Weblog)

Simon Willison / Weblog de Simon Willison:
DeepMind: los modelos de video como VEO 3 podrían convertirse en modelos de Fundación de Propósito General para Visión, como LLMS para Text, utilizando razonamiento de “cadena de marcos” de disparo cero – LLMS tomó la capacidad de predecir el siguiente token y lo convirtió en modelos de base de propósito general para todo lo que
Fuente