Técnica

DeepMind: los modelos de video como VEO 3 podrían convertirse en modelos de Fundación de Propósito General para Vision, como LLM para Text, utilizando razonamiento de “cadena de marcos” de disparo cero (Simon Willison/Simon Willison’s Weblog)


Simon Willison / Weblog de Simon Willison:

DeepMind: los modelos de video como VEO 3 podrían convertirse en modelos de Fundación de Propósito General para Visión, como LLMS para Text, utilizando razonamiento de “cadena de marcos” de disparo cero – LLMS tomó la capacidad de predecir el siguiente token y lo convirtió en modelos de base de propósito general para todo lo que



Fuente

Related Articles

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Back to top button