Técnica

Operai presenta un nuevo modelo de AI de voz a voz

Foto del archivo: OpenAI anunció su modelo de IA de voz a voz “más capaz”, GPT-Realtime. | Crédito de la foto: AP

Openai el jueves (28 de agosto de 2025) anunció su modelo de IA de voz a voz “más capaz”, GPT-Realtime. Se dice que el modelo de IA es natural y expresivo, al tiempo que también es mejor para seguir instrucciones complejas.

“Es mejor para interpretar mensajes del sistema y indicaciones para desarrolladores, ya sea que lea los guiones de descargo de responsabilidad de la palabra por palabra en una llamada de soporte, repitan Alphanumerics o cambian a la perfección entre los idiomas a mitad de la oración”, según el blog de la compañía.

También puede cambiar el lenguaje o el tono en medio de una oración.

GPT-Realtime también puede capturar señales no verbales como risas y detectar números incluso en idiomas como español, chino, japonés y francés.

“Entrenamos al modelo en estrecha colaboración con los clientes para sobresalir en tareas del mundo real como atención al cliente, asistencia personal y educación, alineando el modelo de cómo los desarrolladores construyen y implementan agentes de voz”, declaró el blog.

El modelo estará disponible en la API de tiempo real, que también se puso a disposición generalmente.

Operai también ha lanzado nuevas voces en la API llamada Cedar y Marin, a la que se puede acceder a través de la API.

Fuente

Related Articles

Back to top button