Operai presenta un nuevo modelo de AI de voz a voz

Foto del archivo: OpenAI anunció su modelo de IA de voz a voz “más capaz”, GPT-Realtime. | Crédito de la foto: AP
Openai el jueves (28 de agosto de 2025) anunció su modelo de IA de voz a voz “más capaz”, GPT-Realtime. Se dice que el modelo de IA es natural y expresivo, al tiempo que también es mejor para seguir instrucciones complejas.
“Es mejor para interpretar mensajes del sistema y indicaciones para desarrolladores, ya sea que lea los guiones de descargo de responsabilidad de la palabra por palabra en una llamada de soporte, repitan Alphanumerics o cambian a la perfección entre los idiomas a mitad de la oración”, según el blog de la compañía.
También puede cambiar el lenguaje o el tono en medio de una oración.
GPT-Realtime también puede capturar señales no verbales como risas y detectar números incluso en idiomas como español, chino, japonés y francés.
“Entrenamos al modelo en estrecha colaboración con los clientes para sobresalir en tareas del mundo real como atención al cliente, asistencia personal y educación, alineando el modelo de cómo los desarrolladores construyen y implementan agentes de voz”, declaró el blog.
El modelo estará disponible en la API de tiempo real, que también se puso a disposición generalmente.
Operai también ha lanzado nuevas voces en la API llamada Cedar y Marin, a la que se puede acceder a través de la API.
Publicado – 29 de agosto de 2025 02:07 PM es