Los clones de voz de IA creados en minutos ahora suenan tan reales que tus oídos nunca volverán a confiar en otra voz

- Las voces generadas por IA ahora imitan a los humanos de manera tan convincente que la detección es casi imposible
- Crear un clon de voz convincente ahora lleva minutos y una experiencia mínima
- Algunas voces sintéticas fueron calificadas en realidad más confiables que las grabaciones humanas reales
Durante años, muchas personas asumieron que el discurso generado por IA siempre podría ser identificado por sus cualidades ligeramente “falsas”.
Nuevo investigación De la Universidad Queen Mary de Londres desafían esta suposición, mostrar que la tecnología de voz de IA actual ha alcanzado un nivel en el que los “clones de voz” y los defensores profundos son casi indistinguibles de las grabaciones reales.
En el estudio, los participantes compararon las voces humanas con dos formas de audio sintético: voces clonadas diseñadas para imitar altavoces y voces generadas a partir de un LLM sistema sin contrapartes específicas.
Más allá del realismo y en el dominio
Los oyentes con frecuencia luchaban por distinguir entre los dos, lo que sugiere que la tecnología ha entrado en una fase en la que el realismo de los humanos ya no es una aspiración, sino una realidad.
El equipo de investigación investigó no solo si los participantes podían distinguir entre voces sintéticas y reales, sino también cómo las percibían.
Sorprendentemente, ambos tipos de voces generadas por IA fueron evaluadas como más dominantes que las humanas, y en algunos casos, fueron juzgados más confiables.
La Dra. Nadine Lavan, profesora titular de Psicología en la Universidad Queen Mary de Londres, hizo hincapié en la facilidad y económica que su equipo creó estos clones de voz.
“Las voces generadas por la IA están a nuestro alrededor ahora, era solo cuestión de tiempo hasta que la tecnología de IA comenzó a producir un habla naturalista y de sonido humano, el proceso requirió una experiencia mínima, solo unos minutos de grabaciones de voz y casi sin dinero”, dijo.
Ella dijo que la facilidad de uso muestra hasta qué punto la tecnología ha avanzado en poco tiempo.
Dicha accesibilidad crea oportunidades en campos como educación, comunicación y accesibilidad, donde las voces sintéticas a medida podrían mejorar el compromiso y el alcance.
Precisamente como Escritores de IA plantear preguntas sobre la originalidad, los derechos de autor y el mal uso, la generación de voz de IA provoca debates sobre la propiedad de la identidad y el consentimiento.
Si se puede crear un audio realista a partir de una muestra breve, los riesgos de la clonación no autorizada se vuelven difíciles de ignorar.
Como Herramientas AI Continuar expandiéndose en capacidad y accesibilidad, el desafío será garantizar que los beneficios se obtengan sin abrir nuevas vías para el engaño.
Comprender cómo las personas responden a estas voces es solo el primer paso para abordar las implicaciones éticas, legales y sociales de una tecnología que ya no es futurista, pero firmemente presente.