La traducción de voz en tiempo real de Google me dejó impresionados, ahora creo que lo quiero para mi portátil

Desde entonces Probé La traducción de voz en tiempo real de Google en una llamada entre un par de Google Pixel 10 Pro Teléfonos, he estado imaginando un futuro en el que puedo hablar con cualquier persona en cualquier idioma en mi propia voz y podemos entendernos instantáneamente.
No estoy solo en mi asombro. Cuando Jimmy Fallon y YouTuber Karen Polinesia demostraron la función en vivo durante Hecho por Google 2025 El 20 de agosto de 2025, el presentador de la televisión nocturno fue atónito, asombrado mientras su voz distintiva entregaba oraciones en español a alguien en un teléfono Pixel 10 Pro en un lugar no revelado.
No lo culpo. Como he dicho, esta característica usa la IA para recrear las voces de ambos llamadas en otro idioma, casi sin retraso, que es lo más cercano al que hemos llegado Traductor universal de Star Trek. Pero le falta algo.
Verá, la traducción de llamadas en tiempo real de Google solo funciona cuando llamas a alguien en el teléfono Pixel 10. Lo que realmente quiero es una experiencia más ambiente.
No puedo creer que esté escribiendo esto, pero lo que necesitamos es una pieza de hardware portátil que siempre escuche y cuando escucha a alguien hablarle en un idioma que no sea su lengua materna, comienza a interpetarse con la mosca y “hablar” esas mismas palabras en su laango natal, mientras que, por supuesto, usa una voz que combina con la voz de los altavoces.
En TrekLos exploradores de la galaxia simplemente apuntarían el dispositivo a Aliens, y sus idiomas ininteligibles transformarían sus voces en inglés. Sé que es poco probable; Sin embargo, tengo una visión de lo que quiero.
Soy consciente de que Google ha tenido una función de traducción con Pixel Buds (usando Google Translate y Google Assistant), pero nunca funcionó así y nunca usó un simulacrum de la voz del altavoz para la traducción. En lo que a mí respecta, el sistema no funciona a menos que incluya esto.
Un traductor portátil
En un mundo perfecto, el sistema no sería fricción: en ambos altavoces y siempre listo para interceptar, traducir y hablar de manera transparente para que no tengamos que llamar, tocar, buscar o leer.
En el mundo real, habría algunas concesiones para el estado actual del ecosistema de hardware móvil de Google.
Hay algunas opciones. Podría ser un sistema que funciona en ambos Reloj de píxeles y los brotes de píxeles (el reloj se traduce y envía la voz a los brotes) o los brotes se traducen y entregan la voz por su cuenta. Pixel Watch 4 y Pixel Buds (incluso los modelos Pro) carecen de la potencia para manejar la traducción.
Lo que se necesita es otra pieza de hardware o una combinación de dispositivos portátiles que pueden dar vida a esta traducción en vivo siempre presente.
Una posibilidad de hardware
En general, no soy fanático del hardware de IA dedicado (ver Conejo r1 y Plaud.ai). Los teléfonos inteligentes como el Pixel 10 Pro Tenga toda la IA generativa que necesitamos, y un dispositivo secundario solo para realizar muchas de esas mismas acciones de IA parece superfluo en el mejor de los casos.
La traducción en vivo en tiempo real, sin embargo, me hace pensar de manera diferente. Tal vez sea la combinación de un reloj y brotes de píxeles mejorados, pero preferiría si toda la operación se alojara en lo que podríamos llamar “Pixel Buds Pro mejorado”.
El interior sería un nuevo chip tensor lo suficientemente pequeño como para caber dentro de uno de los brotes, pero lo suficientemente potentes como para realizar la traducción local y la generación de voz. Sabemos que el software funciona, entonces, ¿por qué no crear hardware especial para soportarlo?
Sé que es una tarea difícil. Tensor G5 es un chip de proceso de 3 nm. ¿Podría ser esto un 2 nm? Tal vez. El objetivo sería reducir la IA (con su red neuronal) y reducir el consumo de energía para que una traducción no coma la mitad de la duración de la batería de Pixel Bud Pro mejorada.
Esta es la idea portátil de AI que puedo respaldar. Solo piense en cómo podría ser viajar a otro país si estuviera usando uno de estos. Entiendo que es poco probable que la persona con la que estás hablando también tenga un par, pero si pueden ejecutar Gemini en vivo en su teléfono o si tienen un reloj de píxeles, tal vez puedan escuchar lo que estás diciendo en su idioma (y en tu voz) también.
Mi punto es que esta característica es demasiado poderosa para estar atrapada dentro de un teléfono inteligente, y espero que Google esté funcionando en este momento para dar vida a mis sueños de traductor universal de Star Trek.