Google se ha sacado de la manga una de esas apps que llegan casi sin hacer ruido, pero que tienen todo para convertirse en herramienta de cabecera de muchos profesionales. Se llama Google AI Edge Eloquent y, aunque su nombre suene un poco largo, su idea es muy simple: dictas con tu voz, la IA limpia, reorganiza y pule el texto en tiempo real para que quede listo para enviar o usar sin apenas retoques.
A diferencia de otros lanzamientos llenos de anuncios y conferencias, Eloquent ha aparecido de forma bastante discreta en la App Store de iOS. Sin embargo, detrás de esa discreción hay una apuesta muy seria: llevar la inteligencia artificial avanzada directamente al móvil, sin depender de la nube, con un enfoque claro en la privacidad y en la calidad del texto final. Vamos a desgranar qué es exactamente Google AI Edge Eloquent, para qué sirve y por qué está dando tanto que hablar entre usuarios que viven pegados al dictado por voz.
Qué es Google AI Edge Eloquent y cómo funciona
Google AI Edge Eloquent es una aplicación de dictado por voz con inteligencia artificial, diseñada para transformar tu voz en texto muy pulido prácticamente al instante. La clave no es solo que transcriba lo que dices, sino que entiende que las personas no hablan igual que escriben y se encarga de cerrar esa brecha automáticamente.
En lugar de limitarse a hacer una transcripción literal, la app reescribe sobre la marcha tus frases improvisadas, corrige errores típicos del habla y da formato al texto para que parezca que lo has escrito con calma frente al ordenador. Es decir, si vas hablando a trompicones, dudando, repitiendo palabras o corrigiéndote a mitad de frase, el resultado que ves en pantalla es un texto fluido y profesional, sin ese caos propio del lenguaje oral.
Para conseguirlo, Eloquent se apoya en modelos de IA generativa Gemma instalados directamente en el dispositivo. Estos modelos son capaces de hacer reconocimiento de voz, limpieza de disfluencias, corrección de puntuación y reestructuración del texto en tiempo real. El objetivo es que no tengas que perder tiempo luego revisando cada párrafo.
Google describe la aplicación como una herramienta pensada para “cerrar la brecha entre cómo hablamos realmente y el texto profesional”. Esto la coloca en una categoría diferente respecto al dictado estándar integrado en los móviles, que normalmente se limita a escribir exactamente lo que oye, con todas las dudas, muletillas y tropiezos incluidos.
Dictado con IA en el dispositivo: Gemma y modo offline
Una de las grandes bazas de Google AI Edge Eloquent es que funciona de forma local en el iPhone, sin necesidad de enviar el audio a servidores externos. La app descarga un modelo Gemma ligero (del orden de varios cientos de megas) que se ejecuta utilizando el procesador y el Neural Engine del propio teléfono.
Esto significa que puedes usar la aplicación completamente offline, incluso en modo avión. Una vez instalado el modelo, el reconocimiento de voz y la limpieza del texto se realizan íntegramente en el dispositivo. No hay subidas de audio a la nube, ni procesamiento remoto, ni dependencia de la cobertura. Es especialmente útil para periodistas que trabajan sobre el terreno, profesionales con información sensible o personas que simplemente no quieren que sus notas acaben circulando por servidores ajenos.
Google ha dotado a Eloquent de un interruptor claro para activar un “modo offline total”. Con este ajuste, la app garantiza que absolutamente todo el procesamiento ocurre en local, sin excepciones. A efectos prácticos, significa que puedes estar en un avión, en un garaje sin cobertura o en una sala donde no quieras conexión, y seguir dictando textos largos sin interrupciones.
Los modelos Gemma que utiliza Eloquent forman parte de una familia de modelos de IA generativa de Google con pesos abiertos, lo que implica que sus parámetros pueden descargarse y ejecutarse en distintos dispositivos, incluidos móviles. Están pensados para ser ligeros, eficientes y capaces de manejar tareas como transcripción, resumen, generación de texto y razonamiento básico sin necesidad de una gran infraestructura en la nube.
La filosofía de “Edge AI” que representa Eloquent marca un giro interesante en la estrategia de Google: se pasa de un enfoque “cloud-first” a dar mucho más protagonismo a la ejecución directamente en el dispositivo. En cierto modo, la app demuestra hasta qué punto se puede exprimir el hardware de Apple con modelos propios, compitiendo de tú a tú con las funciones nativas de dictado del iPhone.
Modo en la nube con Gemini: más pulido opcional
Aunque Eloquent está pensada para funcionar principalmente sin conexión, la aplicación también ofrece un modo opcional basado en la nube. Si el usuario lo activa, parte del procesamiento del texto se envía a modelos Gemini alojados en los servidores de Google, lo que puede ofrecer un acabado aún más refinado en frases complejas o documentos especialmente largos.
En este modo “Cloud”, la app sigue capturando el audio en el dispositivo, pero la depuración final del texto corre a cargo de Gemini. Esto puede traducirse en mejor manejo de estructuras gramaticales complicadas, detección más fina de matices y una redacción todavía más natural cuando el dictado es caótico o está lleno de cambios de idea.
Google presenta esta dualidad como un equilibrio entre privacidad y calidad máxima del texto. Por defecto, todo se hace en local, pero si necesitas ese toque extra de pulido (por ejemplo, para informes formales, correos a clientes importantes o documentación legal compleja), puedes activar el procesamiento en la nube con un simple ajuste en la app.
Es importante recalcar que la activación de Gemini es totalmente voluntaria. Quien tenga requisitos estrictos de confidencialidad puede mantener el modo únicamente local sin renunciar a la mayoría de las ventajas de la herramienta. La idea es que no haya un “todo o nada”: cada usuario elige hasta qué punto quiere sacrificar privacidad por un plus de calidad en el texto acabado.
Qué problema histórico resuelve: nadie habla como escribe
Durante años, las grandes tecnológicas han intentado convencernos de que la voz sería la forma natural de hablar con nuestros dispositivos, con asistentes como Google Assistant, Siri o Alexa. Sin embargo, esos asistentes jamás llegaron al uso masivo que se esperaba, y uno de los grandes motivos ha sido la incapacidad para convertir la voz espontánea en texto realmente útil.
El problema de fondo es evidente: no hablamos igual que escribimos. Cuando dictamos, solemos mezclar frases, hacer pausas raras, meter muletillas, corregirnos a mitad de oración y saltar de una idea a otra sin demasiada estructura. Los sistemas clásicos de dictado, incluso los relativamente buenos, se limitan a volcar literalmente todo eso sobre la pantalla, dejando un texto difícil de leer y que exige un repaso exhaustivo.
Google AI Edge Eloquent ataca precisamente esta limitación: se centra en entender el habla improvisada y transformarla en texto profesional desde el minuto uno. No se conforma con reconocer palabras; interpreta el contexto, detecta dónde te has trabado, decide qué partes sobran y cómo reconstruir la frase para que tenga sentido escrito.
En la práctica, esto supone que puedes dictar casi como piensas, sin intentar “hablar perfecto”. Si añades un “bueno, espera, mejor esto…” o repites una palabra al buscar la expresión adecuada, Eloquent es capaz de limpiar ese ruido y dejar una redacción fluida. Para quien toma notas rápidas en la calle, graba ideas de proyectos o redacta correos enteros caminando, el salto de comodidad es notable.
En este terreno, la app se posiciona como competidora directa de otras soluciones avanzadas de dictado y transcripción basadas en IA, como Whisper de OpenAI o servicios como Wispr Flow y SuperWhisper, pero con un enfoque muy marcado en la ejecución local y la privacidad, algo que muchos usuarios profesionales valoran por encima de todo.
Funciones clave: limpieza, formatos y personalización
Uno de los rasgos más llamativos de Eloquent es su capacidad para “limpiar” el habla espontánea. La aplicación detecta y elimina automáticamente muletillas como “eh”, “mmm”, “uhm” y otras expresiones de vacilación que se cuelan sin darnos cuenta cuando pensamos en voz alta.
Además de las muletillas, la app corrige la puntuación y los errores de concordancia que son típicos del habla pero no de la escritura. Por ejemplo, reorganiza la frase cuando te corriges a mitad de camino, añade comas y puntos donde corresponde y ajusta tiempos verbales si te has cambiado sin querer. Todo esto ocurre en tiempo real mientras vas hablando.
Otro punto fuerte es que la herramienta ofrece distintos formatos de salida para el texto. No estás obligado a quedarte con un bloque plano de palabras, sino que puedes elegir entre varias opciones según el uso que quieras darle al dictado:
- Resumen de puntos clave para extraer lo esencial de una reunión o una idea larga.
- Texto formal para correos profesionales, informes o documentos corporativos.
- Versión breve si necesitas algo conciso y directo.
- Versión extendida para desarrollar más las ideas y obtener un texto más largo.
La personalización va un paso más allá con la opción de crear un diccionario propio y editable. Eloquent permite añadir manualmente nombres propios, jerga técnica, acrónimos o términos específicos de tu sector (por ejemplo, médicos, legales o de ingeniería) para que el modelo los reconozca correctamente y no intente “corregirlos” a algo parecido.
Además, la app puede importar vocabulario desde tu cuenta de Gmail. Analizando tu historial de correos, Eloquent aprende los nombres de clientes, proyectos, productos o expresiones habituales que utilizas a menudo. De este modo, cuando dictes algo con un apellido complicado o el nombre raro de un proyecto interno, tendrá muchas más probabilidades de escribirlo bien a la primera.
Con el uso, la IA va adaptándose a tu forma de hablar: mejora con tus patrones de pronunciación, tu gramática habitual y tus preferencias de estilo. Esta capacidad de aprendizaje continuo hace que, a medida que la utilizas, las transcripciones se ajusten cada vez mejor a tu manera de expresarte.
Herramientas extra: métricas y gestión de sesiones

Google AI Edge Eloquent no se queda solo en la transcripción y el formato, también incorpora funciones pensadas para quienes dictan con frecuencia y quieren controlar su productividad o revisar sesiones anteriores con facilidad.
Por un lado, la app registra el número total de palabras y la velocidad de dictado (palabras por minuto) de tus sesiones. Esto puede ser útil para periodistas, redactores o profesionales que quieran medir cuánta “producción” de texto consiguen en determinado tiempo o comprobar si han mejorado su ritmo de trabajo.
También puedes consultar tu historial de dictados y buscar en grabaciones previas para localizar fragmentos específicos. Si utilizas la app para tomar notas de reuniones, ideas rápidas o bocetos de documentos, esta función hace mucho más fácil recuperar información sin tener que rebuscar manualmente en cada transcripción.
En combinación con la opción de formatos (resumen, texto formal, etc.), estas herramientas convierten a Eloquent en algo más que un simple dictado: se acerca a ser un asistente de escritura por voz que organiza, mide y pone orden en la gran cantidad de contenido que puedes generar hablando.
Privacidad y sectores profesionales sensibles
La privacidad es uno de los pilares fundamentales del planteamiento de Google AI Edge Eloquent. A diferencia de muchos servicios que dependen casi por completo de servidores en la nube, esta app está pensada precisamente para los usuarios más reacios a que sus datos de voz salgan del dispositivo.
En modo local, las grabaciones de audio y las transcripciones no se envían a Google. Todo se procesa con el modelo Gemma instalado en el propio iPhone, lo que proporciona un nivel de tranquilidad extra para sectores donde la confidencialidad es crítica: bufetes de abogados, clínicas y hospitales, consultoras, empresas con secretos comerciales, etc.
Google permite que, de manera opcional, concedas permisos a la app para acceder a determinados datos de Google Workspace (por ejemplo, correos de Gmail) con el único objetivo de enriquecer el diccionario contextual y mejorar la comprensión de nombres y términos específicos. Esta autorización es configurable y puede revocarse cuando lo desees.
La compañía insiste en que la aplicación es gratuita y sin límites diarios de uso. No necesitas una suscripción a Google Workspace para aprovechar las funciones básicas de dictado offline. Las integraciones con modelos más avanzados de Gemini pueden variar según la región y la política de Google en cada momento, pero la funcionalidad principal de dictado local se mantiene sin coste.
En cuanto a la comparación con otras soluciones, Eloquent reduce aún más la “brecha de privacidad” respecto a lo que Apple ofrece de forma nativa. Aunque Apple lleva tiempo presumiendo de procesamiento en el dispositivo, la propuesta de Google permite literalmente poner el móvil en modo avión, cortar toda conexión de red y seguir teniendo un dictado con IA totalmente funcional, algo muy valorado por periodistas, directivos y profesionales que manejan información especialmente sensible.
Disponibilidad, idiomas y requisitos de dispositivo
Actualmente, Google AI Edge Eloquent está disponible únicamente para iOS a través de la App Store de Apple, y se ofrece en inglés como idioma principal. De momento, la aplicación no funciona oficialmente en España ni en otras regiones del Espacio Económico Europeo debido a requisitos de aprobación regulatoria.
Google ha indicado que la llegada a Reino Unido, EEE y Suiza está restringida por motivos normativos, pero que están trabajando activamente para conseguir las aprobaciones necesarias y poder expandirse a estas zonas más adelante. Es razonable pensar que, una vez sorteados esos trámites, la app vaya llegando a más mercados progresivamente.
En cuanto al hardware, Eloquent requiere un iPhone con un Neural Engine potente y una versión reciente de iOS. La aplicación está optimizada para modelos modernos como iPhone 16 Pro, iPhone 17 y posteriores, con iOS 26.0 o superior, ya que el procesamiento local intensivo de los modelos Gemma demanda una buena capacidad de cálculo para ofrecer latencias bajas.
Por ahora, no existe una versión final para Android u otros sistemas operativos, aunque en descripciones previas de la App Store se llegó a mencionar soporte para Android que posteriormente fue eliminado. Todo apunta a que Google está usando el ecosistema cerrado de hardware de Apple como banco de pruebas ideal para su SDK de Edge AI, antes de dar el salto a más plataformas.
Además de Eloquent, Google tiene en la App Store otra aplicación llamada AI Edge Gallery, que sirve como entorno de pruebas para la familia de modelos Gemma, incluyendo variantes como Gemma 3n y Gemma 4. Esta app permite ejecutar los modelos íntegramente en el dispositivo, probar funciones de chat y razonamiento paso a paso, y comparar el rendimiento de distintos tamaños de modelo en el hardware del usuario.
Gemma y la familia de modelos abiertos de Google
La tecnología que da vida a Google AI Edge Eloquent se basa en Gemma, una familia de modelos de IA generativa que Google ha desarrollado con la misma base tecnológica que Gemini, pero pensada para que desarrolladores y empresas puedan ejecutarla en sus propios entornos, sin depender siempre de la infraestructura de Google.
Los modelos Gemma se consideran de “pesos abiertos”, lo que significa que sus parámetros pueden descargarse, ajustarse y desplegarse en hardware propio bajo unas condiciones de uso concretas. Esto permite que se integren en aplicaciones locales, servidores de empresas y, como en el caso de Eloquent, directamente en smartphones.
En la práctica, Gemma sirve para tareas como resumir textos, responder preguntas, razonar, generar contenido y procesar transcripciones. Las variantes más ligeras están diseñadas para correr en dispositivos con recursos limitados, como móviles o portátiles, mientras que los modelos de mayor tamaño (26B y 31B parámetros, por ejemplo) están pensados para ordenadores de sobremesa y servidores.
Gemma 4, una de las familias más recientes, incluye modelos adaptados específicamente a teléfonos (como E2B y E4B) y aprovecha ventanas de contexto muy amplias, de hasta 128K tokens, ampliables a 256K en algunas variantes grandes. Esto significa que pueden manejar documentos muy extensos o sesiones largas de conversación sin perder el hilo.
En el caso de Eloquent, Google estaría empleando versiones compactas de Gemma, posiblemente cuantificadas, que logran un equilibrio entre calidad del texto, consumo de batería y velocidad de respuesta. Gracias a estas optimizaciones, es posible disfrutar de una experiencia de dictado con IA muy avanzada sin necesidad de estar permanentemente conectado a la nube.
La existencia de AI Edge Gallery como laboratorio accesible en iOS refuerza la idea de que Google quiere convertir Gemma en la base de un ecosistema de IA local, donde aplicaciones como Eloquent son solo la punta del iceberg para usuarios finales, mientras desarrolladores experimentan con variantes aún más complejas en segundo plano.
Google AI Edge Eloquent se coloca así en un punto muy interesante del panorama actual de IA aplicada al dictado: combina un procesamiento en el dispositivo extremadamente rápido, una limpieza profunda del lenguaje hablado, múltiples formatos de salida y un respeto notable por la privacidad. Para cualquiera que redacte correos, informes, notas de reuniones o ideas completas hablando al móvil, supone un salto de comodidad que va más allá del simple “reconocer la voz” y se acerca a tener un verdadero escritor fantasma instalado en el bolsillo.
