Cómo transcribir voz a texto sin internet en iPhone con IA local

Última actualización: 8 de abril de 2026
Autor: Isaac
  • Nueva app de Google para iPhone que transcribe voz a texto sin conexión usando IA local.
  • Elimina muletillas, corrige errores y permite transformar el dictado en distintos formatos.
  • Ofrece diccionario personalizado, integración opcional con Workspace y modo en la nube con Gemini.
  • Es gratuita, solo en inglés y de momento no disponible en Europa por trámites regulatorios.

Transcribir voz a texto sin internet en iPhone

La posibilidad de transcribir voz a texto sin internet en iPhone da un salto importante con la llegada de una nueva aplicación de Google que apuesta claramente por la inteligencia artificial local. Frente a las soluciones clásicas de dictado que dependen de la nube, esta herramienta funciona directamente en el dispositivo y promete ganar en rapidez, privacidad y comodidad.

Este movimiento encaja con una tendencia clara en el mundo móvil: cada vez más usuarios quieren dictar notas, correos o documentos en el iPhone sin preocuparse por la cobertura, el consumo de datos o el envío constante de audio a servidores remotos. La nueva app de Google se sitúa justo en ese punto, aunque por ahora su disponibilidad es limitada para España y el resto de Europa.

Qué es Google AI Edge Eloquent y qué problema intenta resolver

Aplicación de dictado sin conexión en iPhone

Google ha estrenado en iOS una aplicación llamada Google AI Edge Eloquent, centrada en convertir dictados de voz en textos pulidos sin necesidad de conexión permanente. A diferencia de otros servicios de IA como Gemini, ChatGPT o Claude, aquí el procesamiento principal no se hace en servidores externos, sino en el propio iPhone.

La idea es ir más allá del típico dictado que solo convierte palabra por palabra. Eloquent busca interpretar lo que el usuario quiere decir, limpiar el discurso y generar textos que se parezcan más a un correo listo para enviar, un artículo o un informe, que a una transcripción cruda llena de tropiezos.

Este enfoque responde a uno de los grandes límites de las soluciones de dictado tradicionales: muchas veces el resultado es tan literal que obliga a repasar el texto y editarlo a conciencia, borrando repeticiones, frases a medio hacer o muletillas. La propuesta de Google intenta reducir al mínimo ese trabajo posterior.

IA local en el iPhone: transcribir sin usar internet

El corazón técnico de Google AI Edge Eloquent es Gemma, un modelo de inteligencia artificial de código abierto desarrollado por la propia compañía. Cuando el usuario instala la app en el iPhone y la abre por primera vez, se descargan modelos de reconocimiento de voz directamente al dispositivo.

A partir de ese momento, la aplicación puede transcribir voz a texto sin conexión a internet. Basta con pulsar el botón de grabación y empezar a hablar: la transcripción aparece en pantalla en tiempo real, incluso en modo avión o sin datos móviles. Esto marca una diferencia clara frente a servicios que exigen conexión constante para enviar el audio a la nube.

El procesamiento local tiene varias implicaciones. Por un lado, mejora la sensación de inmediatez, ya que buena parte del trabajo se resuelve en el propio teléfono. Por otro, limita el envío de datos a servidores externos, algo relevante para quienes se preocupan por la privacidad de sus dictados, sobre todo si incluyen información sensible o profesional.

Aun así, Google no renuncia a la nube por completo. La app incorpora un modo opcional que se apoya en los modelos Gemini para refinar todavía más el resultado, de manera que el usuario puede elegir entre priorizar el procesamiento local o activar esa capa extra de calidad cuando dispone de conexión.

Cómo limpia el texto: adiós a muletillas y tropiezos del habla

Uno de los aspectos más llamativos de la aplicación es su capacidad para eliminar muletillas y errores al vuelo. Mientras el usuario dicta, el sistema reconoce expresiones como “eh”, “mmm”, “um” o “ah” y las borra automáticamente de la transcripción.

Además, la IA intenta detectar frases que se han empezado varias veces, correcciones a mitad de oración y otros tropiezos habituales del habla espontánea. En lugar de plasmarlo todo al pie de la letra, Eloquent reordena y pule el texto para que resulte más legible y profesional.

Al terminar el dictado, el usuario puede pausar la grabación y revisar el resultado. Debajo del texto aparecen diferentes opciones de transformación, como “Puntos clave”, “Formal”, “Corto” o “Largo”, que permiten adaptar la salida a cada situación: desde un resumen rápido hasta una versión más extensa o con un tono más cuidado.

La filosofía de la app es cerrar la brecha entre la forma en la que hablamos y el tipo de texto que solemos enviar o publicar. En lugar de transcribirlo todo de forma literal y obligar a una larga sesión de edición, la herramienta intenta entregar directamente un texto “presentable”.

Personalización del vocabulario y aprendizaje contextual

Para quienes utilizan termos técnicos, jerga profesional o nombres poco comunes, la aplicación incluye un sistema de diccionario personalizado. Es posible añadir manualmente palabras y expresiones que el usuario usa con frecuencia, de forma que el reconocimiento se vaya adaptando a su realidad.

Además, Google ofrece la opción de que la app aprenda del entorno Workspace del usuario. Si se concede permiso, Eloquent puede tomar referencias de correos, documentos y otros contenidos de Google Workspace para afinar la comprensión de nombres propios, siglas o terminología específica.

Esta integración es completamente opcional: la compañía insiste en que el usuario mantiene el control sobre qué datos compartir. Quien prefiera no vincular su espacio de trabajo puede seguir usando el dictado local sin esa capa extra de personalización.

En paralelo, la app también contempla la posibilidad de nutrirse de la cuenta de Gmail, siempre bajo autorización expresa, para detectar vocabulario habitual. De este modo, las transcripciones tienden a cometer menos errores con clientes, proyectos o conceptos recurrentes en el día a día del usuario.

Funciones de productividad: historial, métricas y formatos de texto

Más allá del dictado básico, Google AI Edge Eloquent integra funciones propias de una herramienta de productividad. Cada sesión de transcripción se guarda en un historial, lo que permite recuperar fácilmente dictados antiguos y buscar por palabras clave dentro de ellos.

La app también muestra métricas sobre la actividad reciente, como el número de palabras pronunciadas en una sesión, la velocidad de dictado (palabras por minuto) o el volumen total de texto generado. Estas estadísticas pueden resultar útiles para quienes utilizan el dictado a diario y quieren medir su ritmo de trabajo.

En cuanto a la manipulación del texto, la presencia de modos como “Puntos clave”, “Corto” o “Largo” facilita reutilizar un mismo dictado en diferentes contextos. Por ejemplo, se puede convertir una explicación extensa en un listado de ideas principales para compartir con un equipo, o en un resumen breve para añadir a un informe.

Este conjunto de funciones sitúa a la aplicación no solo como un simple motor de voz a texto, sino como un asistente para estructurar y reutilizar contenido dictado, algo interesante para periodistas, creadores de contenido, estudiantes o profesionales que generan muchos textos desde el iPhone.

Modo sin conexión frente a modo en la nube con Gemini

Uno de los rasgos clave de la herramienta es que el usuario puede desactivar por completo el modo en la nube y quedarse solo con el procesamiento local. En ese escenario, todo el dictado se resuelve en el dispositivo y no se envía audio a los servidores de Google.

Si se activa el modo en la nube, entra en juego Gemini, el conjunto de modelos de IA más avanzado de la compañía. Esta capa adicional sirve para refinar todavía más el texto, ajustar el tono y mejorar la coherencia, algo especialmente útil en dictados largos o complejos.

La arquitectura que plantea Google es, por tanto, híbrida: quien priorice privacidad y autonomía puede apoyarse en Gemma y el procesamiento local; quien necesite la máxima calidad linguística tiene la opción de invocar Gemini cuando dispone de conexión.

Esta flexibilidad responde a un equilibrio que muchos usuarios de IA empiezan a exigir: aprovechar el potencial de los modelos en la nube cuando interesa, pero sin renunciar a funciones potentes que sigan funcionando sin internet o en entornos con conectividad limitada.

Precio, idioma y dispositivos compatibles

Google AI Edge Eloquent se lanza como una aplicación gratuita para iOS, sin coste de descarga, sin suscripciones asociadas y sin límites de uso anunciados. La ausencia de un modelo de pago periódico la coloca en una posición competitiva frente a otras herramientas de dictado avanzadas.

Por ahora, la app está disponible únicamente en inglés, lo que supone una barrera para usuarios de España y otros países europeos que necesiten trabajar en español u otros idiomas. Google no ha detallado aún cuándo podría llegar soporte oficial para más lenguas.

En cuanto al hardware, la herramienta está pensada para iPhone capaces de ejecutar modelos de IA de forma local, aprovechando la potencia de los chips más recientes. En dispositivos más antiguos podría no estar disponible o tener limitaciones, algo habitual cuando las apps dependen de capacidades avanzadas de procesado.

La compañía menciona en la descripción de la App Store la intención de llevar la experiencia a Android más adelante, con integración a nivel de sistema y la posibilidad de configurar Eloquent como teclado predeterminado o mediante un botón flotante. Sin embargo, no hay fechas concretas ni versión oficial para Android en este momento.

Restricciones en Europa y situación para usuarios en España

Aunque la app ya puede descargarse en la App Store de varios mercados, Europa se queda de momento fuera. Google ha confirmado que Google AI Edge Eloquent está restringida en el Reino Unido, el Espacio Económico Europeo (EEE) y Suiza debido a procesos regulatorios en curso.

Esto significa que, a día de hoy, usuarios de España y del resto del EEE no pueden instalar la aplicación de forma oficial desde sus tiendas locales de iOS. La compañía ha indicado que está trabajando para obtener las aprobaciones necesarias y poder ampliar la disponibilidad a estas regiones.

Este tipo de restricciones no es nuevo en servicios de IA avanzados, donde las exigencias normativas europeas en materia de protección de datos y transparencia suelen ser más estrictas. En el caso de una app que maneja audio potencialmente sensible, la revisión regulatoria cobra especial relevancia.

Mientras tanto, quienes en España buscan transcribir voz a texto sin internet en iPhone tienen que seguir recurriendo a alternativas ya presentes en el sistema o a apps de terceros disponibles en la App Store local, a la espera de que Google pueda desbloquear su propuesta en el mercado europeo.

Competencia y contexto del mercado de voz a texto

El lanzamiento de Google AI Edge Eloquent se produce en un momento en el que las apps de voz a texto impulsadas por IA están ganando mucha tracción. Herramientas como Wispr Flow, SuperWhisper o Willow han demostrado que existe un nicho claro para quienes quieren escribir hablando.

En este escenario, la apuesta de Google combina varios elementos: procesamiento local con Gemma, refinamiento en la nube con Gemini, edición automática del discurso y funciones de productividad añadidas. La combinación apunta a un uso más intensivo del dictado, no solo a notas rápidas.

Para la compañía, se trata también de una forma de probar sus propios modelos de IA en casos de uso muy concretos y cercanos al día a día de los usuarios. Si la experiencia funciona bien, no sería extraño ver que parte de estas capacidades se integran más adelante en Android o en otros productos del ecosistema Google.

Para los usuarios de iPhone, la llegada de Eloquent, aunque todavía limitada por cuestiones de idioma y regulación, confirma que el dictado por voz está evolucionando hacia soluciones que mezclan reconocimiento, edición y organización del contenido, con la IA trabajando en segundo plano para que el texto final requiera cada vez menos retoques manuales.

El panorama que se abre con Google AI Edge Eloquent refuerza la idea de que dictar al iPhone y obtener un texto limpio, estructurado y listo para compartir, incluso sin conexión a internet, deja de ser un escenario futurista para convertirse en una opción real, pendiente aún de que la app llegue oficialmente a España y al resto de Europa y amplíe su soporte de idiomas más allá del inglés.

manejar iPhone sin tocar-1
Artículo relacionado:
Manejar un iPhone sin tocarlo: todo sobre control por voz, Apple Intelligence y accesibilidad