Voice Translator Online

Traductor de voz para conversaciones en vivo y archivos de audio. Traducir voz al inglés desde 99 idiomas, subir grabaciones MP3/WAV o realizar traducción de voz en vivo en el navegador.

Amado por más de 7.3 millones de personas

Lo que hace el Traductor de Voz

Este traductor de voz convierte el habla entre 99 idiomas; la calidad de la traducción sigue la tasa de error de palabras del idioma de origen. Sube grabaciones o habla en vivo en el navegador. Sin descarga, sin cuenta, sin límites de minutos.

Introduce un archivo de audio, obtén texto traducido. Sube MP3, WAV, M4A, MP4, OGG o FLAC. El modelo transcribe el idioma de origen, realiza la traducción al idioma de destino que elijas y exporta el resultado como texto plano, SRT o VTT para subtítulos. Los archivos de hasta 3 horas funcionan en una sola pasada.

La traducción en vivo se ejecuta en la misma pestaña del navegador. Haz clic en el micrófono, habla y el texto traducido aparece en menos de 1.5 segundos. Útil para llamadas de soporte internacional, reuniones con proveedores y entrevistas bilingües donde esperar a que termine una grabación no es una opción (referencia de latencia de abril de 2026).

Capacidades clave:

  • Traducción de voz al inglés desde cualquier idioma de origen con detección automática
  • Traducción de voz en vivo con menos de 1.5 segundos de retraso
  • Subida de archivos de audio de hasta 3 horas de duración (MP3, WAV, M4A, MP4, OGG, FLAC)
  • Traductor de voz en vivo gratuito para reuniones, llamadas y presentaciones
  • Maneja acentos, dialectos y ruido de fondo con una precisión del 96%+
  • Salida de voz para que las traducciones se reproduzcan como audio hablado
  • Basado en navegador, sin instalación
  • Transcripciones con marca de tiempo para documentación y búsqueda

La herramienta está diseñada para reuniones grabadas, podcasts, entrevistas, llamadas de atención al cliente y contenido de video. Utiliza el modo en vivo para conversaciones en tiempo real o sube archivos para trabajo por lotes con transcripciones buscables.

Matriz de calidad de pares de idiomas

La calidad de la traducción sigue la calidad de la transcripción. Los pares con una baja tasa de error de palabras (WER) en el idioma de origen producen traducciones más limpias porque hay menos entrada confusa que interpretar para la pasada de traducción. Los números a continuación son del retest de WER de abril de 2026.

Par de idiomasWER promedio (transcripción)Calidad de traducciónNotas
en, es4-5%ExcelentePar de mayor volumen, más entrenado
en, pt5-6%ExcelenteVariantes brasileña y europea compatibles
en, fr5-6%ExcelenteFrancés de Quebec cubierto
en, de6-7%BuenoPalabras compuestas manejadas correctamente
en, ja7-8%BuenoPuntuación reconstruida
en, zh7-8%BuenoSimplificado y Tradicional
en, ko7-8%BuenoNiveles honoríficos preservados
es, pt5-6%ExcelenteAlta inteligibilidad mutua
en, ar9-10%AceptableSolo MSA, cobertura de dialectos limitada
en, hi9-10%AceptableManejo de cambio de código con inglés

Para los pares no listados, busca el WER del idioma de origen en la tabla de precisión por idioma y añade aproximadamente un nivel de calidad entre el rango de WER y la traducción final. Los pares en el rango de WER del 10%+ todavía producen traducciones útiles para la comprensión general, solo espera más pulido de nombres propios e modismos.

Cómo Usar el Traductor de Voz

La herramienta funciona en tres pasos, ya sea que subas una grabación o hables en vivo.

  1. Sube archivos de audio (MP3, WAV, M4A, MP4, OGG, FLAC) o haz clic en el micrófono para hablar en vivo
  2. La IA detecta automáticamente el idioma de origen entre más de 100 opciones
  3. El habla se convierte a tu idioma de destino con una precisión del 96%+ y marcas de tiempo
  4. Copia el texto o descarga la transcripción traducida

Los idiomas compatibles incluyen español, francés, alemán, chino, japonés, coreano, árabe, hindi, portugués, ruso, italiano y holandés, además de más de 90.

El modo de traductor de voz en vivo procesa conversaciones instantáneamente con una latencia inferior a 1.5 segundos. Está diseñado para reuniones de negocios, llamadas con clientes, entrevistas y presentaciones internacionales. Haz clic para hablar y traducir durante una llamada sin cambiar de pestaña.

La entrada de micrófono captura tu voz directamente en el navegador. Haz clic en el botón del micrófono, otorga permiso y habla. La IA detecta el idioma, traduce el contenido y muestra el resultado. Funciona en navegadores de escritorio y móviles.

Traductor de Voz vs Otras Herramientas

CaracterísticaScreenAppMaestraSonixNottaSpeechmaticsVeed.io
Idiomas compatibles100+125+535850+125+
Detección automática de idioma de origen
Clonación de voz para salida dobladaNo (voces TTS)NoNoNo
Límite de tamaño / duración de archivo3 horas por subida5 GB por archivo4 GB / 5 horas2 GB / 5 horas2 GB por archivo2 GB por archivo
Nivel gratuitoMinutos ilimitadosPrueba de 30 minPrueba de 30 min120 min/mes8 horas/mes
Formatos de exportaciónTXT, SRT, VTT, DOCXSRT, VTT, TXT, DOCXSRT, VTT, TXT, DOCXTXT, SRT, DOCX, PDFTXT, SRT, JSONSRT, VTT, TXT
Precio (de pago)Gratis$29/mes$22/hora$14.99/mes$0.30/hora API$24/mes
  • vs Maestra: Maestra clona la voz de un orador para la reproducción doblada en el idioma de destino, lo cual es útil para la localización de video. Limita la prueba gratuita a 30 minutos. ScreenApp utiliza voces TTS genéricas en lugar de clonación, pero el uso gratuito no tiene límite de minutos y exporta SRT/VTT directamente.
  • vs Sonix: Sonix cubre 53 idiomas y cobra $22 por hora de audio después de la prueba de 30 minutos. ScreenApp cubre 99 idiomas con traducción gratuita, aunque Sonix tiene etiquetas de diarización de oradores más fuertes en grabaciones de reuniones largas.
  • vs Notta: Notta ofrece 120 minutos gratuitos al mes en 58 idiomas y exporta SRT para trabajo de video. ScreenApp acepta más formatos de archivo (OGG, FLAC incluidos) y elimina el límite mensual de minutos, mientras que Notta tiene una integración de bot más estrecha con Zoom y Google Meet.
  • vs Speechmatics: Speechmatics es un motor de transcripción API-first que se factura a $0.30 por hora de audio con 8 horas gratuitas al mes. Necesita integración de desarrollador para traducir. ScreenApp funciona en el navegador sin código.
  • vs Veed.io: Veed.io añade clonación de voz por IA y estilo de subtítulos en pantalla para editores de video, con un nivel gratuito mensual de 30 minutos. ScreenApp se centra en la ruta de traducción de audio a texto y omite la edición de video, pero maneja archivos más largos (3 horas vs 2 GB) sin costo.

Traducción con Salida de Voz

El traductor de voz devuelve transcripciones de texto y audio hablado en el idioma de destino. Después de convertir el habla a texto, reproduce audio con sonido natural utilizando la síntesis de voz (text-to-speech).

Características de la salida de voz:

  • Pronunciación natural en más de 100 voces de idiomas, incluidos acentos regionales
  • Velocidad de habla ajustable para ralentizar o acelerar el audio traducido
  • Selección de género para opciones de voz masculina o femenina en la mayoría de los idiomas
  • Reproducción instantánea durante conversaciones en vivo
  • Archivos de audio descargables del habla traducida

Usa la salida de voz para el aprendizaje de idiomas, la accesibilidad o cualquier entorno donde leer texto no sea práctico: llamadas telefónicas, conducir o reuniones con manos libres. La traducción hablada también ayuda con la pronunciación y la entonación.

Para quién es el traductor de voz

Los equipos de localización que envían contenido multilingüe procesan locuciones en el idioma original, anuncios y tutoriales de productos a través del traductor para producir archivos SRT para cada mercado de lanzamiento. La cobertura de más de 100 idiomas reduce el número de proveedores necesarios para un solo lanzamiento.

Los periodistas que cubren entrevistas en idiomas extranjeros suben las grabaciones de campo el mismo día en que se capturan. La transcripción y la traducción regresan con marcas de tiempo, por lo que un reportero puede citar una frase en 00:14:32 sin pagar por un asistente separado.

Los profesores de idiomas que preparan materiales bilingües insertan un podcast o un clip de noticias en la herramienta y obtienen tanto la transcripción original como la traducción al inglés. Los estudiantes comparan ambos uno al lado del otro, y la exportación SRT se conecta a los reproductores de video del aula.

Los equipos de soporte que gestionan tickets de audio no en inglés traducen buzones de voz y grabaciones de Zoom de clientes que no hablan el idioma del equipo. El agente lee la transcripción traducida en su mesa de ayuda y responde por escrito sin enrutar el ticket a una cola bilingüe.

Preguntas frecuentes

¿Cómo traduzco audio en vivo a inglés?

Haga clic en el botón del micrófono, hable en cualquier idioma, y la herramienta devuelve la traducción al inglés en menos de 1.5 segundos. La IA detecta el idioma de origen entre más de 100 opciones y produce tanto texto en inglés como voz opcional. No requiere instalación de aplicación.

¿Cómo traduzco archivos de audio a inglés?

Suba archivos MP3, WAV, M4A, MP4, OGG o FLAC. La herramienta detecta el idioma de origen y convierte el habla a texto en inglés con alta precisión. Descargue la transcripción traducida con marcas de tiempo para documentación y búsqueda.

¿Cuál es el mejor traductor de voz online?

Depende del trabajo. Sonix y Speechmatics producen las transcripciones de formato largo más limpias para usuarios de pago. Maestra y Veed.io son útiles cuando se necesita una voz clonada para la salida doblada. ScreenApp maneja cargas de archivos de audio y voz en vivo en 99 idiomas sin límite de minutos en la versión gratuita, lo que lo convierte en una buena opción predeterminada para trabajos de traducción ad-hoc.

¿Puedo usar el traductor de voz gratis?

Sí. Los usuarios gratuitos obtienen traducción ilimitada de archivos y en vivo en 99 idiomas. Microsoft Translator limita a los usuarios de 365 a 300 minutos al mes. La versión gratuita de DeepL Voice se detiene en 30 minutos al día. ScreenApp no tiene límite.

¿Cómo funciona la traducción de voz a inglés?

Habla a tu micrófono o sube una grabación. La IA detecta el idioma de origen de entre más de 100 opciones y genera texto en inglés en menos de 1.5 segundos. La reproducción de voz es opcional.

¿Puedo exportar subtítulos traducidos para trabajos de video?

Sí. Después de la traducción, elige SRT o VTT en el menú de exportación. El archivo utiliza las marcas de tiempo de origen para que los subtítulos se ubiquen en los fotogramas correctos en Premiere, Final Cut, DaVinci Resolve o YouTube Studio. TXT sin formato y DOCX también están disponibles para entregables escritos.

¿La herramienta mantendrá las etiquetas de orador en una grabación con varias personas?

La transcripción marca los turnos de orador cuando las voces están claramente separadas, luego lleva esas etiquetas a la salida traducida. Para el habla superpuesta en una grabación de reunión concurrida, las etiquetas se convierten en un esfuerzo óptimo y es posible que desees verificar los puntos de superposición.

¿Cómo funciona el traductor en vivo en tiempo real?

El modo en vivo utiliza el micrófono de tu navegador. La herramienta captura audio, ejecuta reconocimiento de voz, detecta el idioma de origen, traduce al idioma de destino y genera texto con voz opcional. La latencia es inferior a 1.5 segundos.

¿Puedo traducir voz de archivos de video?

Sí. Sube archivos MP4, AVI, MOV, MKV, WEBM o 3GP. La herramienta extrae el audio, traduce el habla y devuelve una transcripción completa con marcas de tiempo. Exporta subtítulos traducidos en SRT para edición de video.

¿Qué formatos de archivo de audio puedo traducir?

MP3, WAV, M4A, AAC, MP4, OGG y FLAC. Sube archivos de hasta 3 horas de duración con detección automática de idioma.

¿Qué tan preciso es el reconocimiento de voz en el traductor?

La precisión es del 96%+ en 99 idiomas (actualización del modelo de abril de 2026). Los pares comunes son más altos — Español-Inglés al 97.2%, Francés-Inglés al 96.8%, Mandarín-Inglés al 96.4%. El modelo maneja acentos regionales, dialectos, ruido de fondo y terminología técnica.

¿Funciona el traductor de voz en dispositivos móviles?

Sí. Funciona en navegadores móviles en iOS y Android. No requiere instalación de aplicación. La interfaz se adapta a pantallas más pequeñas.

¿Puede el traductor de voz detectar el idioma de origen automáticamente?

Sí. La IA identifica el idioma de origen entre 99 idiomas utilizando análisis de fonemas y patrones de habla, incluyendo dialectos y acentos regionales. Solo tú eliges el idioma de destino.

¿Es gratuito el traductor de voz en vivo?

Sí. traducción en vivo gratuita sin límite por minuto, sin suscripción y sin registro.

¿Es seguro usar el traductor de voz?

Sí. Los archivos de audio viajan a través de HTTPS y se eliminan automáticamente después de la traducción. Su audio nunca se utiliza para entrenar modelos de IA públicos. La herramienta no requiere información personal ni una cuenta. Compatible con GDPR y con cifrado de extremo a extremo.

Resultados Reales de Usuarios Reales

Aaron photo

Aaron

Gerente de Proyecto

★★★★★

¡Nuestra experiencia general con ScreenApp ha sido simplemente excelente! Su soporte es fantástico, y ScreenApp es un gran sistema de grabación.

JP photo

JP

Gerente de Operaciones

★★★★★

Finalmente, un grabador de pantalla que no pone marcas de agua en todo. El plan gratuito me da 45 minutos de procesamiento de IA mensual - eso es suficiente para la mayoría de mis videos de entrenamiento.

Trina photo

Trina

Fundadora

★★★★★

Era escéptica sobre otro asistente de notas con IA, pero el generoso nivel gratuito de ScreenApp me conquistó completamente. La calidad es de nivel profesional, y las funciones de IA realmente funcionan como se anuncia. Ahora lo uso para todas mis presentaciones con clientes y demos del equipo.

Kelvin photo

Kelvin

Ingeniero de Software

★★★★★

Las aplicaciones de escritorio y móvil son fantásticas. Grabar reuniones mientras estoy en movimiento nunca ha sido más fácil, y la función de dictado es un gran ahorrador de tiempo.

Millie photo

Millie

Directora

★★★★★

Nuestro equipo se estaba ahogando en comentarios de clientes hasta que encontramos ScreenApp. Ahora grabamos cada presentación y llamada de cliente, y los resúmenes de IA son perfectos.

Tanmay photo

Tanmay

Gurú de Marketing

★★★★★

Hace que grabar y compartir guías sea fácil. Me encanta cómo puedo capturar mi pantalla y convertirla al instante en guías paso a paso en cualquier formato. Inteligente, simple y un uso brillante de la IA.

Sav photo

Sav

Gerente de Proyecto

★★★★★

Los usuarios elogian constantemente nuestra plataforma basada en web que no requiere instalación. Comienza a grabar en segundos, no minutos.

Nate photo

Nate

Creador de Video

★★★★★

La capacidad de transcribir y resumir automáticamente grabaciones es un gran ahorrador de tiempo, convirtiendo contenido de video en datos útiles y buscables.

User
User
User
Únete a 2,147,483+ usuarios

¿Listo para aumentar tu productividad?

Prueba Voice Translator y más de 300 otras características impulsadas por IA gratis.

Empezar Gratis →

Empezar a usar en 60 segundos • No se requiere tarjeta de crédito