Metodología

Precisión, velocidad y señales de confianza (con pruebas)

Esta página es la fuente de verdad para cada afirmación de precisión, velocidad e idiomas en ScreenApp.io. Los números provienen de nuestro corpus interno de pruebas, el caso de estudio de ingeniería de Groq, los benchmarks de Whisper de OpenAI y los benchmarks publicados de Grok Speech-to-Text de xAI. Última actualización: mayo de 2026.

La pila de modelos

La transcripción no apuesta a un solo proveedor. ScreenApp enruta cada trabajo al proveedor que mejor se adapta al audio: plataforma de origen, duración, configuración de canales, idioma. A mayo de 2026, los proveedores principales son:

Proveedores de respaldo (usados cuando un proveedor principal tiene límite de tasa o no está disponible): Cloudflare Workers AI, Fireworks AI, Mistral, Baseten. Un trabajo de transcripción nunca falla porque un proveedor tuvo una interrupción.

Capa de LLM para resumen, chat y análisis con IA: Google Gemini de extremo a extremo. ScreenApp NO funciona con GPT-4, ChatGPT ni Claude. El LLM que convierte una transcripción cruda en resúmenes estructurados, marcadores de capítulos, ítems de acción, respuestas de Q&A y la interfaz de chat es Gemini desde el principio hasta el final.

Por qué multi-proveedor en lugar de un solo proveedor: cada proveedor tiene su punto fuerte. Whisper tiene la mayor cantidad de idiomas, Groq lo hace rápido. Gemini es el mejor para audio corto y análisis con LLM posterior. xAI Grok STT tiene la menor tasa de error publicada en llamadas telefónicas. Enrutar cada trabajo a su mejor opción supera a usar un solo proveedor para todo.

El audio de los clientes nunca se usa para entrenar ninguno de estos modelos. El audio se procesa y elimina según la configuración de retención de tu cuenta. Manejo completo de datos en el Trust Center.

Velocidad: el caso de estudio Groq

En 2025, ScreenApp migró de un despliegue autoalojado de Whisper en AWS a la infraestructura de inferencia de Groq. Groq publicó el caso de estudio; los números a continuación provienen de las mediciones de su equipo de ingeniería.

MétricaAntes de GroqDespués de GroqCambio
Trabajo de transcripción de 20 minutos~20 minutes~15 seconds20x faster
Costo de transcripción por minutobaseline1/15th15x cheaper
Conversión de gratis a pagobaseline+30%uplift
Ingresos recurrentes anuales (año contra año)baseline+405%crecimiento atribuido a las mejoras de velocidad y costo

Fuente: caso de estudio ScreenApp + Groq (groq.com).

Qué significa esto en la práctica: una reunión de 60 minutos se procesa en aproximadamente 3 minutos de punta a punta (transcripción, diarización, generación de resumen). Un video de 2 horas se procesa en unos 6 minutos. Estos son tiempos de punta a punta que incluyen el resumen y la creación de capítulos, no solo la transcripción cruda.

Precisión: benchmarks de word error rate

El word error rate (WER) cuenta sustituciones, eliminaciones e inserciones por cada 100 palabras de referencia. Cuanto más bajo, mejor. Las cifras de referencia a continuación provienen de los benchmarks publicados para cada modelo subyacente; las filas por condición provienen de nuestra propia repetición de prueba de abril de 2026 con 18 horas de audio de dominio público por idioma en tres condiciones: estudio (un solo hablante, sala tratada), conferencia (varios hablantes, micrófono ambiental) y campo (micrófono de teléfono en mano, ruido ambiental).

Líneas de base publicadas

WER por idioma (repetición de prueba de abril de 2026)

Idioma Locale WER estudio WER conferencia WER campo Hablantes probados
Inglés (EE. UU.)en-US4.2%7.8%12.4%4
Español (Latinoam.)es-4195.1%9.2%14.6%3
Español (España)es-ES5.4%9.8%15.1%3
Portugués (BR)pt-BR5.8%10.1%15.8%3
Portugués (PT)pt-PT6.4%11.2%17.0%2
Francésfr-FR5.9%10.4%16.2%3
Alemánde-DE6.1%10.8%16.5%3
Italianoit-IT6.3%11.0%17.1%3
Japonésja-JP7.8%13.5%19.8%2
Coreanoko-KR7.5%13.1%19.2%2
Mandarín (simplificado)zh-CN7.9%14.0%20.4%3
Hindihi-IN9.2%15.8%23.1%3
Árabe (MSA)ar9.6%16.2%24.0%2
Rusoru-RU6.8%11.5%17.4%3
Indonesioid-ID7.1%12.4%18.5%2

Metodología de prueba

Diarización de hablantes

La diarización (asignar un ID de hablante a cada palabra) se ejecuta por la ruta que mejor se adapta al audio. El enrutamiento es automático; no eliges tú.

La canalización lee la configuración de canales del audio, la plataforma de origen y el tipo de contenido, y luego elige la mejor ruta. Granularidad por palabra en ambos casos (no a nivel de párrafo), de modo que una interjección de una sola oración en una reunión con varios hablantes se atribuye correctamente.

Fuentes: anuncio de la API xAI Grok STT y TTS, Google Gemini.

Idiomas compatibles

ScreenApp es compatible con 99 idiomas para transcripción mediante Whisper Large-v3. Un subconjunto de 25 de esos también admite diarización de hablantes mediante xAI Grok STT (marcados con †).

Lista completa de idiomas (Whisper Large-v3)

Afrikáans, Albanés, Amárico, Árabe †, Armenio, Asamés, Azerbaiyano, Baskir, Vasco, Bielorruso, Bengalí, Bosnio, Bretón, Búlgaro, Birmano, Cantonés, Catalán, Chino (mandarín) †, Croata, Checo, Danés, Neerlandés †, Inglés †, Estonio, Feroés, Finlandés, Francés †, Gallego, Georgiano, Alemán †, Griego, Guyaratí, Criollo haitiano, Hausa, Hawaiano, Hebreo, Hindi †, Húngaro, Islandés, Indonesio †, Italiano †, Japonés †, Javanés, Canarés, Kazajo, Jemer, Coreano †, Lao, Latín, Letón, Lingala, Lituano, Luxemburgués, Macedonio, Malgache, Malayo, Malayalam, Maltés, Maorí, Maratí, Mongol, Nepalí, Noruego, Nynorsk, Occitano, Pastún, Persa, Polaco, Portugués †, Panyabí, Rumano, Ruso †, Sánscrito, Serbio, Shona, Sindhi, Cingalés, Eslovaco, Esloveno, Somalí, Español †, Sundanés, Suajili, Sueco, Tagalo †, Tayiko, Tamil, Tártaro, Telugu, Tailandés, Tibetano, Turco †, Turcomano, Ucraniano, Urdu, Uzbeko, Vietnamita †, Galés, Yidis, Yoruba.

† indica los idiomas con diarización de hablantes a nivel de palabra mediante xAI Grok STT. Los demás idiomas se transcriben (solo texto) sin atribución por hablante.

Fuente de la lista de idiomas de Whisper: github.com/openai/whisper. Fuente de la cobertura de idiomas de Grok STT: documentación de xAI Voice.

Base de usuarios

2,163,740 cuentas registradas a mayo de 2026. La cifra refleja las cuentas únicas con correo verificado en nuestra base de datos de producción. Actualizamos este número trimestralmente en esta página.

No publicamos afirmaciones de marketing con cifras redondeadas como "2 millones de usuarios" sin el conteo subyacente verificable, ni en esta página ni en ninguna otra. Si alguna vez ves una cifra de usuarios inflada o sin fecha en una página de ScreenApp, es un problema de calidad de contenido y queremos saberlo: contáctanos a través del Trust Center.

Acceso gratuito y precios

Dos maneras de usar ScreenApp sin pagar por adelantado:

Planes de pago

Precios actuales y desglose de funciones en la página de precios. Lo que NO ofrecemos: un nivel gratuito mensual recurrente con X minutos al mes, una prueba "sin tarjeta de crédito" del plan de pago, ni grabaciones gratuitas ilimitadas. Si ves alguna de estas afirmaciones en este sitio, es un problema de calidad de contenido, por favor repórtalo a través del Trust Center y corregiremos la página de origen.

Seguridad y cumplimiento

Auditado anualmente bajo SOC 2 Type 2. 22 políticas internas que cubren control de acceso, clasificación de datos, desarrollo seguro y respuesta a incidentes. Monitoreo continuo de controles.

Postura de seguridad en vivo completa, reporte SOC 2 Type 2 descargable y cuestionario de seguridad pre-llenado en nuestro Trust Center (trust.inc/screenapp).

Fuentes y benchmarks externos

Erratas y correcciones

Los números en las páginas de ScreenApp deben coincidir con esta página. Si encuentras una página de funciones que contradiga estas cifras, es un error de calidad de contenido que queremos corregir. Repórtalo a través del formulario de contacto del Trust Center y actualizaremos la página de origen en 7 días.

User
User
User
Únete a 2,163,740+ usuarios

Prueba ScreenApp con una grabación real

Pega una URL o sube un archivo de audio o video. Mira la precisión real con tu contenido, no benchmarks con el contenido de otro.

Comenzar la prueba gratis de 7 días

Sin cargos durante 7 días, cancela cuando quieras • No se requiere tarjeta de crédito