ENCO mejora enCaption 5 con el reconocimiento de voz de Speechmatics

La solución de Reconocimiento Autónomo de Voz (ASR, por sus siglas en inglés) de Speechmatics ha sido integrada en el sistema de transcripción y subtitulado automatizado enCaption5 de ENCO.

El acuerdo entre ambas compañías permitirá a los profesionales del sector audiovisual, a los productores de contenidos y a las cadenas de televisión crear transcripciones “muy precisas”, añadiendo subtítulos cerrados o abiertos tanto a los contenidos audiovisuales en directo como a los pregrabados, independientemente del grupo demográfico, la edad, el sexo, el acento, el dialecto o la ubicación del orador.

Speechmatics desarrolla sistemas de transcripciones basándose en el aprendizaje profundo y en el reconocimiento de voz. Su tecnología se entrena con enormes cantidades de datos no etiquetados sin necesidad de intervención humana, ofreciendo una comprensión completa de todas las voces y reduciendo drásticamente el sesgo de la IA y los errores en el reconocimiento del habla. La quinta generación de enCaption aprovecha la tecnología de Speechmatics basándose en una arquitectura nativa en la nube (si bien también puede desplegarse en flujos de trabajo híbridos o locales) y ofrece funciones adicionales como la integración con fuentes de vocabulario externas, la entrada y salida de señales audiovisuales, la indexación y búsqueda de medios, signos de puntuación avanzados y la capacidad de revisar y editar transcripciones con ajustes manuales que actualizan automáticamente los filtros de palabras del sistema para mejorar la precisión futura. Todo ello es ofreciendo para ser compatible en 34 idiomas diferentes.

Ken Frommert, presidente de ENCO, alaba la tecnología de Speechmatics (“es el más precioso de los motores de conversión de voz a texto de IA disponibles”) y afirma que la compañía está “encantada de utilizar su última tecnología para enCaption5”.