Multiconferencia inmersiva con sonido en 3D
Telefónica presenta en el Mobile World Congress un sistema de multiconferencia destinado a mejorar la calidad de la voz y aumentar el nivel de comprensión ya que permite identificar, con técnicas de sonido en 3D, qué participante está hablando en cada momento y desde qué dirección proviene el sonido.
La comprensión de los mensajes en una multiconferencia es más complicada cuantos más participantes estén conectados. Está demostrado que las personas distinguen y comprenden mejor a varios locutores si la voz de cada uno se escucha desde una dirección distinta.
En esta línea de investigación, Telefónica ha presentado en el Mobile World Congress que se celebra estos días en Barcelona una aplicación para multiconferencia inmersiva desarrollada junto a un equipo puntero en tratamiento del sonido de la Universidad Politécnica de Valencia perteneciente al instituto de investigación iTEAM. En esta aplicación, cada participante tendrá la sensación de encontrarse inmerso en una sala virtual donde podrá colocar al resto de los participantes a su voluntad. La sensación de ‘ver’ a los demás participantes y de ‘oírles’ en función de dónde estén colocados es impactante.
El principal objetivo de la multiconferencia inmersiva es mejorar la calidad de la voz y aumentar el nivel de comprensión ya que permite identificar, con técnicas de sonido en 3D, qué participante está hablando en cada momento y desde qué dirección proviene el sonido en función de la ubicación anteriormente elegida por el usuario para cada uno de los participantes de la reunión.
Aplicaciones
Para entrar en la sala de la multiconferencia los usuarios simplemente tienen que arrancar la aplicación e identificarse con su usuario y password. Automáticamente, el recién incorporado aparecerá en la sala con la foto o avatar que haya elegido para representarle.
El cliente puede, además, personalizar la escena donde quiere que transcurra la multiconferencia, eligiendo el escenario que más le guste entre un abanico de ambientes de empresa, familiares o de amigos.
El proyecto tiene dos pilares tecnológicos. Por un lado, el uso de codificadores de voz de alta calidad, que mejoran la calidad de la voz y permiten una transmisión óptima de los flujos de voz a través de IP. Por otro, el uso de algoritmos de sonido 3D, que permiten aplicar técnicas de audio espacial al sonido recibido.
この記事は気に入りましたか?
購読してください RSSフィード 何も見逃すことはありません。