Nuevas tendencias e implementaciones en tecnología de sensores para el futuro de la producción en vivo
Klaus Weber, director de Marketing de Productos Imaging en Grass Valley, analiza en esta Tribuna la última generación de sensores de imagen Xensium-FT, y las soluciones de transmisión de tercera generación.
Con un impulso cada vez mayor, la adquisición de imágenes para broadcast debe adaptarse a nuevos requisitos para ofrecer compatibilidad con los formatos de señal. Esto incluye compatibilidad con formatos progresivos de eventos en vivo, aumentando el número de cámaras, y las distancias entre las cámaras y los puntos de control.
Las sofisticadas audiencias, a lo largo de amplios puntos de distribución, también están obligando a los broadcasters a identificar formas de mejorar la calidad de su contenido, para aumentar su valor. En respuesta al aumento de las limitaciones de recursos, la producción a distancia está siendo constantemente considerada como una alternativa.
Con presupuestos que no aumentan proporcionalmente, son necesarios equipos con mayor eficiencia y flexibilidad, para poder responder a los cambios de la industria durante períodos de tiempo mayores. Entregando excepcionales soluciones para la adquisición de imágenes, Grass Valley ofrece sensores de imagen Xensium-FT con creación de imágenes 1080p, única sin pérdida, que mantiene la sensibilidad completa. Los sistemas de transmisión 3G de Grass Valley, son la solución de transmisión disponible más flexible y preparada para el futuro, y además ofrecen integración directa con los sistemas de transmisión de larga distancia de otros fabricantes. La integración del sistema de cámara con otros componentes de la producción en vivo, tales como conmutadores y servidores, así como la interconexión con terceros, es posible gracias al Connect Gateway en red. La Serie LDX es una plataforma de cámara que ofrece una serie de mejoras y actualizaciones basadas en software.
Comparación entre tecnología CMOS y CCD
Si bien, la tecnología CCD fue la mejor opción para sensores de imagen en aplicaciones de broadcast durante muchos años, las últimas generaciones de sensores de imagen CMOS ofrecen ahora una serie de ventajas con respecto a los CCD. Esto incluye una mejor sensibilidad, bajo consumo de energía, menos calor, y una mayor integración, con potencial para una mayor resolución, rango dinámico ampliado, y velocidades de cuadro más altas en el futuro.
CMOS está estableciendo el nuevo estándar para aplicaciones de broadcast de calidad superior. A continuación, presentamos una explicación más detallada sobre las diferencias entre la tecnología de los sensores de imagen CMOS y CCD.
Sensores de Imagen Xensium-FT: Un reemplazo superior para la tecnología CCD
Es cierto que los sensores de imagen CMOS son ampliamente utilizados en muchas aplicaciones de cámaras hoy en día, pero en cámaras de broadcast no han tenido un gran uso. Sin embargo, casi todas las cámaras fotográficas y los teléfonos con cámara han estado utilizando sensores de imagen CMOS durante algunos años. Lo mismo ocurre con la última generación de cámaras de cinematografía digital equivalentes a 35 mm. Lo que tienen en común estos dispositivos, es que ofrecen una resolución muy alta y se basan en diseños de chip único con separación de color en el chip, por lo general mediante el patrón de Bayer.
Grass Valley cree en la adquisición de 3 sensores de imagen y considera que la generación actual de CCDs presente en las cámaras de sistema es la última, y que ahora será reemplazada por una nueva generación de sensores de imagen CMOS.
Desde su introducción en cámaras de broadcast en 1987, la tecnología CCD ha experimentado importantes desarrollos, pero desde hace algún tiempo, ha quedado claro que los CCDs han alcanzado sus límites prácticos y no se esperan grandes mejoras. Por el contrario, existe un potencial indiscutible con los sensores de imagen CMOS en aplicaciones de broadcast para mejoras respecto a la lectura más rápida para aplicaciones de súper cámara lenta, rangos dinámicos ampliados, resoluciones más altas y menor ruido.
Hasta ahora, estas ventajas potenciales han sido contrarrestadas por las desventajas del “rolling shutter”, que estaba presente en todos los sensores de imagen CMOS utilizados en aplicaciones de broadcast. Estos efectos han sido exagerados por algunos fabricantes, principalmente porque necesitan proteger sus inversiones, del envejecimiento de la tecnología CCD. Además, la mayor parte de los beneficios potenciales de la tecnología de sensores de imagen CMOS, no era todavía aplicable a las aplicaciones de broadcast. Hoy, el panorama tecnológico de los sensores de imagen CMOS para broadcast, ha cambiado. Las últimas mejoras de los sensores de imagen CMOS han resuelto el problema del “rolling shutter” completamente, manteniendo las ventajas de la tecnología CMOS. También ofrecen un nuevo nivel de rendimiento de imagen, incomparable con cualquier otro sensor de imagen disponible en la actualidad. Ahora hay un argumento convincente para que los sensores de imagen CMOS reemplacen a los CCD.
La diferencia en el diseño del sensor de imagen muestra una notable diferencia en rendimiento en condiciones de luces altas extremas. El TI CCD, debido a su diseño con columnas de transporte en la parte de la imagen, muestra efectos de desbordamiento con luces altas, que son visibles como bandas verticales blancas o de color, en la parte superior e inferior de la luz alta. Un nivel de “smear” vertical típico es de -135 dB, lo que significa que no es visible en muchas aplicaciones, pero si los TI CCDs se cambian a tiempos de exposición cortos, como para eventos deportivos en condiciones de luz diurna, este efecto de “smear” vertical puede ser realmente visible si hay luces altas en la escena.
Los sensores de imagen CMOS, gracias a su estructura, nunca mostrarán ningún “smear” de luz alta o efectos de rayas.
Píxeles 3T contra Píxeles 5T: ¿Por qué es importante?
Los sensores de imagen CMOS utilizados hasta ahora en aplicaciones broadcast (incluyendo las cámaras LDK 3000 de Grass Valley) han utilizado píxeles 3T.
Esto significa que cada píxel tiene tres transistores. En estos píxeles, un fotodiodo convierte la luz entrante (fotones) en una carga de señal (electrones). Esta carga de señal se almacena en el interior de un condensador de difusión flotante, que está conectado directamente al fotodiodo. Un transistor (el transistor SFT en el centro), que está conectado directamente al fotodiodo y al condensador de difusión flotante, convierte la carga de señal en un voltaje. Un segundo transistor (el transistor SEL a la derecha), conmuta la señal a la salida para la lectura. Después de la lectura de la señal, el tercer transistor (el transistor RST a la izquierda) restablece el fotodiodo y el condensador de difusión flotante, de modo que el próximo tiempo de exposición se puede iniciar. Puesto que no hay espacio para una memoria “en-píxel”, es evidente que el tiempo de exposición y el tiempo de lectura no pueden separarse el uno del otro, en un diseño de píxel 3T. Dado que los píxeles tienen que ser leídos uno tras otro, cada píxel tiene un comienzo y un final diferente, de tiempo de exposición. Por lo tanto, los sensores de imagen CMOS que utilizan píxeles 3T siempre mostrarán un comportamiento de “rolling shutter”.
Los nuevos sensores de imagen Xensium-FT de Grass Valley, se basan en un diseño de píxeles 5T. El primero de los transistores adicionales (TXG o transistor de puerta de transferencia), se utiliza para controlar la transferencia de la carga de señal desde el fotodiodo dentro del condensador de difusión flotante.
Una vez realizada la transferencia, el transistor abre la conexión entre los dos componentes, y el fotodiodo puede ser restablecido mediante el transistor SG y comenzar una nueva exposición. La carga de señal que se almacena en el condensador de difusión flotante, puede leerse cuando sea necesario. Después de la lectura de la señal, el transistor de restablecimiento adicional (RST transistor) restablecerá el condensador de difusión flotante, para prepararlo para la siguiente transferencia de señal desde el fotodiodo. Los dos transistores adicionales por píxel, permiten separar el período de exposición, del período de transferencia. Debido a esto, el sensor de imagen Xensium FT proporciona lo que se denomina comportamiento de “global shutter”, idéntico a todos los sensores CCD. Los sensores de imagen Xensium-FT no tienen ninguna de las limitaciones de los sensores CMOS anteriores con “rolling shutter”, tales como sensibilidad a movimientos rápidos de cámara con tiempo de exposición corto,
y sensibilidad a destellos de luz cortos.
En este aspecto, los nuevos sensores de imagen Xensium-FT no tienen ninguna diferencia con cualquiera de los mejores sensores CCD utilizados en la actualidad.
¿Por qué Píxeles 5T ahora?
Si los dos transistores adicionales por píxel son tan importantes para los sensores de imagen CMOS, ¿por qué nadie los había implementado antes? Una mirada histórica a la fabricación de chips responde a esta pregunta. Un sensor de imagen HD de 2/3 de pulgada con 1920×1080 píxeles progresivos, tiene un tamaño de píxel de 5 μm x 5 μm. Cuando se desarrolló el sensor de imagen original Xensium 3T, estaba disponible la tecnología de máscara de 0,25 μm.
Utilizando esta tecnología de máscara, los tres transistores consumen alrededor de 44 por ciento del tamaño total del píxel, y sólo el 56 por ciento restante del píxel puede usarse para convertir la luz entrante en carga de señal. Esto se describe como el factor de relleno. Con los dos transistores adicionales necesarios para un píxel 5T, el factor de relleno sería de alrededor de sólo 40 por ciento, por lo que la sensibilidad con píxeles 5T habría sido un inaceptable 1/3 menor.
¿Cuál es la diferencia en el nuevo sensor de imagen Xensium-FT? El nuevo sensor de imagen Xensium-FT, que se ha desarrollado más recientemente, utiliza una máscara de 0,18 μm, y los transistores son hechos mucho más pequeños. Por lo tanto, el sensor de imagen Xensium-FT 5T ofrece un píxel con factor de relleno similar al del sensor de imagen original Xensium 3T.
Ventajas en formatos progresivos y sensibilidad
¿Cuáles son las principales ventajas de la tecnología de sensores de imagen CMOS actuales frente a los CCD? La respuesta comienza con algo que al principio parece una desventaja. Para producir formatos entrelazados, los sensores de imagen CCD siempre han ofrecido la ventaja de ser capaces de agregar la carga de señal de dos píxeles adyacentes, para duplicar la carga de señal. Como los sensores de imagen CMOS convierten la carga de señal en un voltaje en el interior del píxel, esta propiedad aditiva no puede existir. Sin embargo, al abordar formatos progresivos, el problema se desplaza hacia los sensores de imagen CCD, ya que no tienen una carga combinatoria, por lo que se pierde un factor de dos en cuanto a sensibilidad (un F stop).
Además, el sensor de imagen CCD necesita una velocidad de lectura superior, mientras que el CMOS se lee en paralelo a velocidades más bajas. El ruido aumenta con la raíz cuadrada del ancho de banda, por lo que, duplicarla para modo progresivo significa perder una raíz cuadrada adicional (o 3 dB) en nivel de ruido, haciendo un total de por lo menos 9 dB. Por lo tanto, en los modos entrelazados, los sensores de imagen CCD ofrecen más del doble de sensibilidad en comparación con los formatos progresivos. Con CMOS, la sensibilidad en modos entrelazados y en modos progresivos es la misma.
Hasta ahora, los modos de barrido de 1080i han sido utilizados como la referencia para las especificaciones de sensibilidad, principalmente porque mostraron los mejores resultados para cámaras que utilizan sensores de imagen CCD. Sin embargo, en el futuro los formatos progresivos (1080p50 o 1080p59.94) serán mucho más importantes, especialmente porque los formatos de alta resolución del futuro (como 4k, 8k, y superiores) sólo serán implementados utilizando modos progresivos.
Cuando se usan en 1080i, los nuevos sensores de imagen Xensium-FT ofrecen igual, o mejor sensibilidad. Pero, en formatos progresivos, los sensores de imagen Xensium-FT ofrecen una mejora de 6 dB en sensibilidad, por encima de cualquier cámara CCD en el mercado.
Esta característica por sí sola, demuestra que ha llegado el final de la vida de la tecnología CCD en aplicaciones de broadcast.
¿Por qué los nuevos sensores de imagen Xensium-FT son más sensibles en comparación con los sensores de imagen CCD actuales? Todo comienza por la eficiencia cuántica (QE) o índice de fotones incidentes en electrones convertidos (IPCE). Esto es el porcentaje de los fotones que chocan contra la superficie fotorreactiva del dispositivo que produce portadores de carga.
La QE se mide en electrones por fotón, o como un porcentaje que describe el número de electrones que son producidos por los fotones que golpean la superficie. Con los sensores de imagen CCD actuales, este valor es de alrededor de 40 por ciento, mientras que los nuevos sensores de imagen Xensium-FT alcanzan un valor QE de alrededor de 65 por ciento.
En otras palabras, se necesita mucha menos luz para producir la misma cantidad de carga de señal. Esta sensibilidad aumentada, ha sido ahora combinada con la introducción del “global shutter”, que resuelve el único punto que se ha utilizado como un argumento en contra de la tecnología de sensores de imagen CMOS (el “rolling shutter”). La sensibilidad mejorada en modos progresivos, ofrece ahora una clara ventaja para la tecnología de sensores CMOS, frente a los CCD actuales
Resolución
Otro aspecto de los sensores de imagen es la resolución, y hay un creciente debate acerca de las cámaras 4K. La implementación del sensor de imagen Xensium-FT, se compara favorablemente en este campo.
Los flujos de trabajo de 4K completos, están siendo evaluados para aplicaciones “no-en vivo” tales como producciones estilo cine, muchas de las cuales ya han sido realizadas. 4K se está convirtiendo en un estándar de cine establecido, y para las grandes pantallas de cine, la resolución ampliada de una imagen RGB de 4K verdadera ofrece una ventaja real sobre las imágenes HD de 1920×1080. Para una cámara de cinematografía digital, los sensores de imagen de mayor tamaño no son una desventaja, e inclusive son solicitados por razones artísticas para lograr la llamada “apariencia cine” de poca profundidad de campo. Además, para producciones teatrales se utilizan, principalmente, lentes objetivas o de zoom con una proporción de zoom muy limitada, y se pueden construir con un tamaño y un peso razonable, incluso cuando se utilizan con sensores de imagen más grandes. Pero las limitaciones físicas en el rango del zoom, causadas por tamaños grandes de sensores de imagen, no permiten que estas cámaras sean una opción para producciones de deportes en vivo o de entretenimiento.
Todas las cámaras 4K disponibles hoy en día, utilizan un único sensor de imagen de gran tamaño, mientras que las cámaras de broadcast HD utilizan tres sensores de imagen Full HD de 2/3 de pulgada. En una cámara con un único sensor de imagen, la información de color se genera separando la luz con filtros de color en frente de los píxeles. En la mayoría de los casos, se utiliza un filtro patrón de Bayer para lograrlo, donde 4.000 píxeles por línea serán divididos en 2.000 píxeles verdes en todas las líneas y 2.000 píxeles rojos o 2.000 píxeles azules en cada segunda línea. En otras palabras, sólo se utilizará la mitad de la resolución del sensor de imagen para el canal verde, y sólo se utilizará un cuarto de la resolución para los canales rojo y azul. Bajo ciertas condiciones, se pueden crear efectos de “aliasing”. El uso de tres sensores de imagen 4K de 2/3 de pulgada, producirá una pérdida significativa de sensibilidad, como con cualquier diseño de sensor de imagen único.
El uso de tres sensores de imagen 4K de gran tamaño, requeriría nuevas lentes que serían demasiado grandes y pesadas. Los sensores de imagen Xensium-FT tienen resolución completa de 1920×1080 píxeles, y siempre funcionarán en modo progresivo completo, sin ninguna desventaja en términos de sensibilidad o ruido. La separación de los tres colores primarios se logra con un divisor de haz de prisma. Por lo tanto, la resolución completa 1920×1080 está disponible para los tres canales de color (verde, rojo y azul), sin ningún contratiempo. En comparación con la resolución de una cámara de sensor de imagen 4K único, que utiliza filtros de color patrón de Bayer, una cámara con tres sensores de imagen Xensium-FT puede ofrecer ventajas de resolución en los canales de color, especialmente con el uso emergente de 1080p para producción. Este formato progresivo de dos megapíxeles, aumenta significativamente la resolución sobre cualquier formato 1.5G y se presta como un excelente formato de masterización, produciendo conversiones de alta calidad para cualquier formato como 4K, 1080i y 720p. Por lo tanto, para aplicaciones de broadcast en vivo, utilizar sensores de imagen Xensium-FT le proporcionará el mejor equilibrio entre resolución de imagen, sensibilidad y relación señal-ruido.
Nivel diferente de complejidad e integración
Un entorno CCD es mucho más complejo y menos integrado en comparación con un entorno CMOS. Se requiere un suministro de alto voltaje muy complejo para el nodo de salida del CCD, y todos los impulsos de lectura necesitan ser generados en el exterior.
Las señales de salida son analógicas, lo que significa que necesitan ser pre-procesadas, amplificadas, y convertidas en el dominio digital con convertidores A/D externos. Todas las cargas de señal necesitan ser desplazadas a una velocidad muy alta, a través de los registros de desplazamiento vertical y horizontal, en un nodo de salida única donde se convierten de una carga a un voltaje. Debido a este proceso, los entornos CCD tienen un consumo muy elevado de energía, generan altas temperaturas e incluso requieren, en muchos casos, refrigeración activa.
En los sensores de imagen CMOS Xensium-FT, el procesamiento más avanzado está integrado en el propio sensor, reduciendo la complejidad del sistema total de la cámara. La carga de cada píxel se muestrea de forma individual en el interior del píxel y se convierte allí en un voltaje. El voltaje de cada píxel se dirige a través de una matriz y se envía a la salida. Este proceso no necesita mucha energía, ofreciendo bajo consumo de energía, poco calentamiento y bajo nivel de ruido. El resultado es una mayor estabilidad y confiabilidad. Una ventaja adicional es que el sensor de imagen tiene un diseño más elegante y es más fácil de implementar, reduciendo así el costo de propiedad y mejorando el rendimiento.
Es de reseñar que mientras que el entorno CCD necesita cuatro grandes placas de circuito impreso (PCBs) sobre los tres pequeños PCBs que están montados directamente en los sensores de imagen CCD, el entorno CMOS FT no tiene ningún PCB sobre los pequeños PCB montados en los tres sensores de imagen. Además, la señal de salida en el entorno CCD es sólo analógica, y se necesitan circuitos adicionales para amplificar, pre-procesar, y digitalizar las señales. Con un entorno CMOS, todas las señales son digitales directamente desde los sensores de imagen
Soluciones de Transmisión de Cámara de Tercera Generación
Existe una división entre aquellos usuarios que implementan triax y los que usan fibra. El triax tiene la ventaja de ser capaz de utilizar las infraestructuras de cable existentes, y es extremadamente robusto, con cables y conectores fáciles de manejar. La fibra ofrece más espacio para mayor ancho de banda y compatibilidad de formatos, así como longitudes de cables mucho más grandes. Sin embargo, en muchos casos, queremos ser capaces de utilizar ambos sistemas, dependiendo de los requisitos de la producción. Para combinar los puntos fuertes de ambos en un único sistema de transmisión, fue necesario desarrollar una nueva generación de soluciones de transmisión de cámara. Los principales componentes de este sistema de transmisión de cámara de tercera generación, de Grass Valley, fueron presentados en diferentes ferias internacionales en 2011, y el componente final (un dispositivo convertidor de fibra 3G a triax 3G) se presentó en 2012.
Hasta que las soluciones 3G Transmission de Grass Valley estuvieron disponibles, la opción para un sistema de transmisión de cámara era o triax o fibra. Una vez elegida una opción, los usuarios se comprometían con la decisión de por vida, o se enfrentaban a serias restricciones al realizar conversiones en campo. Esto dio lugar a hacer concesiones en la calidad de vídeo y perder todos los diagnósticos de transmisión. La solución 3G Transmission de Grass Valley tiene una diferencia muy notable: es una convergencia de las soluciones basadas en triax y fibra actuales, en una sola. No hay más diferencias ni limitaciones. La topología de la 3G Transmission ha sido diseñada para las necesidades reales del broadcast: longitudes muy largas de cable pre-instalado, múltiples formatos de producción, y la necesidad de producir imágenes de la más alta calidad.
Hoy, con la 3G Transmission de Grass Valley, las empresas de broadcast de exteriores (OB) pueden decir “sí” a cualquier tipo de solicitud de oferta o licitación, sin tener que considerar el tipo de cable de transmisión de cámara. Esto se debe a que la 3G Transmission integra el triax 3G y la fibra 3G, en un solo sistema de transmisión. Las soluciones 3G Transmission de Grass Valley son compatibles con todos los formatos de vídeo HD (incluyendo 1080p50/60), ofreciendo siempre exactamente el mismo conjunto de características, totalmente independiente del tipo de cable o incluso de la combinación de tipos de cable utilizados.
Como se dijo anteriormente, hay buenas razones para optar por cables de fibra y hay buenas razones para optar por cables triax. Ambos tienen sus puntos fuertes, pero ambos también tienen limitaciones, y la elección del tipo de cable debe realizarse en función de cada producción. La transmisión de fibra se puede utilizar para longitudes de cable mayores y ofrece espacio para requisitos adicionales de ancho de banda, tales como los sistemas de súper cámara lenta. La transmisión triax ofrece máxima confiabilidad y robustez en campo. Además, los cables triax se pueden encontrar en casi todas las instalaciones pre-cableadas.
En muchos casos, se necesita tanto triax como fibra en un entorno de producción. Por ejemplo, en una carrera
de esquí de descenso, la mayoría de posiciones de cámara pueden alcanzarse ya sea con un cable triax o un cable de fibra híbrida. Sin embargo, algunas posiciones de cámara, por lo general las que están en la partida y están lejos de la unidad móvil, pueden ser alcanzadas mejor con cables de fibra oscura (modo único 2X). Estos son relativamente baratos y, en muchos casos ya están pre-cableados en estos locales. Con la estación base 3G Transmission Twin (con conectividad de triax y de fibra), se puede utilizar cualquier combinación de cables de cámara, directamente desde la estación base: triax, fibra oscura, o fibra híbrida (con un dispositivo convertidor).
Esta flexibilidad se consigue teniendo ambos sistemas de transmisión integrados en una única estación base, sin ningún tipo de limitación. Eso difiere de otras soluciones, actualmente disponibles, que utilizan una conversión de un sistema de transmisión en otro, y en las que las limitaciones no pueden ser evitadas.
Si el cable de cámara que está conectado a la cabeza de la cámara debe incluir alimentación, es necesario un convertidor de campo en algún lugar cercano a la cámara. En el convertidor, los dos cables de fibra oscura se convertirán en un cable de fibra híbrida o en un cable triax, dependiendo del adaptador de transmisión utilizado en la cabeza de la cámara. La figura 10 muestra todas las diferentes posibilidades de transmisión cuando la cabeza de la cámara utiliza un adaptador triax 3G Transmission. El ejemplo de la producción de deportes de invierno, descrito anteriormente, podría utilizar una combinación de cámaras triax para las posiciones de cámaras situadas cerca de la unidad móvil, y conversión de triax a fibra oscura para las posiciones de cámaras que se encuentran lejos de la unidad móvil.
Klaus Weber
Director de Marketing de Productos Imaging en Vale da Grama
Gostou deste artigo?
Assine nosso feed RSS e você não vai perder nada.