Fundamentos de tecnología de video.
Funcionamiento básico de la imagen de video
1.1. La imagen de video analógica:
Existen tres tipos de vídeo analógino: PAL, NTSC Y SECAM.
PAL es la sigla de Phase Alternating Line (en español línea alternada en fase). Es el nombre con el que se designa al sistema de codificación empleado en la transmisión de señales de televisión analógica en color en la mayor parte del mundo. Es de origen alemán y se utiliza en la mayoría de los países africanos, asiáticos y europeos, además de Australia y algunos países latinoamericanos.
NTSC (National Television System Committee, en español Comisión Nacional de Sistemas de Televisión) es un sistema de codificación y transmisión de Televisión a color analógica desarrollado en Estados Unidos en torno a 1940, y que se emplea en la actualidad en la mayor parte de América y Japón, entre otros países.
Secam son las siglas de Séquentiel Couleur à Mémoire, en francés, “Color secuencial con memoria”. Es un sistema para la codificación de televisión en color analógica utilizado por primera vez en Francia. Técnicamente es muy semejante al sistema PAL.
La imagen de video analógica se forma con la sucesión de un número determinado de imágenes por segundo en la pantalla. Cada una de estas imágenes a su vez compone de un número determinado de líneas que cubren la pantalla de forma horizontal. Para los principales sistemas de video es de la siguiente forma:
Sistema PAL | Sistema NTSC |
625 líneas cada cuadro o frame. 25 frames por segundo (f.p.s.) | 525 lineas. 29,97 f.p.s. |
Cada frame se compone a su vez de dos campos. El primero de los campos lo formarían las líneas impares que atraviesan la pantalla y el segundo las líneas pares. De esta forma tendríamos:
Sistema PAL | Sistema NTSC |
2 campos por frame. 312,5 líneas cada campo. | 2 campos cada frame. 262,5 líneas cada campo. |
De una forma esquemática se podría representar así:
Representación sencilla de los rayos eléctricos que forman el primer campo de un frame de video. | Representación sencilla de los rayos eléctricos que forman los dos campos de un frame de video. |
El rayo eléctrico comienza en el punto A superior y recorre la pantalla 312,5 veces de izquierda a derecha hasta el punto A inferior, sube y continua del punto B superior al punto B inferior de la misma forma.
Del punto A superior al A inferior es el primer campo. Del punto B superior al B inferior es el segundo campo.
Para la televisión en color cada una de las líneas se forma a partir de tres parámetros:
Luminancia (representada como Y).
Color (representado como C b ).
Diferencia de color (representado como C r ).
Cada una de estos parámetros tendrá una intensidad o valor determinado en cada uno de los puntos que forman la pantalla de TV. Se podría representar de la siguiente forma para cada una de las 625 líneas:
Cada frame completo tiene 625 líneas de cada una de las de arriba que se pueden representar todas juntas, una encima de otra.
1.2. Video digital.
El video digital es un tipo de sistema de grabación de video que funciona usando una representación digital de la señal de vídeo, en vez de analógica. Este término genérico no debe confundirse con el nombre DV, que es un tipo específico de video digital enfocado al mercado de consumo. El video digital se graba a menudo en cinta, y después se distribuye en discos ópticos, normalmente DVDs. Hay excepciones, como las cámaras de vídeo que graban directamente en DVD, las videocámaras de Digital8 que codifican el vídeo digital en cintas analógicas convencionales, y otras videocámaras de alto precio que graban vídeo digital en discos duros o memoria flash.
Para convertir la señal de una imagen de video analógica en digital se realiza una cuantificación en números binarios de cada uno de los parámetros de dicha señal (Y, Cb y Cr), efectuando un muestreo (un scanner) sobre ella. Básicamente lo que se hace es cuantificar numéricamente en binario los valores que antes medíamos en el eje vertical de las gráficas de arriba.
Al número de muestras que se toma de cada una de las líneas de la imagen se le denomina frecuencia de muestreo y se mide en hérzios (Hz).
Los primeros conversores analógico digitales (A/D), eran de 8 bits (esto quiere decir que cuantificaban usando 8 dígitos, por ejemplo: 01011001), y tenían una frecuencia de muestreo de 720 sobre el parámetro de luminancia de cada una de las líneas de imagen analógica (realizaban 720 scaners por línea), y de 360 sobre los parámetros de color y diferencia de color. Cada una de estas mediciones recibía un valor numérico en sistema binario.
Este método de codificación de la imagen de video analógica en digital se basa en el estándar mundial 4:2:2 que está basado en una sola frecuencia de 13,5 MHz para la luminancia y 6,75 MHz para cada componente de crominancia .
Y | 13,5 MHz | 4 |
Cb | 6,75 MHz | 2 |
Cr | 6,75 MHz | 2 |
Estas frecuencias son idénticas para ambos sistemas:
PAL: 625 líneas x 50 cuadros / segundo: 13,75 MHz.
NTSC: 525 líneas x 60 cuadros / segundo: 13,75 MHz.
En el proceso de muestreo se produce también una reducción en el número de líneas horizontales en pantalla, para el sistema PAL hasta 576 líneas y para el sistema NTSC hasta 480 líneas.
De esta forma tenemos las siguientes resoluciones en ambos sistemas:
La resolución PAL es de 720 x 576 píxeles no cuadrados que cubren todo el vídeo activo. También incluye 16 líneas de supresión o código de tiempo interno vertical (VITC) por fotograma (8 líneas por campo).
La resolución NTSC es de 720 x 480 píxeles no cuadrados que cubren todo el vídeo activo. También incluye 10 líneas de supresión o código de tiempo interno vertical (VITC) por fotograma (5 líneas por campo).
La conversión del sonido en digital se realiza de la misma forma: Realizando un determinado número de muestras sobre la onda de sonido original y cuantificándolo en números binarios. Las frecuencias de muestreo estandarizadas para los equipos de video digital son las siguientes:
32kHz: 32.000 muestras por segundo (cuantificadas en sistemas de 12 bits).
44.1kHz: 44.100 muestras por segundo (cuantificadas en sistemas de 16 bits). Esta es la frecuencia de muestreo que usa el sistema CD-Audio.
48kHz: 48.000 muestras por segundo (cuantificadas en sistemas de 16 bits).
De esta forma tendremos los siguientes requerimientos de espacio para la captura de video digital para el caso de contar con 4 canales de audio a 48kHz y 16 bits:
Sistema PAL |
Sistema NTSC |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Esta es la cantidad de información necesaria para cada segundo de televisión digital. Estos datos se pueden comprimir para que ocupen menos espacio.
1.3. Video digital comprimido.
La compresión de la señal digital de video se realiza con el propósito de reducir la tasa de datos por segundo. El proceso consiste en la eliminación de elementos de la señal que resultan irrelevantes o redundantes y no son esenciales para la imagen visualizada.
Esta tecnología está motivada por razones económicas. La compresión reduce el ancho de banda necesario para transportar las señales de vídeo e un lugar a otro y minimiza la cantidad de espacio de memoria ocupada en el disco o en la cinta.
El conversor de video analógico / digital (A/D) tiene los siguientes componentes:
Tipos de compresión.
Compresiones que aprovechan la redundancia de fotogramas (compresión interframe): El resultado es una mayor compresión, o una menor tasa de datos por segundo. Es el tipo de compresión ideal para la distribución por ocupar muy poco espacio. Es el tipo de compresión que usa el sistema DVD.
No puede ser almacenado en cinta magnética para TV ni puede ser editado en sistemas de edición no lineal, o presenta problemas técnicos importantes para lograr hacerlo:
Ejemplos : DVD y HDV (Utilizan la compresión Mpeg-2).
El algoritmo de compresión de Mpeg-2 es un conjunto de reglas flexible, pero ambiguo al mismo tiempo, para la compresión de señales de televisión. Solamente el decodificador está firmemente especificado, y cada fabricante es libre de diseñar un codificador específico, siempre que el decodificador estandarizado sea capaz de decodificar la señal. Esto significa que no hay una calidad de Mpeg-2 garantizada y la tasa de flujo de datos puede ser muy variable de unos casos a otros.
Compresiones que proporcionan un número constante de bits en cada fotograma : Es la compresión que usan los sistemas de edición no lineal. La tasa de datos por segundo es constante por lo que requiere más cantidad de bits por segundo para la misma calidad de imagen final respecta a la compresión que aprovecha la redundancia de fotogramas.
Puede ser almacenado en cinta magnética para TV.
Ejemplos: Digital8, DV, DVCAM, DVCPRO, DVCPRO50, Digital-S, Betacam Digital, HD video (HDCAM, DVCPROHD100, HD Digital-S, HDTV). Formatos de video para ordenadores: Motion-JPEG.
Los algoritmos de compresión para DV (también usado en los sistemas DVCAM y DVCPRO), son por tanto un conjunto de reglas fijas utilizadas de idéntica forma por todos los fabricantes que proporciona un flujo de datos de 25 Mbps. Los sistemas DVCPRO50 y Digital-S utilizan dos codificadores DV en paralelo para aumentar el flujo de datos a 50 Mbps con la consiguiente mejora en la calidad de la imagen. Los sitemas de HD video y Betacam Digital logran una tasa de hasta 100 Mbps con 4 codificadores DV en línea o con codificadores de diseño propio según las marcas.
Formatos de compresión y aplicaciones posibles:
Edición no lineal | Distribución | Grabación en cinta magnética. | |
M-Jpeg. | Si | ||
Mpeg | Si | ||
DV y otros basados en DV. | Si | Si |
1.4. Interfaces para tecnología digital.
Estas son algunas de las distintas interfaces existentes para la conexión de equipos a redes:
SCSI (Small Computer System Interface): 230 Mbytes / seg. 15 máquinas.
SSA (arquitectura de almacenaje en serie): 320 Mbytes / seg. 127 máquinas.
IEEE 1394 – Fireware – iLink: 100 / 200 / 400 Mbytes /seg. 63 máquinas.
CSDI (interface compimido digital serie): 270 -360 Mbytes / seg. Miles de máquinas. (SDI (de Sony; es un subtipo del CSDI)
Fibre Chanel: 1,062 Gb / seg. (para el futuro se espera hasta 4 Gb / seg.) Hasta 126 nudos de red, infinidad de máquinas.
ATM: Se usan de ciudad en ciudad.
Trasmisión de datos | Ciudad a ciudad | ATM | |||
Edificio a edificio | Fibre Chanel | ||||
Edición | Sala a sala | CSDI SDI |
SAA | ||
Estación de trabajo (habitación) | IEEE 1394 SCSI |
Leave a reply