Codificación JPEG: Ejemplo real I (RLE+VLC)
(Gp:) Bloque de muestras cuantizadas
Codificación RLE+VLC de los coeficientes cuantizados
Paso 1. Se codifica la DC usando codificación diferencial DPCM
Si DC Bloque anterior es 98 ? codificar 102-98
Se codifica como:
Num. bits necesarios (tabla VLC) + codif + signo
DC se codifica como: 101 100 0
(Gp:) Tabla para la DC
Codificación JPEG: Ejemplo real II (RLE+VLC)
Paso 2: Se codifica en zig-zag pares
(Gp:) Tabla para pares
(Gp:) Bloque de muestras cuantizadas
Parte del bloque codificado con VLC
Existe código de escape:
0000 01 RRRR RR NNNN NNNN
Codificación JPEG: Ejemplo real III (RLE+VLC)
Bloque de muestras cuantizadas
Resultado final de la codificación RLE+VLC
Bloque codificado con VLC
Tasa de compresión:
Stream final: 1011000010010100011100001101 … 000100110 (85 bits)
Bits por píxel: (Núm bits/ Núm píxels) 85/64= 1’33 bpp
Factor de compresión:
Tam_comprimida:Tam_original= 85:(8*8*8)= 85:512
1:Tam_original/Tam_comprimida= (85/85):(512/85)= 1:6
Codificación JPEG: Ejemplo real IV (Calidad)
Medida objetiva del error:
MSE (Mean Square Error)
Medida objetiva de la calidad:
PSNR (Peak SNR)
Valores del ejemplo:
MSE = 49’53
PSNR = 31’18 dB
Bloque de muestras (pixels)
Bloque recuperado de muestras
JPEG escalado
Motivación
Fundamentos del JPEG escalado
Compatibilidad con JPEG estándar
Cuantificación variable
Resultados
Motivación
Utilización de tamaño de bloque mayor: NxN.
Mayor compactación de energía pero mayor tiempo de cálculo.
Descartar coeficientes de alta frecuencia hasta quedarse con sólo una submatriz de 8×8.
Fundamentos del JPEG escalado
División de la imagen en bloques de NxN puntos conservando sólo los 8×8 primeros coeficientes.
Utilización de la DCT recortada de N a 8, modificada.
Utilización de nuevas matrices de cuantificación.
Elección de N=16.
El proceso de codificación/decodificación JPEG escalado
(Gp:) Bloques de 16×16
(Gp:) Imagen
(Gp:) IDCT 16×16
(Gp:) 8×8 a 16×16
(Gp:) Descuanti-
(Gp:) Decodifica.
(Gp:) de entropía
(Gp:) Decodificador de JPEG escalado
(Gp:) Imagen
(Gp:) comprimida
(Gp:) ficador
(Gp:) IDCT 16×16 recortada
(Gp:) Bloques de 16×16
(Gp:) Imagen
(Gp:) Imagen
(Gp:) comprimida
(Gp:) FDCT 16×16
(Gp:) 16×16 a 8×8
(Gp:) Cuantifi-cador
(Gp:) Codificador de entropía
(Gp:) Codificador de JPEG escalado
(Gp:) FDCT 16×16 recortada
Compatibilidad con JPEG estándar
Aunque el bloque de imagen es de 16×16 el de coeficientes es de 8×8 puntos.
Los coeficientes obtenidos se escalan para que estén en el rango de los que se obtienen en una DCT de 8×8.
Las funciones básicas son similares.
Se incluye información de tamaño real de la imagen, mediante códigos definidos para extensiones.
Comparación de la DCT de 8 y 16 puntos
Funciones básicas de las DCT de 8 y 16 puntos
Mezcla de formatos
Imagen
Leída como
Se obtiene
JPEG estándar
JPEG escalado
JPEG estándar
JPEG escalado
Cuantificación variable
En el proceso de cuantificación se consigue la compresión a base de anular coeficientes
Para conseguir más ceros hay que incrementar los valores Qvu, lo que afecta a todos los bloques
(Gp:) é
(Gp:) ë
(Gp:) ê
(Gp:) ê
(Gp:) ê
(Gp:) ê
(Gp:) ê
(Gp:) S
(Gp:) 0
(Gp:) ,
(Gp:) 0
(Gp:) S
(Gp:) 0
(Gp:) ,
(Gp:) 1
(Gp:)
(Gp:) S
(Gp:) 0
(Gp:) ,
(Gp:) 7
(Gp:) S
(Gp:) 1
(Gp:) ,
(Gp:) 0
(Gp:) S
(Gp:) 1
(Gp:) ,
(Gp:) 1
(Gp:)
(Gp:) S
(Gp:) 1
(Gp:) ,
(Gp:) 7
(Gp:) ®
(Gp:) ®
(Gp:) ¯
(Gp:) ®
(Gp:) S
(Gp:) 7
(Gp:) ,
(Gp:) 0
(Gp:) S
(Gp:) 7
(Gp:) ,
(Gp:) 1
(Gp:)
(Gp:) S
(Gp:) 7
(Gp:) ,
(Gp:) 7
(Gp:) ù
(Gp:) û
(Gp:) ú
(Gp:) ú
(Gp:) ú
(Gp:) ú
(Gp:) ú
(Gp:) ®
(Gp:) ¾
(Gp:) ¾
(Gp:) ¾
(Gp:) ¾
(Gp:) ¾
(Gp:) Cuantificación
(Gp:) r
(Gp:) e
(Gp:) d
(Gp:) o
(Gp:) n
(Gp:) d
(Gp:) e
(Gp:) o
(Gp:) æ
(Gp:) è
(Gp:) ç
(Gp:) S
(Gp:) v
(Gp:) u
(Gp:) Q
(Gp:) v
(Gp:) u
(Gp:) ö
(Gp:) ø
(Gp:) ÷
(Gp:) =
(Gp:) S
(Gp:) q
(Gp:) v
(Gp:) u
(Gp:) é
(Gp:) ë
(Gp:) ê
(Gp:) ê
(Gp:) ê
(Gp:) ê
(Gp:) ê
(Gp:) S
(Gp:) q
(Gp:) 0
(Gp:) ,
(Gp:) 0
(Gp:) S
(Gp:) q
(Gp:) 0
(Gp:) ,
(Gp:) 1
(Gp:)
(Gp:) S
(Gp:) q
(Gp:) 0
(Gp:) ,
(Gp:) 7
(Gp:) S
(Gp:) q
(Gp:) 1
(Gp:) ,
(Gp:) 0
(Gp:) S
(Gp:) q
(Gp:) 1
(Gp:) ,
(Gp:) 1
(Gp:)
(Gp:) S
(Gp:) q
(Gp:) 1
(Gp:) ,
(Gp:) 7
(Gp:) ®
(Gp:) ®
(Gp:) ¯
(Gp:) ®
(Gp:) S
(Gp:) q
(Gp:) 7
(Gp:) ,
(Gp:) 0
(Gp:) S
(Gp:) q
(Gp:) 7
(Gp:) ,
(Gp:) 1
(Gp:)
(Gp:) S
(Gp:) q
(Gp:) 7
(Gp:) ,
(Gp:) 7
(Gp:) ù
(Gp:) û
(Gp:) ú
(Gp:) ú
(Gp:) ú
(Gp:) ú
(Gp:) ú
Cuantificación variable: propuesta
Utilización de una función de cuantificación con umbral.
Clasificación de los bloques en categorías.
Utilización de un umbral distinto para cada categoría.
(Gp:) S
(Gp:) q
(Gp:) v
(Gp:) u
(Gp:) =
(Gp:) ì
(Gp:) î
(Gp:) í
(Gp:) ï
(Gp:) ï
(Gp:) r
(Gp:) e
(Gp:) d
(Gp:) o
(Gp:) n
(Gp:) d
(Gp:) e
(Gp:) o
(Gp:) æ
(Gp:) è
(Gp:) ç
(Gp:) S
(Gp:) v
(Gp:) u
(Gp:) Q
(Gp:) v
(Gp:) u
(Gp:) ö
(Gp:) ø
(Gp:) ÷
(Gp:) ,
(Gp:) si
(Gp:) S
(Gp:) v
(Gp:) u
(Gp:) Q
(Gp:) v
(Gp:) u
(Gp:) >
(Gp:) u
(Gp:) m
(Gp:) b
(Gp:) r
(Gp:) a
(Gp:) l
(Gp:) 0
(Gp:) ,
(Gp:) en
(Gp:) otro
(Gp:) caso
Relación Señal-Ruido para distintastasas de bits de la imagen Lena
Relación Señal-Ruido para distintastasas de bits de la imagen Catedral
Relación del SNR de las imágenes con JPEG escalado y adaptativo frente al estándar
Una secuencia de vídeo es una sucesión de imágenes que producen sensación de movimiento.
El proceso completo de transmisión de vídeo con compresión consiste en:
Adquisición del vídeo a transmitir.
Captura analógica de la secuencia de imágenes.
Digitalización del vídeo.
(Re)codificación y subsampling de las muestras.
Típicamente se pasa de RGB a YCbCr
Subsampling de la crominancia (de 4:4:4 a 4:2:0 ó 4:2:2)
Compresión del vídeo.
Transmisión progresiva del vídeo comprimido (a ser posible usando protocolos con soporte multimedia)
Captura de vídeo analógico
Las imágenes (dos dimensiones) son convertidas en una señal analógica.
Se capturan las imágenes a intervalos regulares.
Cada imagen (cuadro o frame) es barrida calculando la intensidad de cada punto (B&W).
Para reproducir la imagen se realiza el proceso inverso.
(Gp:) Líneas de
barrido
(Gp:) 1
(Gp:) 3
(Gp:) 5
(Gp:) 7
(Gp:) 9
(Gp:) 483
(Gp:) Líneas de barrido mostradas
(Gp:) t
(Gp:) a
(Gp:) Lentes
(Gp:) Placa de
barrido
Captura de vídeo analógico II
La captura (y reproducción) de imágenes en color es muy similar a la de blanco y negro.
En este caso se utilizan tres haces de barrido (RGB).
Conversión RGB a YUV (compatibilidad con señales B&W).
Y: Luminancia (intensidad).
U y V: Diferencias de color.
El ojo humano es más sensible a la intensidad (brillo) que a la información de color (sub-sampling).
(Gp:) Lentes
(Gp:) Placa de
barrido
(Gp:) t
(Gp:) a
(Gp:) Divisor
(Gp:) Filtros
(Gp:) t
(Gp:) a
(Gp:) t
(Gp:) a
(Gp:) R
(Gp:) G
(Gp:) B
(Gp:) Cámara
(Gp:) Demod.
Conv.
(Gp:) CRT
(Gp:) TV Color
(Gp:) R
(Gp:) G
(Gp:) B
(Gp:) Y+C
(Gp:) Filtro
(Gp:) CRT
(Gp:) TV B&W
(Gp:) Y
(Gp:) Y+C
(Gp:) G
(Gp:) B
(Gp:) R
(Gp:) Y
(Gp:) U
(Gp:) V
(Gp:) C
(Gp:) Modulador
(Gp:) Codificador
Captura de vídeo analógico III
Parámetros de barrido:
Relación de aspecto (ancho:alto): 4:3
Existen distintos estándares:
NTSC (Usa y Japón): 525 líneas, 30 frames/s
PAL/SECAM (Resto): 625 líneas, 25 frames/s.
Algunas líneas (superiores e inferiores) no son visibles.
Durante el retorno vertical, se puede insertar información adicional (teletexto).
Barrido entrelazado y progresivo.
Entrelazado.
Cada cuadro se representa con dos campos sucesivos (uno con las líneas impares y otro con las pares) (60 c/s ó 50 c/s).
Página anterior | Volver al principio del trabajo | Página siguiente |