La compresión de imágenes trata de reducir la cantidad de datos necesaria para representar una imagen digital y la idea básica del proceso de reducción de datos no es otra que la de eliminar la redundancia en la información.
a) Conseguir una reducción significativa en el número de bits que utiliza para su almacenamiento.
b) Si conlleva una pérdida en la calidad de la imagen, ésta deberá ser poco significativa para el ojo humano o no suponer pérdida de información en las características relevantes de la imagen cuando se utiliza para aplicaciones en visión artificial.
c) Rapidez de cálculo tanto para la compresión como para la descompresión.
d) El formato de salida deberá permitir su almacenamiento y su transferencia.
Compresión de Imágenes
compresión sin pérdida de información, donde la imagen descomprimida será idéntica a la original y, por tanto, estará libre de error, como así podemos desear en imágenes de texto, huellas dactilares o imágenes médicas
compresión con pérdida de información, donde la imagen descomprimida no será idéntica a la original y su grado de parecido dependerá de la aplicación que se vaya a realizar (vídeoconferencias, televisión, robótica, etc.)
Las técnicas para la compresión de imágenes:
Compresión estadística, donde la codificación de la imagen se basa en los niveles de gris de la imagen completa.
Compresión espacial, donde la codificación se basa en la relación espacial entre los píxeles que presentan valores similares en los niveles de gris.
Compresión por cuantificación, que reduce el número de niveles de gris utilizados en la representación o sustituyen cada ventana de m×m pixeles (m suele ser 3, 5 ó 7, dependiendo de la tasa de compresión que deseemos) por la más parecida entre las ventanas de un conjunto de ventanas prototipo.
Compresión fractal, que consiste en encontrar una regla de construcción que produzca una imagen fractal que se aproxime a la imagen original utilizando la teoría matemática de los sistemas iterados de funciones. Un codificador fractal procesa la imagen original seleccionando una función contractiva cuyo único punto fijo (atractor) aproxima la original. El descodificador desarrolla iterativamente la función para recuperar al atractor.
En general, un sistema de compresión de imágenes consta de tres fases u operaciones:
Transformación:
Lineal
Longitud de la racha
Transformada coseno
Cuantificación:
Uniforme
Vectorial (bloques)
Modulación delta
Codificación:
Aritmética
de Huffman
Transformaciones lineales:
Transformaciones lineales
g(1) = f(1)
g(n) = f(n?1)?f(n)
Transformaciones basadas en la longitud de la racha
g1 = f(1)
li = longitud de la i-ésima racha
Gi = tono de gris de la i-ésima racha
Transformada coseno discreta
La Modulación Delta
Imagen reconstruida:
f*(1) = f(1)
Transformación:
Cuantificación:
Codificación: 1 BIT / píxel
35
??
30
25
35 ?1 ?1 1 1 ?1 ?1 1 ?1 1 ?1 1
1 BIT / píxel
granularidad
sobrecarga de pendiente
¿ Cómo elegir ? ?
pequeño: apropiado para las zonas de tonalidad similar
(interior de los objetos)
grande: apropiado para las zonas de grandes cambio de
tonalidad (bordes y contornos)
Página siguiente |