captura del color
Embed Size (px)
TRANSCRIPT

Tema 1: Colorimetría y Captura de Imagen
Autores:
José Luis Alba y Fernando Martín – Universidad de Vigo
Jesús Cid – Universidad Carlos III
Última revisión: febrero 2006

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 2
Índice
Percepción visual. Teoría del colorModelos de colorFormatos de imagenDigitalización de imágenes. Captura de imágenes

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 3
Percepción visual: El Ojo Humano
Cerebro + Ojo son “el mejor analizador de imágenes que existe”.Lo imitan todos los tipos de cámaras.
Córnea: tejido transparente o lente protectoraIris: diafragma de apertura variable
Cristalino o lente: absorbe gran parte de IR e UV y es un enfoque ajustable. Retina: contiene las
células fotorreceptoras que convierten las
señales luminosas en nerviosas. Las neuronas salen de la capa interna
para formar el nervio óptico por el punto ciego.

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 4
Percepción visual: El Ojo HumanoSensibilidad espectral de las células fotorreceptoras.
Conos. De 6 a 7 millones, concentrados en la fovea.Tres tipos: sensibles al rojo (65 %) , al verde (33 %) y al azul (2 %)
¿Bastan tres colores para representar una imagen en color?Bastones.
Respuesta espectral menos selectiva (UV). De 75 a 150 millones. Mayor sensibilidad (varios bastones conectados a una misma célula nerviosa): visión nocturna. Uniformemente distribuidos y ausentes de la fovea.
Conos
Bastones
http://www.harunyahya.com/books/science/miracle_eye/miracle_eye_02.phphttp://www.harunyahya.com/books/science/miracle_eye/miracle_eye_02.php

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 5
Percepción Visual: modelo de procesado
Experiencias psicovisuales y medidas con electrodos permiten elaborar un modelo aproximado del procesamiento visual.
1.1. Sensibilidad a la intensidad.El ojo humano puede operar en rangos de 1 a 1010. Experimento de la ley de Weber:
Durante intervalos breves de tiempo, se presenta al observador un círculo de intensidad I+ΔI.Se mide la fracción de fracción de WeberWeber:: el valor de ΔI/I para el que el observador acierta sobre la presencia o ausencia del círculo un 50% de veces.
Para un amplio rango de intensidades, ΔI/I~0.02. En consecuencia, el brillo percibidobrillo percibido, C, es tal que
ICI
dIdCIIC log=→≈→
Δ=Δ
II+ΔI

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 6
Esto no significa que dentro de una escena el ojo pueda distinguir variaciones de C de 0.02 en el rango de 1 a 1010 (ΔC=10). Si en una escena el cociente de intensidades máxima y mínima es tal que ΔCmax>2, todo lo que está fuera de ese margen se percibe como blancos y negros puros.Un modelo simple del ojo:
En cada punto, realiza una transformación punto a punto aproximadamente logarítmica
Aplicaciones en tratamiento digital de imágenes:Sensibilidad logarítmica a la intensidad: es importante en el diseño de dispositivos de presentación (monitores) y captación (cámaras).Un cuantificador logarítmico será más eficiente que uno uniforme.Si ΔCmax = 2 y ΔCmin = 0.02 se necesitan al menos ΔCmax/ ΔCmin = 100 niveles de cuantificación (7 bits) para codificar la intensidad.Sensibilidad al ruido: la misma potencia de ruido se percibe más claramente en zonas oscuras (baja intensidad) Aplicaciones en restauración de imágenes y marcado digital.
I C
Percepción Visual: modelo de procesado

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 7
2.2. Filtrado espacialSi dos objetos están separados en el campo visual, sus intensidades se perciben diferentes solo si ΔC > 0.2
El ojo es sensible a cambios locales de intensidad
La intensidad percibida depende de la luz del entorno. Hay experimentos que muestran que el ojo filtra espacialmente.
¡La sensibilidad depende altamente del fondo!
Percepción Visual: modelo de procesado
I+ΔII

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 8
¡Los rectángulos interiores tienen idéntico nivel de gris!
¡Los rectángulos interiores tienen distinto nivel de gris!

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 9
Bandas de Mach: ponen de manifiesto alguna forma de filtrado paso alto (realce de bordes)Consecuencias:
Un compresor de imágenes deberá prestar especial atención para mantener los bordes.El uso de filtros paso bajo para eliminar ruido puede reducir bordes y desenfocar.
Percepción Visual: modelo de procesado

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 10
Medida de la resolución espacial del ojo:
En dirección horizontal, variación sinusoidal.En dirección vertical, decrecimiento lineal de la amplitud
De forma aproximada, puede medirse la respuesta en frecuencia, como el perfil de la curva límite, por encima de la cual no se percibe ninguna oscilación.
Percepción Visual: modelo de procesado

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 11
3. 3. Procesado Temporal
Cuando un punto luminoso parpadea N pulsos/seg, se ve continuamente a partir de una frecuencia de fusión: el ojo realiza algún tipo de filtrado paso bajo temporal, que depende de:
Las condiciones de iluminaciónLa duración del pulso luminosoLa intensidad del punto luminoso.
Fenómeno PHI: la frecuencia de fusión depende de los objetos presentes en la escena.
t~1mseg: Se perciben dos puntos simultáneamente
t~10mseg: Se percibe un punto que se mueve
t>1 seg:Se percibe un punto y luego otro
La frecuencia de muestreo temporal de las imágenes de vídeo o cine está relacionada con la frecuencia de fusión.
1o
Percepción Visual: modelo de procesado

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 12
Modelos de la Visión
Se han elaborado muchos modelos simplificados de la visión humana. Ejemplo para visión monocromática:
Percepción Visual: modelo de procesado

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 13
Niveles perceptuales superiores.El estudio de las células nerviosas en las primeras estapas de su recorrido ya pone de manifiesto que el procesamiento de la imagen que llega a la retina va adquiriendo sucesivos grados de complejidad:
Primeras células: respuesta al on, off, on-off del estímulo, y espontánea.Células vecinas tienden a inhibirse: acentuación de los bordes, esquinas y puntos aislados (filtrado paso alto).Ya en la corteza visual: respuestas óptimas de las células simples a líneas y bordes estáticas (células simples), desplazándose en el espacio (complejas) y cambiando de orientación (hipercomplejas).
Percepción Visual: modelo de procesado

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 14
Ponen de manifiesto la complejidad del procesamiento espacial y temporal en el sistema visual. Veremos algunas (hay más en http://lite.bu.edu/vision/applets/lite/lite/lite.html)
Percepción Visual: ilusiones ópticas

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 15

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 16
TamañoPistas Ficticias
Ilusión de Muller-Lyer
Ilusión de Ponzo(engaño con la distancia)
Tomadas de http://griho.udl.es/ipo/transpas/facthum_lsi.ppt

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 17
Perspectiva (Escher)
Tomadas de http://griho.udl.es/ipo/transpas/facthum_lsi.ppt

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 18
Movimiento

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 19
Teoría del color: la física
Intensidad de LuzToda radiación luminosa se caracteriza por su distribución espectral E (λ): energía que atraviesa una superficie normal a la dirección de propagación por unidad de superficie, tiempo y longitud de onda.La luz, al reflejarse o atravesar un cuerpo, cambia su DE:
Luz transmitida: E’(λ) = t (λ) E (λ) (transmitancia).Luz reflejada: E’(λ) = r (λ) E (λ) (reflectancia).
Sensores.Se caracterizan por su Sensibilidad Espectral, S (λ) Intensidad de luz detectada por el sensor:
( ) ( ) ( ) ( )∫∫ ==∞ max
min0
λ
λλλλλλλ dSEdSEI

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 20
El espectro visible.El ojo es sensible únicamente a la radiación contenida en una pequeña banda de frecuencias del espectro EM (desde 380 hasta 780 nm); en ella, la luz solar en la atmósfera presenta un pico de radiación.
Un color viene representado por las componentes espectrales de la radiación luminosa, C (λ), en la banda visible.
Teoría del color: la física

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 21
Percepción del color El ojo humano tiene 3 sensores de color, cada uno con una sensibilidad espectral diferente.Los conos actúan como un banco de filtros:
Vemos un color a través de 3 estímulos (componentes):
SB(λ)
100
604020
80
400 500 600 700 nm
Respuesta conos
SG(λ) SR(λ)
λ
∫= λλλα dSC RR )()(
∫= λλλα dSC GG )()(
∫= λλλα dSC BB )()(
C(λ)
SR(λ)
SG(λ)
SB(λ)
Color: vector α de 3 componentesno negativas
Curvas definidas por la CIE para un “observador estándar”
Teoría del color: la fisiología

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 22
LuminanciaDefinición de la CIE: Potencia radiante ponderada por una función de sensibilidad espectral característica del sistema visual humano Se mide en Lumens/m2 o candelas/m2.
685 Lumens = 1 Watio emitido a λ=555 nm (longitud de onda de máxima sensibilidad).
La luminancia de un punto es independiente de los objetos que la rodean.Una fuente de luz infrarroja puede tener radiancia alta, pero su luminancia será nula o casi nula.La luminancia de una fuente policromática se calcula como un promedio de las intensidades en cada receptor
Y = 0.30 R + 0.59 G + 0.11 Bque es equivalente a la intensidad captada por un detector de sensibilidad
V(λ) = 0.30 SR(λ) + 0.59 SG(λ) + 0.11 SB(λ)
BrilloMedida perceptual definida por la CIE como la Característica de la sensación visual según la cual una superficie parece emitir más o menos luzDepende tanto de la radiancia del objeto como de la del entorno.Dos objetos con fondos diferentes pueden tener idéntica luminancia pero brillo diferente. No se mide de forma objetiva.
Teoría del color: la fisiología

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 23
Carta cromáticaCarta cromáticaTodas las sensaciones de color pueden representarse mediante puntos de coordenadas positivas α = (α1, α2, α3) en un triedro.La sensación de color viene dada por la magnitud relativa: normalizaremos α de modo que α1+α2+α3 = 1 Los colores puros (del arco iris) se encuentran formando un arco sobre el triangulo
Teoría del color: representación

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 24
La sensación de color es (aproximadamente) aditivaaditiva. el estímulo:
produce respuesta:
Si dos fuentes se combinan, la sensación resultante estará en el segmento que une las sensaciones individuales.
Dado que todas las fuentes de luz son combinación de colores del espectro, todos los colores que pueden percibirse se encuentran en la cubierta convexa del arco.
Algunos puntos del triángulo no representan sensación de color alguna!
Transformando los ejes de modo que dos lados del triángulo sean perpendiculares, se obtiene la carta cromática.
( ) ( ) ( ) ( )λρλρλ ba EEE −+= 1
( ) ( ) ( ) ( )λαρλαρλ ba −+= 1α
Teoría del color: representación

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 25
Observando la carta cromática, ¿Cuántas fuentes son necesarias para representar los colores visibles?
Teoría del color: representación
En teoría, necesitamos infinitas fuentes, pero con 3 adecuadamente escogidas tenemos casi todas.Una cuarta fuente puede aumentar la paleta, pero en la práctica la ganancia puede no compensar su coste computacional

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 26
Modelos de color: RGBObjetivo: especificación estándar de coloresDefinen un color a partir de 3 componentes
RGBRGB.Rojo (700 nm), verde (546.1 nm) y azul (435.8 nm).Es un modelo para fuentes de luz
R
G
B

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 27
CMYCMY.Combinando R, G y B.
R+G=Y; G+B=C; R+B=M.
La situación es distinta si combinamos tintes (sustancias que absorben luz) en lugar de fuentes.
Combinando tinte amarillo (absorbe el azul) con tinte magenta (absorbe el verde) resulta un tinte rojo (absorbe azul y verde).
El modelo CMY se utiliza para codificarcolores en dispositivos de impresión
Modelos de color: CMY

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 28
YIQYIQ.Utilizado en radiodifusión de TV del sistema NTSC (USA y Japón)Desacopla intensidad y color para compatibilidad con blanco y negro.Se obtiene a partir del modelo RGB mediante una transformación lineal.
⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
−−−=
⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
BGR
QIY
311.0513.0212.0321.0275.0596.0
114.0587.0299.0
Modelos de color: YIQ

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 29
YUVYUVUtilizado en radiodifusión de TV del sistema PALTambién desacopla intensidad y color para compatibilidad con blanco y negro.También se obtiene a partir del modelo RGB mediante una transformación lineal.Usado en estándares de codificación digital JPEG y MPEG (más importancia a la Y).Fórmulas lineales:
)(897.0)(493.0
11.059.030.0
YRVYBU
BGRY
−=−=
++=
Y
U
VMatlab: no implementa la conversión RGB PAL. Pero sí para NTSC: Funciones rgb2ntsc, ntsc2rgb.
Matlab: no implementa la conversión RGB PAL. Pero sí para NTSC: Funciones rgb2ntsc, ntsc2rgb.
Modelos de color: YUV

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 30
HSIHSI (también llamado HSV).
H:Hue (matiz). Define el color.
S: Saturación. Cuán lejos está del blanco puro.
I: IntensidadUtilizado en PI, pues todas las componentes tienen un significado perceptual.Es, de los vistos, el único que mantiene una relación no lineal con el modelo RGB
⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
−−−=
⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
BGR
06/26/16/26/16/1
3/13/13/1
VVI
2
1
2/122
21
121
]VV[S)V/V(tanH
+== −
Modelos de color: HSI

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 31
En un corte del modelo:El ángulo determina el tinte,
El 0 es el rojo (y el 2πtambién).Pasa de rojo a verde (por amarillo), de verde a azul (por cyan) y de azul a rojo (por magenta).
La saturación va creciendo Desde el centro (S=0, gris) hasta el borde (S=1, color puro).
V es constante.
H
S
I
Matlab: Funciones rgb2hsv y hsv2rgb.V debería ser igual a Y. Sin embargo, se usan funciones no lineales.Matlab usa: V=max(R,G,B).Ojo: H es un ángulo y matlab lo mide entre 0 y 1 (no entre 0 y 2π).
Matlab: Funciones rgb2hsv y hsv2rgb.V debería ser igual a Y. Sin embargo, se usan funciones no lineales.Matlab usa: V=max(R,G,B).Ojo: H es un ángulo y matlab lo mide entre 0 y 1 (no entre 0 y 2π).
Modelos de color: HSI
V

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 32
Modelos de color: HSI
Matlab (ejemplo):N=100; % TamañoM=3*N;v = ones(5*N,M); % V constanteh = zeros(5*N,M); % Rojos = [zeros(N,M);0.25*ones(N,M);...0.5*ones(N,M);0.75*ones(N,M);...ones(N,M)]; % Saturación crece a ‘saltos’hsv(:,:,1) = h;hsv(:,:,2) = s;hsv(:,:,3) = v; % Armar imagenrgb = hsv2rgb(hsv); % Pasar a RGBimshow(rgb); % Ver imagen
Matlab (ejemplo):N=100; % TamañoM=3*N;v = ones(5*N,M); % V constanteh = zeros(5*N,M); % Rojos = [zeros(N,M);0.25*ones(N,M);...0.5*ones(N,M);0.75*ones(N,M);...ones(N,M)]; % Saturación crece a ‘saltos’hsv(:,:,1) = h;hsv(:,:,2) = s;hsv(:,:,3) = v; % Armar imagenrgb = hsv2rgb(hsv); % Pasar a RGBimshow(rgb); % Ver imagen
Concepto de saturación.

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 33
Modelos de color: Distancia entre Colores
Distancia entre coloresLos colores son vectores de R3.
Diferentes distancias:Norma 1:
Norma 2 (euclídea):
Norma p:
La importancia de cada componente puede ponderarse.¿Cuál usar?
La que mejor se adapte al problema Ensayo y Error.Distancia perceptual: mide la diferencia entre colores que “ve” el ojo humano. Muy compleja, nunca se usa en la práctica.
⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡=
3
2
1
ccc
C⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡=
3
2
1
'''
'ccc
C
3322111 ''' ccccccd −+−+−=
2/1233
222
2112 ]'''[ ccccccd −+−+−=
ppppp ccccccd /1
332211 ]'''[ −+−+−=

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 34
Imagen digital: Matriz bidimensional cuyos elementos se denominan píxeles (del inglés picture element)Cada píxel contiene información sobre un punto o una pequeña región de la escena
Digital significa que:el número de píxeles es finito: la vista de la escena que representa la imagen está recortada y muestreadael contenido de cada píxel está cuantificado
255 255 255 255 255 170 170 170255 170 85 85255 170 85 0
Formatos de Imagen

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 35
Formatos de Imagen
Clasificación según el número de bandas o canales:En color (RGB): se almacena RGB de alguna forma.En escala de grises: se almacena Y de alguna forma.Binarias: sólo existen dos colores, el blanco y el negro. Su origen suele ser el procesado de otras imágenes (ej: OCR’s).Multi-canal: se almacenan más de 3 canales, típico en sensoresmulti- e hiper-espectrales para aplicaciones de observación terrestre.

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 36
Formatos de Imagen
Según la forma de almacenamiento (o transmisión):Analógicas: señal eléctrica (ej: TV analógica).Digitales: bits, ficheros.... Ejemplos: bmp, tiff, jpeg (o jpg), gif, png, avi*, mpg*. * .- Ficheros que almacenan secuencias
Matlab: las imágenes son matrices o arrays (por supuesto, son digitales).Distinguiremos: Multi-banda, RGB (color), grayscale y binarias (logical).Las Multi-banda, RGB y grayscale pueden ser punto fijo (uint8, uint16) o punto flotante (single, double).Comandos: imread.m, imwrite.m, aviread.m, avifile.m,…
Matlab: las imágenes son matrices o arrays (por supuesto, son digitales).Distinguiremos: Multi-banda, RGB (color), grayscale y binarias (logical).Las Multi-banda, RGB y grayscale pueden ser punto fijo (uint8, uint16) o punto flotante (single, double).Comandos: imread.m, imwrite.m, aviread.m, avifile.m,…
Según el comportamiento temporal:Fijas o estáticas: no cambian, ej: fotos, ficheros jpg... En movimiento (vídeo): secuencia de imágenes fijas, ej: TV, mpeg, H.261

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 37
Formatos de Imagen
Estándar DICOM: (Digital Imaging andCommunications in Medicine)
Más que un formato es un estándar para la gestión integral de series de imágenes médicas, desde su almacenamiento hasta su distribución y anotación.Las estaciones de visualización permiten hacer rendering 3D y “viajar” por el interior del cuerpo humano a partir de series DICOM
Matlab: Existen los comandos básicos para gestionar ficheros DICOM:dicomread.m, dicomwrite.m, dicominfo.m
Matlab: Existen los comandos básicos para gestionar ficheros DICOM:dicomread.m, dicomwrite.m, dicominfo.m

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 38
Puede hacerse de dos modos:Por adquisición directa (mediante cámaras digitales)A partir de soporte analógico
En el segundo caso, debe procederse en varios pasos:1. Muestreo espacial2. Cuantificación de las muestras (L bits)3. Codificación de los valores
Imagencontínua MuestreoMuestreo CuantificaciónCuantificación CodificaciónCodificación
0011 0101 0101 0001 ...
Digitalización de Imagen:Muestreo y cuantificación

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 39
Analógica (fotografía)I =f (x,y)
Y
Xj
i
I(i,j)
El proceso de digitalización introduce pérdidas, tanto por efecto del muestreo (discretización espacial) como por el de la cuantificación (discretización en amplitud).
Discreta (Matriz numérica)
Digitalización de Imagen:Muestreo y cuantificación
Digitalizador

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 40
(1)
Efectos del muestreo espacial
Teóricamente, bajo ciertas condiciones (las del teorema de muestreo), no hay pérdida de información en el muestreo.
En la práctica, el muestreo limita la resolución de la imagen.
Digitalización de Imagen:Muestreo y cuantificación

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 41
(3)
(2)
El número de muestras que deben tomarse de una imagen depende de varios factores:
Las condiciones de observación:Distancia de observaciónTamaño físico de la imagen durante la visualización
El uso que se vaya a dar a la imagen
VisualizaciónProcesadoAlmacenamiento / transmisión
Digitalización de Imagen:Muestreo y cuantificación

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 42
32 niveles 16 niveles
4 niveles8 niveles
Efecto de la cuantificación
Si el número de niveles de intensidad usados para representar una imagen monocromo es pequeño, el ojo puede detectar efectos de contorno en el objeto
En el caso de imágenes B&W, con pocos tonos se observa ya alta calidad (con 100 niveles es suficiente, con 64 es muchas veces admisible)
Digitalización de Imagen:Muestreo y cuantificación

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 43
16 mill.
256
16
El tamaño de la “paleta de colores” (es decir, el número de colores utilizados para representar cada píxel es otro factor determinante de la calidad.
Si este número es muy bajo, se apreciarán contornos artificiales que resultan visualmente molestos.
Suelen ser necesarios 24 bits (3x8) ó 16 millones de colores (color real) para una visualización perfecta, con una paleta de 16 bits ó 65556 colores se aprecia casi sin distorsión, pero con una paleta de 8 bits ó 256 colores la calidad se ve muy deteriorada y con 16 la imagen es inservible).
Digitalización de Imagen:Muestreo y cuantificación

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 44
01234567
Planos de bitsHabitualmente, el número de niveles de gris es potencia de dos, lo que facilita su representación en binario.
Las imágenes formadas representando, por separado, cada uno de los bits de esta representación (en blanco si bit=1y en negro si bit=0) se denominan planos de bit.
Digitalización de Imagen:Muestreo y cuantificación

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 45
012345678 planos de bit de “Lena”
Digitalización de Imagen:Muestreo y cuantificación

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 46
Color verdaderoM x N x L x 3
Paleta de color (falso color)M x N x L + paleta
Escala de grisM x N x L
Binaria: blancoy negroM x N x 1
Requisitos de memoria
Digitalización de Imagen:Muestreo y cuantificación

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 47
Captura de Imagen: Sensores CCD y CMOS
Sensores CCD (Charged Coupled Devices).Sensores CMOS (Complemetary Metal Oxide Semiconductor)Cada fotón produce un par electrón-hueco.La carga se puede leer en tiempo casi nulo se convierte en tensión se amplifica y se pasa a un CAD de n bits (8,10,12)Parámetro fundamental: tiempo en el que se acumula carga.Cámaras CCD B/N: sistema óptico + chip CCD/CMOS.
Cámaras color:Triple CCD/CMOS: prisma dicroico + 3 CCD’s/CMOS.CCD/CMOS único + filtros de color.

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 48
Captura de Imagen: Diferencias CCD y CMOS
CCD:• uniformidad de la calidad en toda la superficie del dispositivo
• lectura secuencial de las celdas mediante circuitería circundante
• gran consumo de energía
• fabricación cara
• gran margen dinámico
CMOS:• circuitería en celdas para corregir calidad (área efectiva menor)
• lectura individualizada por celda (permite definir ROIs, evita efecto “blooming”)
• escaso consumo de energía
• fabricación barata (aprovecha tecnología de microprocesadores)
• menor margen dinámico

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 49
Captura de Imagen: Tiempo de Carga
Imagen no entrelazada:
1ª imagen 2ª imagen tiempo
tc=1/NN=número de imágenes por segundo
Imagen entrelazada:
campo-impar campo-impartiempo
campo-par campo-par
tc=1/NN=número de imágenes por segundo
Cámara sin control de tiempo de carga

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 50
Captura de Imagen: Tiempo de Carga
Imagen no entrelazada:
1ª imagen 2ª imagen tiempo
tc<=1/NN=número de imágenes por segundo
Imagen entrelazada:
impar impartiempo
par
tc<=1/NN=número de imágenes por segundo
Cámara con control de tiempo de carga (electronic shutter)

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 51
Captura de Imagen: Efecto del entrelazado
Cámara PAL (25 imág/seg entrelazado).Resolución 768x576.Tiempo de carga: 1/1000.Velocidad objeto: 30 Km/h (aprox.).
Extracción del
campo impar.

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 52
Captura de Imagen: Limitaciones de la Señal PAL para procesado
Resolución: hay 576 líneas físicas (parte activa de 625).Si no queremos deformar la imagen W/H=4/3, si H=576, W=(4/3)*576=768.Por eso se dice que la resolución máxima del PAL es 768x576.La otra gran limitación es el carácter entrelazado (más perjudicial si en la captura coincide en campo par/impar un cambio de escena).

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 53
Captura de Imagen: Cámaras CCD y CMOS
Óptica + CCD/CMOS + electrónica.Clasificación:
Imágenes Fijas (fotografía digital).Secuencias (cámaras de vídeo):
Analógica entrelazada: cámara de TV.Analógica no entrelazada o progresiva: Cámaras para aplicaciones profesionales de visión.Vídeo Digital (DV): uso doméstico o profesional. Puede albergar distintos formatos (PAL entrelazado, video no entrelazado, NTSC, panorámico) en soportes diferentes (Hi-8, miniDV con MPEG2, microMV con MPEG4)

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 54
Captura de Imagen: Captura en Color
Triple CCD: Prisma dicroico + 3 CCD’s.
Imagenverde
filtro verde
Imagenazul
filtro azul
reflexión azul (f. dicroico)
Imagenroja
filtro rojo
reflexióntotal
filtroinfrarrojo reflexión rojo (f. dicroico)
CCD color: Filtros de color + 1 CCD: se interpolan los valores de 2 colores más en cada celda

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 55
Captura de Imagen: CCD’s Lineales
Los sensores se distribuyen en un vector, no en una matriz. La densidad en píxeles por pulgada es mucho mayor.Aplicaciones:
Cámara Lineal: captura imágenes de una sola línea y gran resolución. Con movimiento perpendicular a la línea, podemos componer una imagen de tamaño arbitrario en la dirección perpendicular al sensor lineal.Escáner: la línea de CCD’s (y la fuente de luz) son móviles. Dos tipos:
Reflexión (documento opaco).Transmisión (documento transparente ejemplo: radiografías).

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 56
Captura de Imagen: Captura de Imágenes en Ordenador
Interfaces Ordenador-Cámara:Analógicas: conversión A/D (frame-grabbers).Digitales: FireWire, USB, SCSI, paralelo, CameraLink, propietarias...
Tipos de Frame-Grabber:Tarjetas de TV: PAL, NTSC, SECAM... Todos ellos son entrelazados. Muchas veces, se incluye sintonizador (señales en RF). Otras opciones: radio-FM, teletexto...Tarjetas avanzadas: pueden capturar señales de cámaras progresivas o cualquier formato digital que se defina. Según el modelo pueden incluir procesado en la tarjeta (on board), facilidades para procesar una imagen mientras se captura la siguiente (ping-pong), adaptabilidad a diferentes tipos de señal...

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 57
Captura de Imagen: Ejemplo de Frame-Grabber Básico
Hauppauge WinTV-PCI-FM (aprox. 130 euros).TV banda base o RF, Radio FM estéreo, teletexto. Formatos TV: PAL, SECAM, NTSC.Chip BT 878 u 881.Audio NICAM (si existe en el canal de TV).Graba vídeo formato AVI o MPEG1 (SW) a 25 imágenes/segundo.Imagen fija: BMP, GIF, TIFF, JPEG. Hasta 1600x1200 (interpolado desde 768x576).Modelo superior: WinTV-PVR grabación/edición MPEG1-2 por hardware ( aprox. 315 euros).

José Luis Alba y Fernando Martín - Universidad de Vigo; Jesús Cid - Universidad Carlos III 58
Captura de Imagen: Ejemplo de Frame-Grabber Avanzado
PC2-Vision de Coreco Imaging.Cualquier fuente analógica: CCIR (PAL B/N), RS170 (NTSC B/N), progresivo (configurable), color RGB (3 señales). Siempre banda base.6 canales conversión A/D: 6 cámaras B/N ó 3 B/N y 1 color ó 2 color.Fs=40MHz (por canal, 768x576 25 imag/seg requiere 11MHz).
8 Mb de memoria de imagen.8 entradas y 8 salidas digitales de propósito general (comunicación con entorno industrial).Señales de control de captura: trigger, reset asíncrono.