Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Clase 1 (22-08-2019)
Se conoce el funcionamiento parcial de la Visión Humana, dado que biológicamente se
tienen claras las conexiones y la percepción a color (RGB), pero de todas formas existe un
vacío respecto a como el cerebro es capaz de interpretar las imágenes.
Existen problemas clásicos respecto a la visión (ej. Ilusión ópticas, Ambigüedades ópticas,
Inconsistencias geométricas).
Explicación respecto a la fotografía en general
Ojo humano es más sensible al VERDE > ROJO > AZUL
Muestreo y Cuantización
o Muestro: Discretiza el domino de la función imagen (ej. Resolución MxN).
Intersección de una fila (M) y una columna (N) se llama pixel.
o Cuantización: Discretiza el rango de la función. Consiste en determinar el número
de niveles de intensidad de la luz.
Espectro Electromagnético: Conjunto de longitudes de onda de todas las radiaciones
electromagnéticas (luz visible para el humano [700nm – 400nm]
Las imágenes pueden representarse como una función f(x,y) con origen en la esquina
superior izquierda (x = columnas, y = filas).
Herramienta básica para el procesamiento de imágenes Histograma de una imagen
o El histograma de una imagen representa la frecuencia de ocurrencia de las
intensidades de grises en una imagen. En general, el histograma de una imagen con
L niveles de grises es representado con un vector de tamaño L.
o Matemáticamente se puede presentar como un vector…
ℎ(𝛿) → # de pixeles con intensidad 𝛿
𝐻(𝛿) → # de pixeles con intensidad ≤ 𝛿 (función de acumulación)
o Bajo contraste: El histograma se concentra en una región en particular.
o Alto contraste: El histograma se distribuye de forma “más pareja”
Tipos de operaciones sobre imágenes:
o Punto: La entrada y la salida se trabaja bajo un único pixel (ej. fotos en negativo).
o Local: A partir de un pixel de entrada, se aplica una operación al mismo pixel y a sus
vecinos (ej. detección de bordes).
o Global: Se toma toda la imagen y su resultado es aplicado a un único pixel (ej.
mejora de contraste).
o Filtros (ej. Detección de bordes, Mejoramiento del contraste, Morfología
matemática, Segmentación)
Clase 2 (27-08-2019)
Ejemplo de operaciones punto -> Binarización (transformar una imagen con una paleta de
2 colores)
Binarización Local/Adaptativa
o Cambia el umbral según la vecindad de cada pixel
o ¿Umbral para cada vecindad? -> ej. Valor promedio de tonos de gris
Niblack’s Thresholding
Sauvola’s Thresholding
o Uso frecuente en procesamiento de documentos
Clase 3 (29-08-2019)
Filtrado espacial: Su objetivo es acentuar o disminuir características. La entrada y la salida
es una imagen con leves cambios, para la cual se utiliza el proceso de convolución.
La gran mayoría de los filtros trabajan bajo operaciones locales.
Filtros lineales: Su nombre deriva por el tipo de operaciones matemática (producto punto).
Se aplica mediante un kernel/máscara/filtro centrado en el pixel que se desea transformar.
o 𝒓𝒙 : Distancia desde el centro del kernel al borde horizontal
o 𝒓𝒚 : Distancia desde el centro del kernel al borde vertical
La suma de los valores que constituyen al filtro, deben dar como resultado 1, para así
asegurar que el resultado de la operación se encontrará dentro del intervalo [0-255]
Los filtros pueden trabajar bajo una correlación (operación conmutativa -> no importa el
orden) o convolución.
Convolución
o Similar a correlación, pero la máscara es reflejada
Se refleja las filas o columnas que permitan extender la imagen hasta las
dimensiones necesarias para utilizar el kernel. No hay importancia sobre
que elemento se coloca en la esquina.
Aparte del reflejo, puede extenderse la imagen con un wrap (emplear el
borde situado en el extremo inverso)
Filtros de Suavizamiento: Permiten eliminar el detalle en una imagen o reducir el ruido de
una imagen (noise reduction)
o Ej. Ruido sal-pimienta – Ruido impulso – Ruido Gaussiano
o Filtro Mean (BOX FILTER): A partir de una vecindad, el filtro posee valores que
1
corresponden a
𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒𝑙 𝑓𝑖𝑙𝑡𝑟𝑜
Filtro de 3x3 -> Suavizado leve
Filtro de 9x9 -> Suavizado más fuerte (se ve mucho más borroso, como
miopía)
o Filtro Gaussiano: El filtro se define mediante una distribución gaussiana (normal).
El mayor peso se lo lleva el pixel central y a medida que se avanza hacia los bordes,
se reduce la importancia.
Al complementar este filtro con una Binarización Adaptativa, se puede
lograr una imagen resultante con mayor detalle.
o Filtro Promedio/Rango: Sólo se promedian los pixels en la máscara que están en
cierto rango. El rango depende del tono de gris del pixel central.
Uno de los problemas que presentan los filtros lineales, es la pérdida de bordes.
Filtros de Realce: Se emplean para intensificar detalles finos en la imagen (ej. bordes).
o Filtro de paso alto: Se eliminan las componentes de bajas frecuencias, manteniendo
las altas (frecuencia alta -> cambios drásticos de tonalidad).
o La máscara debe tener un coeficiente positivo cerca del centro y coeficientes
negativos en la periferia.
Filtros no lineales
o Filtro Mediana: A partir de una grilla de 𝑁𝑥𝑁 dimensiones, el pixel resultante
corresponde a la mediana de los tonos que abarca la grilla en la imagen original.
Difusión anisotrópica:
o Descripción espacio-escala (scale-space): Consiste en la descripción de una imagen
mediante un análisis de múltiples escalas. Se genera una familia de imágenes
derivadas obtenidas por convolución de la imagen original.