10.7 Compresión, suavizado y realce del contraste

Las investigaciones realizadas con la técnica de implantación de un minúsculo micro_ electrodo de cuarzo en las células ganglionares y las células del NGL han permitido conocer cómo opera este proceso de inhibición lateral entre fotorreceptores vecinos de un campo receptivo retiniano. Para simular computacionalmente el procesamiento efectuado  por los campos receptivos asociados a estas células (ganglionares y del NGL), de modo que nos permita estudiar la salida (respuesta) generada en estas células, suele recurrirse a dos tipos de filtros que, utilizados de modo adecuado, pueden  producir resultados equivalentes. Estos son, por una lado, el operador Laplaciano de una Gaussiana 2D (LoG-2D= Laplacian of a two-dimensional Gaussian), también conocido como operador de Marr y Hildreth (1980) [véase Figura 14).


FIGURA 14. - Forma de la función operador Laplaciano 2D.

Por otro lado, también produce el mismo efecto la función diferencia de dos gaussianas 2D (DOG-2D= Difference of two Gaussians, two-dimensionals) ((Enroth-Cugell & Robson, 1966; Wilson and Giese, 1977; Rose, 1979).


FIGURA 15. - Función Difference of two gaussians two-dimensionals (DOG-2D).

La Figura 15 muestra la función DOG-2D expresada en niveles de gris, los perfiles de luminancia de cada una de las dos gaussianas componentes que intervienen en la substracción (diferencia gs), una representación isométrica (3D) de la amplitud, y una sección en el eje Y de la misma. Se observará que la porción central excitatoria, al igual que los campos receptivos de las células ganglionares, tiene una mayor amplitud (altura o intensidad de luz), pero una menor anchura (s) que la porción periférica inhibitoria. Adviértase, también, que una de estas gaussianas (la de mayor s, o porción inhibitoria) esta invertida con respecto a la otra gaussiana (la de menor s, o porción excitatoria).

Cuando una determinada porción de la imagen observada incide en la región de la retina, que constituye el campo receptivo asociado a una cierta célula ganglionar, se produce el siguiente procesamiento:

  • Se superpone la imagen proyectada sobre ese campo receptivo con el filtro (o función de pesos de cada punto) perfectamente centrada.
  • Se calcula la suma de los impulsos excitatorios que inciden en el centro del campo receptivo (o del filtro), ponderados por la amplitud (según su nivel de gris) de la gaussiana central (la que tiene mayor amplitud y menor s).
  • Al resultado anterior, se le restan los impulsos inhibitorios que inciden en la periferia del campo receptivo (o del filtro), ponderados (según su nivel de gris) por la Gaussiana periférica (la que tiene menor amplitud y mayor s).
  • La representación generada como salida de este filtrado será la suma algebraica (con signos positivos y negativos) de las dos gaussianas bidimensionales (2D).

Esta salida produce, al menos, tres consecuencias:

  • Una compresión de la imagen original, motivada por la confluencia de la senal de numerosos fotorreceptores sobre una misma célula ganglionar (o sobre una célula del NGL). Ello supone una gran economía para la transmisión de la senal al córtex visual primario, puesto que se han condensado, como promedio, la senal de 127 fotorreceptores en una sola salida.
  • Un suavizado de la variación de la luminancia de la imagen, que da lugar a la eliminación de buena parte del ruido visual y de la información  redundante (redundancias de primer orden), ya que ha tenido lugar una promediación (media de la luminancia, ponderada por la Gaussiana correspondiente) de los puntos (pixeles) vecinos del entorno.
  • Un realce de los contornos o zonas de la imagen en las que la luminancia varía de forma abrupta. En efecto, si la anchura de banda* del filtro (DOG-2D) sintoniza óptimamente con estas transiciones de la luminancia (grosor del borde), de modo que la franja-contorno incida en la porción central del campo excitatorio (ON), la media ponderada resultante (salida o respuesta de la célula ganglionar) será la máxima posible, es decir, se realza o acentúa el contorno de la imagen. Sin embargo, si una región, con un nivel de gris uniforme, incide tanto en el centro como en la periferia del filtro (o del campo receptivo), entonces la respuesta será mínima dado que se contrarrestan los impulsos excitatorios del centro con los inhibitorios de la periferia (véase Figura 16).

FIGURA 16. - a) Anchura de banda óptima de un filtro DOG-2D; b) Respuesta nula.

Es decir, la DOG-2D implementa el cálculo diferencial (la segunda derivada de la matriz de luminancias de la imagen), lo cual produce un empaquetamiento óptimo de la imagen y una agudización de la imagen. En definitiva, se trata de un operador compuesto que suaviza la luminancia de la imagen, eliminando el ruido y la redundancia y a la vez agudiza los contornos físicos presentes en la imagen mediante la diferenciación entre la porción ON y la OFF. El objetivo de estos filtros parece ser el de preprocesar la senal para que se facilite un posterior procesamiento en el córtex cerebral, sin pérdida de detalle.
Puesto que existen 1.000.000 de células ganglionares, distintos grupos de ellas difieren en la anchura de banda a la que ajustan de modo óptimo y, en este sentido, hablamos de canales sensibles a una estrecha banda de frecuencias espaciales. Estos diferentes canales psicofísicos generan una amplia variedad de escalas de granularidad, las cuales contienen distintos grados de detalle (grano fino, medio, grueso). Obviamente la anchura de banda se relaciona con la diferencia entre las desviaciones típicas (s1-s2) de las dos gaussianas 2D.

Expresado en términos del dominio frecuencial (frecuencia espacial) puede decirse que las células ganglionares y las células del NGL operan como filtros paso-bajo (seleccionan las bajas frecuencias espaciales) o filtros paso-banda de amplia banda (seleccionan una gran variedad de frecuencias espaciales medias) y no orientados (frecuencias espaciales localizadas en todas las orientaciones del espacio). No obstante, debe matizase que en el caso de las células del NGL la porción periférica de campo receptivo contribuye con mayor peso a la ponderación que en caso de las células ganglionares.
?Qué consecuencias tiene el filtrado global de la imagen (o parte de ella, filtrado local). En la Figura 17 se muestra el resultado de aplicar a una misma imagen original un filtrado con tres funciones DOG-2D de diferente s (s1= 4; s2= 8; s3= 30).


FIGURA 17.- Imagen de un reloj filtrada por tres funciones DOG-2D de diferente s.

Desde el enfoque computacional, es habitual verificar ciertas hipótesis acerca de las representaciones generadas en una determinada neurona de la vía geniculo-estriada, mediante simulación del procesamiento visual por ordenador. En todas las técnicas aplicadas para reducir/eliminar el ruido visual, subyace la asunción de que el tamano de los pixeles (puntos de la imagen) es mucho más pequeno que cualquiera de los detalles importantes presentes en la imagen. Por tanto, para la mayoría de los pixeles de una imagen, sus vecinos representan la misma estructura que él. En consecuencia, numerosas técnicas de suavizado se basan en calcular el  promedio de las luminancias de un entorno de vecindad. Cuanto más grande sea dicho entorno más ruido se eliminará, pero también se difuminarán más los bordes de los objetos. Esto puede evitarse, de forma loga a los sistemas visuales biológicos, es decir en lugar de calcular simplemente la media aritmética de la luminancia del entorno (convolución de la imagen con un filtro de media), utilizando filtros de media ponderados por la proximidad  al pixel  central. Estos filtros de media ponderada, son precisamente una conocida combinación de funciones gaussianas 2D, es decir , la función DOG-2D.


*La anchura de banda es la proporción de frecuencias espaciales en las que se obtiene la mitad de la sensibilidad al contraste máximo, medida en octavas y tomando el logaritmo binario de la proporción.