10.2 Descripción física de la imagen

La luz que llega a nuestros ojos y es captada por los sistemas de conos y bastones, no es mas que energía electromagnética, cuyas longitudes de onda se hallan dentro del rango denominado espectro cromático visible. Es preciso enfatizar que no estamos refiriéndonos a una masa informe de energía lumínica, sino a una organización de la energía según una determinada configuración espacio-temporal.
Una imagen puede describirse, desde una perspectiva fisicalista, como una distribución bidimensional de pequenos elementos puntuales, adyacentes unos de otros, y que cada uno de ellos emite una cierta intensidad luminosa. Por consiguiente, desde un punto de vista formal (matemático), la imagen estimular se define como una función bidimensional en el conjunto de los números reales, en la que a cada punto del plano con coordenadas (x, y) se le asigna el valor de luminancia emitido por dicho punto:

                R x R        ——————> R
                f(x,y)       ——————> L0     Å { x, y, L0 Î R } (2-D, acromática, estática)
                f(x,y,t)    ——————> L0    (2-D, acromática, en movimiento)
                f(x, y, z)  ——————> L0    (3-D, acromática, estática.)
                r(x, y) + g(x, y) + b(x, y)   ——————> L0 (2-D, color, estática).

Una imagen digitalizada es una matriz de números enteros positivos, en la que los subíndices (fila y columna) de cada elemento indican la localización del punto en la imagen. Y los valores de los elementos representan el nivel de gris, el cual indica la intensidad luminosa en un determinado punto de la imagen.

                  Z x Z      ——————>  Z
                  f(x, y)   ——————>  pi      " {x, y, pi Î Z}

Por tanto, cualquier imagen puede ser digitalizada y representada mediante una matriz de números, similar a la que mostramos en la Figura 5 y 6 (véase también Figura 4). Y, recíprocamente, cualquier matriz de números (o una transformación de éstos) puede representarse como una distribución de luminancias para lograr la apariencia de una imagen. Esta matriz bidimensional de intensidades luminosas, es la primera representación  que capta cualquier sistema de captura de imágenes digitales (cámaras, scaner, etc.) y por tratarse de una representación cuantitativa es operativizable, es decir,  susceptible de procesamiento.
 


FIGURA 4.- Imagen de un cubo en el que se han marcado dos
areas que contienen un trozo de bordes físicos

FIGURA 5.- Matriz de luminacias correspondiente al cuadro de la derecha en imagen 4.




FIGURA 6.- Matriz de luminacias correspondiente al cuadro infereior senalado en la imagen 4.

Cada fotorreceptor puede considerarse como un diminuto fotómetro que mide la intensidad de luz que incide sobre él y lo cuantifica en una patrón de impulsos bioeléctricos por unidad de tiempo. A partir de la matriz bidimensional de luminancia registrada por los fotorreceptores, el S.V.H. es capaz de detectar, discriminar, reconocer e identificar los objetos, e incluso de dar significado a la escena. En consecuencia, el S.V.H. puede estudiarse determinando la entrada o estímulo presentado al sujeto (input) y la salida o experiencia perceptiva (output perceptual), sin embargo, el problema relevante es el de llegar a esclarecer que ocurre entre medio. logamente al procesamiento biológico, en un sistema de procesamiento de imágenes digitales (visión computacional o artificial), pueden modelizarse los supuestos procesos subyacentes, o funciones que transforman unas representaciones en otras, al objeto de verificar  si las salidas de éste se adecúan a las que produce un sistema biológico, en caso de que así sea, ese modelo de simulación computacional y el algoritmo que se ha implementado constituyen  un modelo que permitirá describir y explicar el procesamiento para comprender su funcionamiento y poderlo predecir.