9.3 Integración de imágenes sucesivas



 
FIGURA 4.



Los observadores humanos y otros animales muestrean de forma característica sus mundos visuales con una serie de fijaciones discretas, separadas por sacudidas del ojo, o sácadas. No se experimenta borrosidad visual alguna cuando los ojos van de una localización a otra. En efecto, hay pruebas de que se suprime el procesamiento durante una sácada (Volkmann, 1976), y Stevens et al. (1976). Estos autores indican que la supresión es provocada por el movimiento a gran escala del mosaico retiniano completo. De un modo u otro debemos ser capaces de integrar estas sucesivas "instantáneas" para producir nuestra percepción de un mundo visual estable.

El problema de la integración de sucesivas imágenes retinianas ligeramente diferentes, una vez más, puede considerarse análogo al problema de la fusión de imágenes dispares cuando se logra la estereopsis o el movimiento aparente. En ambos casos, el cerebro debe descubrir qué aspectos de la imagen retiniana "corresponden" a los mismos objetos y emparejarlos de acuerdo con ello. Esperamos que el anterior abordaje de la estereopsis y del movimiento aparente habrá mostrado que el problema de la correspondencia no es trivial. No es más fácil de resolver cuando uno considera la integración de sucesivas fijaciones.

Si se obtiene una perspectiva de una muestra discreta del mundo visual para emparejarse con una segunda perspectiva ligeramente diferente, obtenida en un momento posterior, es necesario postular algún tipo de memoria para preservar la primera perspectiva que ha compararse con la segunda. Los psicólogos del procesamiento de la información han identificado un sistema de memoria visual de vida tan corta que al principio podría parecer un probable candidato para mediar en la integración de sucesivas miradas. Este sistema de memoria visual de vida corta es conocido como memoria icónica (denominado así por Neisser, 1967). Sus propiedades fueron por primera vez enteramente investigadas por Sperling (1960).

Sperling dirigió una serie de experimentos para investigar los límites de la amplitud de aprehensión. Si a un observador humano se le presenta muy brevemente una matriz de tres filas de cuatro letras cada una, es normal que pueda informar solamente de unas cuatro del total de 12 letras de la matriz (promedio de 4.5 letras, empleando exposiciones de 50 msg). Los observadores declaran que pueden "ver" más letras que aquellas de las que pueden informar. Sperling pidió a los observadores que informaran solamente de una fila de tal proyección, dándoles una pista (un tono alto, medio o bajo, para la fila alta, media y baja, respectivamente) después que cesara la exposición. Si la pista seguía inmediatamente a la proyección, los observadores podían informar de unos tres ítems, de los cuatro que componían cada fila, lo que indica que el 75% de las letras estaban disponibles (promedio de 9.1 letras) para dar cuenta de ellas inmediatamente después de la presentación. A medida que el retardo entre el cese de la proyección y la presentación del tono se incrementaba, el número de ítems informado en cualquier fila disminuía, hasta unos 500 mseg de retardo, con campos iluminados antes y después de la exposición no había ventaja alguna que ganar pidiendo un informe parcial respecto a un informe total.



FIGURA 5.

 



FIGURA 6.

 



FIGURA 7.



La memoria icónica, por lo tanto, parece preservar la información visual de una escena mirada brevemente por un período de 500 mseg o más (dependiendo de los niveles de iluminación prévia y posterior del campo). Durante este tiempo la memoria icónica parece decaer pasivamente. La información en la memoria icónica parece estar en una forma no interpretada ya que solamente pueden utilizarse claves físicas para proporcionar una ventaja en el informe parcial (Sperling, 1963; Von Wright, 1968, 1970; aunque véase Merikle, 1980).

?Podría ser esto el sistema de memoria que sirve para integrar las vistas sucesivas a medida que los observadores fijan las diferentes partes de una escena? Hochberg (1968) y Turvey (1977b) sostienen enérgicamente que no podría, ya que la memoria icónica está ligada a coordenadas anatómicas, específicamente retinianas. Así, como el esbozo 2?D de Marr, no puede cubrir una función integrativa provechosa, ya que hemos reemplazado el problema de la comparación de instantáneas retinianas diferentes por el de la comparación de diferentes instantáneas icónicas. Al parecer sería necesario que un sistema de memoria, en un nivel más abstracto que el icónico, para atender a esta función integradora. Hay una considerable y convergente evidencia de un almacenamiento visual post-icónico que parece jugar un papel en la imaginación visual, así como en la percepción visual. Por ejemplo, Phillips (1974) describe algunos elegantes experimentos en los que comparó directamente las propiedades de la memoria icónica con las del almacén visual a corto plazo (AVCP). La memória icónica puede resultar enmascarada por la presentación de una luz brillante o un patrón inmediatamente después del estímulo de prueba, está ligada a coordenadas anatómicas y no resulta afectada por la complejidad del patrón. El AVCP no es destruido por enmascaramiento, no está ligado a coordenadas anatómicas pero resulta afectado por la complejidad del patrón. En el AVCP se retiene menos de los patrones complejos que de los simples. Estas observaciones sugieren que el AVCP es un almacén a corto plazo, de capacidad limitada a un nivel más "esquemático" que la memoria icónica. En efecto, hay ahora una considerable evidencia de que el sistema que subyace a la superioridad del informe parcial en los experimentos de "memoria icónica" originales, podía de hecho estar basado en este nivel más "esquemático" (véase Humphreys y Bruce, 1989, para una revisión).

Hochberg (1968) implicó a un sistema tal de memoria esquemática en la integración de sucesivas perspectivas de objetos, etiquetándolo como un mapa esquemático. Hochberg dirigió varios estudios en los que simuló un muestreo local sucesivo del campo visual completo revelando instantáneas parciales de objetos a los observadores, en una técnica denominada visión de apertura sucesiva. Un dibujo lineal de un objeto podía proyectarse sección a sección a través de una abertura, como se muestra en las siguientes figuras. Los observadores fueron capaces de recuperar la estructura del objeto a partir de estas instantáneas, ver las inversiones espontáneas en la profundidad y advertir correctamente la "imposibilidad" de ciertas configuraciones. Hochberg sostuvo que las vistas parciales eran integradas en el nivel del mapa esquemático, justo como lo serían si el observador estuviera explorando un objeto completo con una sucesión de fijaciones.



FIGURA 8.

 



 
FIGURA 9.



No obstante, el mapa esquemático de Hochberg no sirve para combinar sucesivas instantáneas de modo pasivo, "dirigido por los datos". En lugar de ello, sugiere que se puede necesitar conocimiento previamente adquirido sobre las propiedades de los objetos para integrar las sucesivas perspectivas de los mismos.