Sei sulla pagina 1di 33

Contenido del captulo

POR QU ES TAN DIFCIL DISEAR


UNA MQUINA QUE PUEDA PERCIBIR?
El esrmulo en los receptores es ambiguo
Los objetos pueden estar ocultos o verse
borrosos
Los objetos parecen diferentes desde distintos
puntos de observacin
EL ENFOQUE DE LA GESTALT PARA
LA PERCEPCIN DE OBJETOS
DEMOSTRACIN: Desvanecimiento de
contornos ilusorios
Las leyes de la gestalt de la organizacin
perceptual
DEMOSTRACIN: Encontrar rostros en un
paisaje
Segregacin perceptual: separacin de los
objetos de su fondo
Las "leyes" de la gestalt como heursticos

CAPTULO

Percepcin
de objetos
y escenas

TEOR A DEL RECONOCIMIENTO


POR COM PONENTES
DEMOSTRACIN: Propiedades no accidentales
1 AUTOEXAMEN 5.1

PERCEPCIN DE ESCENAS
Y OBJETOS EN ESCENAS
Percepcin de la totalidad de una escena
MTODO: Uso de una mscara para
presentar brevemente un estmulo
Regularidades en el ambiente: informacin para
la percepcin
DEMOSTRACIN: Creacin de formas
a partir de sombreados
DEMOSTRACIN: Visualizacin de escenas
y objetos
El papel de la inferencia en la percepcin
Revisin del proyecto cientfico: diseo de una
mquina que sea capaz de percibir
LA FISIOLOG[A DE LA PERCEPCIN
DE OBJETOS Y ESCENAS
Neuronas que responden al agrupamiento
perceptual y a la figura-fondo
Cmo responde el cerebro a los objetos?
Conexin de la actividad neuronal y la, percepcin
MTODO: Enfoque de la regin de inters
ALGO QUE DEBEMOS CONSIDERAR:
M ODELOS DE LA ACTIVIDAD CEREBRAL
QUE PUEDEN PREDECIR LO QUE VE
UNA PERSONA

1 AUTOEXAMEN 5.2
Piense en lo siguiente
Si desea saber ms
Conceptos clave
Recursos en lnea

lvLI LABORATORIO VIRTUAL


(VIRTUAL LAB)

PGINA OPUESTA Esta pintura de Robert Indiana, titulada El gran

amor, proporciona ejemplos de cmo diferentes reas de una pintura


se pueden percibir como figura y fondo. Quiz en un principio usted
vea que las reas rojas, que representan la palabra "LOVE" (AMOR),
resaltan en la pintura. Sin embargo, tambi n es posible que vea las
pequeas reas verdes como flechas en un fondo rojo o las formas
azules del centro como tres figuras en un fondo rojo.
2010 Margan Art Foundation Ltd./Arlists Rights Society (ARS), Nueva York. Museo de Arte de
Carnegie, Pittsburgh/Aegalo del Comit de Mujeres.

1VL 1 Los

iconos del Laboratorio virtual (Virtual Lab) lo conducen hacia


animaciones y videos especficos diseados para ayudarle a visualizar
lo que est leyendo. El nmero que se encuentra junto a cada icono le
indica el nmero del extracto al que puede acceder a travs de su
CD-ROM o en el sitio web de su libro (disponible slo en ingls).

99

Algunas preguntas que consideraremo s:


1 Por qu algunos psiclogos perceptuales dicen que
"el todo es diferente de la suma de sus partes"? (p. 104)

1 Cmo distinguimos un objeto de su fondo? (p. 108)


1 Cmo nos ayudan las "normas generales" a lograr una
percepcin del entorno? (p. 109)

1 Por qu ni las com putadoras ms sofisticadas pueden


igualar la capacidad de una persona para percibir objetos?
(p. 119)

entado en el techo del PNC Park de Pittsburgh, Roger


mira la ciudad (figura 5.1). A la izquierda ve un grupo
de aproximadamente 10 edificios y puede distinguir uno del
otro, aunque se superponen. Enfrente ve un edificio pequeo
delante de uno ms grande y no tiene problemas para distinguir que se trata de dos edificios. Siguiendo el ro observa una
franja amarilla horizontal sobre las gradas del jardn derecho.
Para l es obvio que sta no forma parte del parque sino que
est al otro lado del ro.

Todas las percepciones de Roger le llegan de forma natural y


requieren poco esfuerzo. Sin embargo, lo que Roger logra con
tanta facilidad es en realidad el resultado final de procesos complejos. Podemos darnos una idea de cun compleja y potencialmente difcil que es la percepcin si regresamos al "proyecto
cienrfico" que describimos al inicio del captulo 1 (pgina 4).
En este proyecto se plante el problema de disear una
mqLlna que pueda localizar, describir e identificar todos los
objetos que hay en su entorno, y que adems pueda desplazarse
de un punto a otro, evitando los obstculos que haya en su
camino. Este problema ha captado la atencin de los cientficos informticos por ms de medio siglo. Cuando aparecieron
las primeras computadoras en las dcadas de 1950 y 1960, se
predijo que en un lapso de 10 a 15 aos se iban a desarrollar
dispositivos que se aproximaran mucho a la visin humana.
Pero la tarea de disear una computadora que pudiera igualar
la visin humana result mucho ms difcil de lo que los cientficos informticos pensaron; hasta nuestros das, el problema
no se ha resuelto (Sin ha et al., 2006).
Una manera de ilustrar el proyecto cientfico es considerar
los intentos recientes por resolverlo. Observe, por ejemplo, los

Figura 5 .1 1 Es fcil distinguir que hay varios edificios a la izquierda y que enfrente hay un edificio rectangular adelante de un
edificio ms alto. Tambin es posible distinguir que la franja amarilla horizontal que se ve sobre las gradas cruza el ro. Estas
percepciones son fciles para los seres humanos, pero seran difciles para un sistema informtico para la visin.
100

CAPiTULO 5

Percepcin d e objetos y escenas

vehculos diseados para competir en la carrera "Urban Challenge" ("Reto urbano") que se llev a cabo el3 de noviembre de
2007, en Victorville, California. En esta carrera, patrocinada
por la Agencia de Proyectos de Investigacin Avanzada para la
Defensa (DARPA, por sus siglas en ingls) de Estados Unidos,
se requera que los vehculos circularan 88.5 kilmetros por un
trayecto que semejaba calles de una ciudad, con otros vehculos en movimiento, sealamientos de trfico y smbolos. Los
vehculos tenan que hacer el recorrido por s solos, sin otra intervencin humana ms que la de introducir las coordenadas
de posicionamiento global para trazar el recorrido en el sistema de gua del auro. Tambin tenan que mantener el curso
y evitar el trfico impredecible, valindose slo de sus sistemas
informticos integrados.
El ganador de la carrera se muestra en la figura 5.2. "Boss",
de la Universidad Carnegie Mellon, logr mantener el curso y
evitar a otros autos a una velocidad promedio de 22.5 kilmetros por hora. El vehculo de Stanford qued en segundo lugar,
seguido del de Virginia Tech. Los equipos de MIT, Cornell y
la Universidad de Pennsylvania tambin completaron el reco-

rrido de un total de 11 equipos que calificaron para la ~


VL '1
etapa final de la carrera.
El logro del desplazamiento por el entorno, en especial
cuando en l hay obstculos en movimiento, es impresionante.
Sin embargo, aunque tales vehculos robotizados pueden evitar
obstculos a lo largo de una ruta definida, no son capaces de identificar la mayora de los objetos que estn esquivando. Por ejemplo,
aunque "Boss" puede evitar un obstculo en medio de la pista, no
puede distinguir si ste es "una pila de rocas" o "un arbusro".
Se han diseado otras mquinas dirigidas por computadora especficamente para reconocer objetos (no para recorrer
un trayecto). Estas mquinas pueden reconocer algunos de
ellos, pero slo despus de un entrenamiento en un conjunto
limitado de objetos. Las mquinas pueden reconocer rostros,
pero slo si la iluminacin es adecuada y los ven desde un ngulo especfico. Podemos apreciar la dificultad del reconocimiento de rostros por computadora con el hecho de que los
sistemas diseados para esta tarea en los controles de seguridad de los aeropuertos slo pueden identificar con precisin menos de la mitad de los rostros de un grupo seleccionado (Sinha,
2002; vanse tambin Chella et al., 2000, y la seccin "Si desea
saber ms", pgina 128, para obtener m s conocimiento sobre
la percepcin por computadora).

Por qu es tan difcil disear


una mquina que pueda percibir?
Ahora describiremos algunas de las dificultades para el diseo
de una mquina que pueda percibir. Recuerde que el punto de
estas descripciones es que, aun cuando plantean dificultades
para las computadoras, nuestra "mquina para la percepcin"
humana resuelve fcilmente estos problemas.

El estmulo en los receptores es ambiguo


Figura 5. 2 1 El vehculo robot, "Boss", en un recorrido de
prueba en una pista de Robot City, en Pittsburgh. Observe
que no hay un conductor humano. El desplazamiento se
logra por medio de computadoras integradas que reciben
informacin de varios sensores en el vehculo, cada uno de
los cua les tiene una funcin especializada. Los sensores
montados en la parte trasera del toldo son telmetros lser
que apuntan hacia abajo para detectar las marcas de los
carriles. Los sensores que van en el portaequipaje del toldo
apuntan a los cruces para detectar y seguir a otros vehculos
al intentar incorporarse al trfico. Los sensores negros
montados en el cofre son telmetros lser de largo alcance
utilizados para rastrear vehculos. Los dos sensores blancos
montados en las esquinas del parachoques frontal son
telmetros de corto alcance utilizados para detectar y seg uir
vehculos cercanos. Los cuatro rectngulos fijados en la
parrilla son sensores de radar. Los sensores blancos son de
corto alcance y sirven para detectar obstculos cerca del
vehculo. Los sensores negros son de largo alcance y se usan
para rastrear vehculos cuando "Boss" se mueve rpido o va
a dar vuelta en medio del trfico.

Cuando usted ve una pgina de este libro, la imagen que proyecta


esa pgina en su retina es ambigua. Parecera extrao decir esto
porque es obvio que la pgina es rectangular, pero considere la
figura 5.3, que muestra cmo se representa la pgina en su retina.
Vista de frente, la pgina rectangular crea una imagen rectangular en la retina. Sin embargo, otros objetos, como un rectngulo
ladeado o un trapezoide sesgado, pueden crear la misma imagen.
El hecho de que muchos objetos puedan crear una imagen
en particular en la retina (o en los sensores de una mquin a
guiada por computadora para la visin) se llama problema de
la proyeccin inversa. Otra manera de definir este problema
es como sigue: si conocemos la forma, la distancia y la orientacin de u n objeto, podemos determinar la forma de la imagen
del objeto en la retina. Sin embargo, un nmero infiniro de objetos puede crear una imagen particular en la retina.
La ambigedad de la imagen en la retina tambin se ilustra
en la figura 5.4a, que parece ser un crculo de rocas. Sin embargo,
al ver estas rocas desde otro punto de observacin, nos damos
cuenta de que en realidad no forman un crculo (figura 5.4b).
Por tanto, as como un trapezoide y otros objetos no rectangulares pueden crear una imagen rectangular en la retina, muchos

Por qu es t an difcil disear una mquina que pueda percibir?

101

--- ~
\L-~
1

"'...

1
/

/
1

'

'

Imagen en
la retina

Objetos que crean la m1sma


imagen en la retina

)
1
1

Figura 5.3 1 El principio en el que


se basa el problema de la proyeccin
inversa. La pgina del libro que
est cerca del ojo crea una imagen
rectangular en la retina. Sin embargo,
el rectngulo ladeado, el trapezoide
y muchos otros estmulos tambin
pueden crear esta imagen. Esta es
la razn por la que decimos que la
imagen en la retina es ambigua.

1
;

"'"'

l
;

....
"'m
~

b)

a)

Figura 5.4 1 Escultura ambiental realizada por Thomas Macaulay. a) Al verla desde cierto punto de observacin (el balcn del
segundo piso de la Blackhawk Mountain School of Art, Black Hawk, Colorado), las rocas parecen estar acomodadas en crculo.
b) Al verla desde la planta baja del edificio, se puede observar su verdadera configuracin.

objetos que no son circulares pueden crear una imagen circular


en ella. Aunque el ejemplo de la figura 5.4a hace que los seres humanos saquen una conclusin errnea acerca de las rocas, este
cipo de confusin rara vez ocu rre, pues moverse a otro punto de
observacin revela que las rocas no forman un crculo.
Estos ejemplos muest ran que la informacin proveniente
d e una sola observacin de un objeto puede ser ambigua. Los
seres humanos resolvemos este problema al movernos a distintos puntos de observacin o utili zar el conocimiento que tenemos de experiencias pasadas en la percepcin de objeros.

Los objetos pueden estar ocultos


o verse borrosos
En ocasiones los objetos estn oculros o se ven borrosos. Puede
encontrar el lpiz y los anteojos en la figura 5.5? Aunque tiene
que buscar un poco, puede localizar el lpiz en el frente y los
anteojos que sobresalen desde detrs de la computadora, junto
a las tijeras, pese a que slo se ve una peque a parte de estos
objetos. Tambin puede percibi r con facilidad el libro, las tijeras y el papel como objetos distintos, aun cuando estn parcialmente ocultos por otros.
102

CAPfTULO 5

Percepcin de objetos y escenas

Este problema de los objetos ocultos ocurre cada vez que


uno de ellos oculta parte de otro. Esto sucede con frecuencia en
el emorno, pero las personas emienden que la paree de un objeto
que est cubierta sigue existiendo y son capaces de usar su conocim iento del entorno para determinar lo que puede estar presente.
Las personas tambin son capaces de reconocer objetos
que no estn enfocados ntid amente, como los rostros de la figura 5.6. Identifique a cuntas d e estas personas pueda y luego
consulte la respuesta en la pgina 130. Pese al degradado de estas imgenes, muchas personas pueden identificar a la mayora
de estas celebridades, mientras que las computadoras hacen
un trabajo deficiente en este aspecto (Sinha, 2002).

Los objetos parecen diferentes desde


distintos puntos de observacin
Otro problema que enfrenta cualquier mquina para la percepcin es que a menudo los objetos se ven desde d iscimos ngulos. Esto significa que cambian continuamente, dependiendo
del ngulo desde el cual se vean. Los seres hum anos seguimos
percibiendo el objeto de la fig ura 5.7 como la misma silla vista
desde distintos ngulos, pero esto no es tan evidente para una

Figura 5.8 1 Cules fotografas son de la misma persona?


Tomada de Sinha, P. (2002). (Recognizing complex patterns.
Nature Neuroscence, 5, 1093-1097. Reimpresa con permiso
de Macmillan Publishers Ud. Copyright 2002.)

"'"'

.....=---- ~...--Figura 5 .5 1 Parte del desorden en el escritorio del autor.


Puede localizar el lp iz oculto (fcil) y los anteojos del
autor (difcil)?

Figura 5.6 1 Quines son estas personas? Vanse las


respuestas al final de este captulo. (Tomada de Sinha, P.
{2002}. Recognizing complex patterns. Nature Neuroscience,
5, 1093-1097. Reimpresa con permiso de Macmillan
Publishers Ud. Copyright 2002.)

a)

b)

computadora. La capacidad de reconocer objeros vistos desde


distintos puntos de observacin se llama invaria nza d e la
persp ectiva. La capacidad de las personas para lograr la invarianza de la perspectiva les permite idenrificar las imgenes de
la figura 5.8a y e como la misma persona, p ero un sistema informtico de reconoc imiento de rostros clasificara los rostros
a y b como similares (Sin ha, 2002).
Las dificultades que enfrenta cualquier mquina para
la percepcin demuestran que sta es ms compleja de lo que
parece. Pero, cmo superamos los seres humanos estas complejidades? Las primeras respuestas a esta pregunta las proporcion a inicios de la dcada de 1900 un gru po de psiclogos
que se auronombraban psiclogos de la gestalt, donde gestalt,
traduc ida de manera aproximada, es una configuracin completa que no se puede describir simplemente como la suma de
sus partes. Podemos apreciar el significado de esta definicin
considerando cmo comienza la psicologa de la gestalr.

e)

Figura 5 .7 1 Su capacidad para reconocer que todas estas vistas pertenecen a la m isma silla es un ejemplo de la invarianza
de la perspectiva.
Por qu es tan difcil dise ar una mquina que pueda percibir?

103

El enfoque de la gestalt para


la percepcin de objetos

Es posible entender el enfoque de la gestalt consid erando


uno de los primeros intentos por explicar la percepcin: el
Lnea
50 ms de
Lnea
Percepcin:
de Wilhelm Wundt, quien estableci el primer laboratorio de
centelleante
oscuridad
centelleante
movimiento
a la izquierda
a la derecha
psicologa cientfica en la Universidad de Leipzig en 1879. Al
de izquierda
a derecha
enfoque de Wundt para la percepcin se le llam estructuraa)
lism o . Un a de las ideas bsicas del estructuralismo era que
las percepciones se crean al combinar elemencos llamados
sen saciones, as como cada uno de los puntos que forman el
rostro de la figura 5.9 se suman para crear nuestra percepcin
d e un rostro.
e
~
La idea de que la percepcin es el resultado de "sumar" ~
se nsaciones fue rebatida por los psiclogos de la gestalr quie- "': . . .IJii.:'~lf"-1
nes, en su lugar, ofrecieron la idea de que el todo es diferente de 03 a
la suma de sus partes. Este fundamento tiene sus comienzos, segn
b)
una ancdota bien conocida, en un viaje por tren que realiz el
Figura 5.10 1 a) Demostracin del movimiento aparente de
psiclogo Max Wertheimer en 1911 (Boring, 1942). Wertheimer
Wertheimer. b) Las seales electrnicas mviles como stas,
descendi del tren a estirar las piernas en Frankfurt y comen las que las palabras se desplazan hacia la izquierda, crean
pr un estroboscopio de juguete a un vendedor que estaba en
la percepcin de movim iento aplicando los principios del
movimiento aparente que Wertheimer estudi.
el andn del tren. El estroboscopio, un dispositivo mecnico
que creaba una ilusin de movimiento alternando con rapidez
dos imgenes ligeramente distintas, hizo que Wertheimer se
explicacin para el movimiento. (Un ejemplo moderno del mopreguntara cmo se poda explicar la ilusin de movimienco
vim iento aparente lo representan las seales electrnicas como
que observaba med iante la idea estructuralista de que la expela de la figura S.lOb, que muestra anuncios mviles o t itulares
riencia se crea a partir de sensaciones. Podemos entender por
noticiosos. La percepcin d e movimiento en estas pantallas
qu surgi esta pregunta si vemos la figura S. lOa, en la que se
es tan convincente que es difcil imagina r que es producto de
diagrama el principio de la ilusin de movimiento creada en el
luces inmviles que se prenden y se apagan de manera 1\7.1
estroboscopio.
intermitente.
~2
Cuando dos estmulos que estn en posiciones ligeramente
Con esta pregunta sobre el movimiento aparente como su
distintas se muestran uno despus de otro con el intervalo coinspiracin, Werrh eimer y dos de sus colegas, Kurt Koffka e
rrecto, se percibe movimiento entre ambos. Esta es una ilusin
Ivo Kohler, est ablecieron un laboratorio en la Universidad de
llamada movimiento aparente porque en realidad no hay moFrankfurt, se autonombraron psiclogos de la gestalt y procevimiento en la proyeccin, slo dos estmulos inmviles que se
dieron a investigar y publicar artculos que planteaban serios
muestran de manera intermitente. Wertheimer se pregunt:
problemas para la idea estructuralista de que las percepcioCmo pueden las sensaciones ocasionar el movimiento que
nes se crean a partir de sensaciones (Wertheimer, 1912). La siparece ocurrir entre los dos estmulos intermitentes? Despus
guiente demostracin ilustra otro fenmeno que es difcil de
de todo, no hay estimulacin en el espacio entre los dos esexplicar con base en las sensaciones.
tmulos, por lo que no hay sensaciones qu e proporcionen una

DEMOSTRAC I N

D esvanecimient o de contornos ilusorios

Figura 5.9 1 Segn el estructuralismo, varias sensaciones


(representadas con los puntos) se suman para crear nuestra
percepcin del rostro.
104

C APITULO 5

Percepcin de objetos y escenas

Considere la imagen de la figura 5.11. Si ve esto como un cubo


igual al que se muestra en la figura 5.11 b flotando en el espacio
frente a Jos crculos negros, tal vez perciba los tenues co nto rnos ilusorios que representan los bordes del cubo (Bradley
y Petry, 1977). Estos contornos se llaman ilusorios porque en
realidad no estn en el estmulo fsico. Puede comprobar esto
1) al colocar un dedo sobre los dos crculos negros inferiores o
2) si imagina que los crculos negros son orificios y que ve el
cubo a travs de ellos. Cubrir los crculos o ver el cubo por los
orificios ocasiona que los contornos se desvanezcan o que se
vuelva ms difcil verlos. 1

Pragnanz Pragnanz, es una palabra alemana que significa


"buena figura". La ley de pragnanz, tambin llamada ley de la
buena forma o ley de la simplicidad, es la principal ley de la psicologa de la gesralr: cada patrn de estmulos se percibe de manera tal
que la estructura resultante es lo ms sencilla posible. El conocido smbolo olmpico de la figura 5.13a es un ejemplo de la ley de la
simplicidad. Vemos esta imagen como cinco crculos y no como
una canridad mayor de formas ms complicadas como 1\f.l
9
t...:.!:.J
las de la figura 5. 13b.

a)

Semejanza La mayora de las personas percibe la figura


5.14a como filas horizontales de crculos, columnas verticales
de crculos, o ambas. Pero cuando cambiamos el color de algunas columnas, como en la figura 5.14b, la mayora percibe columnas verticales de crculos. Esta percepcin ilustra la ley de

b)

Figura 5.11 1 a) Esto se puede ver como un cubo flotando


frente a ocho discos o como un cubo visto a travs de ocho
orificios. En el primer caso, los bordes del cubo parecen
contornos ilusorios. b) El cubo s in los crculos negros.
(Basada en "Organizational Determinants of Subjective
Contour: The Subjective Necker Cube", de D. R. Bradley
y H. M. Petry, 1977, American Journal of Psychology, 90,
253-262. American Psycho/ogica/ Association.)

Cuando hizo que desaparecieran los contornos poniendo


el dedo sobre los crculos negros, comprob que el contorno

era ilusorio y que la percepcin de una parte de la imagen (los


contornos) se ve afectada por la presencia de la orra parte
(los crculos negros). Los estrucruralistas tuvieron problemas
para explicar los contornos ilusorios porgue en real idad no
existen, as que no puede haber sensaciones donde se f\(.1
t...:.!:.J 3,4
perc1"ba el contorno.
Otras imgenes que son difciles de explicar con base en
las sensaciones son las figuras biestables, como el cubo de la
fig ura S.llb, pues al verlas se mueven de un lado a otro, y las
ilusiones, en las que las percepciones de una parte de una imagen son afectadas por otra parte (vanse los Laboratorios virtuales 5-7). Desvanecer los contornos imaginando que se mira
a travs de los orificios plantea un problema similar para los
esrructuralistas. Es difcil explicar, con base en las sensaciones, una percepcin que est presente un momento y al otro
no, en especial porque el estmulo en la retina nunca ~
L 5-7
.
camb1a.
Despus de rechazar la idea de que la percepcin se forma a partir de sensaciones, los psiclogos de la gesralt propusieron varios principios llamados leyes de la organizacin
perceptual.

~.

.,
~

. ,- .

,_

...

l ~

Figura 5 .12 1 Algunas fo rmas negras y blancas que se

organizan perceptualmente para formar un dl mata.

a)

Las leyes de la gestalt de la organizacin


perceptual
La organizacin perceptual implica el agrupamiento de los
elementos en una imagen para crear objeros ms grandes. Por
ejemplo, algunas de las reas oscuras de la figura 5.12 se agrupan para formar un dlmata y otras se ven como sombras en
el fondo. Veamos seis de las leyes de la organizacin que los
psiclogos de la gestalt propusieron para explicar cmo f\(.1
t...:.!:.J 8
'
.
percept ua 1como este.
ocurre e1agrupamiento

b)

Figura 5.13 1 a) Esto suele percibirse como cinco crculos,

no como las nueve formas que se muest ran en b).

El enfoque de la gestalt para la percepcin de objetos

105

a)


b)

Figura 5 .1 4 1 a) Se perciben como filas horizontales


o como columnas verticales, o ambas. b) Se perciben
como co lumnas verticales.
~

la semejanza: las cosas semejantes parecen estar agrupadas. Esta ley


hace que los crculos del mismo color estn agrupados. El agrupamiento tambin puede ocurrir debido a la semejanza ~
10
de la forma, el tamao o la orientacin (figura 5:15).
L
El agrupamiento tambin ocurre en los estmulos auditivos. Por ejemplo, las notas que tienen tonos semejant es y que
se suceden en intervalos corros pueden agruparse perceptualmenre para forma r una meloda. stos y otros efectos de agrupamiento auditivo se estudiarn en el captulo 12, cuando se
describan los procesos organizacionales de la audicin.
Buena continuacin En la figura 5.16 vemos que el
cable que comienza en A fluye con facilidad hacia B. No va a C
ni D porque esas rutas implicaran dar vueltas m uy pronunciadas y violara la ley de la buena continuacin: Los puntos que, al
unirse, dan como resultado lneas rectas o ligeramente curvas parecen
pertenecer al mismo conjunto, y las lneas tienden a verse de manera tal
que siguen la ruta ms fcil. Otro efecto de la buena continuacin
se muestra en el parrn de nudos celtas de la figu ra 5.17. En
este caso, la buena continuacin garantiza que vemos un parrn entretejido continuo que no parece dividirse en pequeas
piezas cada vez que un hilo se encima en otro h ilo. La buena
continuacin tambin nos ayud a percibir los ~
11 12
crculos ligeramente sinuosos de la figura 5.13a.
L

Proximidad (cercana) Nuestra percepcin de la figura 5.18a como dos pares de crculos ilustra la ley de la proximi-

~
~
:

a;

Figura 5.16 1 La buena continuacin nos ayuda a percibir


dos cables distintos, aunque estn superpuestos.

Figura 5 .17 1 Debido a la buena co ntinuacin, perci bimos


este patrn como hilos entretejidos continuos.

dad, o de la cercan a: Las cosas que se encuentran prximas 1"\f.l


t..:.!:..J 13
parecen estar agrupadas.
Regin comn La figura 5.18b ilustra el principio de la
regin comn: Los elementos que estn dentro de la misma regin
de espacio parecen estar agrupados. Aune u e los crculos que estn
dentro de los valos se encuentran ms alejados que los crculos contiguos entre los valos vecinos, percibimos que los crculos
den tro de los valos estn agrupados. Esro ocurre po rque cada
valo se ve como u n a regin de espacio distinta (Palmer, 1992;
Palmer y Rock, 1994). Observe que en este ejemplo la regin comn predomina sobre la proximidad. Ya que los crculos estn
en regiones distintas, no se agrupan entre s, como en la figura
5.18a, sino con crculos de la misma regin.
Conexin uniforme El principio de la conexin uniforme establece que una regin conectada de propiedades visuales,
como luminosidad, color, textura o movimtento, se percibe como una
unidad. Por ejemplo, en la figura 5.18c, los crculos conectados
se perciben como parte de un grupo, del m ismo modo gue
cuando estaban en la misma regin en la figura 5.18b.

Figura 5.15 1 Qu est n viendo? Lo que sea, Tiger Woods


y Phil Mickelson se pueden vincular en el plano percept ual
debido a las orientaciones similares de sus brazos, palos de
golf y cuerpos.
106

CAPITULO 5

Percepcin de objetos y escenas

Sincron a El principio de sin crona establece que los


eventos visuales que ocurren al mismo tiempo se perciben juntos. Por
ejemplo, las luces de la figura 5.18d que parpadean al mismo
tiempo se perciben juntas.
Destino comn La ley del destino comn establece que
las cosas qtte se mueven en la misma dileccin parecen estar agrupadas. As, cuando usted mira u n a bandada de cientos de aves

a)

_,

b) o o o
e)

d)

-~- -~-

Figura 5.18 1 Agrupamient o por a) proximidad; b) regin


comn; e) conexin, y d) sincrona. La sincrona ocurre
cuando las luces amarillas parpadean al mismo tiempo.

,-

,.t

, 1

,...(

~'

,.

. .. -

,-

_,
- ....-

,-

-~-- ~~---~~ ~~~ ~--~- ~-

;...-

.~

--

--

~-

---'

--

--

Figura 5.19 1 Una bandada de aves que se mueven en la

vola ndo juntas, riende a verla como un a unidad, y si algunas


aves comien zan a volar en o rra direccin, esto crea una nueva
unidad (figura 5.19). Observe que el d estino comn es como
la sincrona porque ambos principios son dinmicos, pero la
sincrona puede ocurrir sin movimiento y los elementos no tienen que cambiar en la misma direccin en que lo hacen 1\/.1
~ 14
.
.
en eId estmo comun.
Significa cin o familiarid ad Segn la ley de la familiaridad , las cosas que fo rman patrones que son familiares o significativos tienden a agruparse (Helson , 1933; Hochberg, 197 1).
Puede apreciar cmo influye la significacin en la organi zacin
perceptual realizando la siguiente demostracin .

misma direccin se aprecia como un grupo. Cuando una


parte de la bandada cambia de direccin, su movimiento crea
un nuevo grupo. Esto ilustra la ley del destino comn.

DEMOST RAC I N

Encontrar rostros en un paisaje


Considere la pintura de la figura 5.20. A primera vista esta
escena parece contener principalmente rboles, rocas y agua.
Pero con una inspeccin ms detallada puede ver algunos
rostros en los rboles del fondo, y si observa con ms atencin

Si desea
Figura 5.20 1 El bosque tiene ojos, de Bev Doolittle (1984). Puede encontrar los 13 rostros ocultos en esta pintura?

obtener la solucin, pngase en contacto con el autor en bruceg@email.arizona.edu .

El enfoque de la gestalt para la percepcin de objetos

107

puede ver q ue varios grupos de rocas forman rostros. Trate de


encontrar los 13 rostros ocultos en esta pintura. 1

A algunas personas les resulta difcil percibir los rostros a


primera vista, pero despus lo logran. El cambio en la percepcin de "rocas en un arroyo" o "rboles en un bosque" es un
cambio en la organizacin perceptual de las rocas y los rboles.
Las dos formas que percibi al principio como dos rocas separadas en el arroyo se agruparon perceprualm ente cuando se
convirtieron en los ojos de un rostro. De hecho, una vez que usted percibe u n agrupamient o de rocas como un rostro, despus
le resulta difcil no percibirlas de este modo, pues se quedan
organizadas permanentem ente como un rostro. Esto se parece
al proceso que observamos para el dlmata. Una vez que vemos al dlmata, desp us resulta difcil no percibirlo.

Segregac in perceptu al: separaci n


de los objetos de su fondo
Los psiclogos de la gestalt tambin queran explicar la segregacin perceptual, es decir, la separacin perceptual de un objeto
de otro, como Jo hizo Roger cuando percibi y separ los edificios de la figura 5.1. La cuestin de qu ocasiona la segregacin
perceptual suele llamarse problema de la segregacin figurafondo. Cuando mira mos un objeto separado, por lo general lo
vemos como una figu ra que sobresale de u n segundo plano, el
cual se llama fondo. Por ejemplo, usted podra ver un libro o un
docu mento sobre su escritorio como figura y la superficie del escritorio como fondo. Los psiclogos de la gestalt deseaban derenninar las propiedades de la figura y el fondo y qu hace que
percibamos un rea como figura y la otra como fondo.
Cules son las propieda des de la figura y
del fondo? Una manera en que los psiclogos de la gestalt
estudiaron las propiedades de la fig ura y del fondo fue analizando patrones como el de la figura 5.21, que fue presentado
por el psiclogo dans Edgar Rubn en 1915. Este patrn es un
ejemplo de figura-fond o reversible porqu e se puede percibir ya
sea como dos rostros azules vindose uno al otro en un fondo
blanco o como un jarrn en un fondo azul. Algunas propiedades de la figura y del fondo son:

La figura parece ms "una cosa" y se recuerda con ms


faci lidad que el fondo. Por ello, c uando usted ve el jarrn
como figura, parece un objeto que puede recordar despus. En cambio, cuando ve la misma rea blanca como
fondo, no parece ser un objeto y por lo tanto n o es 1\/.l
. l armente 1aC1
e - "l d e recor d ar.
t..:!:..J 15
parncu
La figura se percibe enfrente del fondo. Por ello, cuando ve
el jarrn como figura, ste parece esrar enfrente del fondo
oscuro (figura 5.22a), y cua ndo ve los rostros como figu ra,
stos se encuentran sobre el fondo claro (figura 5.22b).
El fondo se ve como material sin forma y parece extenderse
detrs de la figura.
El contorno que separa la figura del fondo parece pert enecer a la figura. Esta propiedad de la figura, llamada
108

CAPITULO 5

Percepcin de objetos y escenas

Figura 5.21 1 Una versin de la figura reversible


de rostros-jarrn de Rubin.

a)

b)

Figura 5 .22 1 a) Cuando el jarrn se percibe como figura,


se ve enfrente de un fondo oscuro homogneo. b) Cuando los
rostros se ven como figura, se ven enfrente de un fondo claro
homogneo.

prin cipio de pertenencia o de borde, significa que, aun


cuando la figura y el fondo comparten un contorno, el
borde pertenece a la figura. La figura 5.23 ilustra el pri ncipio de pertenencia o de borde para otra imagen que se
puede percibir de dos maneras. Si usted percibe la imagen
de la figura 5.23a como un cuadro gris claro (la figura) sobre un segundo plano oscuro (el fondo), entonces el borde
pertenece al cuadro gris, como lo indica el punto en la figura 5.23b. Pero si percibe la imagen como un cuadro con
una oquedad (la figura) a travs de la cual ve una superficie gris {el fondo), el borde est ara en el cuadro oscuro,
como se mu estra en la figura 5.23c.
Qu factores determin an qu rea es la
figura? Qu factores determ inan si un rea se percibe
como figura o como fondo? Shaun Vecera y colaboradore s
(2002) utilizaron el mtodo fenomenolg ico (vase la pgina
13) para mostrar que tendemos ms a percibir como figura las
regiones de la parte inferior de una imagen que las regiones
de la parte superior. Mostraron a sus observadores estmulos
como los de la figura 5.24a durante 150 milisegundo s (ms) y
les preguntaron qu rea vea n como figura, la roja o la verde.
Los resultados, que se muestran en la figura 5.24b, indican que
para las imgenes superior-inferior, los observadores percibie-

a)

b)

e)

Poro ms?

Rojo o amarillo?

Figura 5.23 1 a) Esta imagen se puede percibir de dos


maneras. b) Cuando se percibe como un cuadro pequeo
sobre un segundo plano oscuro, el borde pertenece al cuadro
pequeo, como lo indica el punto. e) Cuando se percibe
como un cuadro oscuro grande con una oq uedad, el borde
pert enece al cuadro oscuro.

b) rea ms pequea

a) Simetra
Cruz vertical-horizon tal

Cruz inclinada

Vertical-horizontal o inclinada?
e) Orientacin vertical u horizontal

Oscuro o claro?
d) Significado (ondas)

Figura 5.25 1 Ejemplos de cmo a) la simetra, b) el


tamao , e) la orientacin y d) el significado contribuyen
a percibir un rea como figura.

a)

vertical-horiz ontal. En la figura 5.25d (significado), el hecho


de que las reas oscuras parezcan ondas incrementa ~ 16
L
las probabilidad es de ver esta rea como figura.

Inferior vista
como figura

Las "leyes" de la gestalt como


heurstic os

Izquierda vista
como figura

b)

Figura 5.24 1 a) Estmulos de Vecera et al. (2002).


b) Porcentaje de intentos en los que los observadores
vieron las reas inferior o izquierda como figura.

ron en ms ocasiones el rea mferior como figura, pero para


las imgenes izquierda-der echa, mostraron slo una pequea
preferencia por la regin izquierda. A partir de este resultado,
Vecera concluy que no h ay una preferencia izquierda-de recha para determ inar la figura, pero s hay una clara preferencia
para ver los objetos inferiores de una imagen como la figura.
La conclusin de este experimento es que tendemos a ver como
figura la regin inferior de una imagen .
La figura 5.25 ilustra otros cuatro factores que ayudan a
determinar qu rea se ver como figura. En la figura 5.25a (simetra), las reas simtricas rojas de la izquierda se ven como
fig ura, as como las reas simtricas amarillas de la derecha. En
la figura 5.25b (rea m s pequea), se tiende a ver como figura
el rea ms pequea en fo rma de signo ms. En la figura 5.25c
(reas vertical u hori:wntal), se tiende a ver como figura la cruz

Aunque los psiclogos de la gestalt llamaron a sus principios


"leyes de la organizacin p erceptual", la mayora de los psiclogos p ercepruales los llaman "principios" o "heursticos" de la
gesralt. La razn para rechazar el t rmino leyes es que las reglas de la organizacin y la segregacin perceptuales propuestas por los psiclogos d e la gestalt no hacen predicciones lo
suficientemen te slidas para calificarlas como leyes. Ms bien,
los principios de la gestalt se definen mejor como heursticos,
que son normas generales que brindan la mejor suposicin para
la solucin de un problema. Podemos entender qu son los
heursticos comparndol os con otro modo de resolver un problema, llamado algoritmos.
Un algoritmo es un procedimient o que garantiza la solucin
de un problema. Un ejemplo de algoritmo son los procedimientos que aprendemos para la suma, la resta y la divisin larga. Si
se aplican correctament e estos procedimient os, siempre se obtendr la respuesta correcta. En cambio, un heurstico quiz no
d como resultado una solucin correcta. Por ejemplo, suponga
que desea encontrar un gato que est oculto en algn lugar de su
casa. Un algoritmo para hacerlo sera buscar sistemticam ente
en cada habitacin de la casa (teniendo cuidado de que el gato
no pase inadvertido!). Si hace esto, encontrar al gato despus

El enfoque de la gestalt para la percepcin de objetos

109

de todo, aunque podra tardar un poco. Un heurstico para encontrarlo sera buscar primero en los lugares donde a l le gusta
esconderse, as que buscara debajo de la cama y en el armario.
Esto tal vez no siempre sirva para hallarlo pero, si lo hace, tiene
la ventaja de ser ms rpido que el algoritmo.
Decimos que los p rincipios de la gestalt son heursticos
debido a que, al igual que estos ltimos, son reglas de la mejor
suposicin que funcionan la mayora de las veces, pero no por
fuerza todas las veces. Por ejemplo, considere la siguiente
situacin en la que las leyes de la gestalr podran provocar una
percepcin incorrecta: al caminar por el bosque, de repente se
detiene aterrado porque cerca de usted ve lo que parece ser un
animal al acecho detrs de un rbol (figura 5.26a). Las leyes de
la organizaci n de la gestalt intervienen en la creacin de esta
percepcin. Usted ve dos formas a la izquierda y a la derecha del
rbol como si fueran un solo objeto debido a la ley de la semejanza de la gestalt (como ambas formas son del mismo color, es
probable que sean parte del mismo objeto). Adems, la buena
continuaci n conecta estas dos partes porque la lnea que corre
a lo largo de la parte superior del objeto se extiende suavemente
de un lado al otro del rbol. Por ltimo, la imagen se parece a
animales que usted ha visto antes. Por todas estas razones, no es
raro que usted perciba los dos objetos como parte de un animal.
Como usted reme que el animal sea peligroso, toma otra
ruta. A medida que rodea el rbol, observa que las formas oscuras no eran un animal, sino dos pequeos troncos de rboles
con formas extraas (figura 5.26b). Entonces, en este caso, las
leyes de la gestalt lo confundier on.
El hecho de que los heursticos son ms rpidos que los
algoritmos ayuda a explicar por qu el sistema perceptual est
diseado para funcionar de un modo que en ocasiones produce
errores. Considere, por ejemplo, cul sera el algoritmo para determinar qu es en realidad la forma de la figura 5.26a. Implicara caminar alrededor del rbol, para que pueda verlo desde
diferentes ngulos y tal vez mirar ms de cerca los objeros que
hay detrs de l. Aunque esto producira una percepcin acertada, es lento y potencialm ente riesgoso (qu tal si la forma es
en realidad un animal salvaje?).
La ventaja de nuestras normas generales basadas en la gesralt es que son rpidas y correctas la mayora de las veces. La

razn de que funcio nen casi siempre es que reflejan propiedades del entorno. Por ejemplo, en la vida coridiana, los objetos
que estn parcialmen te ocultos a m enudo "aparecen en el otro
lado" (buena continuaci n) y con frecuencia tienen grandes
reas similares del mismo color (semejanza). Ms adelante en
el captulo regresarem os a la idea de que la percepcin depende
de lo que sabemos acerca de las propiedade s del entorno.
Aunque el en foq ue de la gestalt se remonta a los inicios de
la dcada de 1900, an se considera una forma importante
de pensamien to para la percepcin. Investigado res modernos
han hecho experimen tos como el de Vecera (figura 5.24) para
estudiar algunos principios de la organizaci n y la segregacin
perceptuale s propuestos por los psiclogos de la gestalt, pero
tambin han considerad o otros aspectos adems de la organizacin y la segregacin. Ahora describirem os un enfoque para
la percepcin de objetos ms reciente llamado reconocimiento
por componentes que est diseado para explicar cmo reconocemos los objetos.

Teora del recon ocimi ento


por comp onent es
Cmo reconocemos los objetos que hay en el entorno con base
en la imagen que se crea en la retina? La teora del reconocimiento por componen tes (RPC), formulada por Irving Biederman (1987), responde esta pregunta proponiend o que n uestro
reconocimi ento de los objetos se basa en caractersti cas llamadas geones, un trmino que significa "iones geomtricos" porque, as como los iones son unidades bsicas de molculas (vase
la pgina 29), estos geones son unidades bsicas de objetos. La
figura 5.27a muestra varios geones, que son formas como cilindros, slidos rectangula res y pirmides. Biederman propuso 36
geones distintos y sugiri que esta cantidad es suficiente para
permitirnos representar mentalmen te la gran mayora de los
objetos que podemos reconocer con facilidad. La figura 5.27b
muestra algunos objetos construido s a partir de geones.
Para entender los geones, necesitamo s presen tar el concepto de propiedad es no accidental es (PNA). Las PNA son las

Figura 5.26 1 a) Qu acecha detrs del


rbol? b) Son dos tocones de rbol con formas
extraas, no un animal!

110

CAPTULO 5

Percepci n de objetos y escenas

3
b) Objetos

a) Geones

Figura 5.27 1 a) Algunos geones. b) Algunos objetos creados a partir de estos geones. Los
nmeros en los objetos indican qu geones se utilizaron. Observe que los objetos reconocibles se
pueden formar combinando slo dos o tres geones. Observe tambin que las relaciones entre los
geones son importantes, como lo ejemplifican la taza y la cubeta. (Reimpresa de "Recognition-byComponents: A Theory of Human lmage Understanding", de l. Biederman, 1985, Computer Vision,
Graphics and lmage Processing, 32, 29- 73. Copyright 1985, con permiso de E/sevier.)

propiedades de los bordes en la imagen retiniana que corresponden a las propiedades de los bordes en el entorno tridimensional. La siguient e demostracin ilustra esta caracterstica de
las PNA.
DEMOSTRACIN

Propiedades no accidentales
Cierre un ojo y mire una moneda frente a usted, de manera que
su lnea visual sea perpendicular a ella, como se muestra en la
figura 5.28a. Al hacer esto, el borde de la moneda crea una imagen curva en la retina. Ahora inclnela, como en la figura 5.28b.
El borde de esta moneda inclinada sigue creando una imagen de
un borde curvo en la retina. Ahora inclnela de manera que slo
vea su borde, como en la figura 5.28c. Al verlo de esta manera,
el borde de la moneda crea una imagen de un borde recto en la
retina. 1

-- -- - -- - -

En esta demostracin, la propiedad de curvatura se llama


propiedad no accidental, porque la nica vez que no ocurre es
cuando se ve la moneda con el borde hacia el frente. Como este
punto de observacin del borde ocurre con poca frecuencia, se
llama perspectiva accidental. As, la gran mayora de sus vistas de objetos circulares producen una imagen curva en la retina. De acuerdo con el RPC, la imagen de un borde curvo en la
retina indica la presencia d e un borde curvo en el entorno.
El RPC sugiere que una propiedad clave de los geones es
que cada tipo de gen tiene un conjunto nico de PNA. Por
ejemplo, considere el gen de slido rectangular de la figura
5.29a. Las PNA de este gen son tres bordes rectos paralelos.
Puede comprobar que estos bordes son PNA viendo un slido
rectangular (como un libro) desde diferentes ngulos, como se
muestra en la figura 5.30. Al h acerlo, observar que la mayora
de las veces puede ver tres bordes rectos paralelos, como en las
figuras 5.30a y b. La figura 5.30c muestra lo que sucede cuando
se ve el libro desde una perspectiva accidental. Los tres bor-

---------~(fl

~~

-- - --- ~ ~

Objeto

~
-.
~
a)

Imagen en la retina
b)

e)

Figura 5.28 1 Lo que sucede con la imagen de una moneda en la retina al inclinarla. La mayora de las vistas, como a) y b),
crean una imagen curva en la retina. El raro punto de observacin accidental mostrado en e) crea una imagen de una lnea recta
en la retina.
Teora del reconocimiento por componentes

111

--------a)

Figura 5.29 1 a) Gen de slido rectangular. Los tres


bordes paralelos resaltados son la propiedad no accidental
de este gen. b) Gen cilndrico. Los dos bordes paralelos
resal tados son la propiedad accidental de este gen.

b)

a)

e)

Figura 5.30 1 La propiedad no accidental (PNA) de tres


bordes paralelos de este libro se aprecia aunque el libro se
observe desde disti ntos ngulos, como en a) y en b). Al verlo
desde una perspectiva accidental, como en e), est a PNA no
se percibe.

des paralelos no son visibles desde esta perspectiva, as como


la curvatura de la moneda no era visible al ver sta desde una
perspectiva accidental.
Las PNA del gen cilndrico de la figura 5.29b son dos
bordes rectos paralelos, que usted puede apreciar al ob servar
desde distintos ngulos un objeto cilndrico, como un lpiz o
una pluma. Al igual que el gen rect a ngular, el gen cilndrico
tiene una perspectiva accidental desde que no se aprecian las
PNA (cul es la p erspectiva accidental del cilindro?).
El hecho de qu e cada gen tenga un conjunto nico de
PNA da como resultado una propiedad d e los geones llamada

a)

discriminacin, esto es, que cada gen se puede discriminar


de otros geones. ELhecho de que las PNA sea n visibles desde la
mayora de los puntos de observacin da como resu ltado otra
propiedad de los geones, la invarianza de la perspectiva (vase
la pgina 103), es decir, Los geones se pueden identificar al verlos desde la mayora de los puntos de observacin.
El principio fundamen tal de la teora del reconocimiento
por componen tes es que si podemos percibir los geones de u n
objeto, podemos identificar st e (vease tambin Biederman y
Cooper, 1991; Biederman, 1995). La capacidad para identificar
un objeto si podemos identificar sus geones se llama principio
de la recuperacin por componentes. En este principio se basa
nuestra capacidad de identificar objetos en el entorno natural
aunque partes de los objetos estn ocultas por otros objetos. La
figura 5.3 la muest ra una situacin en la que no puede ocurrir
la recuperacin por componentes porque el ruido visual est
distribuido de manera que no permite identificar los geones
del objeto. Por suerte, las partes de los objetos raras veces est n
cubiertas d e esta manera en el entorno natural as que, como
vemos en la figura 5.31b, u sualmente podemos identificar los
geones y por ello somos capaces de identificar el objeto.
Otra ilustracin del hecho de que nuestra capacidad para
identificar objetos depende de nuestra capacidad para identificar los geones de los objetos se muestra con la tetera de la figura
5.32a. Cuando la vemos desde la perspectiva inusual mostrada
en la figura 5.32b, no podemos identificar algunos de sus geones bsicos, por lo que es ms difcil identificarla en la figura
5.32b que en la fig ura 5.32a.
La teora RPC tambin es tablece que podemos reconocer
los objetos con base en una cantidad relativamente pequea de
geones. Biedennan (1987) realiz u n experimento para demostrar esto, por medio de la presentacin breve de dibujos lineales de objetos con t odos sus geones y sin algunos de ellos. Por
ejemplo, el aeroplano de la figura 5.33a, que tien e u n total de
nueve geones, se muest ra con slo tres de ellos en la figura
5.33b. Biedennan encontr que los observadores reconocieron

b)

Figura 5.31 1 a) Es d ifcil identificar el objeto que est detrs de la mscara, ya que sus g eones han quedado cubiertos.
b) Ahora que es posible distinguir los geones, el objeto se puede identificar como una linterna. (Reimpresa de "Recogni tionby-Components: A Theory of Human lmage Understanding", de/. Biederman, 1985, Computer Vision, Graphics and lmage
Processing, 32, 29-73. Copyright 1985, con permiso de Elsevier.)
112

CAPiTULO 5

Percepcin de objetos y escenas

<=

~
o

"'
c; ...__ _ _ _,.a..__ _ __
ru

b)

a)

a)

b)

Figura 5.33 1 Un ae ropla no, re presentado a) con nueve


geones y b) c on t res geo nes. (Reimpresa de "Recognition-

Figur a 5 .32 1 a) Un obje to comn.


b) El mismo objeto visto desde un
punto d e obse rvacin que oculta la
mayora de sus geones. Esto hace
que s ea ms difcil reconocerlo .
en la text ura de sus plumas o las marcas de sus a las. De igual
modo, hay algunas cosas en el en torno, como las n ubes, qu e
son d ifciles de crear u tilizando geones (aun que incluso las nub es en ocasiones tienen formas en las que se pueden apreciar
los geones, lo q ue nos hace ver "objetos" en el cielo).
No resulta extrai1o que h aya cosas que la RPC no puede
explicar ya que el propsito d e esta teora no es responder todo
acerca de la percepcin de objetos. Por ejemplo, aunque los
bordes d esempean un papel imp ortante en la RPC, la t eora
no est relacionada con el rpido proceso que nos per mite percibir estos bordes. Tampoco tiene que ver con los proceso s qu e
intervien en en la agrupacin de objetos (de lo cual se encarga el
enfoque gestalt) ni con la manera en que aprend emos a reconocer distintos tipos de objetos.
Sin embargo, la RPC proporciona explicaciones para a lgunos fenmenos important es, como la inva rianza a la vista y la
informacin mnima necesaria para id entificar objetos. Algunas de las teoras cientficas ms elegantes son simples y brindan expl icaciones pa rcia les, dejando que otras t eoras completen el trabajo. Este es el caso de la RPC.

by-Components: A Theory of Human lmage Understanding",


de/. Biederman, 1985, Comp uter Vision, Graphics and lmage
Processing, 32, 29-73. Copyright 19 85, c on permiso de
E/sevier.)

1. Cules son algunos de los problemas que dificultan la

objetos de nueve geones como el aeroplano aproximadament e


78% de las veces con slo tres geones y 96% de las veces con seis
geones, y los objetos de seis geones 92% de las veces aunque les
faltara la mitad d e los geo nes.
La t eora RPC explica muchas observacion es acerca de la
percepcin de objetos con base en su forma, pero para a lgunos
est udiantes es difcil aceptar la idea de que nuestra percepcin
de u n objeto complejo com ienza con la percepcin de cara ctersticas como los geones. Por ejemplo, u no de mis alu mnos,
qu ien despus de leer los primeros cu atro captulos del libro
estaba aparent ement e convencido de que la percepcin es un
proceso complejo, al leer sobre la t eora RPC escribi: "Nuestra
visin es demasiad o compleja para ser det erminada por u nos
cuantos geones".
Podemos responder a la inquietud d e est e estudiame de
varias m aneras. En primer lugar, hay factores adems de los
geones que nos ayudan a id emificar objetos. Por ejemplo, podemos distin gu ir em re dos aves con la m isma fo rma basndonos

percepcin de objetos para las computadoras pero no


para los seres humanos?
2. Qu e s el e structuralis mo y por qu los psiclogos de
la gestalt propusieron una alternativa para esta ma nera
de ver la percepcin?
3. Cmo explicaron los psiclogos de la gestalt la organizacin perceptual?
4. Cmo describieron los psiclogos de la gestalt la
segregacin figura-fondo?
5 . Qu propiedades de un estmulo tienden a propiciar
que veamos un rea como "figura"? Asegrese de
entender el e xperimento de Vecera, que demostr que
vemos como figura la regin superior de una imagen.
6. Cmo explica la teora RPC la manera en que reconocemos los objetos? Cules son las propiedades de los
geones y cmo nos permiten estas propiedades identificar objetos desde distintos puntos de observacin y
otros que estn parcialmente ocultos?

Teora del reconocimiento por componentes

113

Percepcin de escenas y objetos


en escenas
Hasta ahora nos hemos enfocado en los objeros individ uales.
Pero rara vez vemos objetos aislados. As como solemos ver actores en una obra sobre un escenario, tambin vemos objeros
dentro de una escena (Epstein, 2005). Una escena es una visea
de un entorno real que contiene 1) elementos de fondo y 2} varios objetos que estn organizados d e una manera que tiene
sen tido tanto para ellos como para el fondo (Epstein, 2005;
Henderson y Hollingworth, 1999).
Una manera de d istinguir entre objetos y escenas es que
los objetos son compactos y se acta con base en ellos, mientras
que las escenas se extienden en el espacio y se acta dentro de
ellas. Por ejemplo, s vamos caminando por la calle e introducimos una carta en un buzn, estamos actuando con base en el
buzn (un objeto) y actuando dentro de la calle (la escena).

Percepcin de la totalidad de una escena


Percibir escenas presenta una paradoja. Por un lado, las escenas
suelen ser largas y complejas. Sin embargo, pese a este tamao
y complejidad, usted puede identificar la mayora de las escenas vindolas slo durante una fraccin de segundo. Esta descripcin general del tipo de escena se llama totalidad de una
escena (geist). Un ejemplo de su capacidad para percibir con
rapidez la totalidad de una escena es la manera en que puede
cambiar de inmediaro d e un canal de televisin a otro y an as
captar el significado de cada imagen que ve (una persecucin
en auto, los participantes de un programa de concurso o una
escena exterior con montaas), aunque slo vea la imagen durante un segundo o menos. Cuando hace esto, est percibiendo
la totalidad de cada escena (Oliva y Torralba, 2006).
Las investigaciones han demostrado que es posible percibir
la totalidad de una escena en una fraccin de segundo. Mary
Potter (1976} mostr a sus observadores una imagen objetivo
y luego les pregunt si haban visco esa imagen entre una secuencia de 16 imgenes presentadas rpidamente. Sus observadores
pudieron verla con una precisin de casi 100%, aun cuando les
presentaron las imgenes slo durante 250 ms (milisegundos;
1/ 4 de segundo). Aunque slo les proporcionaron una descrip-

Nia
aplaudiendo

Descripcin

cin de la imagen objetivo, como "nia aplaudiendo", los observadores lograron una precisin de casi 90% (figura 5.34).
Li Fei-Fei y su s colaboradores (2007) u tilizaron otro enfoque para detenninar la rapidez con la que las personas pueden percibir escenas. Primero presentaron a los observadores
imgenes de escenas durante la psos que iban de 27 a 500 ms
y luego les pidieron que redactaran una d escripcin de lo que
vieron. Este mtodo para determinar la respuesta del observador es un buen ejemplo del mtodo fenomenolgico, descrito
en la pgina 13. Fei-Fei utiliz un procedimiento llamado enmascaramiento para asegurarse de que los observadores f\f.l
.
1as unagenes
. '
.
.
deseado.
L.:!:..J 17
v1eran
JUSto
e1tlempo

MTODO

Para presentar un estmulo, como una imagen, durante 27 ms


nicamente, necesitamos hacer ms que slo presentar la
imagen por 27 ms, ya que la percepcin de cualquier estmulo persiste casi 250 ms despus de que el est mulo
desaparece, un fenmeno llamado persistencia de la visin.
Por ello, una imagen que se presenta durante 27 ms se percibir con una duracin de hasta 275 ms. Para elim ina r la
persistencia de la visin es necesario presentar un estmulo de
enmascaramiento, que suele ser un patrn de lneas orientadas de manera aleatoria, inmediatamente despus de la
presentacin de la imagen. Esto detiene la persistencia de
la visin y limita el tiempo que se percibe la imagen.
En la figura 5.35 se muestran los resultados tpicos del experimento de Fei-Fei. Con breves duraciones, los observadores
vieron slo reas claras y oscuras de las imgenes. Con 67 ms
pudieron identificar algunos objetos grandes (una persona, una
mesa), y cuando se increment la duracin a 500 ms identificaron objetos ms pequeos y detal les (al chico, la laptop). Con
ot ra imagen, de una estancia adornada al estilo siglo XI X,
los observadores la iden tificaron como una habitacin de una
casa con 67 ms, y distinguir detalles, como sillas y retratos, con
500 ms. Por tanto, primero se percibe la totalidad de la escena
y despus los detalles y pequeos objetos que h ay en ella.

250ms

Uso de una mscara para


presentar brevemente un
estmu lo

250 ms

250ms

Fig u ra 5,34 1 Procedimiento para el experimento de Potter (1976). Primero present a sus observadores una fotografa objetivo
o, como se muestra aqu, una descripcin y luego les present rpidamente 16 imgenes durante 250 ms cada una. La tarea del
observador era indicar si se haba presentado la imagen objetivo. En este ejemplo slo se muestran tres de las 16 imgenes, y la
imagen objet ivo es la segunda imagen presentada. En otras pruebas, la imagen objetivo no est incluida en la serie de 16 imgenes.

114

CAPTULO 5

Percepcin d e objetos y escenas

Grado de aspereza. Las escenas lisas (poca aspereza) como


la playa contienen pocos elementos pequeos. Las escenas
con mucha aspereza como el bosqu e cont ienen muchos
elemenros pequeos y son ms complejas.

27 ms

Pareca algo oscuro en el centro con cuatro lfneas rectas


que sobresalan contra un fondo blanco.
(Sujeto: AM)

40 ms

Lo primero que vi fue una mancha oscura en med1o.


Pudo haber sido una forma rectangular con la parte
superior curva .. pero slo es una suposicin.
(Sujeto. KM)

67 ms

Una persona. creo, sentada o agachada. En la parte


izquierda de la foto. Vemos principalmente su perfil.
Estaban en una mesa o un lugar donde habla un objeto
frente a ellos (a su izquierda en la fotogralfa).
(Sujeto: EC)

500 ms Parece un padre o alguien ayudando a un chico pequeo.


El hombre tenia algo en sus manos. como una pantalla de
LCD o una laptop. Pareca que estaban de pe en un cubculo
(Sujeto: WC)

Figura 5 .35 1 Las descripciones de los observad ores


de una fot ografa presentada en el experimento de Fei-Fei
(2007). La duracin de las p resentaciones se indica a la
izquierda. (Tomada de Fei-Fei, L., /yer, A., Koch C. y Perona,
P. (2007). What do we perceive in a g /ance of a real world
scene? Journal of Vision, 7, 1-29, figura 13. ARVO.)

Qu permite a los observadores percibir con rapidez latotalidad de una escena? Au de Oliva y Antonio Tonalba (2001,
2006) proponen que los observadores se valen de informacin
llamada caractersticas de una imagen global, que se pueden
percibir rpidamente y se relacion an con tipos especficos de
escenas. Algunas de las caractersticas de una imagen global
propuestas por Oliva y Tortalba son:

Grado de naturalidad. Las escenas naturales, como la playa


y el bosque en la figura 5.36, tienen zonas texturizadas y
contornos ondulantes. En las escenas hechas por el hombre, como la calle, predominan las lneas rectas horizontales y verticales.
Grado de apertura. Las escenas abiertas, como la playa, suelen tener una lnea del horizonte visible y contener algunos objetos. La escena de la calle tambin es abierta, aunque n o tanto como la playa. El bosque es un ejemplo de
una escena con un bajo grado de apertura.

Grado de expansin. La convergencia de lneas paralelas,


como la que se aprecia al observar vas de tren que parecen
desaparecer en la distancia, o en la calle de la figura 5.36,
indica una alto grado de expansin. Esta caracterstica depende de manera especial de la perspectiva del observador.
Por ejemplo, en la escena de la calle, ver directamente a un
lado de un edificio da como resultado poca expansin.
Color. Algunas escenas tienen colores caractersticos, como
las escenas de la playa (azul) y del bosque (verde y caf)
(Goffaux et al., 2005).
Las caractersticas globales de la imagen son holsticas y se
perciben con rapidez. Son propiedades de la escena como un todo
y no dependen de procesos lentos como percibir detalles, reconocer elementos individuales o separar un objeto de otro. Ot ra
propiedad de las caractersticas globales de la imagen es que
contienen informacin que propicia la percepcin de la estructura y distribucin espacial de la escena. Por ejemplo, el grado
de apertura y el grado de expansin se refieren directamente a
las caractersticas de distribucin de u na escena, y la naturalidad tambin proporciona informacin sobre la distribucin
que se deriva de saber si una escen a es "de la naturaleza" o contiene "estructuras hechas por el hombre".
Las propiedades globales de la imagen n o slo nos ayudan
a expl icar cmo pod emos percibir la totalidad de escenas a partir de caractersticas que podemos ver en exposiciones breves,
sino que tambin ilustran la siguiente propiedad general de
la percepcin: nuestras experiencias pasadas en la percepcin
de propiedades del entorno desempean un papel en la determinacin de nuestras percepcion es. Aprendemos, por ejemplo,
que el azul est relacionado con el cielo abierto, que los paisajes suelen ser verdes y lisos, y que las verticales y horizontales se
relacionan con edificios. Las caractersticas del entorno como
stas, que ocurren con frecuencia, se llaman regularidades en
el ambiente. Veamos con ms detalle estas regularidades.

Regularidades en el ambiente:
informacin para la percepcin
Aunque los observadores se valen de las regularidades en el
ambiente para percibir, a menudo no estn conscientes de la
informacin especfica que estn utilizando. Este aspecto de
la percepcin es similar a lo que ocurre cuando usamos el lenguaje. Aunque podemos enlazar con facilidad las palabras para

!.. I!J!!~--~

Figura 5 .36 1 Hay escenas


cuya imagen tiene diferentes
caract ersticas globales. Vase
la descripcin en el texto.
Percepcin de escenas y o bjetos en escenas

115

crear oraciones en las conversaciones, quiz haya personas que


no co nozcan las reglas gramaticales que especifican cmo de ben combinarse estas palabras. De la misma manera, podemos
valernos fcilmenre de n uestro conocimiemo de las regularidades en el ambiente pa ra p ercibir, aunque ta l vez no seamos
capaces de identificar la informacin especfica que usamos.
Podemos distinguir dos tipos de regularidades, las regulmidades fisicas y las regularidades semnticas.
Regularidades fsicas Las regularidades fsicas son
propiedades fsicas del ambiente que ocurren con regularidad.
Por ejemplo, hay ms orientaciones verticales y horizontales
que oblicuas (angu lares) en el entorno. Esto ocurre en un encorno hecho p or el hombre (por ejemplo, los edificios con tienen muchas horizontales y vert icales) y tambin en ambientes
naturales (los rboles y las plantas son ms verticales u horizontales que diagonales) (Coppola et al. , 1998). Por tanto, no
es coincidencia que las personas puedan percibir con ms facilidad orientaciones hori zonrales y verticales que de otro t ipo,
un efecto llamado efecto obl icuo (Appelle, 1972; Campbell et
al., 1966; Orban et al., 1984).
Por qu a l estar expu estos a ms orientaciones verricales y horizontales es ms fcil verlas? Una respuesta es que la
plasticidad dependiente de la expenencia, que vimos en el captulo
4 (pgina 80), ocasiona que el sistema visual renga ms neuronas que responden m ejor a estas orientaciones. El hecho
de que el sistema visual tiene una mayor proporcin de neuronas que responden a verticales y horizontales se ha demostrado en experimentos en los que se h an tomado registros de
una gran cantidad de n euron as de la corteza visual de monos
(R. L. Devalois et al., 1982; vase t ambin Furm ansk i y Engel,
2000, donde encontrar evidencias de que la corteza visual de
los seres h umanos respon de mejor a orientaciones verticales y
horizontales que a otras).
Otra ca racterstica fsica del ambiente es que cuando un
objeto cubre parcialmente a ot ro, el contorno de este lt imo
"aparece en el otro lado". Si esto le suena familiar, se debe a que
es un ejemplo de la ley de la buena continuacin de la gestalt,
que vimos en la pgina 106 y a nalizamos junto con nuestra
"criatura" detrs del rbol en la pgina 11 0 (figura 5.26). Otras

leyes (o "heu rsticos") d e la gestalt tambin reflejan regularidades en el ambienre.


Considere, por ejemplo, la idea de la conexin uniforme. Los
objetos suelen estar definidos por reas del mismo color o textura, as que cuando un rea de la imagen en la reti na tiene la
propiedad de conexin uniforme, es probable que esta rea provenga de una sola forma ambienral (Palmer y Rock, 1994). As,
las regiones conectadas de manera uniforme son regularidades
en el ambienre, y el sistema perceptual est d iseado para interpretar estas regiones de modo que percibamos corre([amence el
entorno. Por ello, los heursticos de la gesralr se basan en los tipos
de cosas que ocurren con tanta frecuencia que los damos por hecho. La siguiente demostracin ilustra otra regularidad fsica.
DEMOSTRACI N

Creacin de formas a partir de sombreados


Qu percibe en la fig ura 5.37a? Alg unos discos parecen sobresalir, a modo de partes de esferas tridimensionales, y otros lucen
como hendiduras? S ve los discos de esta manera, observe que
los que parecen sobresalir forman un cuadro. Despus de ver
esto, voltee la pgina de manera que e l punto quede en la parte
inferior de la ilustracin. Esto cambia su percepcin? 1
Las figuras 5.37b y e muestran que si suponemos que la
luz proviene de a rr iba (que suele ser el caso en el entorno),
en tonces los patrones como los crculos qu e tien en la parte
superior clara seran creados po r un objeto que sobresa le (figura 5.37b), pero un parrn como los crculos que tienen la
parte inferior clara sera creado por un a hendidu ra en una superficie (figura 5.37c). La suposicin de que la luz proviene
de arriba se llama heurstica de la luz proveniente de arriba
(K ieffner y Ramachandran, 1992). Al parecer, las personas suponen que la luz proviene de arriba porque la mayor parte de
ella en n uestro entorno proviene de arriba. Esto incluye al Sol,
as como a la mayora de las fuentes lum inosas artificiales.
Las dos fotografas de la figura 5.38 proporcionan otro
ejemplo de la heur stica de la luz proveniente de arriba. La fi-

Luz

Luz

Vista
frontal

'

Vista
lateral

a)

116

b)

CAPTULO 5

Pe rcep c i n d e objetos y escenas

e)

Figura 5 .37 1 a) Algunos de


estos discos se perciben como si
sobresalieran y otros se perciben
como hendiduras. Por qu? La luz
que provie ne de arriba iluminara
b) la parte superior de una forma
que sobresale y e) la parte inferior
de una hendidura.

Figura 5.38 1 Por qu parecen a)

b)

a)

gura 5.38a muestra hendiduras creadas por personas que caminan en la arena. Pero al poner de cabeza esta foto, como se muestra en la figura 5.38b, entonces las hendiduras en la 1\(.1
~ 18-20
' 1
.
arena se convterten en mont tcu os.
Con esros ejemplos de regularidades fsicas en el ambiente
queda claro que una de las razones por las que los seres h umanos podemos percibir y reconocer objeros y escenas mucho mejor que los robots manejados por computadora es que nuestro
sistema est adaptado para responder a las caractersticas fsicas de nuestro entorno. Pero esta adaptacin va ms all de las
caractersticas fsicas. Tambin ocurre porque hemos aprendido
qu tipos de objetos suele haber en tipos especficos de escenas.
Regularidades semnticas En el lenguaje, semntica se
refie re al significado de las palabras u oraciones. Aplicada a la
percepcin de escenas, la semntica se refiere al significado de las
mismas. A menudo este significado se asocia con la funcin de
una escena (lo qu e sucede en ella). Por ejemplo, la preparacin
de la comida, su coccin y quiz su ingesta tienen lugar en la cocina; la espera, la compra de boleros, el registro de equipaje y el
paso por controles de seguridad se dan en los aeropuertos. Las regularidades semnticas son las caractersticas relacionadas con
las funciones que se rea lizan en los distintos tipos de escenas.
Una manera de comprobar que las personas son conscientes de las regularidades semnticas es pedirles simplemente
que imaginen un tipo particular de escena u objeto, como en la
siguiente demostracin.

hendiduras en la arena y b) montculos


de arena? Vase la explicacin en el
texto.
de esta visualizacin implica captar detalles en estas escenas.
Casi rodas las personas piensan en una oficina con una computadora, libreros y una silla, e imaginan la escena de la tienda
departamental con muchos estantes de ropa, un probador y tal
vez una caja registradora.
Qu vio usted cuando visualiz el microscopio o el len?
Muchas personas dicen que no ven slo un objeto, sino un objeto en un entorno. Quiz usted percibi el entorno del microscopio en una mesa de laboratorio o en un laboratorio, y al len
en un bosque, una sabana o un zoolgico.
Un ejemplo del conocimiento que tenemos de las cosas que
en general pertenecen a ciertas escenas proviene de un experimento en el que Andrew Hollingworch (2005) hizo que sus observadores estudiaran una escena duran te 20 segundos, como
la fotografa del gim nasio de la figura 5.39 (sin los crculos),

DEMOSTRACIN

Visualizacin de escenas y objetos


Su tarea en esta demostracin es simple. Tiene que visualizar o
slo pensar en las siguientes escenas y objetos:
1.
2.
3.
4.

Una oficina
La seccin de ropa de una tienda departamental
Un microscopio
Un len 1

La mayora de la gente que ha crecido en la sociedad moderna no tiene problemas para visualizar una oficina o la seccin de ropa de una tienda departame ntal. Lo importan te
acerca de esta capacidad, para nuestros propsitos, es que parte

Figura 5.39 1 Los observadores de Hollingworth (2005)


vieron escenas como sta (pe ro sin los crculos). En esta
escena, el objetivo es la pesa, aunque los observadores no
saben esto cuando la ven. Las escenas "sin objetivo" son
iguales pero no incluyen el objetivo. Los crculos indican el
error promedio de los juicios que los observadores hicieron
de la posicin del objetivo para los inte ntos en los que lo
vieron en la escena (crculo pequeo) y los intentos en los
que el objetivo no apareci en la escena (crculo grande).
(Tomada de A. Hollingsworth, 2005, Memory for object
position in natural scenes. Visual Cognition, 12, 1003-1016.
Reimpresa con permiso del editor, Taylor & Francis Ltd.,
http://www. tandf. e o. u k/ journals.)

Percepcin de escenas y objetos en es cenas

117

que contena un objetivo, como la pesa en el tapete, o la misma


escena pero sin el objetivo. Luego los observadores vieron una
imagen de un objetivo seguida de una pantalla blanca, y se les
pidi que indicaran dnde estaba el objetivo en la escena (si haban visto que la imagen contena el objetivo) o dnde esperaban
ver el objetivo en la escena (si haban visto la misma imagen
pero sin el objetivo).
Los resultados se indican con los crculos, que muestran el
error promedio de los juicios que los observadores hicieron de
muchos objetos y escenas. El crculo pequeo muestra que los
observadores que vieron los objetivos localizaron con precisin
sus posiciones en la escena. El crculo grande muestra que los
observadores que no vieron los objetivos no fueron tan precisos pero an as pudieron sup oner dnde estaban los objetivos.
Para la escena del gimnasio esto significa que, al parecer, los
observadores pudieron predecir dnde estaba la pesa con base
en su experiencia previa en ver objetos en gimnasios.
Stephen Palmer (1975) ilustr este efecto del conocimiento
semntico sobre nuestra capacidad para percibir, con un experimento en el que utiliz estmulos como la ilustracin de la figura 5.40. Primero present una escena contextua) como la de
la izquierda y luego proyect de manera breve una de las imgenes objetivo de la derecha. Cuando Palmer pidi a sus observadores que identificaran el objeto en la ilustracin meta, stos
lo hicieron correctamente con una hogaza de pan (apropiada
para la escena de la cocina) 80% de las veces, pero identificaron
correctamente el buzn o el tambor (dos objetos que no encajan
en la escena) slo 40% de las ocasiones. Al parecer, los observadores de Palmer utili zaron su conocimiento de una cocina para
percibir la hogaza de pan brevemente proyectada.
El efecto de las regularidades semnticas tambin se ilustra en la figura 5.41, llamada "las mltiples personalidades de
un blob" (Oliva y Torralba, 2007). El blob (masa amorfa) se percibe como diferentes objetos dependiendo de su orientacin y
del contexto en el que se observa. Parece ser un objeto sobre
una mesa en b), un zapato de una persona agachada en e) y un
a utomvil y una persona cruzando la calle en d), pese a que es
la misma forma en todas las ilustraciones.

blob
a)

b)

d)

Figura 5 .41 1 Lo que esperamos ver en distintos contextos


influye en nuestra interpretacin de la identidad del " blob"
encerrado en los crculos. (Parte d) adaptada de Trends in
Cognitive Sciences, Vol. 11, 12, Oliva, A. y Torralba, A., The
role of context in object recognition. Copyright 2007, con
permiso de Elsevier.)

El papel de la inferencia en la percepcin


Las personas se valen de su conocimiento de las regularidades
fsicas y semnticas como las que hemos descrito para inferir lo
que hay en una escena. La idea de que la inferencia interviene
en la percepcin no es nueva; fue propuesta en el siglo XVIII
por Hermano von Helmholtz (1866/19 11), que fu e uno de los
preeminentes fi silogos y psiclogos de su poca.
Helmholtz hi zo muchos descubrimientos en fisiologa y
fsica, desarroll el oftalmoscopio (aparatO utilizado por un optometrista u oftalmlogo para ver en el interior del ojo) y propuso teoras sobre la percepcin de objetos, la visin del color y
la audicin. Una de sus propuestas acerca de la p ercepcin es un
principio llamado teora de la inferencia inconsciente, la cual

m
Escena contextua!

118

CAPTULO 5

Percepcin de objetos y escenas

Objetivo

Figura 5.4 0 1 Estmulos utilizados en


el experimento de Palmer (1975). Primero
se presenta la escena de la izquierda y
luego se pide a los observadores que
identifiquen uno de los objetos de la
derecha.

Revisin del proyecto cientfico: diseo de


una mquina que sea capaz de percibir

a)

Figura 5 .42 1 Por lo general, la ilustracin a) se interpreta


com o b) un rectngulo azul enfrente de un rectngulo rojo.
Sin embargo, podra ser e) un rectngulo azul y una figura
roja de seis lados posicionada de modo apropiado.

establece que algunas de nuestras percepciones son resultado de


suposiciones inconscientes que hacemos acerca del ambiente.
La teora de la inferencia inconsciente fue propuesta para
explicar nuestra capacidad de crear percepciones a partir de
la informacin de un estmulo que se puede ver de varias maneras. Por ejemplo, qu ve usted en la ilustracin de la figura
5.42a? La mayora de las personas perciben un rectngulo azul
enfrente de un rectngulo rojo, como se muestra en la figura
5.42b. Pero, como se indica en la figura 5.42c, esta ilustracin
puede representar una figura roja de seis lados posicion ada ya
sea enfrente o detrs del rectngulo azul. Segn esta teora, inferimos que la figura 5.42a es un rectngulo q ue cubre a otro
rectngulo d ebido a experiencias que hemos tenido en situaciones similares. Una consecuencia de la teora de la inferencia
inconsciente es el principio de l a probabilidad; este ltimo
establece que percibimos el objeto que es ms probable que haya
ocasionado el patrn de estmulos que hemos recibido.
Una razn para que Helmholtz propusiera el principio de
la probabilidad fue estudiar la ambigedad de los estmulos per
ceptuales que describimos al inicio de este captulo. Helmholtz
pens que el proceso d e la percepcin era similar al proceso
para resolver un p roblema. Para la percepcin, el objetivo es determina r qu objeto ocasion un patrn de estimulacin en
pa rt icular, y este problema se resuelve mediante un proceso
en el que el observador aplica su conocimiento del entorno
para inferir qu podra ser el objeto. Este proceso es incons
ciente, de ah el trmino inferencia inconsciente. (Vase una versin moderna de esta idea en Rock, 1983.)
Los psiclogos modernos han medido la certeza de la idea
de Helmholtz acerca de la percepcin como inferencia mediante una tcnica llamada inferen cia bayesiana qu e toma en
cuenta las probabilidades (Kersten ct al., 2004; Yuille y Kersten,
2006). Por ejemplo, suponga que deseamos determinar cun
probable es que llueva maana. Si sabemos que llovi h oy, esto
aumenta las probabilidades de que tambin ocurra maana,
porque si llueve un da es ms probable que tambin suceda al
da siguiente. Aplicando un razonamiento como ste a la percepcin, es posible preguntar, por ejemplo, si un objeto dado
en una cocina es una hogaza de pan o un bu zn. Dado que es
ms probable que en ese lugar h aya una h ogaza de pan, el sis
tema perceptual concluye la presencia del pan. Las estadsticas
bayesianas incluyen este tipo de razonamiento, expresado en
frmulas matemticas que no describiremos aqu.

Ahora estamos listos para regresar al proyecto cientfico


(vanse las pginas 4 y 100) y a plicar nuestro conocimiento de
la percepcin al problema de disear un d ispositivo que pueda
identificar los objetos que hay en el entorno. Ahora es posible
ver que una manera de hacer ms eficaz nuestro d ispositivo sera programarle el conocimiento sobre las reg ularidades en el
ambiente. En otras palabras, una "mquina perceptora eficaz"
podra hacer ms que procesar informacin acerca de la luz, la
oscuridad, la forma y los colores que captara con sus sensores.
Tambin estara "capacitada" para responder mejo r a las regularidades en el ambiente que es ms probable que ocurran, y
estara programada para usar esta informacin a fin de hacer
inferencias acerca de lo que le rodea .
Los di spositivos artificiales para la visin alguna vez
igualarn la capacidad humana para percibir? Con base en
nuestro conocimiento de las complejidades de la percepcin,
es fcil decir "no", pero dados los rpidos avances en el campo
de la visin artificial, no resulta descabellado predecir que con
ei tiempo se desarrollarn mquinas que se acercarn a las capacidades perceptuales humanas. Una razn para pensar que
las mquinas se parecen cada vez ms a los seres humanos es
que en los programas de las computadoras act uales se han comenzado a incorporar procesos de inferencia p a recidos a los
humanos. Por ejemplo, considere el vehc ulo Boss, ganador de
la carrera Urban Challenge, de la CMU (vase la pgina 101). Una
razn para el xiro de Boss fue que estaba programado para
tomar en cuenta los eventos comunes que se presentan al conducir por las calles citadinas.
Considere, por ejemplo, lo que sucede cuando un conductor humano (como usted) se aproxima a una interseccin. Lo
ms probable es que busque u na sei1al de "aleo" y luego determine si se aproximan otros autos a la izquierda o a la derecha.
Si se acercan, observa si tienen una seal de "alto". Si la tienen,
espera que disminuyan la velocidad para detenerse. Si decide
que ellos podran ignora r la luz roja del semforo, usted red uce la velocidad para efectuar la accin apropiada. Si ve que no
se aproximan otros autos, procede a cruzar la interseccin. En
ot ras palabras, conforme con duce, constan temente observa lo
que sucede y roma en cuent a su conocimiento de las normas de
trnsito y las situaciones que ha experimemado en el pasado
para tomar las decisiones apropiadas.
El vehculo Boss est programado para llevar a cabo un
proceso similar de toma de decisiones a fin de saber qu hacer
cuando llega a una interseccin. Determina si otro automvil
se aproxima con sus sensores laterales detectores de objetos.
Luego decide si un objeto es un automvil tomando en cuenta
su tamao y con base en la regla "Si se mueve, es probable que
sea un auto". Tambin est programado para saber que otros
automviles deben detenerse si tienen una seal de "alto". As,
la computadora fue diseada no slo para sentir lo que le rodea, sino tambin para decidir qu hacer en la interseccin de
acuerdo con su conocimiento.
El problema con los sistemas de visin artificiales es que,
para que puedan competir con los humanos, se les tiene que dotar de gra n cantidad de conocimientos. Los sistemas actuales
Percepcin de escenas y objetos en escenas

119

se programan con los conocimientos justos para realizar tareas


especializadas como recorrer la ruta del Urban Challenge. Pese a
que Boss est programado para determinar dnde est la calle y
permanecer en ella, no siempre puede decidir cundo es seguro
conducir fuera del camino. Por ejemplo, no puede distinguir entre pasto alto (que no representara u na gran amenaza al conducir fuera del camino) y un campo lleno de clavos verticales (los
cuales seran muy peligrosos para sus llantas) (C. Urmson, comunicacin personal, 2007). 1
Para programar la computadora de manera que reconozca
el pasto, sera necesario proporcionarle el conocimiento acerca
de l como "El pasto es verde", "El pasto se mueve si hay viento",
"El pasto es plano y llega a un punto". Una vez que Boss tuviera
suficientes daros sobre el pasto para identificarlo con precisin,
entonces se le podra programar para no evitarlo y para transitar
fuera del camino sobre el pasto si fue ra necesario. Todo esto
significa que as como es til tener mucha capacidad informtica, tambin es bueno poseer conocimiento sobre el entorno. El
modelo humano de la mquina capaz de percibir tiene este conocimiento y lo utiliza para percibir con una precisin pasmosa.

La fisiolog a de la percepci n
de objetos y escenas
Se han realizado miles de experimentos para responder la pregunta "Cul es la base neuronal de la percepcin de objetos?".
Ya se ha visto que la percepcin de objetos tiene muchos aspectos, incluyendo la organizacin perceptual, el agrupamiento, el
reconocimiento de objetos y la percepcin de escenas as como
los detalles de las mismas. Primero consideraremos las neuronas
que responden al agrupamiento perceptual y a la figura-fondo.

Neuronas que responden al agrupamie nto


perceptual y a la figura-fond o
Muchos aos despus de que los psiclogos de la gestalt propusieran las leyes de la buena continu acin y de la semejanza, los
investigadores descubrieron neuronas en la corteza visual que
responden mejor a las exposiciones que reflejan estos principios
de agrupamiento. Por ejemplo, la fig ura 5.43a muestra una lnea
vertical en el campo receptivo (que se indica con el cuadro) de
una neurona en la corteza estriada de un mono. La respuesta
de la neurona a esta lnea nica se indica con la barra de la izquierda en la figura 5.43d. No ocurre una activacin cuando se
presentan las lneas fuera del cuadro (Zapadia et al., 1995).
Pero sucede algo interesante cuando agregamos un campo
de lneas orientadas aleatoriamente, como en la figura 5.43b.
Estas lneas, qu e quedan fuera del campo receptivo de la neurona, ocasionan una disminucin en la rapidez con que la neurona
dispara ante la lnea vertical nica. Este efecto de los estmulos
que quedan fue ra del cam po receptivo de la neurona (los cuales
normalmente no afectaran la tasa de d isparos de la neurona)

1
Ch ris Urmson es d ireccor de rccnologia d el Tarran Racing Team de la
Universidad Carnegie Mellon.

120

CAPTULO 5

Percepcin de objetos y escenas

OJ

a)

b)

...

e)

50

"'....o

40

n:J

.~ 30

-e
Q)

-e
n:J

"'
n:J

1-

o
d)

Figura 5 .43 1 La manera en que una neurona de la corteza


estri ada (V1) responde a: a) una lnea orientada dentro del
campo receptivo de la neurona (el cuadro pequeo); b) la
misma lnea rodeada de lfneas orientadas de manera aleatoria,
y e) la lnea cuando se vuelve parte de un grupo de lneas
verticales, debido a los principios de la semejanza y la buena
continuacin. (Adaptada de Zapada, M. K., lto, M., Gilbert, C.
G. y Westheimer, G. {1995]. lmprovement in visual sensitivity
by changes in local context: Para/le/ studies in human
observers and in V1 of alert monkeys. Neuron, 15, 843-856.
Copyright 1995, con p ermiso de Elsevier.)

se llama modulacin contextua!, porque el contexto en el que


aparece la lnea afecta la respuesta de la neurona a dicha lnea.
La figura 5.43c muestra que podemos aumentar la respuesta de la neurona a la lnea acomodando algunas de las lneas que estn fuera del campo receptivo, de manera que queden alineadas con la que est dentro de dicho camp o. Cuando
la buena continuacin y la semejanza hacen que la lnea en el
campo receptivo quede perceptualmente agrupada con estas
otras, la respuesta de la neurona aumenta. Por consiguiente,
esta neurona se ve afectada p or la organizacin gestalt p ese a
que sta implica reas que estn fu era de su campo receptivo.
En la figura 5.44 se mu estra ot ro ejemplo de cmo un rea
fuera del campo receptivo puede afectar la respuesta. Esta neurona, en la corteza visual, responde bien cuando se posicionan
lneas inclinadas a la izquierda alrededor de su campo receptivo (indicado con la barra verde en la figura 5.44a; Lamme,
1995). Observe que en este caso percibimos las lneas inclinadas
a la izquierda como un cuadro en un fondo de lneas inclinadas a la derecha. Sin embargo, al reemplaza r este fo ndo con
lneas inclinadas a la izquierda, como en la figura 5.44b, la
neurona ya no dispara.
Observe que cuando reemplazamos el fondo de lneas inclinadas a la derecha con las lneas inclinadas a la izquierda, el
estmulo en el campo receptivo (las lneas inclinadas a la izquierda) no cambi, sino que nuestra percepcin de estas lneas
pas de ser parte de una figura (en la figura 5.44a) a integrar
el fondo (figura 5.44b). Por tanto, esta n eurona responde a las
lneas inclinadas a la derecha slo cuando stas se ven como
parte de la figura. (Vase tambin Qui y von der Heydt, 2005.)

Corteza
frontal
(CF)

1/)

eca

g. aot------.- ---4

'S
Q)

-e

401-- --

Corteza
occipital (CO)

o
a)

150

300
'

Tiempo (ms)

Amgdala
(A)

120 f -- - - - - -.

e
[

80 1-- - - - -- --f

1/)

:0
Q)

-e

40 1-- -- - - - --i

_L_ _..._

0"---_
b)

150

300

Tiempo (ms)

Figura 5.44 1 Cmo responde una neurona en V1 a


lneas orientadas q ue se presentan a su campo receptivo
(rectngulo verde). a) La neurona respondi cuando las
lneas en el campo receptivo fue ron parte de una figura,
pero no hubo respuesta cuando b) el mismo patrn no fue
parte de una figura . Adaptada de Lamme, V. A. F. (1995).
The neurophysiology of figure-ground segregation in primary
visual cortex. Journal of Neuroscience, 15, 1605-1615.

Cmo responde el cerebro a los objetos?


Cmo son representados los objetos por el disparo de las neuronas en el cerebro? Para responder esta pregunta, revisemos
los principios bsicos de la codificacin sensorial que se vieron
en los captulos 2 y 4.
Revisin de la codificacin sensori al En el
captulo 2 describimos la codificacin especfica, que ocurre si
un objeto es representado por el disparo de una neurona que
reacciona slo ante ese objeto, y la codificacin distribuida, que se
presenta si un objeto es representado por el patrn de disparos de varias neuronas. En el captulo 4 vimos la idea de que
ciertas reas se especializan en procesar informacin acerca
de tipos especficos de objetos. A estas reas especializadas
les llamamos mdulos. Tres de ellas son el rea fusiforme del
rostro (AFR), rea exrraestriada para los cuerpos y el rea parahipocmpica de luga res (APL). Aunque las neuronas de estas
reas responden a tipos especficos de estmulos, no son totalmente especializadas, as que una neurona en particular que
responde slo a los rostros lo hace con varios rostros distintos
(Tsao et al., 2006). Los objetos, segn esta idea, son representados por la codificacin disuibuida, as que u n rostro especfico
sera representado por un patrn de disparos de varias neuronas que reaccionan a los rostros.

Giro fusiforme (GF)


(parte inferior del cerebro)

Figura 5.45 1 Algunas de las reas del cerebro humano


que intervienen en la percepcin de rostros. Algunas
de las funciones perceptuales de estas reas son: CO =
procesamiento inicial; GF = identificacin; A = reaccin
emocional; STS = direccin de la mirada; CF = atractivo.
La amgdala se localiza en las profund idades de la corteza,
aproximadamente debajo de la elipse.

Tambin vimos que aun cuando los mdulos se especializan en procesar informacin acerca de tipos especficos de
estmulos como rostros, lugares y cuerpos, los objetos suelen
provocar la actividad no slo de varias neuronas dentro de un
mdulo, sino tambin de varias reas del cerebro. As, un rostro podra ocasionar gran actividad en la AFR, pero tambin
en otras reas. Por consiguiente, los disparos se distribuyen de
dos maneras: 1) en grupos de neuronas dentro de un rea especfica, y 2) en distintas reas del cerebro.
Ms evidencias de la actividad distribuida
a lo largo del cerebro Comenzaremos nuestro anlisis donde lo dejamos en el captulo 4: con la idea de que los
objetos provocan actividad en varias reas cerebrales. Los rostros proporcionan uno de los mejores ejemplos de la representacin distribuida a lo largo del cerebro. Sabemos que el rea
fusiforme del rostro (AFR) se especializa en procesar informacin acerca de los rostros, porque responde a ilustraciones de
los mismos pero no a ilustraciones de otros tipos de estmulos.
Pero percibir un rostro implica mucho ms que simplemente verlo e identificarlo como tal, o incluso como "el rosrro
de Bill". Despus de que usted define un rosuo como, digamos,
su amigo Bill, podra tener una reaccin emocional hacia Bill
con base en la expresin de su rostro o en su experiencia pasada con L Podra observar si lo ve directamente a usted o hacia
un lado. Podra incluso pensar en Jo atracrivo (o poco atractivo)
que es. Cada una de estas reacciones a los rostros se ha vinculado con la actividad en distintas reas del cerebro.
La figura 5.45 muestra algunas de las reas que intervienen en la percepcin de los rostros. El procesamiento inicial de
los mismos ocurre en la corteza occipital, que enva seales al
giro fusiforme, donde se procesa la informacin visual relacionada con la identificacin del rostro (Grill-Spector et al., 2004).
Los aspectos emocionales del rostro, incluyendo la expresin
facial y la reaccin emocional por parte del observador, se reflejan en la activacin de la amgdala, la cual se localiza denrro
del cerebro (Gobbini y Haxby, 2007; Ishai et al., 2004).
La fisiologa de la percepcin de objetos y escenas

121

La evaluacin de hacia dnde mira una persona est vinculada con la actividad en el surco temporal superior; esta rea
tambin interviene en la percep cin de los movimientos de la
boca de alguien cuando habla (Calder et al. , 2007; Puce et al.,
1998). La evaluacin del atractivo de un rostro se relaciona con
la actividad en el rea frontal del cerebro.
El hecho d e que todos estos facto res, o la mayora de ellos,
intervengan cuando percibimos un rostro ha llevado a la conclusin de que hay un sistema distribuido en la corteza para percibir
los rosrros (Haxby et al., 2000; Ishai, 2008). La activacin provocada por otros objetos tambin es distribuida, pues la mayora
de ellos activa varias reas del cerebro (Shinkareva et al., 2008).

tomado al azar, lo cual limitaba la visibilidad de cada estmulo


a slo SO ms (vase el m todo "Uso de un a mscara para poder
presentar brevemente un estmulo" de la pgina 114).
La tarea de los observadores en este experimento era indicar, despus de la presentacin de la mscara, si la imagen era
"Harrison Ford", "otro objeto" o "nada". Esta es la "respuesta del
observador" en la figura S.46. Los resultados, basados en la presentacin de 60 fotogra fas distintas de Harrison Ford, 60 fotos
de otros rostros y 60 textu ras distintas, se muestran en la figura
S.47. Esta figura muestra el curso de la activacin cerebral para las pruebas en las que se present el rostro de Harrison Ford.
La curva ms alea (roja) muestra que la activacin fue mayor
cuando los observadores identificaron correctamente el estmulo
como el rosrro de dicha celebridad. En la siguiente curva se ve que
la activacin fue menor cuando respondieron "otro objeto" para
el rostro de Harrison Ford. En este caso detectaron el estmulo
como un rostro pero no pudieron identifica rlo como el del actor.
La curva ms pequea indica que hubo poca activacin cuando
los observadores no pudieron decir que la imagen era un rostro.
Recuerde que todas las cu rvas de la figura S.47 representan
la actividad cerebral que ocurri n o cuando los observadores
respondan verbalmente, sino durante la presentacin del rost ro
de Harrison Ford. Por consiguiente, estos resultados muest ran
que la actividad neu ronal que se da cuando una persona ve un
estmulo se debe no slo al estmulo presentado, sino tambin
a la m anera en que la persona lo procesa. Una extensa respuesta neuronal se relaciona con el procesamiento que proporciona
la capacidad p ara identificar el estmulo; una respuesta menor
se vincula con la deteccin del estmulo y la ausencia de respuesta se asocia con la incapacidad para percibirlo.
Las conexiones entre las respuestas neuronales y la percepcin tambin se han determinado con base en un fenmeno
perceptual llamado rivalidad binocular: si se presenta una
imagen en el ojo izquierdo y otra d istinta en el ojo derecho, la
percepcin se alterna entre ambos ojos. Por ejemplo, si se presentara el patrn de destello solar de la fig ura S.48 slo en el
ojo izquierdo y la mariposa slo en el ojo derecho, una persona
vera el destello solar una parte del tiempo y la mariposa durante la otra parte, pero nunca juntos.
D. L. Sheinberg y Nikos Logothetis (1997) presentaron un
patrn de destello solar a un mono en el ojo izquierdo y una
imagen como la mariposa u otro anim al u objeto en el ojo derecho. Para determinar lo que perciba el mono, lo entrenaron
para que jalara una palanca cuando percibiera el patrn de d es-

Conexin de la actividad neuronal


y la percepcin
Los resultados que hemos descrito implicaban experimentos
en los que se presentaban estmulos y se meda la actividad cerebral. Pero se han realizado ex pe rimemos que van ms all de
la simple observacin de qu estmulo ocasiona la activacin
en reas especficas, a fin de estudiar las conexiones entre la
actividad cerebral y lo que percibe una persona o un animal.
Uno de estos experimentos fue el que realizaron Kalanit
Grill-Spector y sus colaboradores (2004), quienes estudiaron la
pregunta de cmo se relaciona la ac tivacin del cerebro con el
hecho de que una persona reconozca un objeto, midiendo la
activacin cerebralmienrras observadores hu m anos identificaban fotografas del rostro de una celebridad (Harrison Ford).
Se enfocaron en el rea fusiforme del rost ro (AFR). Para localizar el AFR en cada persona, utilizaron un mtodo llamado
enfoque de la regin de inters (RDI).
MTODO

Enfoque de la regin de inters

Uno de los retos de la investigacin con visualizacin cerebral es que aun cuando se han publicado mapas que indican la ubicacin de d iferentes reas del cerebro, hay una
gran variacin de una persona a otra en la ubicacin exacra
de un rea en particular. El enfoque de la regin de inters
(RDI) aborda este problema haciendo a las personas pruebas preliminares sobre los estmulos que se van a estudiar
antes de realizar un experimento. Por ejemplo, en el estudio que vamos a describir, Grll-Spector localiz la AFR
de cada observador presentndole imgenes de rostros y de
otras cosas, y observando el rea que se activaba con los primeros. Localizar esta RDI antes de realizar el experimento
permiti a los investigadores enfocarse en el rea exacta del
cerebro que, para cada persona, se especializaba en procesar
la informacin sobre los rostros.

!"
"

Respuesta
del observador

Estmulo
Una vez que Grill-Spector determin la ubicacin de la ~
Mscara
AFR de cada observador, le present estmulos como los que ~ Ve
Indica
a) "Harrison Ford""
se muestran en la figura S.46. En cada prueba, los observadores : a) Harrison Ford
b) "Otro objeto"
vean a) una fotografa de Harrison Ford, b) una foto del rostro ~ b) El rostro de otra persona
9 e) Una textura cualquiera
e) "Nada"'
de otra persona o e) una textu ra cualquiera. Grill-Speccor present brevem ente (cerca de SO ms) cada uno de estos estmuFigura 5 .46 1 Procedimiento para el experimento de
los, seguido inmediatamente de una mscara con un patrn
Griii -Spector et al. (2004). Vanse los detalles en el texto.

122

CAPITULO 5

Percepcin de objetos y escenas

0.2

:E

!;
;

u::
Q)

C/)

-0.2

'---------'---------1.------'----'

10

Con sidere lo que sucedi en este experimento. Las imgenes creadas en la retina d el mono permanecieron iguales
a lo largo del experimento, es decir, el destello sola r siempre
estuvo posicionado en la retina izquierda y la mariposa en la
retina derecha. Por consiguiente, el cambio en la percepcin de
"destello solar" a "m ar iposa" debe haber ocurrido en el cerebro
del mono, y este experimento demostr que estos cambios en
la percepcin estuvieron vinculados con los cambios en el disparo de una neurona en el cerebro.
Este procedimiento de rivalidad binocular tambin se ha
utili zado para conectar la percepcin y la respuesta neuronal
en los seres humanos mediante la IRMf Frank Tong y sus colaboradores (1 998) presentaron una fotografa del rostro de una
persona en un ojo y la imagen de una casa en el otro ojo de sus observadores, pero hicieron que stos vieran las fotos con lentes
d e colores, como se muestra en la figura 5.49. Las fotografas se
observan superpuestas en esta figura, pero debido a que cada ojo

15

Tiempo (seg)
Figura 5.47 1 Resultados del experimento de Griii-Spector
et al. (2004) para las pruebas en las que se present el rostro
de Harrison Ford. La actividad se midi en la parte inicial del
experimento, cuando se present el rostro de Harrison Ford.
(Tomada de Gri/1-Spector, K., Knouf, N. y Kanwisher, N., The
tusitorm tace area subserves tace perception, not generic
within category identitication, Nature Neuroscience, 7,
555-562. Reimpresa con permiso de Macmllan Publsher
Ltd. Copyright 2004.)

tello solar y otra palanca para la mariposa. Conforme el mono


indicaba lo que perciba, registraron simultneament e la actividad d e una neurona de la corteza inferotemporal (IT) que
previamente se haba demostrado que responda a la mariposa
pero no a l destello solar. El resultado de este experimento fue
claro: la clula disparaba vigorosamente cuando el mono vea la
mariposa y dejaba de disparar cuando perciba el d estello solar.

"'>

CD

~
a:

Ojo izquierdo
(la neurona no dispara
cuando el mono ve esto)

Ojo derecho
(la neurona dispara
cuando el mono ve esto)

Figura 5.48 1 Estmulos utilizados por Sheinberg y


Logothetis (1997). El estmulo de destello solar se le present a
un mono en el ojo izquierdo y el de mariposa en el ojo derecho.
Vanse los detalles en el texto. (Tomada de Sheinberg, D.
L. y Logothetis, N. K. , The role ot temporal cortical areas in
perceptual organization, Proceedngs of the National Academy
of Sciences, 94, 1997, pp. 3408-3413. Copyright 1997
Nationa/ Academy ot Sciences, Estados Unidos. Todos /os
derechos reservados. Reproducida con permiso.)

Figura 5.49 1 En el experimento de Tong et al. (1998)


los observadores vieron la casa roja y el rostro verde
superpuestos a travs de una lente roja y una verde, asf que la
imagen de la casa se present en el ojo derecho y la imagen
del rostro en el izquierdo. Debido a la rivalidad binocular, la
percepcin de los observadores altern entre el rostro y
la casa. Cuando los observadores percibieron la casa, la
actividad ocurri en el rea parahipocmpic a de lugar (APL),
en los hemisferios izquierdo y derecho (elipses rojas). Cuando
los observadores percibieron el rostro, la actividad ocurri en
el rea fusiforme del rostro (AFR) en el hemisferio izquierdo
(elipse verde). (Tomada de Tong, F., Nakayama, K., Vaughn, J.
T. y Kanwisher, N., 1998, Binocular rivalry and visual awareness
in human extrastriate cortex. Neuron, 21, 753-759.)
La fisiologa de la percepcin de objetos y escenas

123

recibi slo una de las imgenes, ocurri la rivalidad binocular.


Los observadores percibieron slo el rostro o la casa, y estas percepciones se alternaron con algunos segundos de duracin.
Tong determin lo que perciban los observadores haciendo qu e stos oprimieran un botn al percibir la casa y otro
al percibir el rostro. Conforme la percep cin del observador
alternaba entre la casa y el rost ro, Tong meda con IRMf la
respuesta en el rea parahipocmpic a para lugares (APL) y el
rea fusiforme del rostro (AFR). Cuando los observadores perciban la casa, la actividad aumentaba en la APL (y disminua
en la AFR). Por consiguien te, este resultado es similar a lo que
Shein berg y Logothetis encontraron en neuronas individuales
del mono. Aunque la imagen creada en la retina permaneci
igual a lo largo del experimento, la actividad cerebra l cambi,
depen diendo de lo que experimentaba la persona.

Algo que debemos considerar:


modelos de la actividad cerebral
que pueden predecir lo que ve
una persona
Cuando usted ve una escen a, ocurre un patrn de actividad
en su cerebro que la representa. Cuando ve algo m s, surge un
nuevo parrn que representa la nueva escena. Es posible decir
qu escena ve una p ersona al monitorear su actividad cerebral?
Algunas investigaciones recientes nos h an aproximado al logro de esta proeza y han mejorado nuestro entendimiento de la
conexin entre la actividad cerebral y la percepcin.
Yakiyasu Kamitani y Frank Tong (2005) dieron un paso
adelante en la "decodificacin" de la actividad cerebral midiendo con IRMf la respuesta de los observadores a est mulos
de rejilla (alternando barras negras y blancas como las de la
figura 5.50a). Les presentaron rejillas con varias orientaciones
(el de la figura 5.50a est indinado 45 grados h acia la derecha)
y determinaron la respuesta a estas rejillas en varios vxeles de
IRMf. Un vxel es una pequea rea con forma de cubo en el
cerebro de aproximadamen te 2 o 3 mm por lado (el tamao
de un vxel depende de la resolucin del escn er de IRMf. Se
estn desarrollando escneres que sern capaces de resolver
reas menores a 2 o 3 mm en un lado).
Una de las propiedades de los vxeles de IRMf es que hay
cierta variabilidad en la manera en qu e responden. Por ejemplo, los cubos pequeos que representan los vxeles en la figura
S.SOa muestran que la rejilla de 45 grados provoca ligeras diferencias en las respuestas de distintos vxeles. Una rejilla con
una orientacin d iferente provocara un patrn de actividad
distinto en estos vxeles. Utilizando la informacin proporcionada por las respuestas de muchos vxeles, Kamirani y Tong
pudieron crear un "decodificador de la orientacin", que determin cul orientacin vea una persona con base en su actividad cerebral. Crearon este decodificador por medio de la
medicin de las respuestas de 400 vxeles d e la corteza visual
primaria (Vl) y de un rea circunvecina llamada V2 a rejillas
con ocho orientaciones distintas. Luego realizaron un anlisis
124

CAPTULO 5

Percepcin de objetos y escenas

Vxeles
de IRMt

a)

Estmulo

---

Prediccin

..

'

.. ::,\' 1:~;<' ,. .

-:~0"::
.' '

':: .:::
JK
.

'\11
.... ..' ..\ 1 1 ..... ,.

;:~ ~~:.. ..-.. ,

b)

' '

..

Figura 5.50 1 a) Los observadores del experimento de


Kamitani y Tong (2005) vieron rejillas orientadas como la
de la izquierda. Los cubos en el cerebro re presentan
la res puesta de ocho vxeles. En el experimento se
monitore la actividad de 4 00 vxeles. b) Resultados de
dos orientaciones. Las rejillas son Jos estmulos que se
presentaron a los observadores. La lnea de la derecha es la
orientacin predicha por el decodificador de la o rientacin.
El decodificador pudo pred ecir con exac titud cundo se
present cada una de las ocho orientaciones. (Tomada de
Kamitani, Y., y Tong, F., Decoding the visual and subjective
contents of the human brain, Nature Neuroscience, 8,
679-685. Reimpresa con permiso de Macmillan Pub/ishers
Ltd. Copyright 2005.)

estadstico sobre los patrones de actividad de los vxeles para


cada orientacin a fin de crear un decodificador de la orientacin diseado para analizar el patrn de actividad registrado
en el cerebro de una persona y predecir qu orientacin vea.
Kamitani y Tong demostraron el poder predictivo de su
decodificador de la orientacin proyectando rejillas orientadas
a un observador e introduciendo la respuest a IRMf resultante
en el decodificador, que predijo qu orientacin se presentaba.
Los resultados, que se muestran en la figura 5.50b, demuestran
que el decodificador predijo con exactitud las orientaciones que
se presentaron.
En otra prueba del decodificador, Kamitani y Tong presentaron dos rejillas superpuestas, creando as un entramado
como el de la figura 5.51, y pidieron a sus observadores que
prestaran atencin a una de las orientaciones. Como atender
a cada una de las orientaciones provoc d ist intos patrones
de actividad cerebral, el decodificador pudo predecir a cul de
las orientaciones pona atencin la persona. Piense en lo que
esro significa. Si usted estuviera en el laboratorio de Kamitani
y Tong vien do por encima del hombro del observador mientras

1750 imgenes presentadas

Medicin de la respuesta de
cada uno de los 500 vxeles
a las 1 750 imgenes

Uno de los
500vxeles

Figura 5.51 1 El estmulo de rejillas superpuestas utilizado


para el experimento de Kamitani y Tong , e n el que se dijo
a los observadores que prestaran atencin a una de las
orientaciones a la vez. (Tomada de Kamitani, Y. y Tong, F.,

Propiedades de respuesta
de este vxel calculadas con
base en su respuesta
a las imgenes

Decoding the visual and subjective contents of the human


brain, Nature Neuroscience, 8, 679-685. Reimpresa con
permiso de Macmillan Publishers Ltd. Copyright 2005.)

"

ste mira las rejillas superpuestas, no tendra forma de saber


exactamente lo que estara percibiendo esa persona. Pero consultando el decodificador de la orientacin, podra averiguar
en qu orientacin se estara enfocando el observador. En esencia, el decodificador d e la orientacin proporciona una ventana
a la mente de la persona.
Pero, qu sucede con los estmulos ms complejos que las
rejillas orientadas? Kendrick Kay y su s colaboradores (2008)
h an desarrollado un nuevo decodificador que puede determinar cu l fotografa de una escena natural se ha presentado a un
observador. En la primera parte de su experimento, le presentaron 1 750 fotografas en blan co y negro d e varias escenas
natura les y midieron la actividad de 500 vxeles de la cort eza visual primaria (figura 5.52). El objetivo de esta parte
d el experimento era determinar cmo responda cada vxel a
caractersticas especficas de la escena, como la posicin de la
imagen, su orientacin y su grado de detalle, que iba desde
detalles finos (como en las dos imgenes superiores de la figura
5.52) hasta imgenes con pocos detalles (como la inferior). Con
base en u n anlisis de las respu estas de los 500 vxeles a las
1 750 imgenes, Kay y su s colaboradores crearon un decodificador de escenas que pudo predecir los patrones de actividad
de los vxeles que ocurrieron en el cerebro como respuesta a las
imgenes de escenas.
Para probar el decodificador, Kay y sus colaboradores hicieron lo siguiente (figura 5.53): 1) Midieron el patrn de actividad cerebral ante una imagen de prueba que nunca antes
haban presentado (el len en este ejemplo). 2) Presentaron esta

Figura 5.52 1 La primera parte del e xperimento de Kay


et al. (2008), e n la que c rearon e l decodificador de escenas.
Determinaron las propiedades de respuesta de 500 vxeles
de la corteza estriada midiendo la respuesta de cada vxel a
medida que le presentaban 1 750 imgenes a un observador.
Aqu se muestran tres imgenes como las que utiliz Kay. El
cubo representa uno de los 500 vxeles. El decodificador de
escenas se cre al determinar cmo responda cada uno
d e los 500 vxeles a la posicin en el espacio, la orientacin
y el nivel de detalle de una imagen.

imagen y otras 119 nuevas al decodificador, mismo que calcul


los patrones de actividad previstos (que se muestran a la derecha) de los vxeles para cada imagen. 3) Seleccionaron el patrn que coincidi con la actividad cerebral real provocada por
la imagen de prueba. Cuando verificaron si la imagen que corresponda a este patrn era igual que la de prueba, encontraron que el decodificador identific correctamente 92% de las
imgenes para un observador y 72% para otro. Esto es asombroso, ya que el desempeo probabilst ico para 120 imgenes
es menor a 1%. Tambin resulta impresionante debido a que las
imgenes que se presentaron eran nuevas, es decir, el decodificador nunca h aba estado expuesto a ellas.

Algo que debemos considerar: mode los de la actividad cerebral que pue den predecir lo que ve una persona

125

1) Medicin de la actividad cerebral ante la imagen de prueba

Cantidad de vxeles
Imagen

Cerebro

Patrn medido de la actividad de los vxeles

2) Presentacin de la imagen de prueba y de otras 119 imgenes al decodificador

Decodificador } - - -

Decodificador

3) Seleccin del patrn de vxeles previsto que coincide ms con el patrn para la imagen de prueba.

Decodificador } - - -

Decodificador

Patrones previstos de la actividad de los vxeles


Figura 5.53 1 Para probar su decodif icador de escenas, Kay y sus colaboradore s (2008) primero a) midieron
la activi dad
cerebral de un observador ante la presentacin de una imagen de prueba que el observador nunca haba visto,
y luego
b) utilizaron el decodificado r para predecir el patrn de act ividad de los vxeles para esta imagen de prueba
y otras 119
imgenes. El patrn de actividad de los vxeles resaltado indica que el decodificado r ha igualado la respuesta
prevista
a la imagen de prueba con la actividad cerebral real que gener dicha imagen y que se mid i en a). En otras
palabras, el
decodificado r pudo identificar, d e entre 120 imgenes, la imag en que se present al observador. (Basada en
Kay, K. N.,
Nase/aris, T., Prenger, R. J. y Gallant, J. L., ldentifying natural images from human brain activity, Nature, 7185,
352-355,
Fig 1, superior. Reimpresa con permiso de Macmillan Publisher Ltd. Copyright 2008.)

126

CAPTULO 5

Percepc in de objetos y escenas

Estos resultados sugieren que ahora podemos usar la actividad cerebral para "leer la mente", como sugirieron algunos
informes de esta investigacin que se publicaron en la prensa?
Estos experimentos muestran que es posible identificar informacin de la actividad de la corteza visual primaria que puede
predecir cul imagen de un grupo de ellas ve una persona. Sin
embargo, an no podemos crear, a partir de la actividad cerebral de alguien , una imagen que corresponda a lo que ve. No
obstante, esta investigacin constituye un gran paso para entender la manera en que la actividad neuronal representa objetos y escenas.

2.

Considere esta situacin: en el captulo 1 vimos que el procesamiemo descendente ocurre cuando la percepcin se ve
afectada por el conocimiento y las expectativas del observador. Desde luego, este conocimiento est almacenado
en neuronas y grupos de neuronas en el cerebro. En este
captulo vimos que hay neuronas que se han adquirido
la capacidad de responder a caractersticas especficas del
entorno. Por consiguiente, es posible decir que algo de este
conocimiento del entorno forma parte de estas neuronas.
As, si una percepcin en particular ocurre debido al disparo de estas neuronas especializadas, podemos considerar esro como procesamiento descendeme? (p. 116)

3 . Como reaccin a los resultados de la reciente carrera de la

DARPA, Ha rry dice, "Pues bien, finalmente hemos demostrado que las computadoras pueden percibir de manera tan
adecuada como las personas". Cmo respondera usted a
esta afirmacin? (p. 119)

AUTOEXAMEN 5.2
1. Qu es una "escena" y en qu difiere de un "objeto"?

2. Qu evidencias hay de que podemos percibir de


manera muy rpida la totalidad de una escena? Qu
informacin nos ayuda a identificar la totalidad?
3. Qu son las regularidades en el ambiente? D ejemplos
de las regularidades fsicas y analice cmo se relacionan
stas con las leyes de la organizacin de la gestalt.
4. Qu son las regularidades semnticas? Cmo influyen sobre nuestra percepcin de los objetos que hay
en las escenas? Cul es la relacin entre las regularidades semnticas y la idea de que la inferencia interviene en la percepcin? Qu dijo Helmholtz acerca
de la inferencia y la percepcin? Qu es la inferencia
bayesiana y en qu se relaciona con las ideas de
Helmholtz sobre la inferencia?
5. Mencione una manera de hacer que un dispositivo de
visin por computadora sea ms eficaz. Qu razones
hay para pensar que las mquinas estn alcanzando
a los seres humanos? Qu se necesita para que los
sistemas informticos de visin compitan con los

4. La evolucin biolgica hizo que nuest ro sistema percep-

tual se adaptara al mundo de la Edad de piedra en el que


evolucionamos. Dado este hecho, qu tan bien manejamos
ac tividades como el descenso en esqu o la conduccin de
autos, que son adiciones muy recientes a nuestro repertorio conductual? (p. 115)
5. Vecera demostr que es ms probable que percibamos

como figura las regiones de la parte inferior d e u n estmulo. Cmo se relaciona este resultado con la idea de que
nuestro sistema visual est adaptado a las regularidades
en el ambiente? (p. 108)
6.

humanos?
6. Describa las investigaciones sobre a) las neuronas que

responden al agrupamiento perceptual y a la figurafondo; b) la naturaleza distribuida de la representacin


de los rostros en el cerebro, y e) las conexiones entre
la actividad cerebral y la percepcin (asegrese de entender el experimento "Harrison Ford" y los dos sobre
rivalidad binocular).
7. Describa cmo se ha utilizado la IRMf para crear "decodificadores de la orientacin" y "decodificadores de
escenas" que pueden predecir cmo responder el cerebro ante a) rejillas orientadas y b) escenas complejas.

Podemos organizar perceprualmente los objetos que hay en


el entorno aun cuando stos sean similares, como en la figura5.54. Qu principios perceptuales intervienen en la percepcin de dos cebras? Considere t anto las leyes de la gestalt
de la organ izacin como los geon es de la teora RPC. Q u
ocurre cuando cubre las cabezas de las cebras para que slo
pueda ver los cuerpos? Siguen vigentes estos principios?
Hay informacin adems de lo que proponen las leyes de
la gestalt y la teora RPC que le ayude a organizar percept u almente ambas cebras? (p. 105)

7 . Cmo percibi la pintura de la figura 5.55 la primera vez

que la vio? Qu suposiciones perceptuales influyeron en

PIENSE EN LO SIGUIENTE
1. En este captulo se describen varios heursticos perceptuales,

incluyendo las "leyes" de la gestalt y la heurstica de la luz ~


proveniente de arriba. Piense en algunos otros heursticos, ~
ya sean perceptuales o de alguna otra rea, qu e le ayuden "' ....______________.;......_ _ __.....,_
a resolver problemas con rapidez usa ndo las reglas d e "la
mejor suposicin ". (p. 109)

Figura 5.54 1 Qu principios de la organizacin nos


permiten diferenciar a estas dos cebras?
Piense en lo siguiente

127

3. Cundo se separa la figura del fondo? Los psiclogos de

. 1

la gestalt propusieron que se debe separar la figura del


fondo antes de reconocerla. Sin embargo, hay evidencias
de que el significado de un rea se puede reconocer antes de separarla del fondo. Esm signi fica que el reconocimiento debe ocurrir antes o al mismo tiempo de que se
separa la figura del fondo. (p. 108)
Peterson, M. A. (1994). Object recognirion processes can
and do operare before figure- ground organizacion. Current Ditections in Psychological Science, 3, 105-111.
4. Precedencia global. Cuando una ilustracin consta de un

objeto grande que est conformado por elementos ms


pequeos, qu procesa primero el sistema nervioso, el
objeto grande o los elementos ms pequeos? Un efecto
conocido como efecto de precedencia global sugiere 1\f.l
.
L.:..!:..J 21
que pnmero
se procesa e1o b'Jeto grand e.
Navon, D. (1977). Forest before crees: The precedence of
global features in visual perceprion. Cognitive Psychology, 9, 353-383.
5. Plasticidad dependiente de la experiencia y reconocimiento

de objetos. La experiencia de una persona puede moldear


tanto la respuesta neuronal como el desempeo conductual relacionados con el reconocimiento de objems.

Figura 5.55 1 The Scarf (El pauelo), una pintura


de Rita Ludden.

(p. 116)
Kourtzi, Z. y DiCarlo, J. J . (2006). Learning and neural
p lasticity in visual object recognition. Current Opinion
in Neurobiology, 16, 152-158.
6 . Efecto de la extensin del lmite. Cuando se pide a las per-

su respuesta a esta pintura? (Por ejemplo, hizo una suposicin acerca de cmo suelen estar orientadas l as flo res en
el ambiente?) (p. 118)

SI DESEA SABER MS
1. Vehculos robots. Para saber ms sobre la carrera de la

DARPA, vaya a www.grandchallenge .org (en ingls) o


haga una bsqueda sobre la DARPA en internet. (p. 101)
2. Percepcin de figura y fondo. Cuando ve el patrn de ja-

rrn-rostro de l a figura 5.21, puede percibir dos rostros


azules sobre un fondo blanco o un jarrn blanco sobre un fondo azul, pero le resulta difcil ver al mismo
tiempo los rostros y el jarrn. Se ha sugerido que esto
ocurre debido a un heurstico integrado en el sistema visual que toma en cuenta la improbabilidad de que dos
objetos adyacentes tengan los mismos contornos y se
alineen perfectamente. (p. 108)
Baylis, G. C. y Driver, J. (1995). One-sided edge assignment in vision: figure-ground segmentation and
attention to objects. Cttrrent Directions in Psychological
Science, 4, 140-146.

128

CAPfTULO 5

Percepcin de objetos y escenas

sonas que recuerden una fotografa de una escena, tienden a rememorar una imagen ms general que la que se
mostr en la fotografa original. Esm sugiere que los
mecanismos visuales infieren en la existencia de una
distribucin visual qu e ocurre ms all de los lmites de
una vista dada. Existen evidencias de que el rea parahipocmpica de lugares podra interveni r en la extensin
del lmite. (p. 118)
Intraub, H. (1997). T he represencacion of visu al scenes.
Trends in Cognitive Sciences, 1, 217-222.
Park, S., Intraub, H., Yi, D.-J., Widders, D. y Chun, M.
M. (2007). Beyond che edges of view: Boundary extension in human scene-selecrive corcex. Neuron 54,
335-342.
7. Identificacin de los estados cognitivos relacionados con las per-

cepciones. En una investigacin similar a la descrita en la


seccin "Algo que debemos considerar" se ha utilizado
la IRMf para identificar dist intos patrones de activacin
cerebral para herramientas y casas. (p. 124)
Shinkareva, S. V., Mason, R. A ., Malave, V. L., Wang,
W., Mitchell, T. M. y Just, M. (2008). Using fMRI
brain activation to identify cognicive states associat ed wirh perceprion of rools and dwellings. PLoS ONE,
3(1), e1394.

CONCEPTOS CLAVE
Algoritmo (p. 109)
Caractersticas globales de la imagen
(pp. 114-115)
Contorno ilusorio (p. 104)
Discriminacin (p. 112)
Efecto oblicuo (p. 116)
Enfoque de la regin de inters (RDI)
(p. 122)
Escena (p. 114)
Estmulo de enmascaramiento (p. 114)
Estructuralismo (p. 104)
Figura (p. 108)
Figura-fondo reversible (p. 108)
Fondo (p. 108)
Geones (p. 110)
Heurstica de la luz proveniente
de arriba (p. 116)
Heurstico (p. 109)
Inferencia bayesiana (p. 119)
Invarianza de la perspectiva (p. 103)

Ley de la buena continuacin (p. 106)


Ley de la buena forma (p. 105)
Ley de la familiaridad (p. 107)
Ley de la proximidad (cercana) (p. 106)
Ley de la semejanza (p. 105)
Ley de la simplicidad (p. 105)
Ley de pragnanz (p. 105)
Ley del destino comn (p. 106)
Leyes de la organizacin perceptual
(p. 105)

Modulacin contextua! (p. 120)


Movimiento aparente (p. 104)
Organizacin perceprual (p. 105)
Persistencia de la visin (p. 114)
Perspectiva accidental (p. 111)
Principio de la conexin uniforme
(p. 106)
Principio de la probabilidad (p. 119)
Principio de la recuperacin por
componentes (p. 112)

RECURSOS EN LNEA
Sitio web del libro Sensacin
y percepcin

Los siguientes ejercicios de laboratorio estn relacionados


con el material de este captulo:
1. Desplazamiento de vehculos robots: DARPA Urban Challenge Un

www.cengage.com/psychology/goldstein
En este sitio encontrar tarjetas didcticas, cuestionarios
de prctica, vnculos a internet, actualizaciones, ejercicios de
pensamiento crtico, foros de discusin, juegos y ms!

Cengage Now

Principio de la regin comn (p. 106)


Principio de sincrona (p. 106)
Problema de la proyeccin inversa (p. 101)
Propiedad de borde (p. 108)
Propiedades no accidentales (PNA)
(p. 110)
Psiclogos de la gestalt (p. 103)
Regularidades en el ambiente (p. 115)
Regularidades fsicas (p. 116)
Regularidades semnticas (p. 117)
Rivalidad binocular (p. 122)
Segregacin figura-fondo (p. 108)
Segregacin perceptual (p. 108)
Sensaciones (p. 104)
Teora de la inferencia inconsciente
(p. 119)
Teora del reconocimiento por
componentes (RPC) (p. 110)
Totalidad de una escena (p. 114)

r-CENGAGENow.___/

www.cengage.com/cengagenow
En este sitio encontrar un vnculo a CengageNO\V, su t ienda para
todo. Haga un examen previo de este captulo y CengageNOW
generar un plan de estudio personalizado con base en sus
resultados. El plan de estudio identificar los temas que usted
necesita revisar y lo enviar a recursos en lnea que le ayudarn
a dominar esos temas. Entonces puede realizar un examen
posterior que le ayudar a determinar los conceptos que ya ha
dominado as como aquellos en los que an necesita trabajar
(disponible slo en ingls).

Laboratorio virtu a l (Virtua l La b)


Su Laboratorio virtual (Virtual Lab) est diseado para ayudarle a obtener el mximo provecho de este curso. Los iconos
del Laboratorio virtual lo envan a demostraciones y experimentos especficos multimedia diseados para ayudarle a
visualizar lo que est leyendo. El nmero que est junto a cada
icono indica el nmero del elemento multimedia al que puede
acceder a travs de su CD-ROM, CengageNOW o el recurso
WebTutor (disponibles slo en ingls).

video que muestra al vehculo robot, Boss, recorriendo un trayecto en California. (Cortesa de Tartan Racing, Universidad
Carnegie Mellon.)
2. Movimiento apmente Cmo se pueden crear ilusiones de

movimiento entre dos puntos que se proyectan de manera


intermitente.
3. Contornos ilusorios lineales y curvos Ejemplos de cmo las
caractersricas de la exhibicin de contornos ilusorios afectan
los contornos.
4. Mejoramiento de contornos ilusorios La manera en que la
adicin de componentes a una exhibicin puede mejorar los
contornos ilusorios.
5. Contexto y percepcin: La ilusin de Hering Cmo las lneas

de fondo pueden hacer que las lneas rectas paralelas parezcan


curvarse hacia fuera.
6. Contexto y percepcin: La ilusin de Poggendorf Cmo la inte-

rrupcin de una lnea recta hace que los segmentos de la lnea


parezcan no estar alineados. (Cortesa de Michael Bach.)
7. Cubo reversible ambiguo Un estmulo que se puede percibir

de varias formas y hace cosas excraas al moverlo. (Cortesa de


Michael Bach.)
B. Organizacin perceptual: El dlmata Cmo un patrn en
blanco y negro se puede percibir como un dlmata. (Cortesa
de Michael Bach.)
9. Ley de la simplicidad o de la buena forma Una situacin en la que

la ley de la buena figura da como resultado un error de percepcin.

Recursos en lnea

129

10. Ley de la semejanza La manera en que las caractersticas

de una exhibicin ocasion an el agrupamiento debido a la


semeJanza.
11. Ley de la buena continuacin Cmo influye la buena conti-

se utilizaron en el experimento de Fei-Fei para investigar lo


que percibe la gente al ver rpida mente imgenes que se proyectan de este modo. (Corresa de Li Fei-Fei.)

12. Ley de cierre El efecto de agregar pequeas aberruras a un

Cmo pueden provocar un error de


percepcin nuestras suposiciones acerca de la forma tridimensional de un rostro. (Costesa de Michael Bach.)

objeto.

19. Mscara giratoria 2

Cmo influye en el agrupamiento la


variacin de la distancia entre elementos.

20. Mscara giratoria 3 Orra mascara giratoria, pero st a con

14. Ley del destino comn Agrupamiento que ocurre debido


al movimiento comn de elementos de estmu lo.

21. Precedencia global Un experimento para determinar los

nuacin en la organizacin perceprual.

13. Ley de la proximidad

15. Ambigedad figura fondo del mundo real Una exhibicin de

figura-fondo reversible utilizando la imagen d e un jarrn real.

18. Mscara giratoria

Ot ro ejemplo de una mscara giratoria, est a vez d e Charlie Chaplin. (Cortesa de Michael Bach.)
un aro en la nariz! (Cortesa de Thomas Papathomas.)
tiempos de reaccin en respuesta a patrones grandes y elementos ms pequeos que los conforman.

16. Ambigedad figura-fondo Cmo influye en la segregacin

figura-fondo el cambio de contraste de una pintura.


17. Cmo percibir rpidamente estmulos inte1mitentes Algunos

estmulos presentados de manera intermiten te como los que

130

CAPfTULO 5

Percepcin de objetos y escenas

Respuestas a la figura 5.6. Rostros d e izquierda a derecha:


El prncipe Carlos, Woody Allen, Bill Clinton, Saddam Hussein,
Richard Nixon y la princesa Dian a.

Potrebbero piacerti anche