Llámame Por Skype

¡Llámame por Skype!
Interacciones socialmente contingentes ayudan a los niños pequeños a

aprender el idioma
El aprendizaje de idiomas tiene lugar en el contexto de las interacciones sociales, sin embargo, los
mecanismos que hacen que las interacciones sociales sean útiles para aprender el lenguaje no
están claros. Este documento se centra en si la contingencia social podría apoyar el aprendizaje de
palabras. Los niños pequeños de 24 a 30 meses (N = 36) fueron expuestos a nuevos verbos en una
de tres condiciones: entrenamiento de interacción en vivo, entrenamiento de video socialmente
contingente sobre chat de video y entrenamiento de video no contingente (video de yugo). Los
resultados sugieren que los niños solo aprendieron verbos novedosos en interacciones
socialmente contingentes (interacciones en vivo y video chat). El estudio actual destaca la
importancia de la contingencia social en las interacciones para el aprendizaje de idiomas e informa
la literatura sobre el aprendizaje a través de los medios de pantalla como el primer estudio para
examinar el aprendizaje de palabras a través de la tecnología de video chat.
La capacidad de los niños pequeños para aprender el lenguaje a partir del video es un tema muy
debatido. Algunas pruebas sugieren que los niños pequeños no adquieren palabras de los medios
de pantalla antes de los 3 años (Robb, Rickert & Wartella, 2009; Zimmerman, Christakis &
Meltzoff, 2007), mientras que otros encuentran un aprendizaje o reconocimiento limitado en los
primeros tres años (Barr & Wyss, 2008; Krcmar, Grela & Lin, 2007; Scofield & Williams, 2009). Sin
embargo, un hallazgo común en la literatura es que los niños aprenden mejor el lenguaje de una
persona viva que de una fuente de video equivalente (Krcmar, et al., 2007; Kuhl, Tsao & Liu, 2003;
Reiser, Tessmer & Phelps, 1984; Roseberry , Hirsh-Pasek, Parish-Morris & Golinkoff, 2009). ¿Qué
hace que las interacciones sociales sean superiores a las presentaciones de video para el
aprendizaje de idiomas de los niños? Nuestra hipótesis es que una diferencia clave entre los
contextos de los medios de pantalla y la interacción en vivo es la contingencia social entre el
hablante y el alumno.
El "déficit de video" (Anderson & Pempek, 2005), o la discrepancia entre aprender de una persona
en vivo y aprender de una fuente de medios equivalente, es un fenómeno ampliamente conocido.
Kuhl y sus colegas (2003), por ejemplo, expusieron bebés de 9 meses de edad de hogares de habla
inglesa a chino mandarín a través de oradores en video o por oradores en vivo. Los investigadores
preguntaron si los niños experimentarían los mismos beneficios al discriminar entre fonemas
extranjeros si la exposición a idiomas extranjeros llegó a través del video o los oradores en vivo.
Los resultados sugirieron que los niños que escucharon a los oradores en una demostración en
vivo aprendieron a discriminar entre los sonidos de idiomas extranjeros, mientras que la pantalla
de video no confirió esta ventaja. Otro ejemplo lleva a la misma conclusión, aquí con el
aprendizaje de palabras. Estos investigadores investigaron la capacidad de los niños para aprender
verbos, que algunos investigadores han sugerido que son más difíciles de dominar que los
sustantivos (Gentner, 1982; Gleitman, Cassidy, Nappa, Papafragou y Trueswell, 2005; pero vea
Choi y Gopnik, 1995; Tardif, 1996) . ¿Podrían los niños aprender estos verbos de la mera
exposición a pantallas televisadas? En un experimento controlado, los niños de 30 meses
aprendieron mejor cuando un experimentador estaba vivo que cuando apareció en la condición de
pantalla (Roseberry et al., 2009). A pesar de que los niños mayores de tres años obtuvieron
información solo del video, este aprendizaje no fue tan sólido como el aprendizaje de las
interacciones sociales en vivo.
Dada la abrumadora evidencia de que los niños pequeños no aprenden tanto del video como de
las interacciones en vivo, ¿qué explica esta discrepancia? Una línea de investigación, fuera de la
literatura lingüística, sugiere que los niños aprenden del video si el formato del video también les
permite participar en una interacción contingente (Lauricella, Pempek, Barr & Calvert, 2010;
Troseth, Saylor & Archer, 2006) . Troseth y sus colegas (2006), por ejemplo, utilizaron una tarea de
recuperación de objetos, en la que un experimentador escondió un juguete, les dijo a los niños de
24 meses dónde estaba ubicado y luego les pidió a los niños pequeños que encontraran el juguete.
Antes de revelar la ubicación del juguete oculto, todos los niños vieron un calentamiento de 5
minutos del experimentador en video. La mitad de los niños pequeños participaron en una
interacción bidireccional con el adulto a través del video de circuito cerrado para el calentamiento,
mientras que los otros niños vieron un video pregrabado del adulto como habían interactuado con
otro niño. Durante la interacción a través de un circuito cerrado de video, el adulto en video llamó
a los niños por su nombre y los involucró en una conversación acerca de sus mascotas y hermanos.
El video pregrabado o enlazado no dependía de las respuestas del niño y le mostró al
experimentador que le preguntaba acerca de las mascotas y los hermanos que no eran relevantes
para el niño para quien se reproducía el video. Cuando los niños buscaron el juguete oculto, solo
los niños que experimentaron una interacción social con el adulto a través del video encontraron
el juguete a un ritmo mayor que el azar. Los investigadores argumentan que el entrenamiento de
video socialmente contingente permitió a los niños pequeños superar el déficit de video. Estos
hallazgos se han ampliado recientemente para mostrar un mayor aprendizaje de los juegos de
computadora interactivos en relación con ver videos (Lauricella et al., 2010).
Troseth y sus colegas (2006) definieron las interacciones contingentes como un intercambio
bidireccional en el que la persona adulta en video se estableció como relevante e interactiva al
referirse al niño por su nombre y al hacerle preguntas específicas a los niños sobre sus hermanos y
mascotas. Esta visión de la contingencia social postula que las interacciones socialmente
contingentes deben ser apropiadas en el contenido (Bornstein, Tamis-LeMonda, Hahn y Haynes,
2008) e intensidad (Gergely y Watson, 1996). Es una desviación de una definición más estrecha de
contingencia, que se centra únicamente en el tiempo y la confiabilidad (Beebe et al., 2011;
Catmur, 2011). En los pocos estudios que han investigado el papel de la contingencia en el
aprendizaje de idiomas, el enfoque y la sincronización de las interacciones han sido el foco. Bloom,
Russell y Wassenberg (1987), por ejemplo, manipularon si los adultos respondían a los niños de 3
meses de forma aleatoria o conversacional, tomando turnos. Aquí, la interacción contingente
apareció mientras el padre escuchaba mientras el bebé vocalizaba y luego vocalizaba
inmediatamente a cambio. Los resultados sugirieron que los bebés que experimentaron
interacciones de turnos con un adulto produjeron más vocalizaciones silábicas o similares al habla.
Estos hallazgos se han ampliado con niños de 5 y 8 meses que participaron en una interacción
contingente o no contingente con sus madres (Goldstein, King & West, 2003; Goldstein, Schwade
& Bornstein, 2009). Los bebés aprenden rápidamente que sus vocalizaciones afectan la respuesta
de sus cuidadores (Goldstein et al., 2009), y los bebés a quienes se les dijo a las madres que
respondieran de inmediato a las vocalizaciones infantiles, en lugar de responder al azar,
produjeron vocalizaciones más maduras (Goldstein et al., 2003). En conjunto, la contingencia se ha
implicado como un importante catalizador para el desarrollo temprano del lenguaje, y su ausencia
puede ser responsable de la incapacidad de los niños para usar la información presentada en el
video. Sin embargo, el papel de la contingencia social en la capacidad de los niños para aprender
palabras no se ha explorado. El estudio actual examina la contingencia social como una señal para
el aprendizaje de idiomas. Definimos un socio socialmente contingente como una persona cuyas
respuestas no solo son inmediatas y confiables, sino que también son precisas en su contenido
(Csibra, 2010; Tamis-LeMonda et al., 2006; Troseth et al., 2006).
Un método para investigar la contingencia social en el aprendizaje de idiomas de los niños es a

través de video chats. El video chat es una nueva tecnología que proporciona un punto medio
entre las interacciones sociales en vivo y los medios de pantalla. Esta herramienta de
comunicación tiene algunas características de video y algunas características de interacciones en
vivo. Como video, proporciona una pantalla bidimensional. Como interacción, es una plataforma
para intercambios socialmente contingentes. En un grado ligeramente menor, el video chat ofrece
la posibilidad de observar dónde está mirando el hablante, aunque la mirada del hablante está
algo distorsionada desde la perspectiva del niño. Los niños usan la mirada del hablante como una
señal comunicativa importante desde los primeros años de vida (Csibra, 2010). Los bebés prefieren
mirar a los ojos desde el nacimiento (Batki, Baron-Cohen, Wheelwright, Connelan y Ahluwalia,
2000), e incluso los niños de 3 meses prefieren mirar fotografías de caras con ojos que parecen
hacer contacto visual con ellos ( Farroni, Csibra, Simion & Johnson, 2002). Entre los 19 y los 20
meses, los niños pequeños entienden que la mirada puede ser referencial y pueden ayudarles a
descubrir los significados de las palabras nuevas (Baldwin, 1993). Las etiquetas novedosas
generalmente se refieren al referente en la competencia del orador (Baldwin, 1993; Bloom, 2002;
Tomasello, 1995) y, de hecho, cuando el referente de una palabra novedosa es ambiguo, es más
probable que los niños verifiquen la mirada del hablante para determinar la correcta referente
(Baldwin, Bill & Ontai, 1996). Un estudio reciente sugiere que los bebés mayores usan la mirada
para aprender etiquetas de objetos aburridos, incluso cuando prefieren mirar otros objetos
interesantes (Pruden, HirshPasek, Golinkoff & Hennon, 2006). Este estudio es el primero en usar
video chats para probar el papel de la contingencia social en el aprendizaje de palabras, así como
también investigar si los niños asisten a los ojos del orador, tal vez en un intento de reclutar
información sobre el referente del verbo de la novela. Sobre la base de investigaciones anteriores
que comparan el aprendizaje del video con el aprendizaje de la interacción en vivo (Roseberry et
al., 2009), probamos la eficacia de la contingencia social en el aprendizaje de idiomas preguntando
si el aprendizaje del idioma a través de chats de video es similar al aprendizaje en interacciones en
vivo o para aprendiendo de video De esta manera, el estudio actual busca informar tanto la
literatura sobre la capacidad de los niños para aprender de los medios de pantalla como la
literatura sobre los factores sociales del aprendizaje de idiomas de los niños. Investigamos un caso
particular de adquisición del lenguaje: el aprendizaje del verbo. Los verbos son los bloques de
construcción de la gramática y
El fulcro alrededor del cual se construye una oración. Casi treinta años de investigación
demuestran que los verbos pueden ser mucho más difíciles de adquirir que los sustantivos para
niños que aprenden inglés (Gentner, 1982; Gleitman et al, 2005; Golinkoff & HirshPasek, 2008;
pero vea Choi y Gopnik, 1995; Tardif, 1996) . La investigación apenas comienza
para descubrir cómo los niños aprenden palabras de acción, por lo que evalúan las señales sociales
con el aprendizaje de los verbos
proporciona una prueba especialmente fuerte del papel de la contingencia social en la adquisición
del lenguaje. Nuestra hipótesis es que si el aprendizaje de palabras se basa en la contingencia
social, el aprendizaje de los niños a partir de chats de video será más similar a aprender de las
interacciones en vivo que a aprender de un video. En contraste, si el aspecto bidimensional de los
chats de video evita que los niños aprendan verbos, sugerimos que no se produzca un aprendizaje
de chats de video, revelando una vez más, el "déficit de video" (Anderson & Pempek, 2005). En
este caso, aprender de los chats de video se asemejará a aprender de un video. Además, el papel
de la mirada en el aprendizaje de idiomas está bien establecido (Baldwin et al., 1996; Bloom, 2002;
Tomasello, 1995), aunque el video hating solo ofrece una mirada ocular contingente pero algo
desalineada. Nuestra hipótesis es que si los niños intentan reclutar información de la mirada del
hablante, mirarán más tiempo a los ojos del experimentador.
Método
Participantes
Treinta y seis niños entre las edades de 24 y 30 meses (19 varones, m = 26.52, SD = 1.74, rango =
24.09 a 29.80) participaron en el estudio. Se eligió esta edad porque los 24 meses de edad
muestran un sólido aprendizaje verbal de las interacciones sociales (Childers y Tomasello, 2002;
Naigles, Bavin y Smith, 2005) pero aún no muestran evidencia de aprendizaje verbal de pantallas
de video (Krcmar et al., 2007; Roseberry et al., 2009). Los niños fueron asignados al azar a una de
las tres condiciones de entrenamiento: Doce niños participaron en la condición de video chat (m =
26.35, SD = 1.90, rango = 24.09 a 29.80), 12 en la condición de interacción en vivo (m = 26.78, SD =
1.79, rango = 24.09 a 28.90), y 12 en la condición de video enlazado (m = 26.42, SD = 1.64, rango =
24.36 a 29.18). La condición del video enlazado mostró a los participantes un video pregrabado del
experimentador que se comunicaba en un chat de video con otro niño (ver Murray y Trevarthen,
1986; Troseth, et al., 2006). Se excluyeron 8 participantes adicionales del conjunto de datos actual
para inquietud (2), bilingüismo (1), error del experimentador (2), prematuridad (2) y dificultades
técnicas (1). De los participantes excluidos, 3 eran de la condición de chat de video (1 por
inquietud, 1 por dificultades técnicas, 1 por prematuridad), 3 por la condición en vivo (1 por
inquietud, 1 por bilingüismo y 1 por error del experimentador) y 2 fueron de la condición de video
enlazado (1 por error del experimentador y 1 por prematuridad). Todos los niños eran de término
completo y eran de hogares monolingües de habla inglesa.
Diseño y Variables
Para determinar si el aprendizaje de idiomas en los chats de video es similar al aprendizaje en vivo
interacciones o de un video de yugo, utilizamos una versión modificada del Intermodal

Preferential Looking Paradigm (IPLP; Hirsh-Pasek & Golinkoff, 1996). El IPLP es una tarea dinámica,
de opción múltiple visual para niños. Aquí, la variable dependiente es la comprensión, medida por
el porcentaje de la duración de la mirada a la acción que coincide con el verbo novel durante los
ensayos de prueba.
Además, recopilamos datos de seguimiento ocular para determinar si los niños miraron a los ojos
del experimentador durante la capacitación basada en pantalla (es decir, chat de video y
capacitación de video en yugo). La variable dependiente aquí es el porcentaje de tiempo mirando
hacia los ojos del experimentador.
Aparato
Las partes del estudio actual basadas en video (por ejemplo, Fases de introducción, Fases de
saliencia, Fases de entrenamiento de video chat, Fases de entrenamiento con video de Yoked,
Fases de prueba; todo, excepto las Fases de entrenamiento de interacción en vivo) utilizaron un
rastreador ocular Tobii X60 para recopilar datos de la mirada durante exposicion de video La
mirada de los niños se registró a través de una caja de sensores colocada frente a un monitor de
computadora de 32.5 pulgadas. Esta mirada oculta capturada dentro de una caja virtual de espacio
(20 cm × 15 cm × 40 cm) según lo determinado por la máquina. Los niños se sentaron en el regazo
de sus padres en una silla a aproximadamente 80 cm del borde de la mesa de la computadora. La
altura de la silla se ajustó para cada diada participante, de modo que los ojos de los niños se
ubicaran a 90 cm a 115 cm por encima del suelo en la dimensión vertical y en el centro de la
dimensión horizontal de 40 cm de la barra de sensores. Antes de que comenzara el estudio,
apareció un indicador en la pantalla para confirmar que los ojos del niño estaban centrados
correctamente en el espacio virtual para la detección. Las fijaciones de cada niño se calibraron a
través de un video corto y amigable para niños de un gato animado acompañado por un sonido de
timbre en cada una de las cinco ubicaciones estandarizadas en la pantalla. Las condiciones de chat
de video del estudio utilizaron el mismo aparato, pero el monitor de la computadora también
estaba equipado con una cámara web de alta calidad (Logitech Quickcam Vision Pro) y un
micrófono externo (Logitech USB Desktop Microphone). La cámara web se conectó al monitor de
la computadora en el centro superior de la pantalla y se inclinó ligeramente hacia abajo para
capturar el video de la cabeza y el torso del niño. El micrófono independiente se colocó en el
escritorio a la derecha del monitor de la computadora y se calibró para capturar el habla del niño.
Durante las interacciones del chat de video, un experimentador apareció en el chat de video desde
otra habitación, en el que estaban sentados frente a una computadora de 21.5 pulgadas con una
cámara incorporada y
micrófono. Ambas computadoras estaban equipadas con Skype, un software de video chat que
conecta a los usuarios a través de Internet. Usando el software de Skype, el experimentador y el
participante se comunicaron entre sí en tiempo real a medida que las computadoras transmitían
audio y video de un lado a otro. Esto proporcionó la base para una interacción contingente.
Todas las condiciones usaron luces fluorescentes para facilitar la captura de la mirada y los padres
usaron lentes opacos para asegurarse de que no vieran el video y que no pudieran influir en los
patrones de apariencia de sus hijos.
Estímulos
Cada niño fue entrenado y probado en cuatro verbos nuevos (Tabla 1). Las cuatro acciones
referentes eran transitivas, lo que significa que las acciones requerían que se actuara sobre un
objeto o personaje. Cada acción fue etiquetada con una palabra sin sentido. Para entrenar a los
niños en cada uno de los verbos de novela, un experimentador realizó la acción de referencia con
el puntal designado mientras etiquetaba la acción con el verbo de novela. Por ejemplo, meeping
se refiere a girar un dial en un objeto. Cuando el experimentador realizó una charla para el niño,
ella dijo: “¡Mira lo que puedo hacer con este juguete! ¡Lo estoy haciendo! ¿Me ves llorando el
juguete? Wow, estoy llorando! ¡Mírame lloriquear el juguete! Estoy llorando. ¡Me hace el juguete!
¿Te gustaría ver eso de nuevo? Déjame mostrarte una vez más. ¡Guay! ¡Lo estoy haciendo! ¿Me
ves llorando el juguete? Wow, estoy llorando! ¡Mírame lloriquear el juguete! Estoy llorando.
¡Estoy hablando del juguete! ”Cada verbo de la novela fue pronunciado 12 veces en oraciones
completas. La secuencia de comandos fue idéntica para cada acción, excepto para el verbo de la
novela en particular (es decir, blicking, twilling, frepping, meeping) y el objeto específico utilizado
para demostrar la acción. Todos los verbos fueron probados usando clips de video editados de
Sesame Beginnings (Hassenfeld, Nosek & Clash, 2006a; 2006b). Cada clip de prueba requería que
los niños extendieran su conocimiento del verbo de la novela a un nuevo actor y a un nuevo objeto
que realiza la acción. Por ejemplo, un experimentador demostró su presencia durante el
entrenamiento al girar los rotores en un helicóptero de juguete, pero el clip de prueba de la
demostración mostró al padre de Elmo girando el dial en una radio antigua. Aunque el
los rotores y el dial de radio eran perceptualmente similares, y el experimentador y el padre de

Elmo hicieron movimientos de giro similares; sin embargo, los niños tenían que ampliar su
conocimiento de la presencia de un nuevo actor que realiza la acción (es decir, de un actor
humano a un actor títere) Nuevo objeto (es decir, de un helicóptero a una radio).
Procedimiento
El experimento se dividió en cinco fases que siempre ocurrieron en el mismo orden y consistió en
la Introducción / Fase de aprendizaje, Fase de entrenamiento 1, Fase de prueba 1, Fase de
entrenamiento 2, Fase de prueba 2, con la condición de entrenamiento como la única variable
entre los sujetos (Figura 1). La capacitación y la evaluación de los verbos nuevos se dividieron en
dos segmentos basados en datos piloto que sugieren que los niños perdieron el enfoque en la
tarea cuando se presentaron cuatro verbos en serie. Es importante destacar que cada niño solo
experimentó un modo de entrenamiento durante el experimento. Es decir, un niño en la condición
de chat de video participó en una interacción de chat de video durante la Fase de entrenamiento 1
y la Fase de entrenamiento 2. Cada niño estuvo expuesto a cuatro verbos durante todo el estudio.
Fase de introducción: un personaje (por ejemplo, Cookie Monster) apareció primero en un lado de
la pantalla y luego en el otro lado durante 6 segundos cada uno. El orden de presentación
izquierda / derecha fue compensado. Esta introducción aseguró que los niños pequeños
esperaban encontrar información en ambos lados de la pantalla. Fase de reconocimiento: los
niños vieron vistas previas de los clips de prueba exactos que se mostrarán en la Fase de prueba.
Medir el tiempo de espera de esta presentación en pantalla dividida antes del entrenamiento
permitió detectar preferencias a priori para cualquiera de los miembros de un par de clips. La falta
de una preferencia a priori en la fase de saliencia indica que los niños no tenían una preferencia
natural por mirar un videoclip o el otro. Esto asegura que las diferencias en el tiempo de
observación durante la fase de prueba se deben a los efectos de la fase de entrenamiento. Debido
a que cada niño recibió capacitación en cuatro verbos nuevos, la fase de saliencia presentó cuatro
clips de prueba de 6 segundos; uno para cada uno de los verbos de novela en los que la acción de
novela para el verbo de novela se emparejó con una segunda acción de novela.
Cada uno de los cuatro ensayos en la Fase de Saliencia fue separado por un "ensayo de centrado"
de 3 segundos que mostraba un video de un bebé riendo acompañado de música para niños. Esto
fue diseñado para recordar la atención del niño al centro de la pantalla. El orden de presentación
de los videos de prominencia para cada verbo fue compensado. Fases del entrenamiento: los
niños participaron en una serie de dos fases de entrenamiento y pruebas. Para entrenar y probar
con mayor eficacia cuatro verbos nuevos, cada fase de entrenamiento presentó dos verbos nuevos
y el niño fue evaluado de inmediato en esos verbos en la siguiente fase de prueba. Los dos verbos
restantes fueron emparejados y presentados en la segunda Fase de Entrenamiento y Prueba. La
presentación y el orden de las pruebas se compensaron entre los participantes, de modo que cada
verbo apareció con la misma frecuencia tanto en la primera como en la segunda posición de
entrenamiento y en las posiciones de prueba. Capacitación de video chat: los niños asignados a las
fases de entrenamiento de video chat se sentaron en el regazo de sus padres frente al monitor de
la computadora, la cámara web y el micrófono. Un experimentador (Experimentador 1) estaba
sentado frente a una computadora en otra habitación lista para interactuar con el niño a través de
Skype. Dado que el formato de chat de video requería que el Experimentador 1 y el participante
estuvieran en diferentes salas, las sesiones de entrenamiento de chat de video requerían la
asistencia de un segundo experimentador (Experimentador 2) para operar la computadora del
participante. Inmediatamente
Después de las fases de Introducción y Saliencia, Experimentador 2 inició una llamada de Skype
con el Experimentador 1. Una vez que se respondió la llamada, el Experimentador 2 comenzó a
registrar los eventos con el rastreador ocular Tobii, maximizó la pantalla de Skype y ocultó todas
las barras de herramientas de Skype. Cuando se completó este proceso, el monitor de la
computadora del niño contenía un video en pantalla completa de Experimentador 1 y nada más. El
Experimentador 2 le indicó al Experimentador 1 que la Fase de Entrenamiento podría comenzar y
se movió detrás de una partición durante la duración de la Fase de Entrenamiento.
Las Fases de entrenamiento de Video Chat utilizaron un guión fijo para garantizar que todos los
participantes recibieran la misma información verbal. El Experimentador 1 comenzó el
entrenamiento de video chat con un período de calentamiento; saludó al niño por su nombre, le
hizo una pregunta relacionada con la hora inicial del niño en la sala de juegos del laboratorio (por
ejemplo, "¿Le gustó jugar con los bloques?"), e invitó al niño a jugar un juego corto. El juego
consistió en que el experimentador le hiciera preguntas al niño, como por ejemplo, "¿Puedes
señalar tus ojos? ¿Dónde están tus ojos? ”El experimentador 1 respondió de manera contingente
al niño después de hacer las preguntas, de modo que si el niño señalaba sus ojos con éxito,
Experimentador 1 aplaudiría y diría "¡Gran trabajo! ¡Usted señaló sus ojos! "Si el niño no responde
de inmediato, el Experimentador 1 lo incitará diciendo:" Puedo ver sus ojos, ¿puede señalarlos por
mí? "Si el niño no responde después de 3 indicaciones, el Experimentador Reconocí que la falta de
respuesta pasó a otra pregunta (por ejemplo, "Esa fue una pregunta difícil. Probemos otra"). El
objetivo de este procedimiento de calentamiento fue establecer al experimentador como un socio
socialmente contingente y demostrar la naturaleza interactiva del video chat (Troseth et al., 2006).
El experimentador continuó involucrando al niño con preguntas durante 60 segundos, según lo
medido por un temporizador en la computadora del experimentador. Para comenzar a entrenar
los verbos de la novela, el experimentador dijo: “Tengo algunos juguetes divertidos para
mostrarles. ¡Déjame mostrarte algunos juguetes geniales! ”Para cada uno de los verbos nuevos
presentados durante una sesión de entrenamiento, el experimentador produjo el juguete o la
muñeca prescritos y realizó la acción durante 60 segundos. mientras lo etiqueta 12 veces en
oraciones completas. Aunque la experimentadora centró su atención en la niña en la pantalla,
ocasionalmente miró hacia la acción que estaba produciendo. Al final de la demostración, el
experimentador repitió el proceso para el segundo verbo de novela en la Fase de entrenamiento.
El orden de presentación del verbo fue contrapesado. La fase de entrenamiento duró
aproximadamente 3 minutos: un minuto para el período inicial de calentamiento y un minuto para
presentar cada uno de los dos verbos nuevos. En la fase de entrenamiento de Video Chat, como en
todas las fases de entrenamiento, los padres usaron lentes opacos y se les pidió que se abstengan
de interactuar con sus hijos; Todos los padres cumplieron. Entrenamiento de interacción en vivo:
los niños asignados al entrenamiento de interacción en vivo pasaron del regazo de sus padres a
una silla frente al Experimentador 1 en una mesa para niños en la misma sala para comenzar la
Fase de Entrenamiento. El padre permaneció en la silla frente a la computadora durante la
interacción en vivo, todavía con lentes opacos y orientado lejos del experimentador y el niño.
Interacción en vivo Las Fases de entrenamiento usaron el guión común. Como en las otras
condiciones, la
La fase de entrenamiento comenzó con un período de calentamiento. El experimentador comenzó

saludando al niño por su nombre, haciendo preguntas relevantes para la experiencia de juego del
niño e invitándolo a jugar un juego corto que demuestra la naturaleza contingente de la
interacción en vivo. Después de esta secuencia inicial, el experimentador presentó los dos verbos
nuevos. Los accesorios necesarios para realizar las acciones se ocultaron en un contenedor opaco
junto a la mesa. El experimentador 1 recuperó los juguetes según fue necesario y luego los volvió a
colocar en el recipiente. Por lo tanto, la exposición de los niños a los juguetes se limitó a la
demostración de un minuto del nuevo verbo, como en las otras condiciones de entrenamiento.
Nuevamente, cada fase de entrenamiento duró aproximadamente tres minutos: un minuto para el
juego de calentamiento y un total de dos minutos para la presentación de los dos verbos nuevos.
Entrenamiento con video de Yoked: los niños asignados al entrenamiento con video de yugo
estaban sentados en su
La vuelta de los padres frente al monitor de la computadora durante la sesión de entrenamiento,

al igual que en la condición de chat de video. Estos niños vieron un video extraído de las
grabaciones del rastreador ocular de los entrenamientos de video chat anteriores. Los videos de
Yoked fueron un subconjunto de todos los entrenamientos de video chat seleccionados para ser
representativos del orden de presentación del verbo equilibrado, así como la duración total del
entrenamiento. Por lo tanto, se tomaron cuatro juegos de videos (cada uno incluye tanto la Fase
de entrenamiento 1 como la Fase de entrenamiento 2) de la condición de chat de video para
usarlos como entrenamiento en la condición de video enlazado. Se utilizaron videos de Yoked para
dar a los niños la experiencia exacta, menos la contingencia social, de los chats de video. El
aspecto crítico de la capacitación en video con yugo es que los niños en realidad no
experimentaron una interacción socialmente contingente con el experimentador en el video. Más
bien, las respuestas del experimentador se registraron y no cambiaron, independientemente de
cómo
El niño trató de interactuar con el experimentador. Dentro del video, la sesión de entrenamiento
fue idéntica a las otras condiciones: un período de calentamiento de un minuto seguido de dos
minutos de entrenamiento de verbos nuevos que contenían 12 presentaciones de cada verbo de
novelas.
Fases de la prueba: después de cada fase de capacitación, todos los niños participaron en la misma
fase de la prueba que examinó su conocimiento de los verbos. Las Fases de prueba basadas en
video consistieron en cuatro pruebas por verbo y fueron idénticas para todos los niños,
independientemente del tipo de entrenamiento que recibieron. Los cuatro ensayos de prueba
para un verbo en particular se presentaron secuencialmente, seguidos de cuatro ensayos de
prueba para el segundo verbo novedoso entrenado. Por lo tanto, cada fase de prueba contenía
ocho pruebas de prueba totales. En cada una de las pruebas, una pantalla dividida presentó
simultáneamente dos nuevos clips. Uno de los clips mostró la misma acción que los niños vieron
durante la Fase de entrenamiento (por ejemplo, blicking). Es importante destacar que todas las
condiciones requerían que los niños extendieran su conocimiento del verbo de la novela a un
nuevo actor y una nueva instanciación del evento. Como la extensión es más exigente que rápida.
Mapeo (por ejemplo, Seston, Golinkoff, Ma & Hirsh-Pasek, 2009), la inclusión de los ensayos de
extensión proporciona una fuerte prueba de aprendizaje verbal.
Los niños vieron los mismos videoclips para todos los ensayos de prueba para cada verbo; Las
pruebas diferían en el audio que escuchaban los niños, que les pedía que vieran diferentes
eventos. De los cuatro ensayos de prueba para un verbo dado, los ensayos 1 y 2 fueron diseñados
para examinar la capacidad de los niños para generalizar el verbo entrenado a una acción realizada
por un actor novel (por ejemplo, de experimentador a títere). En esta prueba de extensión, el
audio pregrabado pidió a los niños que encontraran la acción etiquetada por el verbo de la novela.
Por ejemplo, si se entrenó a los niños para que el nuevo verbo blicking se refiriera a rebotar arriba
y abajo sobre la rodilla, un clip de prueba mostró al padre de Elmo rebotando a Elmo sobre la
rodilla (la acción correspondiente) y el otro clip mostró a la madre de Cookie Monster meciéndose
Cookie Monster (la acción no coincidente). El audio preguntó a los niños, "¿Dónde está blicking?
¿Puedes encontrar blicking? ¡Mira a blicking! ”Si los niños aprenden el verbo objetivo, deben mirar
la acción correspondiente o el padre de Elmo que despide a Elmo durante cada una de las dos
primeras pruebas de prueba. Las pruebas de prueba 3 y 4 juntas constituyeron una prueba
rigurosa de aprendizaje de verbos preguntando si los niños realmente habían asignado el verbo de
la novela a la acción de la novela en particular (Hollich, HirshPasek y Golinkoff, 2000). Aquí,
examinamos si los niños aceptarán algún nuevo verbo para la acción presentada durante el
entrenamiento o si los niños saben que solo el verbo entrenado debe etiquetar la acción
entrenada. Basado en el principio de exclusividad mutua (Markman, 1989), los niños deberían
preferir unir un solo verbo a cualquier acción dada. Por lo tanto, la Prueba de Prueba 3, la prueba
del Nuevo Verbo, pidió a los niños que encontraran una acción novedosa que no estuviera
etiquetada durante el entrenamiento ("¿Dónde está glorping? ¿Puede encontrar glorping? ¡Mire
glorping!"; Glorping, spulking, hirshing, and wezzling was términos utilizados para los verbos no
entrenados). Si los niños aprendieron el verbo objetivo (por ejemplo, hacer blick), no deben mirar
hacia la acción etiquetada anteriormente como blicking durante la nueva prueba del verbo. En su
lugar, pueden mirar hacia la acción no coincidente (por ejemplo, la mamá de Cookie Monster
meciendo a Cookie Monster), deduciendo que si la acción blicking ya había sido nombrada,
glorping debe referirse a la otra acción no coincidente. O los niños pueden no mostrar preferencia
por ninguna de las acciones, lo que indica indirectamente que no están dispuestos a adjuntar una
nueva etiqueta a la acción previamente etiquetada. Prueba de prueba 4, la prueba de
recuperación, pidió a los niños que renovaran su atención a la acción entrenada (p. Ej., El padre de
Elmo que despide a Elmo) pidiéndolo nuevamente por su nombre ("¿Dónde está el blicking?
¿Puedes encontrar el blicking? ¡Mira el blicking!") . En resumen, los niños que aprendieron un
verbo novedoso deberían mirar más hacia la acción de concordancia durante la Prueba de
Extensión (ensayos 1 y 2), apartar la vista de la acción de emparejamiento en la Prueba de Prueba
3 (el nuevo verbo de prueba) y reanudar la búsqueda de concordancia pantalla durante la prueba
de prueba 4 (la prueba de recuperación). Esta forma de v en el tiempo de fijación visual durante la
Prueba de extensión, Prueba de prueba 3 y Prueba de prueba 4 forma un patrón cuadrático de
observación, en el que podemos examinar las diferencias relativas entre estos tres puntos de
datos para determinar si observar la acción entrenada en Prueba La prueba 3 es relativamente
menor que en la prueba de extensión; y si mirar a la acción entrenada es relativamente más en el
ensayo de prueba 4 que en el ensayo de prueba 3. El contrapeso determinó qué verbo se probó
primero y segundo en cada fase de prueba. Después de que se probaron los dos verbos nuevos,
los niños participaron en la segunda serie de Fases de entrenamiento y pruebas (Figura 1). En
resumen, el protocolo completo duró 10 minutos (54 s para las fases de introducción y saliencia, 3
min para cada una de las dos fases de entrenamiento y 93 s para cada una de las dos fases de
prueba), más el tiempo mínimo para las transiciones entre las fases.
Codificación
Primero codificamos la atención general de los niños a las Fases de entrenamiento. Para los niños
en el video chat y en las condiciones del video enlazado, los datos fueron registrados por el
rastreador ocular Tobii. Para los niños en la condición de entrenamiento de interacción en vivo,
utilizamos grabaciones de video de estas interacciones. Los datos de video fueron codificados
fuera de línea por un codificador entrenado. Un segundo codificador recodificó el 25% de las
medidas de atención para el entrenamiento de interacción en vivo para establecer la confiabilidad.
La atención a la Fase de Entrenamiento se definió simplemente por la cantidad de tiempo que el
niño miró hacia el experimentador o la acción (en oposición a la pared o la puerta de la habitación,
por ejemplo). A continuación, la dirección de la mirada de los niños y la duración de los lados
izquierdo y derecho de la pantalla dividida se codificaron para las fases de saliencia y prueba. La
dirección de la mirada y la duración durante las fases de Prueba y Salud se usaron para calcular el
porcentaje de tiempo que los niños miraron a ambos lados de la pantalla.
Finalmente, exploramos la mirada de los niños durante las fases de entrenamiento. Aunque los
chats de video se aproximan a las interacciones sociales en vivo de muchas maneras, nos
interesaron los patrones de atención de los niños a los ojos del experimentador en el chat de video
y en las condiciones del video de yugo. Para examinar los patrones de observación, definimos los
ojos del experimentador como un área de interés (AOI). Debido a que la fuente de video para la
sesión de entrenamiento de cada niño era única (con la excepción de los videos enlazados, que
incluían algunas repeticiones), esta AOI se definió individualmente para cada presentación verbal
para cada niño. Para capturar el movimiento de la cabeza del experimentador a lo largo del tiempo
con un AOI estático, un programador capacitado observó los videos, marcó las extremidades del
movimiento del ojo y luego utilizó estas medidas para definir el AOI. La vista ocular especificada
AOI se utilizó para determinar la fijación total a los ojos del experimentador durante el
entrenamiento. Esto se convirtió en un porcentaje del tiempo total de búsqueda.
Resultados
Se llevaron a cabo análisis preliminares para establecer los efectos nulos de varias variables para
las que se suponía que no había diferencias debido a la condición de entrenamiento: preferencias
de prominencia, género, tiempo total de las fases de entrenamiento y atención infantil durante el
entrenamiento. Para determinar los efectos potenciales del género y si los niños tenían una
preferencia a priori para cualquiera de los clips de prueba durante la Fase de saliencia, un
preliminar 2 (género) x 4 (porcentaje mirando la acción correspondiente durante la prominencia
para cada verbo novedoso: blicking, frepping, twilling) , meeping) se realizó un análisis
multivariado de varianza (MANOVA). No surgieron efectos de género, F (1, 36) = .77, p = .55, ηp 2
= .09 y los resultados indicaron que no hubo sesgo hacia ninguno de los clips de prueba para
ninguno de los verbos nuevos (blicking, F (1, 36) = .05, p = .82, ηp 2 <.01; frepping, F (1, 36) = .07, p
= .80, ηp 2 <.01;
twilling, F (1, 36) = .37, p = .55, ηp 2 = .01; y, meeping, F (1, 36) = 1.82, p = .19, ηp
2 = .05).
Un análisis preliminar final preguntó si la atención a la capacitación y la duración de las fases de

capacitación diferían según las condiciones. Un ANOVA de una sola vía comparó la atención de los
niños con el entrenamiento y la duración del entrenamiento por condición (es decir, video chat,
interacción en vivo, video con yugo). No se encontraron diferencias entre los grupos para la
atención de los niños al entrenamiento, F (2, 35) = .02, p = .99, ηp 2 <.01, o en la duración del
entrenamiento F (2, 35) = .25, p = .78, ηp 2 = .02. En conjunto, estos análisis indican que las
diferencias a nivel de grupo en la prueba no pueden atribuirse al tiempo empleado en la
capacitación. Para determinar si el aprendizaje del video chat se parecía más al aprendizaje de las
interacciones en vivo o al aprendizaje de los videos, examinamos la comprensión de palabras
novedosas durante las Fases de prueba y las referencias de los niños a los ojos del experimentador
durante las Fases de entrenamiento.
¿Los niños pequeños mostraron evidencia de la comprensión verbal de una novela?
Prueba de extensión del aprendizaje verbal: en las pruebas de prueba 1 y 2, se pidió a los niños
que encontraran
La acción coincidente cuando escucharon el verbo de la novela. Como estos ensayos fueron
idénticos, los datos de los ensayos de prueba 1 y 2 se promediaron para cada uno de los verbos. El
uso de la media de dos pruebas de prueba aumenta la confiabilidad de las respuestas de los niños.
A cada niño se le enseñaron cuatro verbos nuevos y porque estudios anteriores han encontrado
un efecto de orden tal que los niños aprenden mejor los verbos más adelante en el experimento
(Roseberry et al., 2009), un 3 (tipo de entrenamiento: chat de video, interacción en vivo, video en
yugo) Se utilizó el análisis de varianza (ANOVA) de 4 × (orden verbal) para determinar el efecto del
estilo de entrenamiento y el orden verbal en el aprendizaje. Los resultados indican un efecto
principal de la condición de entrenamiento, F (2, 36) = 12.04, p <.001, ηp 2 = .50, pero sin efecto
principal de verborder, F (3, 36) = .45, p = .72 , ηp 2 = .05, y ningún efecto de interacción, F (6, 36)
= .91, p = .50, ηp 2 = .19. Esto sugiere que la condición de entrenamiento afectó la capacidad de
los niños para aprender verbos nuevos y que el aprendizaje no se vio afectado por el orden verbal.
Otros análisis consideraron todos los verbos sin importar el orden.
Para descifrar el efecto de los diferentes estilos de entrenamiento, realizamos pruebas de pruebas
pareadas planificadas, comparando los tiempos de observación de los niños con la acción
correspondiente y la acción no correspondiente para cada tipo de entrenamiento. Después de las
correcciones de Bonferroni para comparaciones múltiples, los resultados indicaron que los niños
que fueron entrenados a través de video chats e interacciones en vivo miraron significativamente
más hacia la acción correspondiente, t (11) = 7.06, p <.001 (m = 66.90, SD = 8.29 para la
comparación) acción; m = 33.1, SD = 8.29 a la acción no coincidente), y t (11) = 5.87, p <.001 (m =
64.19, SD = 8.37 a la acción correspondiente) m = 35.81, SD = 8.37 a la acción no coincidente),
respectivamente. Estos tiempos de búsqueda medios no difirieron entre sí, t (22) = .80, p = .43 (m
= 66.90, SD = 8.29 a la acción correspondiente en la condición de chat de video; m = 64.19, SD =
8.37 al acción coincidente en la condición de interacción en vivo). En contraste, los niños
entrenados a través del video enyugado no miraron más hacia ningún lado de la pantalla, t (11) =
.05, p = .96 (m = 50.12, SD = 8.57 a la acción correspondiente, m = 49.88, SD = 8.57 a la acción no
coincidente; Figura 2a). Por lo tanto, los niños solo aprendieron los verbos de la novela después
del chat de video o el entrenamiento de interacción en vivo, pero no cuando fueron entrenados
con videos enlazados.
Prueba rigurosa de aprendizaje verbal: la Prueba rigurosa de aprendizaje verbal se compone de

tres puntos de datos: el puntaje promedio de las Pruebas de Prueba 1 y 2 (la Prueba de Extensión),
la Prueba de Prueba 3, la prueba New Verb, y la Prueba de Prueba 4, la prueba de Recuperación.
Cabe destacar que esta prueba se basa en el patrón de resultados entre los tres puntos de datos,
en oposición a los porcentajes específicos de los tiempos de observación. Debido a que
planteamos la hipótesis de que la Prueba rigurosa detectaría un aprendizaje sólido cuando los
niños tuvieran éxito en la Prueba de extensión, analizamos aún más los patrones de búsqueda solo
para determinar las condiciones en las que los niños extendían el verbo novedoso (Roseberry et
al., 2009); Video chat y condiciones de entrenamiento de interacción en vivo. Los datos se
analizaron utilizando un ANOVA de medidas repetidas con tipo de entrenamiento (video chat o
interacción en vivo) como el factor entre sujetos y una serie de tres puntos de datos (prueba de
extensión, ensayo de verbo nuevo, ensayo de recuperación) como factor dentro de los sujetos. Los
resultados no sugieren ningún efecto principal del tipo de entrenamiento, F (1,22) = 1.86, p = .19,
ηp 2 = .08, pero surgió un contraste cuadrático significativo dentro de los sujetos, F (2,22) = 30.08,
p < .001, ηp 2 = .58, que indica que los niños con entrenamiento contingente (ya sea a través de
video chat o interacción en vivo) aprendieron los verbos de la novela, incluso según los estándares
de la prueba fuerte de aprendizaje verbal (Figura 2b). Además, las pruebas t de muestras
emparejadas con las correcciones de Bonferroni revelaron que los niños en la condición de video
chat no tenían preferencia por ningún lado de la pantalla en la Prueba de Prueba 3, t (11) = 1.79, p
= .10 (m = 42.12, SD = 15.26 a la acción coincidente; m = 57.88, SD = 15.26 a la acción no
coincidente), pero miró significativamente más hacia la pantalla correspondiente en la Prueba de
Prueba 4, t (11) = 6.57, p <.001 (m = 74.60, SD = 13.00 a la acción coincidente; m = 25.40, SD =
13.00 a la acción no coincidente). El mismo patrón surgió para los niños en la condición de
interacción en vivo, t (11) = 1.76, p = .11 (m = 41.45, SD = 16.83 para la acción coincidente; m =
58.55, SD = 16.83 para la acción no coincidente) yt (11) = 3.50, p = .005 (m = 65.68, SD = 15.51 a la
acción coincidente; m = 34.32, SD = 15.51 a la acción no coincidente), respectivamente.
Finalmente, una comparación del porcentaje de tiempo entre niños en el chat de video y las
condiciones de interacción en vivo durante la Prueba rigurosa no reveló diferencias en la Prueba
de prueba 3, t (22) = .10, p = .92 (m = 42.12, SD = 15.26 a la acción coincidente en la condición de
video chat; m = 41.45, SD = 16.83 a la acción coincidente en la condición de interacción en vivo), o
en la Prueba de Prueba 4, t (22) = 1.53, p = .14 (m = 74.60, SD = 13.00 a la acción coincidente en la
condición de video chat; m = 65.68, SD = 15.51 a la acción coincidente en la condición de
interacción en vivo). Por lo tanto, después del entrenamiento contingente (ya sea en vivo o por
video chat), los niños tuvieron éxito en la Prueba de Extensión, no mostraron preferencia en la
nueva prueba verbal, y nuevamente prefirieron la pantalla correspondiente en la prueba de
recuperación.
¿Los niños miran a los ojos del experimentador durante el entrenamiento?
Para investigar si los niños hicieron referencia a los ojos del experimentador durante el
entrenamiento, realizamos una prueba t de Muestras Independientes para detectar las diferencias
en el porcentaje de tiempo entre los niños en el chat de video y las condiciones de entrenamiento
de video enlazadas, o los grupos de entrenamiento para los cuales tuvimos datos de mirada
ocular. . Los resultados no revelaron un efecto significativo del grupo de entrenamiento, t (22) =
1.52, p = .14 (m = 22.42, SD = 12.86 en la condición de chat de video; m = 14.08, SD = 14.00 en la
condición de video enlazado), sugiriendo que los niños en entrenamiento de video chat y video en
yugo no difirieron en la cantidad de tiempo que miraron a los ojos del experimentador. Aunque la
asignación de miradas no difirió a nivel grupal, las diferencias individuales en la atención de los
niños a los ojos durante el entrenamiento pueden estar relacionadas con su desempeño en la
prueba. Las correlaciones de Pearson revelaron que el porcentaje de tiempo de observación de los
niños dirigido hacia los ojos del experimentador se correlacionó significativamente con el tiempo
de observación durante la prueba de extensión, r (24) = .66, p <.001. Esto sugiere que cuanto más
se centre un niño en los ojos del experimentador durante la fase de entrenamiento, más tiempo
observarán la acción correspondiente durante la prueba de extensión del aprendizaje verbal.
Discusión
Las discusiones sobre la capacidad de los niños pequeños para aprender el lenguaje de las
interacciones en vivo pero no de los medios de pantalla aparecen repetidamente en la literatura
(p. Ej., Childers y Tomasello, 2002; Krcmar et al., 2007; Kuhl et al., 2003; Naigles et al., 2005 ;
Roseberry et al., 2009; Scofield & Williams, 2009; Zimmerman et al., 2007). El estudio actual utilizó
una nueva tecnología, video chats, para comenzar a entender el mecanismo detrás de esta
dicotomía. Preguntamos si el aprendizaje de idiomas a través de video chats es similar al
aprendizaje en interacciones en vivo o al aprendizaje de video.
Encontramos que los niños pequeños aprendieron palabras nuevas tanto en video chats como en
vivo. interacciones, lo que sugiere que las interacciones socialmente contingentes son un
poderoso catalizador para el aprendizaje de palabras. Impresionantemente, los niños que
aprendieron en estos entornos contingentes extendieron los verbos nuevos a nuevas instancias de
la acción, una tarea que es más exigente que simplemente mapear los significados verbales a las
acciones, y los niños se resistieron a aplicar una segunda etiqueta de novela a la misma acción.
Además, encontramos algunas pruebas de que los niños que asistieron a los ojos del
experimentador durante el entrenamiento aprendieron mejor las nuevas palabras. Esta
investigación tiene implicaciones importantes para el papel de las señales sociales en el
aprendizaje de idiomas, así como para la forma en que los niños procesan los medios de pantalla.
Mecanismos sociales del aprendizaje de idiomas
De los posibles mecanismos que facilitan la adquisición del lenguaje de los niños pequeños, el
estudio actual destaca el papel de la contingencia social. La tecnología de video chat nos permitió
comparar el aprendizaje de medios de pantalla socialmente contingentes con el aprendizaje de
interacciones en vivo socialmente contingentes y video no contingente. Los resultados sugieren
inequívocamente que el aprendizaje de idiomas mejora con la contingencia social.
Basados en el trabajo de Troseth y sus colegas (2006), definimos a los adultos socialmente
contingentes como interlocutores sociales cuyas respuestas fueron inmediatas, confiables y
precisas en el contenido. Aunque esto difiere de la definición tradicional de contingencia, en la
que la sincronización del tiempo es el único requisito, las características de las interacciones
sociales, como la toma de turnos, respaldan una definición más amplia de contingencia social.
Según Csibra (2010), “tomar turnos es un tipo de contingencia interactiva que es cualitativamente
diferente de la sincronía temporal o las reacciones de reflejo simultáneas” (p. 150). Este tipo de
contingencia interactiva o social requiere un patrón iterativo de respuestas de ida y vuelta que
contengan contenido complementario, no idéntico (Csibra, 2010). De manera crítica, las
interacciones socialmente contingentes deben mantener estos elementos a lo largo del tiempo, ya
que las investigaciones demuestran que los niños son sensibles a los retrasos temporales (Henning
y Striano, 2011), alteraciones en la confiabilidad de la respuesta (Goldstein et al.,
2009), y cambios en la precisión del contenido (Scofield & Behrend, 2008).
¿Por qué la contingencia social era tan útil para los niños pequeños? Un beneficio de la
contingencia social puede ser la confianza que establece entre el hablante y el niño (Koenig &
Harris, 2005; Sabbagh & Baldwin, 2001; Scofield & Behrend, 2008). Un período de calentamiento
comenzó todas las fases de entrenamiento y permitió a los niños determinar si el orador era
confiable o no. El experimentador le hizo preguntas al niño (por ejemplo, "¿Puedes señalar tu
camisa?"), Elogió al niño por una respuesta correcta (por ejemplo, "¡Eso está bien!"), Corrigió al
niño por respuestas incorrectas (por ejemplo, "Tu camisa está no es rojo. ¡Es amarillo! ”), y ofreció
sugerencias específicas para niños como indicaciones (es decir,“ Puedo ver el animal en tu camisa.
¿Qué tipo de animal es? ”). Aunque esta interacción fue probablemente beneficiosa para los niños
en condiciones de entrenamiento contingente, los niños en video-entrenamiento no contingente
con yugo pueden haber experimentado el efecto contrario; estos niños experimentaron la
interacción de calentamiento de otro niño. Cuando los niños entendieron que las preguntas y
respuestas del experimentador no dependían del destinatario, el experimentador demostró ser
poco confiable. Esto puede haber sido particularmente importante una vez que el experimentador
comenzó la novedosa formación de verbos, que usaba un guión fijo. Cuando el experimentador
produjo los verbos de la novela mientras realizaba las acciones, la etiqueta del verbo de la novela
siempre aparecía junto con la acción correspondiente, que es un tipo de sincronía temporal (Brand
& Tapscott, 2007; Tomasello & Barton, 1994). Denominado "embalaje acústico" (Hirsh-Pasek y
Golinkoff, 1996), esta técnica ha demostrado facilitar el aprendizaje de idiomas de los niños
(Tomasello y Barton, 1994). Aunque la sincronía temporal entre la etiqueta y la acción existía en
las tres condiciones de entrenamiento, solo la contingencia social parecía facilitar el aprendizaje
de palabras en el presente estudio.
Una segunda pregunta crítica que surge de los hallazgos actuales es cómo sabemos que los
resultados pueden atribuirse a la contingencia y no a otra señal social, como la mirada o la
atención conjunta, particularmente a la luz del hecho de que nuestros resultados indican que los
niños que miraron Más tiempo a los ojos del experimentador también aprendió mejor las palabras
de la novela.
Investigaciones anteriores sugieren que la atención a la mirada es beneficiosa para el aprendizaje

del lenguaje (por ejemplo, Baldwin et al., 1996; Brooks & Meltzoff, 2005), y que la mirada es un
componente crítico de la atención conjunta o una interacción social en la que ambos socios
centran su atención en un objeto o evento común (Adamson et al., 2004; Baldwin, 1991; Bruner,
1981; Moll & Tomasello, 2007). Aunque el estudio actual midió la atención de los niños a los ojos
del experimentador y no a los ojos que los seguían, se sabe que los niños establecen contacto
visual inmediatamente antes de seguirlos. De hecho, es posible que los niños no sigan la mirada de
un hablante a menos que hayan experimentado primero una mirada mutua (Senju & Csibra, 2008;
Senju, Csibra & Johnson, 2008). Puede ser que nuestra medida de atención a los ojos del hablante
haya captado la primera parte de este proceso. La correlación entre la atención a los ojos y el
aprendizaje de idiomas es consistente con investigaciones anteriores que vinculan el seguimiento
visual y el aprendizaje de idiomas (Baldwin, 1991, 1993; Baldwin y otros, 1996; Brooks y Meltzoff,
2005; Dunham, Dunham y Curwin, 1993). Aunque la atención a los ojos del hablante fue útil para
algunos niños pequeños y aunque algunos niños también pueden haber prestado atención
conjunta con el hablante, es poco probable que los niños en el estudio actual confiaran
únicamente en la mirada o en la atención conjunta para aprender palabras nuevas. estos factores
impulsaron el aprendizaje de idiomas, habríamos esperado niños tanto en el video Chat y las
condiciones de entrenamiento con video yugo para aprender las nuevas palabras ya que no había
Diferencia en mirar a los ojos del experimentador entre condiciones. Sin embargo, este hallazgo
no surgió; en cambio, el verdadero predictor del éxito en el estudio actual fue si los niños
experimentaron personalmente una interacción socialmente contingente. En cierto sentido, es
sorprendente que la atención a los ojos durante el entrenamiento de video chat fue útil para niños
en absoluto, ya que la mirada del investigador en el video parecía estar proyectada hacia abajo
debido a la colocación relativa de la cámara y la pantalla de la computadora. Por lo tanto, aunque
los ojos del experimentador en los chats de video se movieron apropiadamente, y se alinearon
adecuadamente para los objetos y las acciones dentro del entorno del experimentador, la vista del
ojo se distorsionó de la perspectiva del niño. Es decir, cuando el experimentador miró al niño en su
pantalla, el experimentador parecía estar mirando hacia la parte inferior de la pantalla desde el
punto de vista del niño. Dado que los niños son adeptos a observar la mirada y no simplemente la
postura del cuerpo o la orientación de la cabeza (Brooks y Meltzoff, 2005), los niños en el estudio
actual asistieron a la mirada desalineada. Aunque los bebés muestran una preferencia por la
mirada directa, a diferencia de la mirada oculta (Blass y Camp, 2001; Hood et al., 2003; Farroni et
al., 2007), se sabe poco sobre cómo los niños pequeños pueden corregir los desajustes en la
alineación de la mirada.
Medios de pantalla para niños
Además de descubrir la contingencia social como una posible herramienta para el aprendizaje de
los niños, también replicamos el hallazgo de que los niños menores de tres años no aprenden el
lenguaje solo a través del video (Krcmar y otros, 2007; Kuhl y otros, 2003; Robb y otros ., 2009;
Roseberry et al., 2009) en el control de yugo. Décadas de investigación demuestran que los niños
mayores de tres años aprenden sólidamente del video (Reiser et al., 1984; Rice & Woodsmall,
1988; Singer & Singer, 1998). La hipótesis de la representación dual puede explicar este cambio
evolutivo en la capacidad de los niños para aprender del video, lo que sugiere que los niños
pequeños tienen problemas para usar la televisión como fuente de información (DeLoache, 1987;
Troseth y DeLoache, 1998). De acuerdo con la hipótesis de la representación dual, los niños
pequeños se sienten tan atraídos por los aspectos destacados y concretos de la televisión que no
pueden comprender su naturaleza abstracta y simbólica (DeLoache, 1987; Troseth y DeLoache,
1998). El apoyo adicional a la hipótesis de la representación dual proviene de experimentos en los
que los niños están convencidos de que
Los eventos en video son realistas y ocurren en vivo. En estas circunstancias, los niños menores de
tres años pueden aprender de los medios de pantalla (Roseberry, Hirsh-Pasek & Golinkoff, 2010;
Troseth & DeLoache, 1998). Los chats de video pueden ayudar a los niños pequeños a evitar la
representación dual a través de una plataforma para interacciones socialmente contingentes. Si
bien los niños mayores pueden compensar la falta de contingencia en los videos tradicionales, este
formato puede ser particularmente útil para los niños más pequeños.
El éxito del video chat es importante para los niños pequeños dado el aumento
popularidad de este medio. Según una estimación, el video chat se ha incrementado en un 900 por
ciento desde 2007, con más de 300 millones de minutos de chats de video que se realizan en
Skype diariamente (Scelfo, 2011). Sin embargo, independientemente de su popularidad, la
tecnología de video chat ofrece a los investigadores la oportunidad de desenredar la contingencia
de otras señales sociales. Nuestros hallazgos sugieren que el aprendizaje de idiomas ocurre en las
interacciones socialmente contingentes que se hacen posibles a través del video chat.
Investigadores en otros dominios también han capitalizado la popularidad del video chat,
utilizando el medio con niños de diferentes edades para investigar la posibilidad de citas virtuales
entre niños en edad escolar (Yarosh, Inkpen & Brush, 2010), y para probar la capacidad de los
niños. para mantener relaciones de apego a los cuidadores a través del espacio virtual (Tarasuik,
Galligan & Kaufman, 2010).
Aunque nuestros hallazgos apoyan la utilidad de los chats de video, también insinúan cómo los
niños adeptos distinguen la contingencia real de otros tipos de interacciones. Nuestros resultados
de la condición del video enlazado indican que simplemente hacer preguntas a los niños y hacer
una pausa para obtener la respuesta no dio como resultado el aprendizaje del idioma si los niños
no podían interactuar de manera contingente con la persona en el video. De hecho, puede ser más
beneficioso para los niños pequeños ver a dos personajes interactuando entre sí en la pantalla que
para que los personajes intenten hablar con los niños directamente. Los niños pequeños aprenden
mejor viendo una interacción social en un video que a través de un video directo (O'Doherty,
Troseth, Shimpi, Goldenberg, Akhtar & Saylor, 2011). Esto tiene implicaciones importantes para los
medios infantiles. Muchos programas de televisión para niños han intentado incorporar las
interacciones en sus programas planteando preguntas a la audiencia invisible, esperando una
respuesta y luego respondiendo (Anderson, Bryant, Wilder, Sontomero, Williams & Crawley, 2000;
Fisch & McCann, 1993). Por ejemplo, el anfitrión de Blue's Clues a menudo se dirigirá a la cámara
(es decir, “¿Ves una pista?”), Se detiene por unos segundos y luego responde (es decir, “¡Ahí está!
¡Tienes razón!”; Troseth et al., 2006). Nuestros resultados sugieren que los niños de hasta 24
meses pueden distinguir este modelo de "pedir y esperar" unilateral de las interacciones
contingentes reales. Una advertencia, sin embargo, es que el estudio actual utilizó nombres de
niños una vez al comienzo del período de calentamiento que comenzó la fase de entrenamiento
(Troseth et al., 2006). En consecuencia, los niños en la condición de video enlazado escucharon el
nombre incorrecto durante el calentamiento pregrabado. La investigación sugiere que los niños
reconocen su nombre por 4.5 meses y probablemente esperan escucharlo de los adultos (Mandel,
Jusczyk y Pisoni, 1995). Como los niños pueden haber estado confundidos cuando el
experimentador se dirigió a ellos con el nombre incorrecto, es posible que un modelo de
"preguntar y esperar" que no usa nombres produzca más aprendizaje que la condición de video
enlazado del estudio actual. Sin embargo, dado que es probable que la contingencia social se
establezca mediante reforzamiento a lo largo del tiempo (Csibra, 2010) y que los niños estén en
sintonía con los cambios en la confiabilidad del hablante (Scofield y Behrend, 2008), puede haber
una segunda interpretación. podría haber compensado la única información incorrecta (es decir, el
nombre utilizado al comienzo del calentamiento) si el contenido posterior hubiera sido oportuno,
confiable y preciso. Es decir, una interacción adicional socialmente contingente podría haber
brindado a los niños datos suficientes para determinar que el orador era exacto en todas las
instancias menos en una y, por lo tanto, suficiente como socio social. Las investigaciones futuras
deberían examinar esta posibilidad.
A medida que la industria del entretenimiento se hace más avanzada tecnológicamente, la

capacidad de incorporar interacciones en vivo en los medios de comunicación transformaría las
experiencias de visualización pasiva en situaciones de aprendizaje socialmente contingentes. Por
lo tanto, el aprendizaje de los niños en los medios puede no ser un producto del medio per se (es
decir, video chat, video o interacción en vivo), sino el tipo de interacción que los niños
experimentan con los medios.
Conclusiones
Este estudio da el primer paso para descubrir los mecanismos responsables de por qué los niños
pueden aprender de las interacciones sociales, pero no del video. Las interacciones socialmente
contingentes, como las de los video chats y las interacciones en vivo, proporcionaron a los niños
pequeños información social suficiente para aprender el idioma. Los resultados de este estudio no
solo abordan la contingencia como una señal social crítica, sino que también resaltan la capacidad
de los medios de comunicación de pantalla para capitalizar el poder de la contingencia social.

Llámame Por Skype

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Llámame Por Skype

Caricato da

Copyright:

Formati disponibili

¡Llámame por Skype!

Interacciones socialmente contingentes ayudan a los niños pequeños a

Un método para investigar la contingencia social en el aprendizaje de idiomas de los niños es a

interacciones o de un video de yugo, utilizamos una versión modificada del Intermodal

los rotores y el dial de radio eran perceptualmente similares, y el experimentador y el padre de

La fase de entrenamiento comenzó con un período de calentamiento. El experimentador comenzó

La vuelta de los padres frente al monitor de la computadora durante la sesión de entrenamiento,

Un análisis preliminar final preguntó si la atención a la capacitación y la duración de las fases de

¿Los niños pequeños mostraron evidencia de la comprensión verbal de una novela?

Prueba rigurosa de aprendizaje verbal: la Prueba rigurosa de aprendizaje verbal se compone de

¿Los niños miran a los ojos del experimentador durante el entrenamiento?

2009), y cambios en la precisión del contenido (Scofield & Behrend, 2008).

Investigaciones anteriores sugieren que la atención a la mirada es beneficiosa para el aprendizaje

Medios de pantalla para niños

A medida que la industria del entretenimiento se hace más avanzada tecnológicamente, la

Potrebbero piacerti anche