Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ISSN: 0716-050X
eped@uach.cl
Universidad Austral de Chile
Chile
INVESTIGACIONES
Resumen Abstract
7
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
INTRODUCCION
FUNDAMENTOS
Marco terico. La perspectiva didctica que se emplear est basada en el modelo terico
denominado enfoque ontosemitico propuesto por Godino y sus colaboradores (Godino
8
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
2002; Godino y Batanero 2003; Godino, Batanero y Font 2007; Godino, Contreras y Font
2006). Este enfoque terico proporciona una perspectiva pragmtico-antropolgica sobre
el conocimiento matemtico y propone tres dimensiones en el anlisis de la enseanza
y el aprendizaje de las matemticas: epistemolgica, cognitiva e instruccional. Cada
una de ellas se aborda con herramientas agrupadas en tres modelos tericos: teora de
los significados institucionales y personales de los objetos matemticos, teora de las
funciones semiticas y teora de las configuraciones didcticas. Se pretende elaborar
un modelo de los procesos de comprensin de las matemticas que tenga en cuenta los
factores institucionales y socioculturales implicados en los mismos. Se considerar para
el anlisis del teorema central del lmite la siguiente tipologa de objetos matemticos
primarios, denominada elementos del significado y que a su vez se organizan en sis-
temas conceptuales, teoras, etc.
9
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
METODOLOGIA
10
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
CAMPOS DE PROBLEMAS
11
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
Las compaas elctricas podan los rboles que crecen cerca de sus lneas para evitar cortes
elctricos debidos a la cada de rboles durante las tormentas. La aplicacin de un producto
qumico para retrasar el crecimiento de los rboles es ms barato que podar los rboles, pero
estos productos matan algunos de los rboles. Suponga que un producto qumico de este tipo
matar el 20% de los arces. La compaa prueba este producto con una muestra aleatoria
de 250 arces. Cul es la probabilidad de que mueran al menos 60 rboles (el 24% de la
muestra)? (Moore 1995: 327)
CP2.1. Variables con distribucin uniforme discreta. Este primer caso fue estudiado
por Laplace, quien se interes por la distribucin de la suma de errores, hacia 1810.
Afront el problema de la desviacin entre la media aritmtica de los datos (diferentes
medidas con errores observacionales) y los valores tericos, suponiendo que todos
stos estn distribuidos aleatoriamente. El teorema proporciona la distribucin de
la media muestral, incluso si la poblacin muestreada no es normal, como vemos
en el siguiente ejemplo en que la poblacin tiene una distribucin uniforme.
12
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
x 4 5 6 7
P (X = x) 0,2 0,4 0,3 0,1
Unos bilogos aseguran que el nmero de semillas por limn, en cierta variedad de limones
sigue una distribucin de Poisson con parmetro = 5. Determinar la probabilidad de que
el nmero promedio de semillas por limn sea menor a 5,5 en una muestra aleatoria de n =
125 limones. (Wisniewski y Velasco 2001: 231).
n
Sean X1 , X 2 ,... variables aleatorias independientes, X n ~ U n, n y Sn = Xi . Mostrar que
i =1
)
Sn E ( Sn n converge a la distribucin normal estndar, verificando las condiciones de
Linderberg y Liapounov. (James 1981: 267).
13
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
CP5: Estimar el error de aproximacin en el teorema central del lmite. Dirichlet fue el
primero en intentar estimar el error de aproximacin, aunque no tuvo xito. Fue Cauchy,
mediante la funcin caracterstica, quien dio una demostracin del teorema siguiendo la
demostracin de Poisson y estableci una cota superior para la diferencia entre el valor
exacto y la aproximacin. Este estudio del error de estimacin tuvo como precedente
la ley de los grandes nmeros, que establece que la media observada X de un nmero
grande de observaciones tiene que estar cerca de la media de la poblacin. Se presenta
el siguiente ejemplo:
El decano de una universidad desea estimar cuntos puntos se puede esperar que obtengan
los aspirantes que se someten a un examen de ingreso. Si utiliza una muestra aleatoria de
100 aspirantes y supone que la desviacin estndar es 20 puntos, qu puede aseverar acerca
de la probabilidad de que su error sea menor que tres puntos si emplea a) el teorema de
Chebyshev; b) el teorema central del lmite? (Freund y Smith 1989: 312).
Sea Xn una sucesin de variables aleatorias independientes, cada una distribuida uniforme-
mente en el intervalo de 0 a . Sea {An} una sucesin de constantes positivas. Establezca
condiciones bajo las cuales la sucesin Xn = An cos Un obedezca el teorema central del
lmite (Parzen 1987: 477).
14
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
CP12: Estimar por intervalos de confianza la media y otros parmetros para muestras
grandes
En la tabla 1 se observa que los campos de problemas comunes en todos los libros
son el de aproximacin de la distribucin binomial (CP1) y la distribucin de la suma
de variables aleatorias continuas (CP4). En cambio, los campos CP7 y CP3, carcter
terico, son inexistentes en la mayora de los libros. Los ocho textos especficos de
estadstica aplicada a la ingeniera, ordenados por ao, carecen de la mayora de estos
campos de problemas; slo uno de ellos muestra aplicaciones basadas en la distribucin
de Poisson; modelo que es de importancia para los ingenieros.
Entre los campos de problemas indirectos (CP8 a CP13), los campos de intervalos de
confianza (CP12) y pruebas de hiptesis (CP13) son los ms frecuentes y estn presentes
hoy en da en la mayora de los textos de estadstica para ingenieros.
En general, los libros de textos muestran muchos ejercicios de aplicacin de esta
proposicin para variables con distribucin continua, en particular a la distribucin ex-
ponencial y uniforme, y, por otro lado, carecen de problemas elementales, basados en
extraccin a partir de urnas, lanzamientos de dados o monedas, que permitan un primer
acercamiento tangible del teorema. Adems, falta rigurosidad en los ejemplos resueltos
en algunos libros, pues no mencionan explcitamente que se est utilizando el teorema
en el desarrollo del ejercicio, ni tampoco indican que el resultado es slo aproximado.
Estos seran puntos a mejorar en la presentacin de los problemas. Asimismo, si se
quiere que los alumnos aprecien la utilidad y alcance de este teorema, sera necesario
mostrar diferentes aplicaciones de los campos de problemas a problemas especficos en
su profesin.
15
Tabla 1
16
Campos de problemas que presentan los libros seleccionados
Situaciones problemas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
CP1: Aproximacin de la distribucin binomial x x x x x x x x x x x x x x x x
LENGUAJE
Trminos y expresiones verbales. Un primer tipo son las palabras y frases que se usan
para describir los conceptos, sus operaciones y transformaciones. Se diferencian tres
categoras de palabras usadas en la enseanza de las matemticas:
Notaciones y smbolos. Las notaciones simblicas permiten realizar operaciones con los
conceptos, trabajando a un alto nivel de complejidad. Se han encontrando las siguientes
expresiones simblicas del teorema tales como X1 , X 2 , , X n para referirse a una muestra
( )
n
aleatoria, Sn = Xi al enunciar la suma de n variables aleatorias, X N , 2 n al des-
i =1
cribir la distribucin muestral de la media de la muestra para n suficientemente grande,
la frmula de estandarizacin de la media muestral x 0 , etc.
s n
Representaciones grficas. Uno de los elementos caractersticos de la estadstica son
los grficos. En la mayora de los textos es comn ver el histograma como primer
acercamiento al teorema. Se han encontrado histogramas para representar la distribucin
emprica de las medias muestrales y grficos de control de medias para representar
que la distribucin de las medias muestrales estarn ms prximas a una distribucin
normal que las mediciones individuales. Al hablar de conceptos relacionados aparecen
grficos de barras para ilustrar la distribucin de probabilidad terica de la poblacin,
distribucin de frecuencias relativas y distribuciones poblacionales.
17
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
Tabla 2
Expresin 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Trminos x x x x x x x
Smbolos x x x x x x x x x x x x x x x
Grficos x x x x x x x
Simulacin x x x x x x
PROCEDIMIENTOS
18
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
Una mquina para llenar botellas tiene una varianza en las cantidades de llenado aproxi-
2
madamente de = 1 onza. Sin embargo el promedio de las onzas de llenado depende
de un ajuste que puede cambiar de da a da. Cuntas observaciones se deben efectuar en
la muestra para que X quede a menos de 0,3 onzas de con una probabilidad de 0,95?
(Scheaffer y Mc Clave 1993: 236).
Tabla 3
Procedimientos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
AP1: Clculo algebraico
y transformacin de x x x x x x x x x x x x x x x x
variables aleatorias
AP2: Tipificacin/
x x x
destipificacin
AP3: Clculo de
probabilidades con
x x x x x
calculadora, tablas
estadsticas u ordenador
AP4: Clculo de
probabilidades a partir de x x x x x x
simulacin
19
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
E2: Enunciado del teorema como lmite ordinario de una sucesin de funciones. En
este caso la convergencia tiene un matiz determinista, mientras que en el anterior es
aleatoria (en probabilidad). Se reproduce la formulacin del teorema por Kalbfleisch
(1984: 189):
Denotemos por fn la funcin densidad de probabilidad de la suma Sn, o la altura del histo-
grama de Sn en el caso discreto. El teorema central del lmite afirma que, para todo nmero
real z, Lim fn ( z ) = 1 exp( z 2 / 2) .
n 2
20
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
Si se extrae una muestra aleatoria de n observaciones de una poblacin con una media finita
y una varianza finita 2 , entonces, si n es lo bastante grande, la distribucin de muestreo
de la suma Sn = Xi se puede aproximar con una funcin de densidad normal cuya media
2
es n y varianza n . (Mendenhall y Sincich 1997: 315).
E5: Enunciado del teorema de forma general. Son varios los textos aplicados a la inge-
niera que introducen el tema sin formulacin matemtica. Hoy en da es ms conocido
el teorema de manera general para el estimador de medias muestrales.
Obtn una muestra aleatoria simple de tamao n de cualquier poblacin de media y desvia-
cin tpica finita . Cuando n es grande, la distribucin de la media muestral X se aproxima
mucho a la distribucin normal N ( , n ) con media y desviacin tpica n . Moore
(1995: 304).
E6: Enunciado intuitivo del teorema. Otra forma de presentar el teorema es a travs de la
manipulacin con objetos didcticos concretos de un experimento. Montgomery y Runger
(1996: 302) introducen el teorema mostrando grficamente que la aproximacin normal
para X depende del tamao n de la muestra, mediante la distribucin de lanzamientos
de varios dados legal de seis caras.
Se observa en la tabla 4 que los enunciados presentes en la mayora de los textos
es el correspondiente a la suma de variables aleatorias independientes idnticamente
distribuidas (E4). Los menos encontrados en los libros son los presentados con rigor
matemtico (E1 y E2), seguido del enunciado del teorema para variables no idntica-
mente distribuidas. La tendencia de los textos actuales es hacia la presentacin intuitiva
del teorema, contrario a los libros ms antiguos que introducen de manera formal el
teorema. Por ltimo, los enunciados E4 a E6 no son dados en forma precisa y clara, lo
hacen por medio de un ejercicio planteado.
21
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
Tabla 4
PROPIEDADES
Tauber (2001: 139 a 144) encontr nueve propiedades de la distribucin normal que
clasific en geomtricas, estadsticas y algebraicas. Entre ellas, las siguientes ponen en
correspondencia diferentes elementos de definicin, lenguaje, representacin y procedi-
miento del teorema central del lmite:
P1: La media de una suma de variables aleatorias es siempre la suma de las medias,
sea aproximada o exacta la distribucin de dicha suma;
P5: Las transformaciones lineales de variables aleatorias tambin siguen una distribu-
cin asinttica normal.
22
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
Adems se han encontrado las siguientes propiedades que tratan aplicaciones del
teorema:
P6: Las medias muestrales en dos poblaciones siguen una distribucin aproximadamente
normal;
P7: Aproximacin de una distribucin discreta por una continua;
P8: Aproximacin de algunas distribuciones clsicas a la distribucin normal;
P9: Los errores aleatorios siguen una distribucin normal;
P10: Los estimadores de mxima verosimilitud tienen distribucin asinttica normal;
P11: Los estimadores de los momentos tienen distribucin asinttica normal;
P12: Correccin de continuidad.
Tabla 5
Proposiciones 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
P1: Media de la distribucin de la
x x x x x x x x
suma de variables aleatorias
P2: Varianza de la distribucin de
x x x x x x x x
la suma de variables aleatorias
P3: Media aritmtica sigue una
distribucin aproximadamente x x x x x x x x x x
normal
P4: La aproximacin mejora con
x x x x x
el nmero de sumandos
P5: Transformaciones lineales de
variables aleatorias x x x x x x x x x x x x
23
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
Las propiedades ms frecuentes en los textos son las relacionadas con la correccin
de continuidad (P12) presente en todos los textos pero con diferente intensidad y la con-
vergencia a la normal (P5 y P3), siendo escasa la presencia de las propiedades referida
a los errores (P9) y estimadores de mxima verosimilitud (P10), a pesar de que este
mtodo de estimacin, segn Pea (1995), es el ms utilizado y produce estimadores
con buenas propiedades estadsticas. Slo la mitad de los textos consultados inicia el
teorema con el clculo algebraico de las propiedades de la suma y varianza de variables
aleatorias (P1 y P2), lo que implica que en los otros textos el estudiante debe conocer
esto anteriormente.
Los textos de estadstica matemtica son los que ms propiedades tienen, siendo
Meyer (1992) el mayor con nueve propiedades. Lo siguen los textos clsicos que tambin
trabajan las propiedades algebraicas, a diferencia de los libros para ingenieros.
Las propiedades P6 y P7 no son definidas en forma precisa y clara; por ejemplo,
Scheaffer y Mc Clave (1993) presentan la propiedad P6 slo como un ejercicio plan-
teado. Finalmente, de los 16 textos analizados, la mitad presenta el tema especfico del
teorema y a continuacin como caso especial la aproximacin de la binomial por la
normal. Didcticamente sera preferible iniciar la enseanza del teorema partiendo con
el caso particular del estudio de la distribucin binomial para muestras grandes, seguido
del caso general para cualquier distribucin, como lo enfoca Meyer (1992).
ARGUMENTOS
A2: Presentacin del teorema como caso especial de un resultado general. Meyer (1992)
lo presenta mediante un ejemplo y Parzen (1987) lo argumenta mediante la funcin
caracterstica de la normalidad asinttica de variables aleatorias binomiales.
A4: Simulacin grfica con ordenador del teorema. Una forma moderna de ilustrar y
argumentar esta proposicin consiste en realizar simulaciones con el ordenador aumentando
24
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
Tabla 6
Argumentos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
A1: Demostraciones
formales algebraicas x x x x x
y/o deductivas
A2: Caso especial de
x x x x
un resultado general
A3: Simulaciones
x x x x
manipulables
A4: Simulacin
grfica con x x x x x
ordenador
A5: Comprobar
ejemplos y x x x x x x x x x x x x x X
contraejemplos
Son pocos los textos que utilizan la simulacin con ordenador, o bien dispositivos
de dados y monedas como un tipo de argumento que, aunque no proporciona una de-
mostracin, puede ayudar a la comprensin intuitiva del teorema. Las demostraciones
algebraicas del teorema tienden a desaparecer en los textos ms recientes. Los libros de
estadstica matemtica son los ms completos en las demostraciones aunque no trabajan
la simulacin como elemento validativo. En general, las demostraciones formales estn
ausentes en los textos para ingenieros; al parecer estn ms all del propsito de los
autores, dejndolo para cursos ms avanzados.
CONCLUSIONES
25
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
BIBLIOGRAFIA
Alvarado, H. (2004). Significados del teorema central del lmite y sus campos de problemas en
los textos de estadstica para ingenieros. Memoria de Tercer Ciclo, Universidad de Granada,
Espaa.
Alvarado, H. y C. Batanero (2006). El significado del teorema central del lmite: Evolucin hist-
rica a partir de sus campos de problemas. En A. Contreras, L. Ordez y C. Batanero (eds.),
Investigacin en Didctica de las Matemticas/ Congreso Internacional sobre Aplicaciones
y Desarrollos de la Teora de las Funciones Semiticas (pp. 257-277). Jan: Universidad de
Jan, Espaa.
Batanero, C. (2000). Controversies around significance tests, Mathematical Thinking and Learning
2 (1-2): 75-98.
Cobo, B. y C. Batanero (2004). Significado de la media en los libros de texto de secundaria.
Enseanza de las ciencias 22 (1), 5-18.
Cuadras, C. (1999). Problemas de probabilidades y estadstica. Barcelona: EUB.
26
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
APENDICE
27
Estudios Pedaggicos XXXIV, N 2: 7-28, 2008
teorema central del limite en textos de probabilidad y estadistica
28