Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ANTROPOLOGA
Unidad temtica 4
Distribuciones muestrales.
Estadsticos. Variabilidad de un
estadstico. Estadsticos sesgados e
insesgados
Del Histograma a la Curva de densidad
Cmo conocer la forma de la distribucin de una variable cuantitativa?
Realizar un resumen grfico de los datos sea mediante un histograma o un
diagrama de tallos.
28 a 54 64,0%
1 a 3 0,0%
0,0%
0,1%
10 a 12 0,3%
0,6%
1,5%
19 a 21 3,4%
8,1%
19,3% 55 a 81 2,7%
28 a 30 19,9%
14,0%
9,8%
37 a 39 6,9%
4,8%
46 a 54 5,2%
Del Histograma a la Curva de densidad
55 a 63 1,8%
64 a 72 0,6%
73 a 81 0,2%
de igual superficie, mientras que la media es aquel valor de la variable que equilibra la curva
En una curva de densidad la mediana es aquel valor de la variable que la divide en dos partes
Distribucin normal
Una clase especial de curvas de densidad son las distribuciones normales. La
distribucin normal es el grfico de una funcin que depende de los valores de la
media m y la desviacin tpica s, simtrica, de forma de campana, con punto de
inflexin en m+/-s, con las siguientes propiedades:
La distribucin normal estndar es la distribucin normal N(0;1) de media igual a 0 y desviacin tpica
igual a 1.
Si una variable tiene una distribucin normal N(;s), entonces la variable estandarizada z=(x-)/s tiene una
distribucin normal estndar N(0;1).
Dado que es posible expresar las infinitas poblaciones normales que resultan de considerar todo par de
valores y s, s>0, mediante la distribucin normal estndar, se justifica la elaboracin de la Tabla A (Pag.
638 de Moore) en la que se presentan las reas bajo la curva normal estndar para diversos valores de la
variable Z(0;1).
Actividad. Distribucin normal standard
1) 1.62, p. 77. Los cuartiles de cualquier curva de densidad son los puntos que tienen a su izquierda
reas iguales a 0.25 y 0.75
2) 1.63, p. 77. Los deciles de cualquier distribucin son los puntos que sealan el 10% de las
observaciones menores y el 10% de las mayores .
Cules son los deciles de una distribucin normal standarizada?
La altura de las mujeres tiene aproximadamente una distribucin normal con una media de 1,64 m y
una desviacin tpica de 0,06 m Cules son los deciles de esta distribucin?
3)
Actividad. Distribucin normal standard
4.
Diferencias entre el anlisis exploratorio de datos y la
inferencia estadstica
MUESTRA
Una muestra es un subconjunto de casos o individuos
de una poblacin.
Las muestras aleatorias se obtienen con la intencin de
inferir propiedades de la totalidad de la poblacin.
El muestreo admite diversas tcnicas de muestreo.
METODOS DE MUESTREO
Intencional
No probabilsticos Sin norma (chunk)
Accidental (casos)
De voluntarios
METODOS
Aleatorio simple
Probabilsticos Sistemtico
Estratificado
De conglomerados
MUESTRA
Se le denota por: n
Subconjunto del universo en que se llevar a cabo la
investigacin.
De cualquier poblacin o universo puede extraerse un
nmero finito de muestras distintas.
n1
N
n2
n3
n4 nn
VENTAJAS DE LA ELECCIN DE UNA MUESTRA
Reduccin de costos
Rapidez
Viabilidad
DEFINICIONES Y TERMINOS
a. Unidad de anlisis
b. Poblacin
c. Unidad de muestreo
d. Marco muestral
e. Parmetro
f. Estadgrafo o estadstico.
UNIDAD DE ANALISIS
Tambin llamado ELEMENTO DE LA POBLACION
es aquella unidad indivisible de la que se obtiene
el dato estadstico.
Ejemplos:
Universidades, hogares en localidades de ms de
100.000 habitantes, madre de familia, nota de
enfermera, animal de experimentacin,
producciones de los alumnos en los cuadernos de
una asignatura, sentencia judicial, comunidad,
restos fsiles, etc. que participa en el estudio
conformando la muestra.
POBLACIN
Poblacin:
Es el conjunto de unidades de anlisis con alguna
caracterstica de inters o atributos especialmente
cuantificables en un periodo y en un lugar determinado.
Ejemplo:
Si se desea conocer en qu medida las madres de una
determinada comunidad cumplen o no con el calendario de
vacunaciones de sus nios menores de 5 aos.
Ejemplo
Edad promedio de los individuos de la poblacin ()
Proporcin de nios discapacitados ()
ESTADSTICO O ESTADGRAFO
Ejemplo:
la edad promedio de los sujetos pertenecientes a la muestra
(xr),
la proporcin de nios con discapacidad en la muestra (p),
etc.
Se tiene el inters en determinar el porcentaje de nios desnutridos
menores de 5 aos del departamento de Cochinoca en la provincia
de Jujuy
Desventaja
Las inferencias realizadas con este tipo de muestreo no
tienen validez estadstica.
Los resultados slo sern vlidos para ese grupo
estudiado, no pudiendo inferir, a toda la poblacin.
No probabilsticos
Entre los tipos ms comunes de este tipo de muestreo tenemos:
Intencional. La "muestra" o mejor dicho el grupo de estudio
se toma supeditndola ntegramente a la preferencia del
investigador.
Ejemplo:
Sondeos preelectorales de zonas que en anteriores votaciones
han marcado tendencias de voto.
Sin norma (chunk). Se toma una porcin de la poblacin de
cualquier manera o por razones de comodidad.
Ejemplo:
-Los primeros diez de la lista.
-Todas las madres de familia de una manzana.
-Todos los pacientes que acuden a un establecimiento de
salud en una semana.
No probabilsticos
Accidental. El grupo de estudio est compuesto por un
conjunto de sujetos acumulado durante mucho
tiempo,(casustica).
Ejemplo:
-casos de cncer del corazn en 15 aos.
- body building, piercings en genitales.
De voluntarios.
Muy utilizado en medicina, principalmente en ensayos clnicos,
es decir, en estudios experimentales con seres humanos.
La muestra o grupo de estudio est conformado por todos los
sujetos que voluntariamente se someten al trabajo de
investigacin y que adems participan hasta el final del mismo.
Probabilsticos
Es un proceso muestral donde cada elemento de la
poblacin tiene una probabilidad perfectamente
conocida de ser incluida en la muestra.
Slo una muestra probabilstica proporciona
estimaciones con medida de su precisin.
Comuna A
Comuna C
Comuna D
4. MUESTREO POR CONGLOMERADOS
Grupo 5C
Grupo 2A
Grupo 3B
Heterogneos en su interior; diferentes entre s en
propiedades y tamao
Muestra aleatoria simple
Una muestra es una muestra aleatoria simple si el procedimiento utilizado para su
extraccin asegura que todas las muestras del mismo tamao tendrn la misma
probabilidad de ser extradas desde la poblacin considerada.
Para construir una muestra aleatoria simple se emplea una Tabla de nmeros
aleatorios. Se trata de una lista de dgitos del 0 al 9 que cumplen con dos
propiedades:
b) Supongamos que se quiere conformar dos grupos de estudiantes de igual tamao para
la realizacin de un trabajo de campo y se decide asignar al azar los estudiantes a cada
grupo.
Nmeros aleatorios
Muestra aleatoria simple. Actividad
Variacin Ej 3.15, p. 197. En cada uno de los siguientes estudios identifica la poblacin y
si la muestra es o no una muestra aleatoria simple.
b) Un diputado quiere saber si los electores apoyan una propuesta legislativa sobre
saneamiento urbano. Su equipo le informa que se han recibido 228 cartas sobre el
tema, de las cuales 193 se oponen a la nueva ley.
c) Una compaa de seguros quiere averiguar la calidad de sus servicios con relacin a
los reclamos de sus asegurados con plizas de automvil. Cada mes la compaa
selecciona una muestra de tamao 50 a partir de los nmeros de expediente de
todos los reclamos relacionados con sus seguros de automvil, con el fin de evaluar la
precisin y rapidez de los trmites efectuados.
Distribuciones muestrales
Parmetro: caracterstica numrica desconocida de la poblacin.
ACTIVIDAD (Variaciones de los Ej. 4.1 a 4.3, p. 235). Identificar el parmetro y el estadstico
1. El INDEC entrevist el mes pasado a 60.000 trabajadores argentinos de los cuales el 8,4%
no tena empleo.
2. Las bolsas de alimento balanceado en un conteiner pesan en promedio 20,1 kgs., lo que
cumple con las condiciones fijadas por el comprador para la aceptacin del conteiner. Un
inspector escoge 100 bolsas del conteiner que en promedio pesan 19,9 kgs. Como este
valor es menor al acordado, el conteiner es rechazado errneamente.
3. Una empresa portea que realiza estudios de mercado utiliza un aparato que marca al azar
nmeros de telfono de la ciudad. De los 100 primeros nmeros marcados el 48% no
aparece en la gua telefnica. No es sorprendente, ya que el 52% de los telfonos de lnea
de Buenos Aires no estn en la gua.
Distribucin muestral: distribucin del estadstico cuando se consideran todas las muestras de
igual tamao de la poblacin.
Nos vamos a concentrar en la distribucin muestral de la media y la proporcin.
Distribucin muestral de la media con muestras de tamao creciente
Distribucin poblacional. N= 6
Poblacin x: Ingresos
Individuo A 800
Individuo B 1200
Individuo C 2300
Individuo D 900
Individuo E 1000
Individuo F 500
1116.67
624.23
Distribucin muestral de la media con muestras de tamao creciente
Media 1116.7
Desvo 373.1
Distribucin muestral de la media con muestras de tamao creciente
Muestras posibles de tamao 3. N= 20
Media
Ind.1 Ind.2 Ind.3 muestral Desv Est
A-B-C 800 1200 2300 1433.3 634.2
A-B-D 800 1200 900 966.7 170.0
A-B-E 800 1200 1000 1000.0 163.3
A-B-F 800 1200 500 833.3 286.7
A-C-D 800 2300 900 1333.3 684.8
A-C-E 800 2300 1000 1366.7 665.0
A-C-F 800 2300 500 1200.0 787.4
A-D-E 800 900 1000 900.0 81.6
A-D-F 800 900 500 733.3 170.0
A-E-F 800 1000 500 766.7 205.5
B-C-D 1200 2300 900 1466.7 601.8
B-C-E 1200 2300 1000 1500.0 571.5
B-C-F 1200 2300 500 1333.3 740.9
B-D-E 1200 900 1000 1033.3 124.7
B-D-F 1200 900 500 866.7 286.7
B-E-F 1200 1000 500 900.0 294.4
C-D-E 2300 900 1000 1400.0 637.7
C-D-F 2300 900 500 1233.3 771.7
C-E-F 2300 1000 500 1266.7 758.7
D-E-F 900 1000 500 800.0 216.0
Media 1116.7
DesvEst 261.5
Distribucin muestral de la media con muestras de tamao creciente
Muestras posibles de tamao 4. N= 15
Media 1116.7
DesvEst 187.0
Distribucin muestral de la media con muestras de tamao creciente
En el siguiente cuadro se presentan las medias y las desviaciones tpicas de las
anteriores distribuciones de la media muestral:
2 15 1116,7 373,1
3 20 1116,7 261,5
4 15 1116,7 187,0
a ser simtrica,
a que su dispersin, funcin de la desviacin tpica poblacional, se reduzca, y,
a tener escasas observaciones atpicas.
Distribucin muestral de la proporcin con muestras de tamao
creciente
Distribucin poblacional. N= 6
Poblacin Y= Legaliz de
la marihuana
Individuo A 0
Individuo B 1
Individuo C 1
Individuo D 0
Individuo E 0
Individuo F 0
Media 0.33
Desv Est M 0.52
Distribucin muestral de la proporcin con muestras de tamao
creciente
Muestras posibles de tamao 2. N= 15
Y= P
Legalizacin muestral
A-B 0 1 0.5
A-C 0 1 0.5
A-D 0 0 0
A-E 0 0 0
A-F 0 0 0
B-C 1 1 1
B-D 1 0 0.5
B-E 1 0 0.5
B-F 1 0 0.5
C-D 1 0 0.5
C-E 1 0 0.5
C-F 1 0 0.5
D-E 0 0 0
D-F 0 0 0
E-F 0 0 0
Proporcin 0.33
DesvEst 0.31
Distribucin muestral de la proporcin con muestras de tamao
creciente
Muestras posibles de tamao 3. N= 20
Prop en
Yi en la muestra c/mues
A-B-C 0 1 1 0.67
A-B-D 0 1 0 0.33
A-B-E 0 1 0 0.33
A-B-F 0 1 0 0.33
A-C-D 0 1 0 0.33
A-C-E 0 1 0 0.33
A-C-F 0 1 0 0.33
A-D-E 0 0 0 0.00
A-D-F 0 0 0 0.00
A-E-F 0 0 0 0.00
B-C-D 1 1 0 0.67
B-C-E 1 1 0 0.67
B-C-F 1 1 0 0.67
B-D-E 1 0 0 0.33
B-D-F 1 0 0 0.33
B-E-F 1 0 0 0.33
C-D-E 1 0 0 0.33
C-D-F 1 0 0 0.33
C-E-F 1 0 0 0.33
D-E-F 0 0 0 0.00
Proporcin 0.33
DesvEst 0.21
Distribucin muestral de la proporcin con muestras de tamao
creciente
Muestras posibles de tamao 4. N= 15
Proporcin 0.33
DesvEst 0.15
Distribucin muestral de la proporcin con muestras de tamao
creciente
En el siguiente cuadro se presentan las proporciones y las desviaciones tpicas de las
anteriores distribuciones de la proporcin muestral:
2 15 0.33 0.31
3 20 0.33 0.22
4 15 0.33 0.15
Sesgo Variabilidad
(a) grande grande
(b) pequeo pequea
(c) pequeo grande
(d) grande pequea
Actividad.
Construya la distribucin muestral de la proporcin de caras al arrojar al aire una
moneda balanceada
a) Una vez,
b) Dos veces,
c) Tres veces,
d) Cuatro veces
e) Describa cmo cambia la forma de la distribucin a medida que aumenta el
nmero de tiros.
Distribuciones muestrales de la media con muestras de tamao
creciente
Ej. 4.6 Moore
Una poblacin est constituida por N=10 estudiantes. Para cada estudiante se registra la
variable calificacin de acuerdo al siguiente detalle (matriz de datos):
Estudiante Calificacin
1 82
2 62
3 80
4 58
5 72
6 73
7 65
8 66
9 74
10 62
(Media 69,4000
Poblacional)
S (D. Tpica 8,0443
poblacional)
Distribuciones muestrales de la media con muestras de tamao
creciente
Ej. 4.6 Moore
/n
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
100
200
300
400
500
600
700
800
900
1000
0
Propiedades de la probabilidad de un suceso
-La probabilidad de un suceso es un nmero entre 0 y 1.
F, F, NF
F, NF, F
NF, F, F
0 0.20 0,35
0,3
1 0.25
probabilidad
0,25
2 0.35 0,2
0,15
3 0.10 0,1
4 0.05 0,05
0
5 0.05 0 1 2 X
3 4 5
Suma 1
Variables aleatorias discretas
Ej. 4.30 de Moore
Sea X: la suma de los valores al lanzar dos dados
i xi pi xipi xi2pi
1 2 0,0278 0,0556 0,1111
2 3 0,0556 0,1667 0,5000
3 4 0,0833 0,3333 1,3333
4 5 0,1111 0,5556 2,7778
5 6 0,1389 0,8333 5,0000
6 7 0,1667 1,1667 8,1667
7 8 0,1389 1,1111 8,8889
8 9 0,1111 1,0000 9,0000
9 10 0,0833 0,8333 8,3333
10 11 0,0556 0,6111 6,7222
11 12 0,0278 0,3333 4,0000
Suma 1,0000 7,0000 54,8333
a. 1%.
b. Tres condiciones: (1) P(x), x=0,1,...,5; (2) P(S)=1; (3) Si x1 y x2 son
mutuamente excluyentes, entonces P(x1 x2)=P(x1)+P(x2).
c. P(X3)=0,48+0,38+0,08=0,94.
d. P(X<3)=0,48+0,38=0,86.
e. P(X>3)=1-P(X3)=0,06.
Variables aleatorias discretas
4.26
Actividad. 4.26 y 4.28 Moore
x P(x)
1 1/6
2 1/6
3 1/6 P(X<3)=2/6=0,33
4 1/6
5 1/6
6 1/6
1
4.28
Probabilidad X x P(x)
A A A 1/8 3 0 1/8
A A O 1/8 2 1 3/8
A O A 1/8 2 2 3/8
A O O 1/8 1 3 1/8
O A A 1/8 2 1
O A O 1/8 1
O O A 1/8 1 P(X=2)=3/8
O O O 1/8 0
Media y desviacin tpica de una variable
discreta
Si X es una variable aleatoria discreta cuya distribucin
es:
= x1p1+x2p2+x3p3 +xkpk
Ley de los grandes nmeros.
Si repetimos el fenmeno
aleatorio muchas veces,
apuntamos cada vez el
valor de X y promediamos
estos valores, dicho
promedio se acercar cada
vez ms a a medida que
hagamos ms y ms
repeticiones.
Desviacin tpica
i xi pi xipi (xi-)2pi
1 x1 p1 x1p1 (x1-)2p1
2 x2 p2 x2p2 (x2-)2p2
k xk pk xkpk (xk-)2pk
Suma 1 (xipi) (xi-)2pi)
Media: m=(xipi).
= 1,7
= 1,71 = 1,3
Variable aleatoria continua
Cuando los resultados de la misma son expresados como un
nmero real.
4.74. Segn el teorema central del lmite si X es una variable con media m y desviacin tpica
s, entonces bajo muestreo aleatorio simple, considerando un tamao de muestra n
suficientemente grande, la media muestralX tendr distribucin normal con media m y
desviacin tpica s/n. En este caso la desviacin tpica de la media muestral ser igual a
5,9/76=0,6768.