Sei sulla pagina 1di 86

MTODOS CUANTITATIVOS EN

ANTROPOLOGA

Unidad temtica 4

Distribuciones muestrales.
Estadsticos. Variabilidad de un
estadstico. Estadsticos sesgados e
insesgados
Del Histograma a la Curva de densidad
Cmo conocer la forma de la distribucin de una variable cuantitativa?
Realizar un resumen grfico de los datos sea mediante un histograma o un
diagrama de tallos.

Identificar la existencia de valores atpicos.

Resumir numricamente el centro y la dispersin de la distribucin.


Una curva de densidad expresa la forma de la distribucin de una gran cantidad
de datos cuantitativos.

La curva de densidad es una curva que trazada sobre la base de un histograma:


se encuentra siempre en o por encima del eje de las abscisas,

el rea debajo de la curva es igual a 1 ( 100%), con la propiedad de que el


rea debajo de la curva de densidad correspondiente a un intervalo cualquiera
de la variable corresponde al porcentaje de observaciones originales que se
encuentran en ese intervalo.
1 a 27 33,4%

28 a 54 64,0%
1 a 3 0,0%
0,0%
0,1%
10 a 12 0,3%
0,6%
1,5%
19 a 21 3,4%
8,1%
19,3% 55 a 81 2,7%
28 a 30 19,9%
14,0%
9,8%
37 a 39 6,9%
4,8%

de densidad si se apoyara en un fiel de balanza.


3,4%
46 a 48 2,4% 1 a 9 0,2%
1,7%
1,2%
55 a 57 0,8% 10 a 18 2,3%
0,6%
0,4%
64 a 66 0,3% 19 a 27 30,9%
0,2%
0,1%
73 a 75 0,1% 28 a 36 43,6%
0,1%
0,0%
37 a 45 15,1%

46 a 54 5,2%
Del Histograma a la Curva de densidad

55 a 63 1,8%

64 a 72 0,6%

73 a 81 0,2%
de igual superficie, mientras que la media es aquel valor de la variable que equilibra la curva
En una curva de densidad la mediana es aquel valor de la variable que la divide en dos partes
Distribucin normal
Una clase especial de curvas de densidad son las distribuciones normales. La
distribucin normal es el grfico de una funcin que depende de los valores de la
media m y la desviacin tpica s, simtrica, de forma de campana, con punto de
inflexin en m+/-s, con las siguientes propiedades:

El 68% de las observaciones se encuentra en el intervalo m+/-s.


El 95% de las observaciones se encuentra en el intervalo m+/-2s.
El 99,7% de las observaciones se encuentra en el intervalo m+/-3s.

La forma usual de indicar una distribucin normal es N(;).


Distribucin normal, probabilidad
Distribucin normal. Actividad
Ej. 1.61, Pag 77. La duracin del embarazo humano desde la fecundacin del vulo hasta el
parto tiene una distribucin aproximadamente normal, con una media de 266 das y una
desviacin tpica de 16 das.

a) Qu porcentaje de embarazos dura menos de 250 das?


b) Qu porcentaje de los embarazos tiene una duracin comprendida entre 250 y 282
das?
c) Qu duracin tiene el 50% de los embarazos ms largos?
Distribucin normal standard
Si x es una observacin de una distribucin con media xr y desviacin tpica sx, entonces el valor
estandarizado de xi es z=(xi- /s).

La distribucin normal estndar es la distribucin normal N(0;1) de media igual a 0 y desviacin tpica
igual a 1.
Si una variable tiene una distribucin normal N(;s), entonces la variable estandarizada z=(x-)/s tiene una
distribucin normal estndar N(0;1).
Dado que es posible expresar las infinitas poblaciones normales que resultan de considerar todo par de
valores y s, s>0, mediante la distribucin normal estndar, se justifica la elaboracin de la Tabla A (Pag.
638 de Moore) en la que se presentan las reas bajo la curva normal estndar para diversos valores de la
variable Z(0;1).
Actividad. Distribucin normal standard
1) 1.62, p. 77. Los cuartiles de cualquier curva de densidad son los puntos que tienen a su izquierda
reas iguales a 0.25 y 0.75

Cules son los cuartiles de una distribucin normal standarizada?


A qu distancia (tomando como unidad de medida una desviacin tpica) se hallan los cuartiles de la
media?
Cules son los cuartiles correspondientes a la duracin del embarazo humano: N(266; 16)

2) 1.63, p. 77. Los deciles de cualquier distribucin son los puntos que sealan el 10% de las
observaciones menores y el 10% de las mayores .
Cules son los deciles de una distribucin normal standarizada?
La altura de las mujeres tiene aproximadamente una distribucin normal con una media de 1,64 m y
una desviacin tpica de 0,06 m Cules son los deciles de esta distribucin?

3)
Actividad. Distribucin normal standard
4.
Diferencias entre el anlisis exploratorio de datos y la
inferencia estadstica

Anlisis exploratorio de Inferencia estadstica


datos
Bsqueda de caractersticas Bsqueda de respuestas a
interesantes de los datos las preguntas originadas en
el anlisis exploratorio
Las conclusiones se Las conclusiones son
restringen exclusivamente a realizadas para la
los datos analizados poblacin desde la que
fueron extrados los datos
Las conclusiones son Las conclusiones son
descriptivas formales e incluyen un
intervalo de confianza

La realizacin de conclusiones para la poblacin desde la que fueron extrados


los datos exige que la muestra sea extrada de manera aleatoria, de ese modo,
las conclusiones podrn ser realizadas sobre bases probabilsticas.
Muestra (1)

Es una parte seleccionada de un todo ms amplio con el objeto de


aprender algo del todo: la poblacin de la que fue seleccionada.
Razones: es imposible, inconveniente, lento o antieconmico
estudiar a toda la poblacin.
Preguntas en estudios muestrales:

Cmo seleccionar la muestra?


Qu tamao debe tener?
Cmo estimar las caractersticas de la poblacin?
Cun confiables son las estimaciones?
Muestra (2)
Poblacin: coleccin existente de elementos reales. En principio
cada uno de ellos podra ser identificado, localizado, estudiado y
observado.
Cada elemento de la poblacin lleva consigo sus caractersticas: valores
numricos de algunas variables y categoras de atributos de inters.
Raramente estamos interesados en una caracterstica singular de los
elementos.
Puede o no ser posible medir adecuadamente todos los elementos
seleccionados en la poblacin. Es frecuente el rechazo de las entrevistas o de
las respuestas escritas a un cuestionario. Cuando se puede asumir que los no
respondentes son similares a los respondentes no hay problema. Caso
contrario, los resultados pueden conducir a malinterpretaciones.
Propsito para extraer la muestra: estimar el valor medio de una
variable o una proporcin en una categora.
En general, las muestras son sin reemplazo: los elementos
seleccionados no son elegibles otra vez.
MUESTREO
Muestreo probabilstico (Aleatorio, Sistemtico, estratificado, por
conglomerados) y Muestreo no probabilstico

MUESTRA
Una muestra es un subconjunto de casos o individuos
de una poblacin.
Las muestras aleatorias se obtienen con la intencin de
inferir propiedades de la totalidad de la poblacin.
El muestreo admite diversas tcnicas de muestreo.
METODOS DE MUESTREO

Intencional
No probabilsticos Sin norma (chunk)
Accidental (casos)
De voluntarios

METODOS
Aleatorio simple
Probabilsticos Sistemtico
Estratificado
De conglomerados
MUESTRA
Se le denota por: n
Subconjunto del universo en que se llevar a cabo la
investigacin.
De cualquier poblacin o universo puede extraerse un
nmero finito de muestras distintas.
n1
N
n2
n3

n4 nn
VENTAJAS DE LA ELECCIN DE UNA MUESTRA
Reduccin de costos
Rapidez
Viabilidad

DEFINICIONES Y TERMINOS
a. Unidad de anlisis
b. Poblacin
c. Unidad de muestreo
d. Marco muestral
e. Parmetro
f. Estadgrafo o estadstico.
UNIDAD DE ANALISIS
Tambin llamado ELEMENTO DE LA POBLACION
es aquella unidad indivisible de la que se obtiene
el dato estadstico.

Ejemplos:
Universidades, hogares en localidades de ms de
100.000 habitantes, madre de familia, nota de
enfermera, animal de experimentacin,
producciones de los alumnos en los cuadernos de
una asignatura, sentencia judicial, comunidad,
restos fsiles, etc. que participa en el estudio
conformando la muestra.
POBLACIN
Poblacin:
Es el conjunto de unidades de anlisis con alguna
caracterstica de inters o atributos especialmente
cuantificables en un periodo y en un lugar determinado.

Poblacin Finita: Se conoce el tamao de la poblacin.


Poblacin Infinita: No se conoce el tamao de la
poblacin.
UNIDAD DE MUESTREO
Es la unidad seleccionada del marco muestral.
Puede coincidir con la unidad de anlisis.
Es el elemento utilizado para seleccionar la muestra.

Ejemplo:
Si se desea conocer en qu medida las madres de una
determinada comunidad cumplen o no con el calendario de
vacunaciones de sus nios menores de 5 aos.

La unidad de muestreo: son las viviendas numeradas


de la comunidad.
La unidad de anlisis: es la madre de familia que se
entrevistar.
MARCO MUESTRAL

Es una lista detallada y actualizada de las unidades


de muestreo de donde se obtiene la muestra.

Ejemplos: de marco muestrales

Lista de municipios de la provincia de Buenos Aires.


Directorio de empresas radicadas en una provincia.
Lista de alumnos de una universidad.
Lista de egresados de una escuela entre 1990 y 2000
Lista de manzanas de una comunidad, etc.
PARMETRO

Medida estadstica que describe una caracterstica de


la poblacin.

Su valor se calcula en base a todas las observaciones


de la poblacin de estudio.
Se representa con letra griega y es un valor fijo para la
poblacin en estudio.

Ejemplo
Edad promedio de los individuos de la poblacin ()
Proporcin de nios discapacitados ()
ESTADSTICO O ESTADGRAFO

Medida estadstica que describe una caracterstica de la


muestra y cuyo resultado est en funcin de los datos
muestrales.

Se representa con letra latina y presenta variabilidad entre


una muestra y otra.

Ejemplo:
la edad promedio de los sujetos pertenecientes a la muestra
(xr),
la proporcin de nios con discapacidad en la muestra (p),
etc.
Se tiene el inters en determinar el porcentaje de nios desnutridos
menores de 5 aos del departamento de Cochinoca en la provincia
de Jujuy

Poblacin de estudio: Los nios de ambos sexos menores de


5 aos del departamento de Cochinoca
Unidad de anlisis: nio menor de 5 aos
Marco muestral: plano censal del departamento de
Cochinoca. Ao 2010.
Unidad de muestreo: viviendas
Parmetro: proporcin de nios desnutridos menores de 5
aos del departamento de Cochinoca .
Estadstico: proporcin de nios desnutridos menores de 5
aos
Muestreo no probabilstico
Denominado tambin muestreo dirigido, se
desconocen las probabilidades de seleccin de
cada elemento.

El procedimiento de seleccin se realiza de


manera un poco informal y arbitraria.

Con este mtodo no se pueden hacer las


inferencias porque no podemos cuantificar el
error muestral.
No probabilsticos
Resulta muy til cuando el estudio resulte muy costoso o
cuando se tiene dificultades para llegar a zonas de difcil
acceso o tambin en los cuales no es indispensable que
las muestras sean representativas de la poblacin, sino
que solamente, renan ciertas caractersticas
previamente especificadas.

Desventaja
Las inferencias realizadas con este tipo de muestreo no
tienen validez estadstica.
Los resultados slo sern vlidos para ese grupo
estudiado, no pudiendo inferir, a toda la poblacin.
No probabilsticos
Entre los tipos ms comunes de este tipo de muestreo tenemos:
Intencional. La "muestra" o mejor dicho el grupo de estudio
se toma supeditndola ntegramente a la preferencia del
investigador.
Ejemplo:
Sondeos preelectorales de zonas que en anteriores votaciones
han marcado tendencias de voto.
Sin norma (chunk). Se toma una porcin de la poblacin de
cualquier manera o por razones de comodidad.
Ejemplo:
-Los primeros diez de la lista.
-Todas las madres de familia de una manzana.
-Todos los pacientes que acuden a un establecimiento de
salud en una semana.
No probabilsticos
Accidental. El grupo de estudio est compuesto por un
conjunto de sujetos acumulado durante mucho
tiempo,(casustica).

Ejemplo:
-casos de cncer del corazn en 15 aos.
- body building, piercings en genitales.

De voluntarios.
Muy utilizado en medicina, principalmente en ensayos clnicos,
es decir, en estudios experimentales con seres humanos.
La muestra o grupo de estudio est conformado por todos los
sujetos que voluntariamente se someten al trabajo de
investigacin y que adems participan hasta el final del mismo.
Probabilsticos
Es un proceso muestral donde cada elemento de la
poblacin tiene una probabilidad perfectamente
conocida de ser incluida en la muestra.
Slo una muestra probabilstica proporciona
estimaciones con medida de su precisin.

TIPOS DE MUESTREO PROBABILISTICO

1. Muestreo aleatorio simple (MAS)


2. Muestreo Sistemtico (MS)
3. Muestreo Estratificado
4. Muestreo por Conglomerados
1. MUESTREO ALEATORIO SIMPLE

Escoge al azar los miembros del universo hasta


completar el tamao muestral previsto

Se enumeran previamente todos los elementos


y de acuerdo con una tabla de nmeros
aleatorios se van escogiendo

El procedimiento puede darse con o sin


reemplazos y esta condicin afectar
posteriormente el anlisis.
MUESTREO ALEATORIO SIMPLE. Actividad
MUESTREO ALEATORIO SIMPLE. Actividad
2. MUESTREO SISTEMATICO

En el universo (N) se elige el primer elemento


al azar

Luego los dems se escogen cada cierto


intervalo (k), hasta completar el tamao
muestral (n).

El tamao del intervalo (k) se calcula as: k =


N/n

Extraer una muestra sistemtica de tamao 4 de la poblacin de 20 alumnos de la


Universidad de Talca.
3. MUESTREO ESTRATIFICADO

Considera que al interior del universo


existen estratos (subgrupos internamente
homogneos pero cualitativa y
cuantitativamente diferentes entre s), y
que no se cumple la condicin de seleccin
aleatoria pues los miembros del grupo
mayoritario tienen una mayor probabilidad
de ser seleccionados en la muestra.
ESTRATOS Homogneos en su interior;
diferentes entre s en propiedades y
tamao
Comuna B

Comuna A

Comuna C

Comuna D
4. MUESTREO POR CONGLOMERADOS

Tambin se denomina de etapas mltiples.


Se utiliza para poblaciones grandes y dispersas.
No es posible disponer de un listado.
En lugar de individuos se seleccionan conglomerados que
estn agrupados de forma natural (cuadras de casas,
departamentos, Hospitales, provincias, etc.)
Se selecciona en primer lugar el conglomerado ms alto, a partir
de ste se selecciona un subgrupo.
A partir de este subgrupo se selecciona otro subgrupo y as
sucesivamente, hasta llegar a las unidades de anlisis.
4. MUESTREO POR CONGLOMERADOS
Ejemplo.
Si se desea estudiar a los pacientes con SIDA atendidos en los
hospitales de cabecera de distrito.

Nuestro primer conglomerado: regiones


a partir de estas regiones aleatoriamente seleccionar un
subgrupo.

Segundo conglomerado : provincias.


De este conglomerado seleccionar aleatoriamente un subgrupo
de provincias.

Tercer conglomerado: hospitales cabecera


Luego seleccionar aleatoriamente un subgrupo de Hospitales.

A partir del grupo de hospitales hacer un listado de los


pacientes con SIDA luego realizar muestreo aleatorio.
CONGLOMERADOS
Grupo 1A

Grupo 5C

Grupo 2A

Grupo 3B
Heterogneos en su interior; diferentes entre s en
propiedades y tamao
Muestra aleatoria simple
Una muestra es una muestra aleatoria simple si el procedimiento utilizado para su
extraccin asegura que todas las muestras del mismo tamao tendrn la misma
probabilidad de ser extradas desde la poblacin considerada.

Para construir una muestra aleatoria simple se emplea una Tabla de nmeros
aleatorios. Se trata de una lista de dgitos del 0 al 9 que cumplen con dos
propiedades:

- Todos los valores de la tabla tienen la misma probabilidad de ser cualquiera de


los 10 dgitos de 0 hasta 9.
- Los valores son independientes entre s. Es decir, conocer una parte de la tabla
no da informacin sobre cualquier otra parte.

Procedimiento para seleccionar una muestra aleatoria simple:


- Paso 1: Asignar una etiqueta numrica a cada uno de los individuos de la
poblacin.
- Paso 2: Utilizar una tabla de nmeros aleatorios para seleccionar las etiquetas al
azar.
Las muestras aleatorias simples pueden ser con o sin reposicin segn que un
individuo que ha sido seleccionado para integrar la muestra sea o no sea
reintegrado a la poblacin antes de seleccionar el siguiente individuo.
Muestra aleatoria simple. Actividad
Variacin ej 3.6, p. 187. Los estudiantes de una comisin no estn conformes con cmo se
ensea la materia y quieren presentar un reclamo a la ctedra y al Departamento. La clase
decide elegir al azar a 4 alumnos para que presenten la queja. A continuacin se presenta
una lista de los estudiantes de la comisin. a) Escojan una muestra aleatoria simple de 4
estudiantes utilizando la tabla de dgitos aleatorios y comenzando por la ltima fila, ltima
columna desplazandose de derecha a izquierda
Amador Guerrero T. Parra
Arrabal Gutirrez Pichn
Belisario Herrero Ramones
Botella Hortensia Rato
Buruaga Jarabo Rodrguez
Castillo Jover Romero
Doreste Larrea Sosa
Estruch Leonardo Toribio
Gonzlez Lpez Trueba
Guerrero A. Olea Velasco

b) Supongamos que se quiere conformar dos grupos de estudiantes de igual tamao para
la realizacin de un trabajo de campo y se decide asignar al azar los estudiantes a cada
grupo.
Nmeros aleatorios
Muestra aleatoria simple. Actividad
Variacin Ej 3.15, p. 197. En cada uno de los siguientes estudios identifica la poblacin y
si la muestra es o no una muestra aleatoria simple.

a) Una investigadora quiere saber qu factores afectan a la supervivencia y al xito de


las pequeas empresas. La investigadora selecciona una muestra de 150 pequeas
empresas del sector bares y restaurantes del listado de las Pginas de la gua
telefnica de una gran ciudad.

b) Un diputado quiere saber si los electores apoyan una propuesta legislativa sobre
saneamiento urbano. Su equipo le informa que se han recibido 228 cartas sobre el
tema, de las cuales 193 se oponen a la nueva ley.

c) Una compaa de seguros quiere averiguar la calidad de sus servicios con relacin a
los reclamos de sus asegurados con plizas de automvil. Cada mes la compaa
selecciona una muestra de tamao 50 a partir de los nmeros de expediente de
todos los reclamos relacionados con sus seguros de automvil, con el fin de evaluar la
precisin y rapidez de los trmites efectuados.
Distribuciones muestrales
Parmetro: caracterstica numrica desconocida de la poblacin.

Estadstico: estimacin del parmetro realizada a partir de la muestra.

ACTIVIDAD (Variaciones de los Ej. 4.1 a 4.3, p. 235). Identificar el parmetro y el estadstico

1. El INDEC entrevist el mes pasado a 60.000 trabajadores argentinos de los cuales el 8,4%
no tena empleo.
2. Las bolsas de alimento balanceado en un conteiner pesan en promedio 20,1 kgs., lo que
cumple con las condiciones fijadas por el comprador para la aceptacin del conteiner. Un
inspector escoge 100 bolsas del conteiner que en promedio pesan 19,9 kgs. Como este
valor es menor al acordado, el conteiner es rechazado errneamente.
3. Una empresa portea que realiza estudios de mercado utiliza un aparato que marca al azar
nmeros de telfono de la ciudad. De los 100 primeros nmeros marcados el 48% no
aparece en la gua telefnica. No es sorprendente, ya que el 52% de los telfonos de lnea
de Buenos Aires no estn en la gua.

Distribucin muestral: distribucin del estadstico cuando se consideran todas las muestras de
igual tamao de la poblacin.
Nos vamos a concentrar en la distribucin muestral de la media y la proporcin.
Distribucin muestral de la media con muestras de tamao creciente

Distribucin poblacional. N= 6

Poblacin x: Ingresos

Individuo A 800
Individuo B 1200
Individuo C 2300
Individuo D 900
Individuo E 1000
Individuo F 500

1116.67
624.23
Distribucin muestral de la media con muestras de tamao creciente

Muestras posibles de tamao 2. N= 15

Media Desv Est


Xi ingreso muestral (n-1)
A-B 800 1200 1000 282.8
A-C 800 2300 1550 1060.7
A-D 800 900 850 70.7
A-E 800 1000 900 141.4
A-F 800 500 650 212.1
B-C 1200 2300 1750 777.8
B-D 1200 900 1050 212.1
B-E 1200 1000 1100 141.4
B-F 1200 500 850 495.0
C-D 2300 900 1600 989.9
C-E 2300 1000 1650 919.2
C-F 2300 500 1400 1272.8
D-E 900 1000 950 70.7
D-F 900 500 700 282.8
E-F 1000 500 750 353.6

Media 1116.7
Desvo 373.1
Distribucin muestral de la media con muestras de tamao creciente
Muestras posibles de tamao 3. N= 20

Media
Ind.1 Ind.2 Ind.3 muestral Desv Est
A-B-C 800 1200 2300 1433.3 634.2
A-B-D 800 1200 900 966.7 170.0
A-B-E 800 1200 1000 1000.0 163.3
A-B-F 800 1200 500 833.3 286.7
A-C-D 800 2300 900 1333.3 684.8
A-C-E 800 2300 1000 1366.7 665.0
A-C-F 800 2300 500 1200.0 787.4
A-D-E 800 900 1000 900.0 81.6
A-D-F 800 900 500 733.3 170.0
A-E-F 800 1000 500 766.7 205.5
B-C-D 1200 2300 900 1466.7 601.8
B-C-E 1200 2300 1000 1500.0 571.5
B-C-F 1200 2300 500 1333.3 740.9
B-D-E 1200 900 1000 1033.3 124.7
B-D-F 1200 900 500 866.7 286.7
B-E-F 1200 1000 500 900.0 294.4
C-D-E 2300 900 1000 1400.0 637.7
C-D-F 2300 900 500 1233.3 771.7
C-E-F 2300 1000 500 1266.7 758.7
D-E-F 900 1000 500 800.0 216.0

Media 1116.7
DesvEst 261.5
Distribucin muestral de la media con muestras de tamao creciente
Muestras posibles de tamao 4. N= 15

Combinac Media Desv


iones Ind. 1 Ind. 2 Ind.3 Ind. 4 muestral muestral
A-B-C-D 800 1200 2300 900 1300 688.0
A-B-C-E 800 1200 2300 1000 1325 670.2
A-B-C-F 800 1200 2300 500 1200 787.4
A-B-D-E 800 1200 900 1000 975 170.8
A-B-D-F 800 1200 900 500 850 288.7
A-B-E-F 800 1200 1000 500 875 298.6
A-C-D-E 800 2300 900 1000 1250 704.7
A-C-D-F 800 2300 900 500 1125 801.6
B-C-D-E 1200 2300 900 1000 1350 645.5
B-C-D-F 1200 2300 900 500 1225 771.9
B-C-E-F 1200 2300 1000 500 1250 759.4
C-D-E-F 2300 900 1000 500 1175 780.5
D-E-F-A 900 1000 500 800 800 216.0
D-E-F-B 900 1000 500 1200 900 294.4
D-E-F-C 900 1000 500 2300 1175 780.5

Media 1116.7
DesvEst 187.0
Distribucin muestral de la media con muestras de tamao creciente
En el siguiente cuadro se presentan las medias y las desviaciones tpicas de las
anteriores distribuciones de la media muestral:

Total de Proporcin de D. Tpica de la


Tamao de
muestras la distribucin distribucin
muestra n
posibles muestral muestral

2 15 1116,7 373,1
3 20 1116,7 261,5
4 15 1116,7 187,0

El promedio de la distribucin muestral de la media coincide con la media poblacional.


Esta propiedad puede ser generalizada diciendo que bajo muestreo aleatorio sin
reposicin la media muestral es un estimador insesgado de la media poblacional.

La desviacin tpica de la distribucin muestral de la media decrece a medida que crece


el tamao de muestra n. Se puede comprobar que la desviacin tpica de la media es
igual a : /n
Descripcin de la distribucin muestral de
La principal caracterstica de la distribucin muestral dey es que su media coincide
con la media poblacional. Adems, a medida que n crece la distribucin muestral
dey tiende

a ser simtrica,
a que su dispersin, funcin de la desviacin tpica poblacional, se reduzca, y,
a tener escasas observaciones atpicas.
Distribucin muestral de la proporcin con muestras de tamao
creciente
Distribucin poblacional. N= 6

Poblacin Y= Legaliz de
la marihuana
Individuo A 0
Individuo B 1
Individuo C 1
Individuo D 0
Individuo E 0
Individuo F 0

Media 0.33
Desv Est M 0.52
Distribucin muestral de la proporcin con muestras de tamao
creciente
Muestras posibles de tamao 2. N= 15

Y= P
Legalizacin muestral
A-B 0 1 0.5
A-C 0 1 0.5
A-D 0 0 0
A-E 0 0 0
A-F 0 0 0
B-C 1 1 1
B-D 1 0 0.5
B-E 1 0 0.5
B-F 1 0 0.5
C-D 1 0 0.5
C-E 1 0 0.5
C-F 1 0 0.5
D-E 0 0 0
D-F 0 0 0
E-F 0 0 0

Proporcin 0.33
DesvEst 0.31
Distribucin muestral de la proporcin con muestras de tamao
creciente
Muestras posibles de tamao 3. N= 20

Prop en
Yi en la muestra c/mues
A-B-C 0 1 1 0.67
A-B-D 0 1 0 0.33
A-B-E 0 1 0 0.33
A-B-F 0 1 0 0.33
A-C-D 0 1 0 0.33
A-C-E 0 1 0 0.33
A-C-F 0 1 0 0.33
A-D-E 0 0 0 0.00
A-D-F 0 0 0 0.00
A-E-F 0 0 0 0.00
B-C-D 1 1 0 0.67
B-C-E 1 1 0 0.67
B-C-F 1 1 0 0.67
B-D-E 1 0 0 0.33
B-D-F 1 0 0 0.33
B-E-F 1 0 0 0.33
C-D-E 1 0 0 0.33
C-D-F 1 0 0 0.33
C-E-F 1 0 0 0.33
D-E-F 0 0 0 0.00
Proporcin 0.33
DesvEst 0.21
Distribucin muestral de la proporcin con muestras de tamao
creciente
Muestras posibles de tamao 4. N= 15

Yi en la muestra Prop mues


A-B-C-D 0 1 1 0 0.5
A-B-C-E 0 1 1 0 0.5
A-B-C-F 0 1 1 0 0.5
A-B-D-E 0 1 0 0 0.25
A-B-D-F 0 1 0 0 0.25
A-B-E-F 0 1 0 0 0.25
A-C-D-E 0 1 0 0 0.25
A-C-D-F 0 1 0 0 0.25
B-C-D-E 1 1 0 0 0.5
B-C-D-F 1 1 0 0 0.5
B-C-E-F 1 1 0 0 0.5
C-D-E-F 1 0 0 0 0.25
D-E-F-A 0 0 0 0 0
D-E-F-B 0 0 0 1 0.25
D-E-F-C 0 0 0 1 0.25

Proporcin 0.33
DesvEst 0.15
Distribucin muestral de la proporcin con muestras de tamao
creciente
En el siguiente cuadro se presentan las proporciones y las desviaciones tpicas de las
anteriores distribuciones de la proporcin muestral:

Total de Proporcin de D. Tpica de la


Tamao de
muestras la distribucin distribucin
muestra n
posibles muestral muestral

2 15 0.33 0.31
3 20 0.33 0.22
4 15 0.33 0.15

La proporcin de la distribucin muestral de la proporcin coincide con la proporcin


poblacional. Esta propiedad puede ser generalizada diciendo que bajo muestreo
aleatorio sin reposicin la proporcin muestral es un estimador insesgado de la
proporcion poblacional.

La desviacin tpica de la distribucin muestral de la proporcin decrece a medida que


crece el tamao de muestra n. Se puede comprobar que la desviacin tpica de la
proporcin es igual a :
______________
p^(1-p^)/n
Estadstico insesgado
Estadstico insesgado: si la media de la distribucin muestral de un estadstico coincide con
el parmetro poblacional se dice que ese estadstico es insesgado.

Dispersin de un estadstico: es expresada mediante la desviacin tpica de su distribucin


muestral. Si el muestreo es aleatorio sin reposicin, entonces la desviacin tpica de la
media muestral ser igual a:
_____
(1-n/N) s/n,

donde s es la desviacin tpica poblacional.

LAS DISTRIBUCIONES MUESTRALES NOS AYUDAN A ESTIMAR LA PROBABILIDAD DE


OCURRENCIA DE NUESTRA MUESTRA Y DE ESTA MANERA NOS PERMITEN GENERALIZAR DE
LA MUESTRA A LA POBLACIN

EL ERROR MUESTRAL ES LA DISCREPANCIA ENTRE LA ESTIMACIN Y EL VERDADERO VALOR


DEL PARAMETRO

DILEMA: SI LAS ESTIMACIONES MUESTRALES VARAN Y SI CASI TODAS LAS MUESTRAS


CONDUCEN A CIERTO TIPO DE ERROR, QUE CONFIANZA PODEMOS TENER EN ESAS
ESTIMACIONES?
Distribucin muestral. Variabilidad de un estadstico. Actividad
Ejercicio 4.8 de Moore

Sesgo Variabilidad
(a) grande grande
(b) pequeo pequea
(c) pequeo grande
(d) grande pequea

Actividad.
Construya la distribucin muestral de la proporcin de caras al arrojar al aire una
moneda balanceada
a) Una vez,
b) Dos veces,
c) Tres veces,
d) Cuatro veces
e) Describa cmo cambia la forma de la distribucin a medida que aumenta el
nmero de tiros.
Distribuciones muestrales de la media con muestras de tamao
creciente
Ej. 4.6 Moore
Una poblacin est constituida por N=10 estudiantes. Para cada estudiante se registra la
variable calificacin de acuerdo al siguiente detalle (matriz de datos):

Estudiante Calificacin
1 82
2 62
3 80
4 58
5 72
6 73
7 65
8 66
9 74
10 62
(Media 69,4000
Poblacional)
S (D. Tpica 8,0443
poblacional)
Distribuciones muestrales de la media con muestras de tamao
creciente
Ej. 4.6 Moore

n=2, total de muestras


posibles: 45.

n=3, total de muestras


posibles: 120.
Distribuciones muestrales de la media con muestras de tamao
creciente
Ej. 4.6 Moore

n=4, total de muestras


posibles: 210

n=5, total de muestras


posibles: 252
Distribuciones muestrales de la media con muestras de tamao
creciente
Ej. 4.6 Moore

n=6, total de muestras


posibles: 210

n=7, total de muestras


posibles: 120
Distribuciones muestrales de la media con muestras de tamao
creciente
Ej. 4.6 Moore

n=8, total de muestras


posibles: 45

n=9, total de muestras


posibles: 10
Distribuciones muestrales de la media con muestras de tamao
creciente
Ej. 4.6 Moore
En el siguiente cuadro se presentan las medias y las desviaciones tpicas de las anteriores
distribuciones de la media muestral:
Tamao de Total de Media de la D. Tpica de la
muestra n muestras distribucin distribucin
posibles muestral muestral
2 45 69,4000 5,0877
3 120 69,4000 3,8858
4 210 69,4000 3,1156
5 252 69,4000 2,5438
6 210 69,4000 2,0770
7 120 69,4000 1,6653
8 45 69,4000 1,2719
9 10 69,4000 0,8479

La media de la distribucin muestral de la media coincide con la media poblacional. Esta


propiedad puede ser generalizada diciendo que bajo muestreo aleatorio sin reposicin la
media muestral es un estimador insesgado de la media poblacional.

La desviacin tpica de la distribucin muestral de la media decrece a medida que crece el


tamao de muestra n.
La desviacin tpica de las desviaciones muestrales de la media y la
proporcin

La desviacin tpica de la distribucin muestral de la media decrece a medida que


crece el tamao de muestra n. Se puede comprobar que la desviacin tpica de la
media es igual a :

/n

La desviacin tpica de la distribucin muestral de la proporcin decrece a medida que


crece el tamao de muestra n. Se puede comprobar que la desviacin tpica de la
proporcin es igual a :
___________________
p^(1-p^)/n
Teorema central del lmite

En el texto de Moore, en la pgina 298, se asevera que la


distribucin muestral de la media (muestral) tiende a
adoptar, a medida que n crece, la forma de una
distribucin normal menos dispersa que la variable. En el
recuadro de la pgina 304 esas aseveraciones se resumen
en el teorema central del lmite:

A medida que n crece la distribucin de la media muestral


tiende a una distribucin normal con media igual a la
media poblacional y desviacin tpica igual a la
desviacin tpica poblacional dividida en la raz
cuadrada de n:
XN(m;s/n).
Probabilidad
Se dice que un fenmeno es aleatorio si su resultado no puede predecirse con exactitud.

Se denomina probabilidad a la medida asignada a la ocurrencia de un resultado especfico


de un fenmeno aleatorio. Esa medida es determinada como el cociente de los casos
favorables sobre los casos posibles en una serie larga de pruebas. El siguiente cuadro
muestra ese cociente para el acontecimiento la bolilla extrada es de color blanco en mil
extracciones independientes de una bolilla desde una urna conteniendo el 30% de bolillas
blancas y el 70% de bolillas de otro color.

1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
100

200

300

400

500

600

700

800

900

1000
0
Propiedades de la probabilidad de un suceso
-La probabilidad de un suceso es un nmero entre 0 y 1.

-Si se consideran todos los sucesos posibles la probabilidad es 1. Esto implica


que la probabilidad de que un suceso no ocurra es igual a 1 menos la
probabilidad de que ocurra.

-Si dos sucesos son mutuamente excluyentes, entonces su probabilidad es la


suma de sus probabilidades.

Ley de la suma: P(a b)= P(a)+P(b)

P(voto izquierda)= 0,36


P(voto derecha)= 0,38
P(votar izq o der)= 0,36+0,38= 0,74
Reglas de conteo A tres personas diferentes se les
pregunta si fuman o no fuman.
Muchos experimentos probabilsticos
Tres pasos (personas), cada uno de los
comprenden dos o ms pasos, cada uno de los
cuales puede dar lugar a cierto nmero de cuales tiene dos resultados posibles (F,
resultados diferentes. Para calcular las NF). Entonces el total posible de
resultados es 2x2x2=8
probabilidades en tales experimentos se necesita
primero determinar el nmero total de resultados
posibles. El nmero total de resultados es igual La probabilidad de cualquiera de estos
al producto de los resultados en cada paso. sucesos es 1/8

Supongamos que queremos saber cul


es la probabilidad del suceso dos
fumadores, un no fumador

En este caso, 3 combinaciones


responden a este suceso

F, F, NF
F, NF, F
NF, F, F

Por lo tanto, P(2 F, 1 NF)= 3/8


Distribuciones de probabilidad

La distribucin de probabilidad de una variable aleatoria nos


dice cules son los posibles valores de la variable y cmo se
asignan probabilidades a esos valores.

Variable aleatoria: es el resultado numrico de un fenmeno


aleatorio. Es una regla bien definida para asignar valores
numricos a todos los resultados posibles de un experimento.

Ej. Experimento: lanzar una moneda


Resultados: dos resultados discretos, cara y cruz
Variable aleatoria: definimos x=1 si sale cara y x=2 si sale
cruz
Variable aleatoria discreta
Cuando la variable aleatoria tiene un nmero contable de resultados.

Cantidad de individuos con los que vives:


Cul es la probabilidad que un individuo viva con ms de dos individuos?

P(X>2)= P(X=3)+ P(X=4)+ P(X=5)= 0.10+0.05+0.05= 0.2

n ind. Probabilidad 0,4

0 0.20 0,35
0,3
1 0.25
probabilidad

0,25

2 0.35 0,2
0,15
3 0.10 0,1

4 0.05 0,05
0

5 0.05 0 1 2 X
3 4 5
Suma 1
Variables aleatorias discretas
Ej. 4.30 de Moore
Sea X: la suma de los valores al lanzar dos dados
i xi pi xipi xi2pi
1 2 0,0278 0,0556 0,1111
2 3 0,0556 0,1667 0,5000
3 4 0,0833 0,3333 1,3333
4 5 0,1111 0,5556 2,7778
5 6 0,1389 0,8333 5,0000
6 7 0,1667 1,1667 8,1667
7 8 0,1389 1,1111 8,8889
8 9 0,1111 1,0000 9,0000
9 10 0,0833 0,8333 8,3333
10 11 0,0556 0,6111 6,7222
11 12 0,0278 0,3333 4,0000
Suma 1,0000 7,0000 54,8333

=7; s2 = 54,8333 72 = 5,8333.


Variables aleatorias discretas
Actividad. 4.24 P. 258 Moore
4.24.
x P(x) Un estudio sobre la movilidad social analiz la case social
1 0,48
2 0,38 alcanzada por los hijos de padres de clase baja. Las clases
3 0,08 sociales se numeraron de 1 (baja) hasta 5 (alta). Considera que
4 0,05 la variable aleatoria X es la clase social en la que se encuentra
5 0,01 un hijo escogido aleatoriamente entre los hijos de padres de
1,00 clase 1. El estudio hall que la distribucin es:

a. 1%.
b. Tres condiciones: (1) P(x), x=0,1,...,5; (2) P(S)=1; (3) Si x1 y x2 son
mutuamente excluyentes, entonces P(x1 x2)=P(x1)+P(x2).
c. P(X3)=0,48+0,38+0,08=0,94.
d. P(X<3)=0,48+0,38=0,86.
e. P(X>3)=1-P(X3)=0,06.
Variables aleatorias discretas
4.26
Actividad. 4.26 y 4.28 Moore
x P(x)
1 1/6
2 1/6
3 1/6 P(X<3)=2/6=0,33
4 1/6
5 1/6
6 1/6
1

4.28

Probabilidad X x P(x)
A A A 1/8 3 0 1/8
A A O 1/8 2 1 3/8
A O A 1/8 2 2 3/8
A O O 1/8 1 3 1/8
O A A 1/8 2 1
O A O 1/8 1
O O A 1/8 1 P(X=2)=3/8
O O O 1/8 0
Media y desviacin tpica de una variable
discreta
Si X es una variable aleatoria discreta cuya distribucin
es:

Valor de X= x1, x2, x3 xk


Probabilidad p1, p2, p3 pk

La media se halla multiplicando cada valor posible de X


por su probabilidad y sumando todos los productos.

= x1p1+x2p2+x3p3 +xkpk
Ley de los grandes nmeros.

Si repetimos el fenmeno
aleatorio muchas veces,
apuntamos cada vez el
valor de X y promediamos
estos valores, dicho
promedio se acercar cada
vez ms a a medida que
hagamos ms y ms
repeticiones.
Desviacin tpica

1) Clculo de desviaciones a la media


2) Promedio de dichas desviaciones= varianza
3) Desviacin tpica= raz cuadrada de la varianza positiva

= (x1-)p1+ (x2-)p2+ (x3-)p3


El siguiente cuadro muestra, en general, la distribucin de una variable aleatoria
discreta y los elementos complementarios que se requieren para la
determinacin de su media y desviacin tpica:

i xi pi xipi (xi-)2pi
1 x1 p1 x1p1 (x1-)2p1
2 x2 p2 x2p2 (x2-)2p2

k xk pk xkpk (xk-)2pk
Suma 1 (xipi) (xi-)2pi)

Media: m=(xipi).

D. Tpica: s=[(xi-m)2pi] (Definicin)


=[(xi2pi)-m2] (Frmula computacional)
Desviacin tpica
2 2
n ind probabilidad xipi (xi-) (xi-) (xi-) pi

0 0,2 0 -1,7 2,89 0,578


1 0,25 0,25 -0,7 0,49 0,1225
2 0,35 0,7 0,3 0,09 0,0315
3 0,1 0,3 1,3 1,69 0,169
4 0,05 0,2 2,3 5,29 0,2645
5 0,05 0,25 3,3 10,89 0,5445
Suma 1 1,7 1,71

= 1,7
= 1,71 = 1,3
Variable aleatoria continua
Cuando los resultados de la misma son expresados como un
nmero real.

Algunas variables aleatorias toman valores que no son nmeros


aislados, sino que pueden tomar cualquier valor dentro de un
intervalo.

Su representacin es realizada mediante una curva de densidad


y la probabilidad de un intervalo real (x0;x1) se calcula como el
rea encerrada por ese intervalo y la curva de densidad.

Las distribuciones continuas asignan probabilidades a intervalos


de valores en lugar de hacerlo a valores individuales.

La media y desviacin tpica para estas variables se interpreta


de la misma manera que para las variables aleatorias discretas.
Variable aleatoria continua
Variables aleatorias continuas
Variable aleatoria continua: cuando los resultados de la misma son expresados como un
nmero real. Su representacin es realizada mediante una curva de densidad y la
probabilidad de un intervalo real (x0;x1) se calcula como el rea encerrada por ese intervalo
y la curva de densidad. El ejemplo ms ntido que se puede dar en este punto es la
distribucin normal.
4.36. XN(m=0,3;s=0,023).
a. P(X0,5)=P(Z(0,5-0,3)/0,023=8,696)=1.
b. P(X0,25)=P(Z(0,25-0,3)/0,023=-2,174)=0,015.
c. P(0,25<X<0,35)=P(-2,174<Z<+2,174)
=P(Z<+2,174)-P(Z<-2,174)
=0,985-0,015
=0,970.

4.74. Segn el teorema central del lmite si X es una variable con media m y desviacin tpica
s, entonces bajo muestreo aleatorio simple, considerando un tamao de muestra n
suficientemente grande, la media muestralX tendr distribucin normal con media m y
desviacin tpica s/n. En este caso la desviacin tpica de la media muestral ser igual a
5,9/76=0,6768.

La normalidad de la distribucin de la media muestral no depende de la distribucin de la


variable X, pero s depende de que (1) el muestreo sea aleatorio simple, y, (2) el tamao de
la muestra.
Actividades
Ej. 4.14 de Moore. Actividad
Escoger al azar una mujer entre 25 y 29 aos de edad. El censo dice que la
probabilidad de que escojamos una mujer sea soltera, viuda o divorciada es:
Cul es la probabilidad de que una mujer de ese grupo de edad
a) sea casada? b) sea viuda o divorciada?

Estado civil Probabilidd a. P(casada)=1-{P(soltera)+P(viuda)+P(divorciada)}=


=1-{0.288+0.003+0.076}=
Soltera 0,2888 =1-0.367=
Casada =0.633.
Viuda 0,003 b. P(viuda o divorciada)=P(viuda)+P(divorciada)=
=0.003+0.076=
Divorciada 0,076 =0.079.
Problema
La distribucin del tamao de la familia en una sociedad tribal es
asimtrica hacia la derecha con = 5,2 y = 3,0. Estos valores son
desconocidos para un antroplogo, quien toma una muestra de
familias de esta sociedad para estimar la media del tamao familiar.
Sea la media el promedio del tamao familiar para una muestra
aleatoria simple de 36 familias.
a) Especifique la distribucin muestral de ,
b) Halle la probabilidad de que la media de la muestra difiera en 0,5 de

c) Suponga que el antroplogo toma una muestra simple al azar de


tamao 100. Halle la probabilidad de que la media de la muestra
difiera en 0,5 de y compare con la respuesta expuesta en b)
d) En relacin al item c). Si la muestra fuera realmente aleatoria,
sorprendera que el antroplogo obtuviera = 4? Por qu? (Esto
bien podra ocurrir si la muestra no fuera aleatoria)
Actividad
Sea Y: el resultado de seleccionar un solo dgito
en una tabla de nmeros aleatorios
a) Construya la distribucin de probabilidad
de la variable Y
b)dibuje el histograma
c) calcule
d) La desviacin standard de la distribucin
es una de las siguientes: 0,7 / 2,9 / 5,0 / 9,0
Elija la correcta y justifique.
Actividad
El Hospital Italiano report, a partir de los datos
suministrados por 5459 mujeres en el perodo 2009-
2010, que la media de la gestacin hasta el nacimiento
fue de 281,9 das con un desvo standard de 11,4 das.
Un recin nacido se clasifica como prematuro si la
gestacin es de 258 das o menos.
a) Si la gestacin de bebs se distribuye normalmente,
qu proporcin de bebs son prematuros?
b) Qu porcentajes de nacimientos tuvieron entre 275
y 290 das de gestacin?
Preguntas / Dilemas
El error standard de un estadstico describe:
a) La desviacin de la distribucin muestral del estadstico
b) La desviacin standard de la muestra
c) La probabilidad de que el estadstico caiga a una distancia determinada del
parmetro
d) La variabilidad en los valores del estadstico para muestras aleatorias repetidas
de tamao n
e) El error debido a la no respuesta y los errores de medicin
El teorema central del lmite implica que:
a) Todas las variables tienen una forma aproximadamente normal si una
muestra aleatoria simple tiene al menos 30 observaciones
b) Las distribuciones poblacionales son normales cuando son de gran tamao
c) Para muestras aleatorias grandes, la distribucin muestral de es
aproximadamente normal independientemente de la forma de la distribucin
poblacional
d) La distribucin muestral se parece ms a la poblacional a medida que se
incrementa el tamao de muestra
e) Todas las anteriores son correctas

Potrebbero piacerti anche