Sei sulla pagina 1di 53

Estadstica Bsica

1. Introduccin
2. Estadstica Descriptiva para Muestras
3. Probabilidad
4. Variables Aleatorias y sus Distribuciones
5. Dos Variables Aleatorias
6. Muestreo
7. Estimacin
8. Contraste de Hiptesis
9. Anlisis de Varianza

Introduccin
1. Ejemplo
2. Induccin y deduccin
3. Por qu se toman muestras?
4. Cmo extraer muestras
Introduccin
Definicin original: Estadstica
Conjunto de datos demogrficos y
econmicos de importancia vital para el
estado
Mtodo cientfico de anlisis, que ahora
se aplica a todas las ciencias sociales y
naturales
Es una disciplina de las matemticas
Ejemplo: metas y propsitos
actuales de la estadstica
Encuesta preelectoral de la opinin pblica:
Quin ser el ganador?
Qu proporcin de la poblacin votar por cada
candidato?
Consultar a todos los votantes no se puede.
Se investiga una muestra de unos cuantos
miles con la esperanza de que la proporcin
muestral se aproxime a la proporcin total de la
poblacin. (inferencia induccin estadstica)
Ejemplo
Qu seguridad tenemos de estar en lo
cierto?
Qu tan pequeo es el error?
El muestreo debe realizarse en forma
imparcial y adecuada
Si la muestra es aleatoria y lo
suficientemente grande, se puede
calcular un intervalo de confianza
Frmula del error con un 95% de confianza



muestra la de tamao :
muestra de proporcin :
poblacin de proporcin :
) 1 (
96 . 1
n
P
n
P P
P
H

= H
En el ejemplo:
Se muestrearon 1000 votantes, de los cuales
610 eligen al candidato peronista.
Con un 95% de confianza:
03 . 0 61 . 0
1000
) 61 . 0 1 ( 61 . 0
96 . 1 61 . 0
= H

= H
Establecer la prueba de hiptesis
Hiptesis: un ferviente partidario radical
sostiene que el partidario de esta faccin
poltica ganar la eleccin




Se rechaza la hiptesis

5 . 0 < H
64 . 0 58 . 0 s H s
Observaciones
A medida que aumenta n disminuye el
error permitido.
Intuitivamente, una muestra mayor
contiene ms informacin y permite una
conclusin ms precisa
Cualquier enunciado estadstico
comienza con cierto grado de
incertidumbre
a) Induccin (Inferencia Estadstica)
vs. b) Deduccin (Probabilidad)
Objetivos
Ir de lo general a lo particular
(deduccin)
Induccin: Sacar conclusiones acerca de
la poblacin total a partir de una muestra
Etapa preliminar de una inferencia
(induccin):
Simplificar la muestra
Reducirla a un conjunto de nmeros
descriptivos (estadsticos de muestra)
Por qu se toman muestras?
1. Recursos limitados
2. Datos disponibles limitados
3. Prueba destructiva
Cmo extraer muestras?
Al aumentar el tamao de la muestra
mejoramos la confiabilidad de los valores
estimados
Asegurar una muestra no sesgada
Entonces se habla de una muestra aleatoria:
Satisfar los supuestos de la teora de
probabilidades
Se podrn hacer inferencias cientficas
Estadstica descriptiva para
muestras
1. Introduccin
2. Tablas y diagramas de frecuencia
3. Centro de una distribucin
4. Extensin de una distribucin
5. Transformaciones lineales
(codificacin)
Ejemplos: estadsticos de
muestra
Respuestas de 1000 personas:
{ P R R R R R P P P P }
P: peronistas
R: radicales
Estadsticos:
nmero P : proporcin de peronistas
(0.61)
Centro de la distribucin
Extensin de la misma
Ejemplo discreto
Nmero de hijos en una muestra de
familias de los EEUU

0, 2, 2, 3, 5, 1, 2, 0, .. 4, 2


Muestra: 50 familias
Clculo de frecuencia y
frecuencia relativa
Distribucin de frecuencia
00 . 1
50
=
|
.
|

\
|
= =

n
f
n f
Ejemplo continuo
Estatura promedio de hombres norteamericanos (in)
Muestra: 200 hombres
X: estatura variable aleatoria continua
Se eligen clulas considerando:
1. Que el nmero de clulas no sea demasiado
grande ni pequeo (5-15 cl)
2. El punto medio de cada clula es un nmero
entero conveniente y representar todas las
observaciones en cada una
Frecuencias y frecuencias
relativas

=
|
.
|

\
|
= =
00 . 1
200
n
f
n f
Centro de una distribucin
Formas de medirlo:
Moda: valor ms frecuente
Distribucin bimodal: Es posible extraer una
muestra donde la frecuencia mayor aparezca
dos veces
Media: promedio
Mediana: es el valor debajo del cual
queda la mitad de los valores de la
muestra
Moda: 69 in
Mediana: 69.41 in
Distribucin simtrica
con cima nica
Distribucin asimtrica
hacia la derecha
Mediana
Es el valor de x para el cual:

2
1
) (
y
2
1
) (
s >
s <
x X P
x X P
Mediana
Para una distribucin continua:






La mediana separa la curva de densidad en dos
partes con rea igual a cada una
) (
2
1
) ( x X P x X P > = = <
Espacios de probabilidad finita
Sea S un espacio muestral finito, es decir



Un ESPACIO DE PROBABILIDAD FINITA,
o MODELO DE PROBABILIDAD FINITA, se
obtiene asignando a cada punto en S un
nmero real p, llamado la PROBABILIDAD
DE a
i
, que satisface las siguientes
propiedades:
{ }
n
a a a S ... , ,
2 1
=
i) La suma de los p
i
es 1, es decir



ii) Cada p
i
es no negativo

= + + + = 1 ...
2 1 n i
p p p p
0 >
i
p
Distribucin de probabilidad
Es la tabla:

n
n
p p p ad probabilid
a a a resultado
...
...
2 1
2 1

Histograma
Es simplemente un grfico de barras,
donde la altura de la barra es la
frecuencia del nmero dado en la lista
Distribucin de probabilidad
Funcin de distribucin de probabilidad
x d x f x F
x d x f x X P x F
x f x X P x F
x
x
X X
x
x x
X X
i
j
j X i i X
L
' '
=
' '
= s =
= s =
}
}

= '
= '
=
) ( ) (
) ( ) ( ) (
) ( ) ( ) (
1
Funcin de distribucin de probabilidad
(es acumulativa)
Percentiles
Es conveniente subdividir el rea bajo una curva de
densidad mediante el uso de ordenadas, de modo
que el rea la izquierda de la ordenada es algn
porcentaje del rea total.
El valor correspondiente a esa rea se llama
percentil.
Dcimo percentil = primer decil = 10% percentil
Mediana: Quinto decil = Quincuagsimo percentil:
50% percentil
Media
( )
( ) ( ) ( )
( )

=
|
.
|

\
|
= + + + ~
(
(

+ + + + + + + + + + + + ~
+ + +
T
i
i
i
T T
f
T T T
f f
n
x
n
f
x f x f x f
n
X
x x x x x x x x x
n
X
X X X
n
X
T
1
2 2 1 1
veces veces
2 2 2
veces
1 1 1
2 1
...
1
... ... ... ...
1
....
1
2 1

Extensin de una distribucin
Qu tan variadas son las observaciones
muestrales?
Medidas de extensin:
Amplitud
Desviacin media absoluta (MAD)
Desviacin media cuadrtica (MSD)
Varianza y desviacin estndar


Amplitud
A = observ. ms grande observ. ms pequea

Ejemplo:
A = 79.5 - 58.5 = 21

Los extremos pueden ser poco confiables
Desviacin media absoluta

=

n
i
i
X X
n
MAD
1
1
Desviacin media cuadrtica
( )

=

n
i
i
X X
n
MSD
1
2
1
Varianza y Desviacin
estndar
( )

=
n
i
i
X X
n
s Varianza
1
2
2
1
1
varianza = = s estndar Desviacin
Ej.: Clculo de la media y MSD
Transformaciones lineales:
Cambio de origen

Desviacin
X x
i
i i
s s
a X X
a X X
=
=
'
=>
=
'
'
Codificacin: cambio de escala
Acortamiento
X
X
i
i i
s b s
X b X
bX X
=
= =>
=
*
*
*
Transformaciones lineales generales
X Y
i i
s b s
X b a Y
bX a Y
=
+ = =>
+ =
Aplicacin a la codificacin
Se puede usar en la bsqueda de un
clculo ms sencillo de la media y la
extensin
Pasos:
1. Codificar X
i
a Y
i

2. Calcular la media y la desviacin estndar
de los valores Y
3. Traducirlas a valores X
Clculo codificado de la muestra
de las estaturas de 200 hombres
Clculo de media
39 . 69
69 3
13 . 0
200
26
26
=
+ =
= = =
=

X
Y X
n
y f
Y
y f
i i
i i
Clculo de desviacin estndar
( )
44 . 3
316 . 1 3 3
316 . 1
199
262
262
2
2
=
= =
= =
=

X
Y X
Y
i i
s
s s
s
f Y Y
Cambio de origen y de escala
Lectura obligatoria
Cap. 1: Introduccin p. 23-29
Cap. 2: Estadstica descriptiva para
muestras p. 31-48

Potrebbero piacerti anche