Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADISTICA
Estadstica Descriptiva
Medidas de Tendencia Central
Son indicadores estadsticos que
muestran hacia que valor (o valores se
agrupan los datos.
Medidas:
Media
Moda
Mediana
Tipos de Medidas
Media (promedio). Es la suma de todos los valores
divido para el numero de ellos (promedio simple).
MUESTRAL
n
X i
X i 1
n
Ventajas Desventajas
Es la medida de tendencia central
ms usada. Es sensible a los valores
extremos.
Es sensible a cualquier cambio en No es recomendable emplearla
los datos (puede ser usado como un en distribuciones muy
detector de variaciones en los datos). asimtricas.
Se emplea a menudo en clculos Si se emplean variables
estadsticos posteriores. discretas o cuasi-cualitativas, la
media aritmtica puede no
En la grfica de frecuencia pertenecer al conjunto de
representa el centro de gravedad. valores de la variable.
Tipos de Medidas
Mediana. Es un indicador en divide en dos partes
iguales la base de datos.
Para su calculo deben ordenarse primero los datos de
menor a mayor.
Luego dependiendo del nmero de datos se escoge la
tendencia.
Ventajas Desventajas
Es estable a los valores
extremos. No presenta todo el rigor
matemtico.
Es recomendable para
distribuciones muy asimtricas Se emplea solo en variables
cuantitativas
Tipos de Medidas.
Moda. Es el dato que ms se repite en la base
de datos.
En el caso de que dos valores presenten la misma
frecuencia, decimos que existe un conjunto de datos
bimodal. Para ms de dos modas hablaremos de un
conjunto de datos multimodal
Ventajas Desventajas
Es estable a los valores
extremos. Pueda que no se presente.
Puede existir ms de una moda.
Es recomendable para el En distribuciones muy
tratamiento de variables asimtricas suele ser un dato
cualitativas muy poco representativo.
Carece de rigor matemtico.
Tipos de Medidas.
Asimetra.- Mide el grado de asimetra de la distribucin con
respecto a la media. Un valor positivo de este indicador significa
que la distribucin se encuentra sesgada hacia la izquierda
(orientacin positiva). Un resultado negativo significa que la
distribucin se sesga a la derecha. La distribucin se considera
simtrica si el valor del coeficiente es cero.
Tipos de Medidas.
Curtosis.- Indica que tan apuntada o plana se encuentra una
distribucin respecto a un comportamiento normal (distribucin normal).
Si los datos estn muy concentrados hacia la media, la distribucin es
leptocrtica (curtosis mayor a 0). Si los datos estn muy dispersos, la
distribucin es platicrtica (curtosis menor a 0).
El comportamiento normal exige que la curtosis sea igual a 0
(distribucin mesocrtica).
Medidas de Posicin
Son indicadores estadsticos que muestran la frecuencia
acumulada hasta un valor k cualquiera.
X i X
Dm i 1
n
Medidas de desviacin
Varianza : Es el resultado de la divisin de la sumatoria de las
distancias existentes entre cada dato y su media aritmtica
elevadas al cuadrado, y el nmero total de datos.
MUESTRAL
2
X X
n
i
S2 i 1
n 1
X X
n
i
S S 2 i 1
n 1
Habamos visto que la varianza transforma todas las distancias a
valores positivos elevndolas al cuadrado, con el inconveniente de
elevar consigo las unidades de los datos originales.
Covarianza
Correlacin
Medidas de asociacin
Covarianza.- Es una medida de relacin entre 2 variables.
1 n
S xy
n 1 i 1
( X i X )(Yi Y )
Sxy
r xy
Sx2 Sy 2
Desaparece el problema de a-dimensionamiento.
Es un valor que se encuentra entre -1 y 1.
Coeficiente de Spearman
La correlacin de Spearman mide el grado de
asociacin entre dos variables cuantitativas que siguen
una tendencia siempre creciente o siempre decreciente.
Es ms general que el Coeficiente de correlacin de
Pearson, la correlacin de Spearman, en cambio se
puede calcular para relaciones exponenciales o
logartmicas entre las variables.
Estadstica inferencial
Probabilidades
Teora de la probabilidad: Se encarga del estudio de
los fenmenos o experimentos aleatorios
Unin:
Interseccin:
Complemento:
Diferencia o exclusin:
Probabilidades
Teora de la probabilidad
P(A) 0
0 P(A) 1
P() = 1
P(A B) = P(A) + P(B), si A B =
P() = 0
P(Ac) = 1 P(A)
Si A B, P(A) P(B)
P(A B) = P(A) + P(B) P(A B), si A B
Probabilidades
Probabilidad condicional
Ingresos Sexo
F ( xi ) P( X xi )
Esperanza matemtica
La esperanza matemtica o valor esperado de una variable aleatoria discreta es
la suma del producto de la probabilidad de cada suceso por el valor de dicho
suceso.
E X xi P( X xi ) xi p( xi )
i i
X P(X) X P(X)
-1 .1 -.1
0 .2 .0
1 .4 .4
2 .2 .4
3 .1 .3
1.0
Propiedades de la esperanza
Sean a, b y c constantes:
(1) E (c) c
(2) E ( X Y ) E ( X ) E (Y )
(3) E (aX b) aE( X ) b
Varianza matemtica
Se utiliza para estudiar el comportamiento de los valores de la variable aleatoria
en funcin de la media o valor esperado
2 Var( X ) E (( X ) 2 )
i(
i
x ) 2
P( X xi )
X ( X ) ( X ) P( X )
2 2
X P(X)
-1 .1 -2 4 .4
0 .2 -1 1 .2
1 .4 0 0 .0
2 .2 1 1 .2
3 .1 2 4 .4
1.2
Propiedades de la varianza
Sean a, b y c constantes:
(1) Var(c) 0
X B p, n
n x n x
P( X x) p q
x
Edwin Buenao - Estadstica II
PUCE
Funciones Discretas Sencillas
Distribucin de Poisson
Dado un suceso que aparece de espordicamente, en un intervalo de tiempo o
un espacio dado, cul es la probabilidad de que se haya dado x veces?
x
f ( x) e x 0,1,2,...
x!
Aplicacin:
Por ejemplo, al momento de revisar deberes, cuando de un lote
pequeo de tamao N con K deberes con error se extrae una
muestra aleatoria de tamao n , la probabilidad de encontrar un
determinado nmero de deberes con error en lac muestra se puede
calcular mediante la distribucin hipergeomtrica.
k N k
x nx
P ( X x)
N
Edwin Buenao - Estadstica II
PUCE
n
Funciones Continuas
Dado que entre dos datos continuos siempre existe otro dato continuo, se puede
conseguir una agrupacin mas fina de los mismos mediante los intervalos de clase;
situacin que no sucede con los nmeros enteros
Este hecho permite conseguir una curva mas continua del polgono de frecuencias
Sin embargo, como el nmero de valores que puede tomar una variable continua es
infinito, la probabilidad puntual de que suceda uno de ellos es nula.
Por lo tanto, solo es posible determinar probabilidades de intervalos con este tipo de
variables
b
P ( a X b) f ( x ) dx
a
f(x)
a b
Funciones Continuas
x
F ( x) P ( X x) f (t )dt
a
Funciones Continuas
La funcin de distribucin cumple:
2. Se verifica:
Funciones Continuas
Distribucin Uniforme.- Se produce en experimentos
cuando los posibles resultados pueden darse
equiprobablemente dentro de un determinado intervalo
de valores.
X U a, b
x
xa
P X x
ba
a, b
Funciones Continuas
Distribucin Normal.- Se produce en experimentos
cuando los posibles resultados pueden concentrarse
alrededor de un valor central y repartirse inferiormente
en los extremos
X N ,
x
x
1 1 x 2
P X x exp x
2 2
a, b
Funciones Continuas
Distribucin Normal Estandar.- Este tipo de
distribucin es simplemente una transformacin de la
variable normal, de manera que consiga media 0 y
desviacin 1:
X
Z N 0,1
a, b
Funciones Continuas
Distribucin muestral.- Si X1, X2, , Xn es una
muestra aleatoria de una poblacin normal con media x
y varianza x, entonces la media muestral sigue una
distribucin:
x N ( x ; / n)
2
x
Funciones Continuas
Distribucin t-student.- Est estrechamente relacionada con la
distribucin normal
x N ( x ; x2 / n)
x x
Z N (0;1)
x / n
La variable Z sigue una distribucin normal estndar, siempre que
se conozca x y x. Suponiendo que slo conocemos x y
estimamos x a partir de su estimador muestral: n
( xi x ) 2
Sx
i 1 n 1
Funciones Continuas
x x
t t( n 1)
Sx / n
Esta variable sigue una distribucin t de student con (n-1) grados de libertad (g.l)
La distribucin t tiene un nico parmeto que son los grados de libertad
Propiedades:
Es simtrica
La media es 0 y la varianza es k/(k-2), donde k representa los grados de libertad
a, b
Funciones Continuas
Distribucin Ji-Cuadrado.- El cuadrado de una variable normal
estndar se distribuye siguiendo una distribucin de probabilidad Ji-
cuadrado (c2) con un grado de libertad
Z 2 c (21)
Sean ahora Z1, Z2, Z3, .., Zn variables normales con media 0 y
varianza 1. Se puede demostrar que la suma de las Zi variables al
cuadrado, tambin sigue una distribucin Ji-Cuadrado
k
i 1 2
Z 2
i 1
Z 2
Z 2
..... Z 2
k c 2
(k )
a, b
Funciones Continuas
Propiedades.-
Funciones Continuas
Distribucin F.- Sean X1, X2, .., Xm una muestra aleatoria de
tamao m de una poblacin normal con media x y desviacin x. Y
sean Y1, Y2, , Yn una muestra aleatoria de tamao n de una
poblacin normal con media y y desviacin y.
Suponiendo que dichas muestras son independientes y se extraen
de poblaciones que se distribuyen normalmente y el inters radica
en conocer si las varianzas de estas 2 poblaciones son las mismas
x = y Si no se conoce las poblaciones y se utiliza los estimadores
muestrales de la siguiente manera:
m
( xi x ) 2 n
( yi y ) 2
S x2 S y2
i 1 m 1 i 1 n 1
S x2
F 2 F( m 1;n 1)
Sy
a, b
Funciones Continuas
S x2
F 2 F( m 1;n 1)
Sy
La teora muestra que si las varianzas son iguales, el coeficiente F
sigue una distribucin F con (m-1) g.l del numerador y (n-1) g.l del
denominador.
a, b
Funciones Continuas
Propiedades.-
Eficiencia
Se emplea para COMPARAR estimadores.
lim P 0
n
1 2 1 2
( x1 x2 ) Za / 2 ( ) 1 2 ( x1 x2 ) Za / 2 ( )
n1 n2 n1 n2
Varianza desconocida.-
Si la varianza es desconocida, la muestra es pequea y la poblacin es normal,
podemos utilizar el estadstico t para determinar el rango del verdadero valor de
la diferencia de medias, con una confianza de (1-a)100%
S1 S2 S1 S2
( x1 x2 ) ta / 2 ( ) 1 2 ( x1 x2 ) ta / 2 ( )
n1 n2 n1 n2
a, b
Pruebas de hiptesis
Es una declaracin acerca del valor de un parmetro poblacional. Se plantea
mediante 2 tipos:
H0: Hiptesis nula
H1: Hiptesis alternativa
La hiptesis nula plantea un determinado valor 0 para el parmetro , mientras que
la hiptesis alternativa propone cualquiera de la siguientes opciones.
Prueba bilateral: H0: =0
H1: 0 puede ser mayor o menor)
Prueba superior: H0: =0 (equivale a decir que es menor o igual)
H1: >0
Prueba inferior: H0: =0 (equivale a decir que es mayor o igual)
H1: <0
a, b
Pruebas de hiptesis
La decisin sobre cual es ms probable se realiza utilizando
informacin muestral.
Se pueden cometer 2 tipos de errores:
Error tipo I: Rechazar la hiptesis nula cuando es verdadero (a)
Error tipo II: Aceptar la hiptesis nula cuando es falsa (b)
a= P(rechazar H0 / H0 es verdadero)
b= P(aceptar H0 / H0 es falso)
RECHAZAR ACEPTAR
VERDADERO
Tipo I Correcto
FALSO
Correcto Tipo II
a x 0 Za / 2 x 0 Za / 2
n n
b x 0 Za
n
c x 0 Za
n
a, b
S S
a x 0 ta / 2 x 0 ta / 2
n n
S
b x 0 ta
n
S
c x 0 ta
n
a, b
02 02
a s 2 c12a / 2 s 2 c12a / 2
(n 1) (n 1)
02
b s c
2 2
1a
(n 1)
02
c s c
2 2
1a
(n 1)
a, b
a pq pq
p p0 Za / 2 p p0 Za / 2
n n
b pq
p p0 Za
n
pq
c p p0 Za
n