Sei sulla pagina 1di 38

Estadstica

Ing. Ind. Guillermo Conde Medina,


M.P.E.
Definicin
Matemticas
Aritmtica
Estadstica
Probabilidad lgebra
Rama de las matemticas que se encarga
de la recopilacin e interpretacin de los
datos obtenidos de un estudio, para
facilitar la toma de decisiones.
Conceptos
Variable
Se refiere a las cosas que son susceptibles a ser modificadas.
Variable aleatoria
Es una variable estadstica cuyos valores se obtienen de
mediciones en algn tipo de experimento aleatorio.
Variable
aleatoria
discreta
Variable aleatoria
continua
Estadstica Descriptiva
Comprende la recoleccin,
visualizacin y resumen
de los datos que pueden
ser presentados en forma
tabular o grfica.
Estadstica descriptiva
Medidas de
tendencia
central
Media
Mediana
Moda
Medidas de
dispersin
Varianza
Desviacin
estndar
Frecuencias
Frecuencia
absoluta
Frecuencia
relativa
Distribucin
de
frecuencias
Media (promedio)
n
X
X
n
i
i
=
=
1
___
Sumatoria de datos
Nmero de datos
Hay que considerar la
sensibilidad de la media a un
dato de valor atpico.
EJEMPLO:
Considere el siguiente conjunto de edades de
personas:
23, 38, 42, 25, 60, 55, 50, 42, 32, 35



2 . 40
10
35 32 42 50 55 60 25 42 38 23
___
=
+ + + + + + + + +
= X
EJEMPLO:
Para indicar la sensibilidad de la media a una
medicin atpica, suponga que sustituimos la
edad 60 con una edad mucho mayor (90):
23, 38, 42, 25, 90, 55, 50, 42, 32, 35



Incrementar el tamao de una sola de las diez
edades originales da como resultado un
incremento de 3 aos en la media de la edad.
2 . 43
10
35 32 42 50 55 90 25 42 38 23
___
=
+ + + + + + + + +
= X
Mediana
Nmero central
de un arreglo
de datos
ordenados de
menor a mayor
Si n es un nmero
impar, solo hay un
dato central.
Si n es un nmero
par, hay dos datos
centrales, y la mediana
debe tomarse como la
media aritmtica de
esos valores.
EJEMPLO:
Considere las edades del ejemplo anterior,
ahora se disponen en orden de menor a
mayor:
23,25,32,35,38, 42, 42,50,55, 60
Al ser un nmero par de datos, se tienen dos
datos centrales (38,42), la media de estos dos
nmeros es la mediana (40).


Moda
Dato que ms
se repite.
Desviacin estndar
n
X X
S
n
i
i
=
|
.
|

\
|

=
1
2
___
Unidad para medir la
distancia promedio de
los datos alrededor de
la media (grado de
dispersin).
Sumatoria del cuadrado de las diferencias de
los datos con respecto a la media.
Nmero de datos
Varianza
n
X X
S
n
i
i
=
|
.
|

\
|

=
1
2
___
2
Desviacin
estndar elevada
al cuadrado.
Sumatoria del cuadrado de las diferencias de
los datos con respecto a la media.
Nmero de datos
EJEMPLO:
Amayrani y Joel son estudiantes de la Facultad de Ingeniera
en el Campus de ingeniera y ciencias exactas de la UADY. Tras
terminar su primer semestre tuvieron las siguientes
calificaciones:

Amayrani Joel
lgebra II
100 100
Mecnica de materiales
100 94
Fsica II
70 95
Economa
100 98
Anlisis vectorial
70 100
Investigacin de
operaciones
100 90
Dibujo tcnico
100 91
Clculo II
100 87
Comunicacin
100 97
Introduccin a la ingeniera
100 88
EJEMPLO:
Tanto Amayrani como Joel tienen un promedio de 94
(Comprubelo).
Qu conclusin puede sacar a partir de la desviacin
estndar?

12
94
___
=
=
A
A
S
X
56 . 4
94
___
=
=
J
J
S
X
Frecuencia
Nmero de veces que aparece un determinado valor en un
estudio estadstico. La suma de las f.a. es igual al total de datos.
Frecuencia absoluta
Es el cociente entre la frecuencia absoluta entre el nmero total
de datos. La suma de las f.r. es igual a 1.
Frecuencia relativa
Se emplea si los datos corresponden a un nmero grande de
valores.
Distribucin de frecuencias
Relacin entre la frecuencia y la teora
de la probabilidad
Si A es un evento
asociado a un
experimento, la
frecuencia relativa
de A est dada
por la ecuacin :
Teora de la
probabilidad
n
f
A P
i
= ) (
Nmero de datos favorables (frecuencia relativa)
Total de datos
Relacin entre la frecuencia y la teora
de la probabilidad
Teora de la
probabilidad
Mientras ms se repita
un experimento
aleatorio, la frecuencia
relativa tiende a
permanecer constante
La probabilidad
obtenida as es una
estimacin y no una
probabilidad exacta.
La probabilidad es
vlida cuando existen
condiciones idnticas a
aquellas en que se
obtuvieron los datos.
Clases
Intervalos de datos de la misma amplitud.
Amplitud
Diferencia entre el lmite superior
y el lmite inferior de la clase.
Marca
La mediana del intervalo que
representa a toda la clase.
Como regla prctica, el nmero de clases debe ser de 5 a 12;
cuantos ms datos haya, ms clases se requieren.

EJEMPLO:
Pesos de 30 bebs de gestacin completa al
momento de nacer (libras):

7.2 7.8 6.8 6.2 8.2
8.0 8.2 5.6 8.6 7.1
8.2 7.7 7.5 7.2 7.7
5.8 6.8 6.8 8.5 7.5
6.1 7.9 9.4 9.0 7.8
8.5 9.0 7.7 6.7 7.7
EJEMPLO:
Para los pesos al nacer que se muestran en la
tabla anterior, se decide usar intervalos de peso
de igual longitud. Se procede a restar el dato
menor del dato mayor:
9.4 5.6 = 3.8
El ancho mnimo de clase necesario para cubrir el
margen de los datos es (3.88) 0.475. Para ms
comodidad, se redondea este ancho aproximado
a 0.5. Empezando el primer intervalo al valor ms
bajo, 5.6, formamos subintervalos de 5.6 hasta
pero no incluyendo 6.1, y as sucesivamente.
EJEMPLO:
Clase
Amplitud
de la
clase Total
Frecuenci
a de clase
Frecuencia
relativa de
clase
Marca de la
clase
1 5.6 < 6.1 2 2 0.0667 5.8
2 6.1 < 6.6 2 2 0.0667 6.3
3 6.6 < 7.1 4 4 0.1333 6.8
4 7.1 < 7.6 5 5 0.1667 7.3
5 7.6 < 8.1 8 8 0.2667 7.8
6 8.1 < 8.6 5 5 0.1667 8.3
7 8.6 < 9.1 3 3 0.1000 8.8
8 9.1 < 9.6 1 1 0.0333 9.3
La amplitud
va del lmite
inferior (5.6)
hasta antes
del lmite
superior
(6.1), es
decir que no
incluye este
ltimo dato.
Estadstica inferencial
Estudia cmo sacar conclusiones generales
para toda la poblacin a partir del estudio de
una muestra, y el grado de fiabilidad o
significacin de los resultados obtenidos.
Estadstico Smbolo de
muestra
Smbolo de
poblacin
Media X

Varianza S
2

2
Desviacin
estndar
S
Desviacin estndar para inferir
Estadstico Smbolo de
muestra
Smbolo de
poblacin
Media X

Varianza S
2

2
Desviacin
estndar
S
n
X X
S
n
i
i
=
|
.
|

\
|

=
1
2
___
1
1
2
___

|
.
|

\
|

=

=
n
X X
n
i
i
o
Grados de
libertad
Nmero de
datos que son
independientes
uno de otro
que tienen
piezas de
informacin
nicas.
Estadstica inferencial
Distribuciones
de
probabilidad
Distribuciones
muestrales
Intervalos de
confianza
Pruebas de
hiptesis
Distribuciones de probabilidad
La distribucin de probabilidad para
una variable aleatoria discreta enlista
todos los posibles valores que puede
tomar la variable, junto con la
probabilidiad de que ocurra cada uno.
Ventas
diarias Frecuencia
0 5
1 15
2 35
3 25
4 20
TOTAL 100
Ventas
diarias Probabilidad
0 0.05
1 0.15
2 0.35
3 0.25
4 0.2
Total 1
Funcin de probabilidad y algunas
distribuciones

= =
s = s
1 ) (
1 ) ( 0
x X P
x X P
Distribucin
normal
Distribucin
t-student
Distribucin
binomial
Distribucin
Fisher
Distribucin
Poisson
Distribucin muestral
Es la distribucin de todos los valores
posibles dentro de una muestra que
se pueden obtener de la poblacin.
Distribucin normal
Distribucin t-student (n<30)
D
i
s
t
r
i
b
u
c
i

n

N
o
r
m
a
l

D
i
s
t
r
i
b
u
c
i

n

t
-
s
t
u
d
e
n
t

Distribucin muestral

Distribucin
normal

Distribucin
t-student
n
X
Z
o

=
___
n
S
X
t

=
___
Intervalos de confianza
Es un rango de valores (calculado en una muestra) en el
cual se encuentra el verdadero valor del parmetro, con
una probabilidad determinada.
La probabilidad de que el verdadero valor del
parmetro se encuentre en el intervalo
construido se denomina nivel de confianza, y se
denota 1-. La probabilidad de equivocarnos se
llama nivel de significancia y se simboliza .
Intervalos de confianza
n
S
Z X
2 /
___
o

Depende del nivel de


confianza que se quiera, se
determina con la tabla de
distribucin normal.
n
S
t X
2 /
___
o

Se encuentra con n-1


grados de libertad.
Prueba de hiptesis
Una hiptesis estadstica es una proposicin o supuesto
sobre los parmetros de una o ms poblaciones.
La hiptesis nula (H
0
) es el enunciado sobre una o ms
caractersticas de poblaciones que refuta lo que afirma la
hiptesis alternativa.
La hiptesis alternativa (H
A
) es la afirmacin
contradictoria a H
0
, y sta es la hiptesis del investigador.
Pruebas de hiptesis
Establecer las
hiptesis nula y
alternativa (H
0
y H
A
).
Calcular la
estadstica adecuada
de la prueba de la
muestra.
Establecer la regin
de rechazo.
Establecer una regla
de decisin.
Conclusin en el
contexto del
problema.
Si se rechaza la H
0

automticamente se
acepta la H
A
.

Si se acepta la H
0
, la H
A

es rechazada.
Pruebas de hiptesis
Si el estadstico es mayor al valor crtico de
la distribucin respectiva, se rechaza la
hiptesis nula y se acepta la alternativa.
Si t
modelo
> t
tabla
se rechaza la Hiptesis nula (H
0
), y por lo
tanto se acepta la Hiptesis alternativa (H
A
).
Si Z
modelo
> Z
tabla
se rechaza la Hiptesis nula (H
0
), y por lo
tanto se acepta la Hiptesis alternativa (H
A
).
Pruebas de hiptesis
Si el valor p es mayor al nivel de
significancia () se acepta la hiptesis
nula.
Si p > se rechaza la Hiptesis nula (H
0
), y por lo tanto se
acepta la Hiptesis alternativa (H
A
).
Ejemplo de H
0
y H
A
Hiptesis bilateral ( z
/2
, t
/2
, F
/2
)

Potrebbero piacerti anche