Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INTRODUCCION
Hace ms de 100 aos H. G. Wells, escritor e historiador ingls, dijo que el conocimiento
estadstico ser algn da tan necesario para ser un buen y eficiente ciudadano, como la
aptitud de poder leer y escribir.
HISTORIA DE LA ESTADSTICA
El trmino Estadstica que se utiliz hasta el siglo XVII como una abreviatura de la ciencia
descriptiva de los Estados, se identific cada vez ms, en el siglo XIX, con las cifras
cuantitativas. Hacia 1830, en Francia e Inglaterra, el trmino ya fue usado de forma general
como sinnimo de la ciencia numrica de la sociedad. Este cambio de significado se debi a
que, desde 1800, los gobiernos de Europa Occidental y de Estados Unidos comenzaron a
recopilar y publicar sistemticamente una gran cantidad de registros de censos y de otros tipos
de tablas.
Aunque a lo largo del siglo XIX la teora de la probabilidad haba sido desarrollada por
matemticos tales como Jacob Bernoulli, Karl Friedich Gauss y Pierre Simon Laplace, su
aplicacin al estudio de hechos estadsticos fue casi inexistente, ya que la mayor parte de los
estadsticos sociales de la poca se contentaban con dejar que los datos hablaran por s
mismos. En particular, en esa poca los estadsticos no estaban interesados en sacar
inferencias a partir de individuos, ms bien se centraban en la sociedad en su totalidad. Por
consiguiente, no estaban preocupados por el muestreo sino que intentaban obtener censos de
1
Mtodos Estadsticos 2014
No fue hasta finales de este siglo cuando los estadsticos empezaron a preocuparse por inferir
conclusiones a partir de los datos numricos. El movimiento comenz con los trabajos de
Francis Galton sobre el anlisis de la influencia de la herencia a travs de la utilizacin de
tcnicas que actualmente se conocen como anlisis de regresin y correlacin, que alcanzaron
su mayor auge con los trabajos de Karl Pearson. ste, que desarroll los contrastes de bondad
de ajuste, fue el primer director del laboratorio Galton, fundado por Galton en 1904. All,
Pearson lider un programa de investigacin con el objetivo de desarrollar nuevos mtodos en
los que la Estadstica se utiliza con fines inferenciales. Su laboratorio potenci que
investigadores provenientes de distintas reas de la ciencia y la industria aprendieran los
mtodos estadsticos que podan tener aplicacin en sus campos. Uno de los primeros
estudiantes que acudi a su laboratorio fue W. S. Gosset qumico de formacin, que demostr
su devocin por Pearson y public sus propios trabajos bajo el seudnimo de Student. Existe
una famosa leyenda que mantiene que Gosset tema publicar sus trabajos, bajo su propio
nombre por miedo a que, en la fbrica de cerveza Guinnes, donde laboraba, sus jefes
descubrieran que uno de sus qumicos realizaba investigaciones estadsticas. Gosset es famoso
por el desarrollo de los contrastes de t.
Dos de las reas ms importantes de aplicacin de la Estadstica a principios del siglo XX fueron
la biologa y la agricultura; todo ello gracias al inters de Pearson y de otros investigadores de
su laboratorio, y tambin a los logros del cientfico ingls Ronald A. Fisher. La teora de la
inferencia desarrollada por estos investigadores pioneros y otros entre los que se encuentran
Egon Pearson, hijo de Karl Pearson, y el estadstico matemtico polaco Jersy Neyman- fue lo
suficiente general como para tratar una amplia gama de problemas cuantitativos prcticos.
Como resultado, tras los primeros aos del siglo XX, aument muy rpidamente el nmero de
personas, procedente de la ciencia, los negocios y la administracin, que empezaron a
considerar la Estadstica como una herramienta capaz de suministrar soluciones cuantitativas a
una gran variedad de problemas cientficos y prcticos.
La Estadstica tiene el objeto de realizar una representacin fiable de un Estado en una poca
determinada (Quetelet, 1849)
2
Mtodos Estadsticos 2014
La Estadstica puede considerarse (i) como el estudio de las poblaciones, (ii) como el estudio de
las variaciones y (iii) como el estudio de los mtodos de reduccin de datos (Fisher, 1925).
La Estadstica es el nombre de la ciencia que trata de llevar a cabo inferencias bajo situaciones
de incertidumbre; para ello, usa los nmeros para averiguar cuestiones relativas a la
naturaleza y la experiencia. (Weaver, 1952).
Estadstica es la ciencia que nos ayuda a recolectar, organizar, presentar, analizar e interpretar
datos para una toma de decisin ms efectiva. (Alvaro Pintado-Agurto Meja, 2009).
Nos topamos con ella en el lenguaje cotidiano. En realidad posee dos significados: En su
acepcin ms comn, la estadstica se refiere a informacin numrica. Algunos ejemplos son:
el sueldo inicial de los graduados de Universidad, el nmero de muertos provocados por el
alcoholismo el ao pasado, el nmero de goles en un partido de futbol etc. En estos ejemplos
las estadsticas se refieren a un valor o porcentaje.
DIVISION DE LA ESTADISTICA
3
Mtodos Estadsticos 2014
POBLACION.- Coleccin de todos los elementos que se estn estudiando y sobre los cuales
intentamos llegar a conclusiones
TIPOS DE VARIABLE
Variable cualitativa ordinal, es aquella que agrupa a los objetos, individuos, en categoras
ordenadas, para establecer relaciones comparativas Ejemplo Nivel de instruccin, nivel de
pobreza
Variable discreta, es aquella que adopta solo ciertos valores y existe vaco entre ellos,
ejemplo: Nmero de camas en una casa, nmero de estudiante en cada aula. Las variables
discretas son el resultado de un preso de conteo.
Variable contina, es aquella que toma cualquier valor dentro de un intervalo especfico.
Ejemplo, presin de aire de una llanta, duracin de un vuelo entre Lima y Chiclayo. Las
variables continuas son el resultado de mediciones.
Tipos de variable
Cualitativas Cuantitativas
4
Mtodos Estadsticos 2014
Variables independientes (VI) son las variables explicativas o predictivas, cuya asociacin,
relacin o influencia en la variable dependiente se pretende descubrir en una investigacin.
Las variables independientes son las que traducen o explican las causas o razones de las
variaciones de la variable dependiente
Variables dependientes (VD) Son aquellas que se explican por otra variable, son los efectos
o resultados respecto a los cuales hay que buscar un motivo, causa o razn de ser. Es la
variable que traduce la consecuencia del efecto de una o varias razones o causas, de otras
variables
Ejemplo:
Los datos se clasifican por niveles de medicin. El nivel de medicin de los datos rige los
clculos que se llevan a cabo con el fin de resumir y presentar los datos. Tambin determina
las pruebas estadsticas que se deben realizar.
Por ejemplo, si se compra una caja de lentejas de dulce, encontramos que hay seis colores.
Suponga que se le asigna 1 al caf, 2 al amarillo, 3 al azul, 4 al naranja, 5 al verde y 6 al rojo.
Sume la cantidad de lentejas que hay en la caja, la divide entre el nmero de lenteja e informa
que el color promedio es 3.56. Significa que el color promedio es azul o anaranjado? Desde
luego que no.
Otro ejemplo, en la pista atltica hay ocho competidores para una carrera de 400 metros. Para
indicar el orden en que llegan a la meta se dice que la media es de 4.5 Qu revela este
promedio? Nada. En ambos casos, no se emple adecuadamente en nivel de medicin. Existen
cuatro niveles de medicin: nominal, ordinal de intervalo y de razn
En el caso del nivel nominal de medicin, las observaciones acerca de una variable cualitativa
solo se clasifican y se cuentan. No existe una forma particular para ordenar las etiquetas
(categoras). La clasificacin de las de lentejas de dulce, simplemente se clasifican por color. No
5
Mtodos Estadsticos 2014
existe un orden natural. Es decir, no se presentan primero las lunetas color caf, las
anaranjadas o las de cualquier color. El gnero representa otro ejemplo del nivel de medicin
nominal. Si contamos en una aula de clase, cuantos hombre y cuantas mujeres hay. Podramos
presentar primero a los hombres o a las mujeres. Para el nivel nominal, la medicin consiste en
contar.
El nivel inmediato superior de datos es el nivel ordinal. En la siguiente tabla se presentan las
calificaciones que los alumnos del profesor PERICO PEREZ le otorgaron despus de un curso de
introduccin aeroespacial. Cada estudiante de la clase respondi a la pregunta En trminos
generales. Cmo calificas al profesor del curso? Las calificacin variable ilustra el uso dela
escala ordinal de medicin. Una calificacin es la ms alta o mejor, que la siguiente: Superior es
mejor que bueno, bueno es mejor que promedio, etc. Sin embargo no es posible distinguir la
magnitud de las diferencias entre grupos. La diferencia entre superior y bueno es la misma
que entre malo e inferior? No es posible afirmarlo.
1.- Las calificaciones de los datos se encuentran representadas por conjuntos de etiquetas o
nombres (alto, medio, bajo), las cuales tienen valores relativos.
2.- En consecuencia, los valores relativos de los datos se pueden clasificar u ordenar.
6
Mtodos Estadsticos 2014
1.- Las clasificaciones de datos se ordenan de acuerdo con el grado que posea la caracterstica
en cuestin
2.- Diferencias iguales en la caracterstica representan diferencias iguales en las mediciones.
1.- Las clasificaciones de datos se ordenan de acuerdo con la cantidad de caractersticas que
poseen.
2.- Diferencias iguales en la caracterstica representan diferencias iguales en los nmeros
asignados las clasificaciones.
3.- El punto cero representa la ausencia de caractersticas y la razn entre dos nmeros es
significativa.
NIVEL DE MEDICIN
DESCRIPCIN DE DATOS
PARTES DE UNA TABLA O CUADRO ESTADSTICO.
Las partes de un cuadro estadstico son: 1 Nmero del cuadro; 2 Ttulo; 3 Cuadro propiamente
dicho; 4 Las notas explicativas o calce; 5 Fuente
7
Mtodos Estadsticos 2014
1.-NMERO DEL CUADRO.- Es el cdigo de identificacin del cuadro. Este nmero se escribe a
continuacin de la palabra cuadro, por ejemplo cuadro No 2.5, indica el quinto cuadro
del captulo dos.
2.- TTULO.- Es la identificacin que preside la tabla y es colocada en la parte superior de la
misma. El ttulo debe reunir las condiciones siguientes: a.- ser completo; b.- ser conciso.
a.- SER COMPLETO: Un ttulo completo debe indicar claramente cul es el contenido del
cuadro estadstico. Debe responder a las preguntas: Qu, Cmo, Dnde y Cundo
QUE: A qu se refiere la tabla que se estudia. Cul es el universo que se investiga.
Ejemplo: Alumnos matriculados
COMO: Cmo se estudia, de acuerdo a cules caractersticas se clasifican los individuos
u objetos estudiados. Las variables ubicadas en las filas se identifican con la
proposicin segn y las de las columnas con la proposicin por
Ejemplo: Por sexo y segn especialidad
CUANDO: Momento o periodo de tiempo a que se refiere el estudio.
Ejemplo: Ciclo 2014 - I
DONDE: Lugar a que se refiere la informacin.
Ejemplo: Universidad Csar Vallejo
b.- SER CONCISO.- El ttulo debe ser breve, lo ms conciso posible, aunque no debe
sacrificarse la claridad a la concisin.
3.- CUADRO PROPIAMENTE DICHO.- Es la parte del cuadro que contiene la informacin y
consta de un conjunto de casillas o celdas, dispuestas en columnas y filas. Sus elementos
esenciales son: encabezamiento de las columnas, columna principal o matriz y cuerpo.
ENCABEZAMIENTO.- Es la primera fila del cuadro, en l se explica las categoras, y el objeto
de cada una de las columnas, es decir indica la naturaleza de los datos inscritos en cada una
de las celdas que se hallan debajo. Deben ser breves y explcitos.
COLUMNA PRINCIPAL O MATRIZ.- Es aquella en que se anotan las categoras o las
diferentes clases de la escala de clasificacin utilizada.
CUERPO.- Es el conjunto de celdas o casillas, que son las intersecciones de filas y columnas,
donde estn anotados los datos numricos.
4.- NOTAS EXPLICATIVAS O CALCE O NOTA DE PIE O LLAMADAS: Se usa para aclarar algunos
trminos o siglas tambin para indicar que elementos estn o no incluidos en algunos de los
conceptos del cuadro.
5.- FUENTE.- Sirve para nombrar la publicacin, entidad, estudio o fuente de donde se
obtuvieron los datos utilizados para construir el cuadro.
Hay dos tipos de fuentes:
a.- Primaria.- Cuando se obtiene directamente de la unidad de anlisis o cuando se
recurre a los propios formularios de una encuesta.
b.- Secundaria.- Cuando se recurre a documentos, boletines o cuadros
8
Mtodos Estadsticos 2014
Caracterstica Z 100 %
Totales n 1 100%
Tabla No 1 Tabla de frecuencia de los vehculos vendidos por VEHICULOS SAC, el mes pasado.
Tabla No 2 Tabla de frecuencia relativa de vehculos vendidos por VEHICULOS SAC el mes
pasado
Una caracterstica distintiva de la grfica de barras es que existe una distancia o espacio entre
las barras. Es decir que, como la variable de inters es de naturaleza cualitativa, las barras no
9
Mtodos Estadsticos 2014
son adyacentes. Por consiguiente, una grfica de barras es una representacin grfica de una
tabla de frecuencias mediante una serie de rectngulos de anchura uniforme, cuya altura
corresponde a la frecuencia de clase
Grfica No 1 Vehculos vendidos por tipo el mes pasado por VEHICULO SAC.
70.00%
60.00%
50.00%
40.00%
30.00%
20.00%
10.00%
0.00%
Domstico De importacin
GRAFICA DE PASTEL Grfica que muestra la parte o porcentaje que representa cada clase
del total de nmeros de frecuencia
Grfica No 2.-
Domstico
37.50%
62.50%
De
importacin
Ejemplo.- Un experimento consisti en contar el nmero de flores por planta de una muestra
de 32 plantas. Los valores resultantes del conteo fueron los siguientes:
1 10 9 7 17 9 25 4
2 8 10 3 18 7 26 6
3 4 11 6 19 8 27 7
4 6 12 7 20 1 28 5
5 5 13 2 21 9 29 7
6 8 14 8 22 10 30 3
7 10 15 2 23 5 31 5
8 3 16 3 24 6 32 8
10
Mtodos Estadsticos 2014
Clasificacin.- En este caso se identifican los distintos valores que tiene y ubicamos el mayor
y menor valor: = 1 = 10
Los diferentes valores que toma la variable los vamos a denotar por
1 = 1 2 = 2 3 = 4 4 = 2 5 = 4 6 = 4 7 = 5 8 = 5 9 = 2 10 = 3
Tabla No 4. Distribucin del nmero de flores por planta. Junio 2014.
CLASES.- (m, K) se llaman clases a cada uno de los grupos en los que se divide el conjunto de
datos. No hay una regla fija para determinar el nmero de clases.
K = 2,5 4
K = 1 + 3,3 log n
5 20
RANGO. - (R) Diferencia entre la observacin que tiene el valor mximo y la observacin que
tiene el valor minino, tambin se conoce como recorrido amplitud total.
R=
INTERVALO DE CLASE (C).- es el cociente que resulta de dividir la amplitud total o rango
entre el nmero de clases.
C
11
Mtodos Estadsticos 2014
0 1 1 1 1 1 1
1 2 2 2 2 2 2
= =
= 1 + 2 + 3 + +
Entonces tenemos
1
1 = = 1
=1
2
2 = = 1 + 2
=1
3
3 = = 1 + 2 + 3
=1
4
4 = = 1 + 2 + 3 + 4
=1
5
5 = = 1 + 2 + 3 + 4 + 5
=1
12
Mtodos Estadsticos 2014
Y as sucesivamente
=
=1
Entonces tenemos:
1
1 = = 1
=1
2
2 = = 1 + 2
=1
3
3 = = 1 + 2 + 3
=1
4
4 = = 1 + 2 + 3 + 4
=1
5
5 = = 1 + 2 + 3 + 4 + 5
=1
As sucesivamente
0 y 0 para i = 1, 2, 3,., m
2.- La suma de todas las frecuencias absolutas es igual al nmero total del conjunto de
observaciones.
= 1 + 2 + =
=1
3.- Las frecuencias relativas y las frecuencias relativas acumuladas son siempre nmero
fraccionados no negativos, no mayores de uno.
0 1 0 para i= 1, 2,., m
13
Mtodos Estadsticos 2014
3.- La frecuencia absoluta acumulada correspondiente al valor coincide con el nmero total
conjunto de observaciones.
= =
=1
= = 1
=1
1 = 1 2 . Para i = 1, 2,, m
1 = 1 2 . Para i = 1, 2,, m
Ejemplo
Se toma una muestra de 100 espigas de trigo y en cada una de ellas se registra la longitud en
cm. En este caso la variable X es longitud de espiga. Los resultados se presentan a
continuacin:
10,3 12,8 8,3 6,9 10,2 11,1 11,9 8,7 9,5 6,9 8,6 7,0 6,8 11,4
7,3 8,1 6,4 15,9 12,9 8,6 10,6 9,3 14,1 12,8 13,2 6,9 7,9 10,3
11,6 8,7 7,9 8,6 8,9 6,8 7,9 11,6 10,3 11,8 10,9 11,3 12,3 12,6
9,7 12,8 13,1 6,3 8,4 8,9 10,6 11,3 7,8 14,6 9,5 6,3 8,7 10,5
8,7 8,5 9,3 10,6 11,4 13,7 8,5 9,7 10,1 10,8 14,0 13,6 10,1 6,9
6,9 7,5 15,0 9,3 10,0 10,6 11,3 11,4 9,9 7,8 9,9 6,7 7,8 10,9
10,6 11,8 10,5 10,7 10,6 14,9 13,2 10,9 10,6 11,1 10,6 11,3 9,8 9,6
15,0 11,0
6,3 6,3 6,4 6,7 6,8 6,8 6,9 6,9 6,9 6,9 6,9 7,0 7,3 7,5 7,8
7,8 7,8 7,9 7,9 7,9 8,1 8,3 8,4 8,5 8,5 8,6 8,6 8,6 8,7 8,7
8,7 8,7 8,9 8,9 9,3 9,3 9,3 9,5 9,5 9,6 9,7 9,7 9,8 9,9 9,9
10,1 10,1 10,1 10,2 10,3 10,3 10,3 10,5 10,5 10,6 10,6 10,6 10,6 10,6 10,6
10,6 10,6 10,7 10,8 10,9 10,9 10,9 11,0 11,1 11,1 11,3 11,3 11,3 11,3 11,4
11,4 11,4 11,6 11,6 11,8 11,8 11,9 12,3 12,6 12,8 12,8 12,8 12,9 13,1 13,2
13,2 13,6 13,7 14,0 14,1 14,6 14,9 15,0 15,0 15,9
El rango ser
R = 15,9 6,3= 9,6
14
Mtodos Estadsticos 2014
4
K =m = 2,5100 = 7,905 8
A continuacin calculamos:
Marca de clase ( ). - es la semisuma de los lmites de clase. Es decir lmite inferior ms lmite
superior entre dos.
Frecuencia absoluta ( ). Es el nmero de observaciones o de datos comprendidos entre los
lmites de clase
Frecuencia relativa ( ) . - se denomina frecuencia relativa del valor al cociente de la
frecuencia absoluta de y el nmero total de observaciones. Se denota por
= =
1 14 2 18
1 = = = 0,14 2 = = = 0,18
100 100
3 13 4 25
3 = = = 0,13 4 = = = 0,25
100 100
5 13 6 8
5 = = = 0,13 6 = = = 0,08
100 100
7 5 8 4
7 = = = 0,05 8 = = = 0,04
100 100
As sucesivamente
Interpretacin
: 0,14 se interpreta como la proporcin de espigas cuya longitud est comprendida entre
6,3 y 7,5 cm. Inclusive
: 0,18 se interpreta como la proporcin de espigas cuya longitud vara desde 7,5 hasta 8,7
cm. inclusive
Y as sucesivamente
= 1 + 2 + 3 + +
1 = 1=1 = 1 = 14
15
Mtodos Estadsticos 2014
2 = = 1 + 2 = 14 + 18 = 32
=1
3
3 = = 1 + 2 + 3 = 14 + 18 + 13 = 45
=1
4
4 = = 1 + 2 + 3 + 4 = 14 + 18 + 13 + 25 = 70
=1
5
5 = = 1 + 2 + 3 + 4 + 5 = 14 + 18 + 13 + 25 + 13 = 83
=1
Y as sucesivamente.
Interpretacin.-
2 = 32 Significa que hay 32 espigas de trigo cuya longitud est comprendida entre 7,5 y 8,3
cm. inclusive.
1 +2 +3 +.+
= 1 + 2 + . + =
=
=1
1 = = 1 = 0,14
=1
2
Interpretacin:
= 0,32 es la proporcin de espigas de trigo cuya longitud varia de 7,5 y 8,7 cm. inclusive.
= 0,45 es la proporcin de espigas de trigo cuya longitud vara desde 8,7 y 9,9 cm. inclusive.
As sucesivamente
16
Mtodos Estadsticos 2014
6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1
Interpretacin:
Un histograma que utiliza las frecuencias relativas de cada una de las clases, en lugar de usar la
frecuencia absoluta se conoce como histograma de frecuencias relativas. Este histograma tiene
la misma forma que un histograma de frecuencias absolutas construido a partir del mismo
conjunto de datos
17
Mtodos Estadsticos 2014
El polgono tambin se puede construir con las frecuencias relativas, a esta figura se le conoce
como polgono de frecuencias relativas.
18
Mtodos Estadsticos 2014
DESCRIPCCION DE DATOS
=1
MEDIA POBLACIONAL: =
En la cual.
PARMETRO.- Es una medida resumen que describe una caracterstica de toda una
poblacin
=
MEDIA MUESTRAL =
En la cual:
= Media muestral
n= es el nmero de valores de la muestra.
1.- Todo conjunto de datos de intervalo o de nivel de razn posee una media
2.- Todos los valores se encuentran incluidos en el clculo de la media
3.- La media es nica. Solo existe una media en un conjunto de datos.
4.- Si todos los valores observados X1, X2,. son iguales a b (donde b es una constante)
entonces la media de una constante es la misma constante
M(x) = M (b) = b
19
Mtodos Estadsticos 2014
5.- Si a cada valor de las observaciones X1, X2,Xn se le suma (o se resta) una constante, la
media del nuevo conjunto transformado yi= xi b; es la media aritmtica del conjunto original
ms (o menos) la constante. Es decir
6.- Si cada valor de un conjunto X1, X2,.,Xn se multiplica por una constante diferente de
cero, la media aritmtica del conjunto transformado yi = axi, donde i= 1,2,,n es la
media aritmtica del conjunto original multiplicado por la constante. O sea:
7.- La suma algebraica de las desviaciones de cada valor observado X1, X2, X3,.Xn con respecto
a su media es cero. Esta propiedad significa que,
m = nmero de clases
= frecuencia absoluta de la clase i
yi = punto medio del intervalo i (marca de clase)
8.- Si X1, X2,,Xn, y ,Y1,Y2,Yn son dos conjuntos de observaciones de n valores cada uno,
de dos variables X y Y, expresados en las mismas unidades, entonces
9.- En casos especiales, esto es cuando es apropiado hacerlo, la media aritmtica se puede
utilizar para estimar la cantidad total de una poblacin. Esta propiedad indica que:
Total = N
MEDIA PONDERADA
( )
=
20
Mtodos Estadsticos 2014
MEDIANA
+1
Ubicacin de la mediana
2
Si hay cinco datos, entonces la ubicacin de la mediana (n+1)/2 ser igual a (5+1)/2 igual a 3.
Al ordenar los datos de menor a mayor, se obtiene el valor del tercer elemento, que es 7, la
mediana
Nmero de elemento 1 2 3 4 5
Valor del elemento 2 4 7 8 15
Mediana
En el siguiente ejemplo hay seis elementos de manera que (n+1)/2 ser igual a (6+1)/2 igual a
3,5 Despus de ordenar los datos de menor a mayor se encuentra la semi suma de los valores
3 y 4. Luego la mediana ser 31
Numero de elemento 1 2 3 4 5 6
Valor del elemento 25 29 30 32 35 35
31
Mediana
PROPIEDADES DE LA MEDIANA
1.- La mediana es nica; esto es, a semejanza de la media solo existe una mediana para un
conjunto de datos.
2.- No es difcil determinar la mediana para datos no agrupados. Tan solo se necesita
ordenarlos de menor a mayor o viceversa, y encontrar el valor del elemento central.
3.- No se ve afectada por valores muy grandes o muy pequeos y por tanto, es una medida
valiosa de tendencia central cuando ocurre este tipo de valores.
4.- Puede calcularse para datos de nivel de razn, de intervalo y ordinal
MODA
La moda puede determinarse para todos los niveles de datos: nominales, ordinales, de
intervalo y de razn. La moda tambin tiene la ventaja de no verse afectada por valores muy
altos o muy bajos
Hay muchos conjuntos de datos que no tienen moda, porque ningn valor figura ms de una
vez. Pero tambin existen conjunto de datos que tiene ms de una moda.
21
Mtodos Estadsticos 2014
M.G. g (1 )(2 )(3 ) . . ( )
Ejemplo: Supngase que las utilidades obtenidas por una compaa constructora en cuatro
proyectos fueron de 3, 2, 4 y 6% respectivamente Cul es la media geomtrica de las
ganancias?
M.G. (1 )(2 )(3 ) . . ( )
4
M.G. (3)(2)(4)(6)
4
M.G. 144 3,46%
La media geomtrica de trminos positivos es siempre menor o igual que la media aritmtica.
Es igual a la media aritmtica slo en el caso en que todos los trminos sean iguales entre s
La media geomtrica para datos agrupados en clases, es la raz n-sima del producto de las
marcas de clase elevadas a sus respectivas frecuencias
. . = g = 1 1 2 2 .
MEDIA ARMONICA (h )
22
Mtodos Estadsticos 2014
Es decir
1
= = 1 1
=1 /
=1
Ejemplo
4
= = 1 1 1 1 = 4,57143
+ + +
3 4 6 8
VENTAJAS Y DESVENTAJAS
1.- La media armnica se basa en todas las observaciones por lo que est afectado por los
valores extremos. Pero da a los valores grandes un peso menor que el que da la media
geomtrica; mientras que a los valores pequeos, le da un peso mayor que el que da la
media aritmtica y la media geomtrica.
2.- La media armnica no est defino, si alguno de los valores es cero.
e=p x t
Donde : e = espacio p = productividad t = tiempo
- La velocidad y el tiempo
e=v x t
Donde: e= espacio v = velocidad t= tiempo
Ejemplos
1.- Suponga que ha gastado usted, un nuevo sol por 3 docenas de naranjas en una tienda, otro
nuevo sol por 4 docenas de naranjas en una segunda tienda y otro nuevo sol ms por 5
docenas en una tercera tienda. Determinar el precio promedio por una docena de naranjas.
23
Mtodos Estadsticos 2014
Solucin:
= = 1
=1
3
= = 1 1 1 = 0,25
+ +
1/3 1/4 1/5
2.- Cinco secretarias tienen las siguientes velocidades 40, 36, 28, 40, y 35 palabras por minuto.
Si cada una de ellas escribe un mismo texto, calcule la velocidad media
= = 1
=1
5
= = 1 1 1 1 1 = 35,196 palabras/minuto
+ + + +
40 36 28 40 35
MEDIA ARITMERICA PARA DATOS AGRUPADOS (datos tabulados) Si los datos han sido
clasificados en m clases en una tabla de frecuencia con marca de clase yi y frecuencia absoluta
= 1,2,.., m, la media aritmtica de estos datos est definida por:
6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1
24
Mtodos Estadsticos 2014
Donde:
6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1
100
45
Me = + [
] = , +1,29[
2
70 45
] 10,158
Mo= + [ ]
( )+ ( +)
Donde:
6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1
1 2513
Mo= 1 + [ ( 1 )+ ( +1)
] = 9,9 + 1,2 [(2513)+ (25 13)] 10,5
25
Mtodos Estadsticos 2014
2.- Si la distribucin tiene la forma acampanada, es unimodal, pero no tiene simetra, las tres
medidas toman valores diferentes, y la mediana queda comprendida generalmente entre la
moda y la media aritmtica.
3()
Media
2
2()+
Mediana
3
26
Mtodos Estadsticos 2014
Los cuantiles ms usados son los cuartiles, , los deciles, Dj y los percentiles, .
PERCENTILES
PERCENTIL.- El p simo percentil es un valor tal que, a lo sumo, p por ciento de las
observaciones son menores o iguales que este valor y, a lo sumo, (100 p) por ciento de
las observaciones son mayores o iguales que este valor.
3.- Si k no es entero, se redondea. El valor del entero inmediato superior que k indica la
posicin del i simo percentil.
Si k es entero, el i simo percentil es el promedio de los valores de los datos ubicados en
los lugares k y k + 1.
Ejemplo
53 55 70 58 64 57 72 53 69 57 68 53
Solucin
Para percentil 30
30
K = [100]n = [100] 12 = 3.6
27
Mtodos Estadsticos 2014
3.- Como k no es entero, redondeamos. El lugar del percentil 30 es el siguiente entero mayor
de 3.6, es decir, el lugar 4. En este caso el percentil 30 es el valor del dato que ocupa la
posicin cuarta, o sea 55. Esto significa que el 30% de los datos es menor que 55 y el 70%
mayor o igual a 55.
Para percentil 75
75
k = [100]n = [100] 12 = 9
Como k es entero se establece que el percentil 75 es el promedio de los valores de los datos
68 +69
noveno y dcimo; es por lo tanto. [ ] = 68.5 Esto significa que el 75% de los datos, a lo
2
sumo es menor que 68.5 y a lo sumo el 25% mayor o igual que 68.5.
Donde:
1 = Lmite inferior de la clase que contiene a
n= Tamao de la muestra o poblacin.
= Tamao del intervalo de clase
1 = Frecuencia acumulada de la clase anterior a la clase que contiene a
f = frecuencia simple de la clase que contiene a
Ejemplo
30 40 1 1
40 50 3 4
50 60 11 15
60 70 21 36
70 80 43 79
80 90 32 111
90 - 100 9 120
Solucin
28
Mtodos Estadsticos 2014
La edad minina del 25% de las personas de ms edad es el percentil 75, en ese sentido
tenemos que encontrar las frecuencias acumuladas
75 120
1.- Se calcula 100 = 100
= 90
2.- La clase que contiene al 75 es 70 80
3.- Utilizando la frmula
1
100
= 1 + [ ]
9079
75 = 80 + 10 [ 32
]= 83.44
CUARTILES
Los cuartiles son solo percentiles especficos; por lo tanto, los pasos para calcular los
percentiles se pueden aplicar en forma directa para calcular los cuartiles. Esto es:
1 = Primer cuartil o percentil 25
2 = Segundo cuartil o percentil 50
3 = Tercer cuartil o percentil 75
Ejemplo
Los siguientes datos representan los sueldos mensuales para una muestra de 12 Ingenieros
Agrnomos.
2850 2950 3050 2880 2755 2710 2890 3130 2940 3325 2920 2880
Determine el 1 3
Solucin
Cuartil uno,
2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325
29
Mtodos Estadsticos 2014
Como K es entero se establece que el percentil 25 es el promedio de los valores de los datos
2850 +2880
tercero y cuarto; es por lo tanto [ 2
] = 2865. Esto significa que el 25% de los
Ingenieros Agrnomos tienen un salario mensual superior a 2865.
Cuartil tres, :
75
k = [ ]n = [ ] 12 = 9
100 100
Como K es entero se establece que el percentil 75 es el promedio de los valores de los datos
2950 +3050
noveno y dcimo; es por lo tanto, [ ] = 3000. Esto significa que el 75% de los
2
Ingenieros Agrnomos tienen un salario menor a 3000 y el otro 25% un salario mensual
superior a 30000
1 2 3
2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325
3
1
= + [ 4 ]
Donde:
1 =Limitre inferior de la clase que contiene al cuartil i
= Nmero de datos
1 = Frecuencia acumulada de la clase anterior de la clase que contiene al cuartil i
f = frecuencia de clase simple de la clase que contiene al cuartil
= tamao del intervalo de clase
Ejemplo
Una empresa decide evaluar a sus empleados. La clasificacin se lleva a cabo mediante la
aplicacin de un test que arroja los siguientes puntajes
0 - 20 94
20 - 40 140
40 - 60 160
60 - 80 98
80 - 100 8
30
Mtodos Estadsticos 2014
Determine:
1
= + [4 ]
Esto quiere decir que el 75% de los trabajadores tienen una calificacin mayor a 24.43
b.- La puntuacin que supera a las puntuaciones del 75% de los trabajadores, corresponde al
valor del tercer cuartil.
3 3 500
El lugar del tercer cuartil es la posicin = = 375. Es decir, que el cuartil est
4 4
ubicado en la clase 40 - 60. Por lo tanto
3
1
3 = 1
+ [ 4
] = 40+ 20 [375160
234
] = 57.625
Esto quiere decir que el 25% de los trabajadores tiene una puntuacin mayor a 57.625
Existen varias razones por la cual se debe estudiar la dispersin en un conjunto de datos
1.- Al aplicar una medida de dispersin es posible evaluar la confiabilidad del promedio que se
est utilizando. Una dispersin pequea indica que los datos se encuentran acumulados
cercanamente, por ejemplo, alrededor de la media aritmtica. Por tanto, la media se
considera bastante representativa de los datos. Esto es: la media es un promedio confiable.
31
Mtodos Estadsticos 2014
Por el contrario, una dispersin grande indica que la media no es muy confiable, es decir no
es muy representativa de los datos.
2.- Una medida de dispersin permite apreciar cun dispersas estn dos o ms distribuciones.
Por ejemplo veamos la siguiente figura
AMPLITUD TOTAL.- se trata de la diferencia entre los valores mayor (o ms alto) y menor (o
ms bajo) de un conjunto de datos
| |
D.M.
Donde:
32
Mtodos Estadsticos 2014
La desviacin media tiene dos ventajas. Utiliza en su clculo el valor de cada uno de los
elementos de un conjunto de datos, y es fcil de comprender; y es el promedio en que los
valores se desvan con respecto de la media.
Ejemplo
Los pesos de una muestra de cajas listas para embarcarse a Italia son (en kilogramos): 103,97,
101, 106 y 103
= 103+97+101+106+103
= = = 102 Kg
5
|103102|+|97102|+|101102|+|106102|+|103102|
D.M. =
5
D.M. 2,4 Kg
Interpretacin.- En promedio, los pesos de las cajas se desvan 2,4 Kg respecto de la media
aritmtica que es 102
( )2
Variancia de poblacin: 2 =
2
( )
( )2 2
Variancia de la muestra: 2 = =
1 1
PROPIEDADES DE LA VARIANZA
2.- La varianza de una constante es cero. Esto significa que si x1 = x2 =..= xn= b entonces:
V(b) = 0
33
Mtodos Estadsticos 2014
4.- Si a cada valor de un conjunto x1,x2,xn, se multiplica por una constante a, la varianza
del nuevo conjunto de valores y1,y2,yn, donde yi = axi, i= 1,2,,n es igual a la
varianza del conjunto original multiplicada por el cuadrado de la constante. Es decir:
V(y) = a2 V(x)
VARIANZA CALCULADA A PARTIR DE SUB MUESTRAS
DESVIACION ESTANDAR
DESVIACIN ESTANDAR
CV = 100
MEDIA ARITMETICA
Poblacin Muestra
CV = [ 100] CV = [ 100]
34
Mtodos Estadsticos 2014
3.- Se afecta su valor cuando se suma una constante K a cada observacin de un conjunto
de datos.
4.- No cambia de valor cuando se multiplica por una constante K a cada una de las
observaciones.
Calificacin de una distribucin de datos, segn el grado de dispersin:
95,44%
68,26%
99.74%
35
Mtodos Estadsticos 2014
MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRIA.
Las medidas de asimetra tienen como facilidad elaborar un indicador que permita establecer
el grado de simetra o asimetra, que presenta una distribucin, sin necesidad de llevar a cabo
su representacin grfica.
Tambin existen otras frmulas alternativas para el clculo del coeficiente de asimetra.
3( )
=
El sesgo positivo surge cuando la media aumenta debido a algunos valores grandes y poco
usuales: el sesgo negativo ocurre cuando la media se reduce debido a algunos valores muy
pequeos. Los datos son simtricos cuando en realidad no hay valores extremos en ninguna
direccin, de tal manera que los valores grandes y pequeos se equilibran.
Simetra Relacin
Simtrica o insesgada Media = Mediana = Moda
Sesgo positivo o a la derecha Media > Mediana > Moda
Sesgo negativo o a la izquierda Media < Mediana < Moda
Analiza el grado de concentracin que presentan los valores alrededor de la zona central de la
distribucin, es decir, estudia la distribucin de frecuencias en la zona central. La mayor o
menor concentracin de frecuencias alrededor de la media y en la zona central de la
distribucin, dar lugar a una distribucin ms o menos apuntada.
Si el valor de la curtosis es positivo, se dice que los datos tienen una distribucin leptocrtica
(es ms apuntada o puntiaguda que la distribucin normal); en caso contrario, si la curtosis es
negativa, se dice que los datos tienen una distribucin platicrtica (es menos apuntada o
36
Mtodos Estadsticos 2014
puntiaguda que la distribucin normal). Si la curtosis es cero, entonces los datos se distribuyen
siguiendo una distribucin normal, y se dice que en este caso la distribucin mesocrtica.
Donde
3 = Cuartil tres 90 =
( )2 ( )4
2 4 16
4 0 0
8 16 256
2 4 16
16 24 288
Media = 4
Varianza 2 = 8
37
Mtodos Estadsticos 2014
Ejemplo
Una muestra de digitadoras de texto revel que su rapidez media de tecleo es de 87 palabras
por minuto, con una media de 73. La desviacin estndar es de 16.9 palabras por minuto.
Cul es el coeficiente de asimetra? Interprete su respuesta.
Solucin
3() 3(8773)
Reemplazando =
= 16.9
= 2.49
PROBABILIDAD
38
Mtodos Estadsticos 2014
Ejemplos
ENFOQUES DE LA PROBABILIDAD:
Se analizarn dos enfoques de la teora probabilstica que son dos puntos de vista: objetivo y
subjetivo.
PROBABILIDAD CLASICA:
Probabilidad de un evento
Ejemplo:
Probabilidad de que suceda un evento
PROBABILIDAD SUBJETIVA
Ejemplo.-
1.- Estimar la probabilidad de que el equipo del JUAN AURICH, salga campen en el
campeonato de futbol profesional.
2.- Estimar la posibilidad de que usted tenga una calificacin de 20 en este curso.
REGLA DE LA ADICION
Si dos eventos A y B son mutuamente excluyentes, la regla indica que la probabilidad de que
ocurra uno u otro de los eventos es igual a la suma de probabilidades.
Ejemplo
En el experimento de tirar un dado, el evento "un nmero par" y el evento "un nmero impar"
son mutuamente excluyentes. Si se observ un nmero par, no podra caer un nmero impar
al mismo tiempo.
Ejemplo
Clasificacin de empleados
Supervisores 120
Mantenimiento 50
Produccin 1460
Gerencia 302
Secretaria 68
Total 2000
REGLA DE LA MULTIPLICACION
P (A y B) = P(A). P (B)
41
Mtodos Estadsticos 2014
P (A\B) = P (A)
P (B \ A) = P (B)
Ejemplo
Una moneda es lanzada dos veces al aire, cul es la probabilidad de que las dos veces se
obtenga cara?
Ejemplo
Una mquina automtica introduce legumbres en una bolsa de plstico. La experiencia indica
que algunos paquetes tuvieron menos peso, y algunos otros pesos de ms, pero la mayora
fueron satisfactorias. Veamos el siguiente cuadro:
P (F) = 0.025
P (F y F y F) = 0.000015625
b) Descubrir que a los tres paquetes les falte peso es poco probable.
Observacin
Si dos eventos no son independientes, se dice que son dependientes. Con un ejemplo
ilustraremos esta idea:
Supongamos que hay 10 rollos de pelcula fotogrfica en una caja y se sabe que tres estn
defectuosos. Se selecciona uno:
42
Mtodos Estadsticos 2014
3
P (D) = 10 Probabilidad de que sea defectuoso.
7
P (D') = Probabilidad de que no sea defectuoso.
10
Despus se elige un segundo rollo de la caja, sin devolver el primero, la probabilidad de que
este sea defectuoso depender si el primero lo fue, de ser as es:
2
P (2) = 9 Probabilidad de que el segundo rollo extrado sea defectuoso dado que el
primero lo fue.
7
P (2) = Probabilidad de que el segundo rollo extrado no sea defectuoso dado que el
9
primero fue bueno.
Este tipo de anlisis nos ayuda a definir la probabilidad condicional.
PROBABILIDAD CONDICIONAL
( )
P (B \ A) =
( )
( )
P (B \ A) =
( )
P (B \ A) = Probabilidad de que ocurra B dado que ya ocurri A.
Solucin
P (1 2 1 2 ) = (1 ) (2 / 1 ) (1 / 1 2 ) P (2 / 1 2 1 ) P ( /
1 2 1 2)
13 12 13 12 13
P (1 2 1 2 ) = 52
51
50
49
48
= 0.001014
43
Mtodos Estadsticos 2014
Pero esta es solo una parte, el total de posibilidades ser una permutacin de ellas, pero es
una permutacin con repeticin ya que las espadas se repiten dos veces y los corazones
tambin dos veces, entonces:
13 12 13 12 13 5 !
P (1 2 1 2 ) = ( ) = 0.0304
52 51 50 49 48 2 ! 2 !
TABLAS DE CONTINGENCIA
Una tabla de contingencia es una distribucin, una matriz, en cuyas filas y columnas los
individuos de una poblacin se clasifican en funcin de dos variables. Tambin se le conoce
con el nombre de tabla de doble entrada.
Por ejemplo, la siguiente es una tabla de contingencia en la que 300 personas se han
clasificado segn el sexo y por su adiccin al tabaco.
Las tablas de contingencia nos ayudan a calcular los valores de probabilidad. Una tabla de
probabilidad puede crearse dividiendo cada valor de las casillas por el total, que en el ejemplo
anterior sera 300.
Los valores en los mrgenes de la tabla se llaman probabilidades marginales. Por ejemplo,
elegida una persona al azar la probabilidad de que esta sea hombre es P (H) = 0.6 y la
probabilidad de seleccionar una mujer es P (M) = O.4
44
Mtodos Estadsticos 2014
( ) 0.1667
P (M \ F) = = = 0.2942
() 0.5667
Por lo tanto, hay una probabilidad del 29.42% de que sea mujer dado que es fumador la
persona elegida.
Es una representacin grfica til para organizar clculos que abarcan varios datos. Cada
segmento en el rbol es una etapa del problema.
Ejemplo
Un club nocturno tiene los siguientes datos sobre la edad y el estado civil de 140 clientes.
Estado Civil
Edad civil
Soltero Casado Total
Menor de 30 77 14 91
Mayor o igual a 30 28 21 49
Total 105 35 140
45
Mtodos Estadsticos 2014
Probabilidad Probabilidad
condicionada conjunta
P(S/A)
77
a.-P (A y S) = 140 = 0.55 Probabilidad de que un cliente sea menor de 30 y soltero
77
b.- P (S \ A) = 91 = 0.85 Probabilidad de que un cliente sea soltero dado que es menor de 30
aos.
Tambin se puede asociar a cada diagrama de rbol una tabla de contingencia Y viceversa.
Para el ejemplo se tiene
Estado Civil
Edad civilIVIL
Soltero Casado Totales
A P (A y S) P (A y C) P (A)
B P (B y S) P (B y C) P (B)
Totales P(S) P(C) 1
Los datos obtenidos en el diagrama de rbol los reemplazamos en la tabla, esto es:
Estado civil
Edad civil
Soltero Casado Totales
A 0.55 0.1 0.65
B 0.2 0.15 0.35
Totales 0.75 0.25 1
TEOREMA DE BAYES
46
Mtodos Estadsticos 2014
PROBABILIDAD A PRIORI
PROBABILIDAD A POSTERIORI
TEOREMA DE BAYES
(1 )( )
1
P(A\B) =
(1 ) ( )+ (2 )( )+ .+( )( )
1 2
Observacin
Ejemplo
La Dra. Blanquita ha estado enseando Estadstica Bsica durante muchos aos. Se sabe que
el 80% de los estudiantes terminarn los problemas asignados. Determin, que de los
estudiantes que cumplen con su trabajo el 90% aprobar el curso. De aquellos estudiantes que
no lo hacen as, el 60% ser aprobado. Eduardo Lpez tom Estadstica durante el ltimo
semestre con la profesora Blanquita y recibi una calificacin aprobatoria. Cul es la
probabilidad de que s haya hecho sus tareas?
Solucin
Sea:
47
Mtodos Estadsticos 2014
P( ) = 0.1
P(A) =0.8 P(A y ) = ()( )
P(B) =0.6
P( y B ) = ( )( )
P( ) = 0.4
P( y ) = ( )( )
P( y ) = (0.2)(0.4) = 0.08
Por definicin de probabilidad condicional tenemos:
( )
P () =
()
( ) ()
P () =
( )
Tener en cuenta que p (B) no es discernible de inmediato. Aqu es donde participa el teorema
de Bayes. Existen dos razones por las que Eduardo Lpez haya aprobado el curso. Puede haber
hecho los trabajos asignados y aprobar el curso o puede no haber hecho los trabajos asignados
y tambin aprobar el curso, es decir:
P (B) = P (A y B) +P (A y B)
P (B) = P (A). P (B \ A) + P (A'). P (B \ A')
P(A)P()
P () =
() ()+ ( )( )
0.72 0.72
P () = 0.72 +0.12
= 0.84
= 0.86 = 86%
Por lo tanto, hay un 86% de probabilidad de que Eduardo Lpez haya hecho sus tareas dado
que recibi una calificacin aprobatoria.
Ejemplo
48
Mtodos Estadsticos 2014
Ejemplo:
Supngase que se est interesado en el nmero de caras que caen al lanzar tres veces una
moneda. Este es el experimento. Los posibles resultados son cero, uno, dos y tres caras. Cul
es la distribucin de probabilidades para el nmero de caras?
Nmero Probabilidad
De caras del resultado
X P(X)
0 1 = 0,125
8
1 3 = 0,375
8
2 3 = 0,375
8
3 1 0,125
8
TOTAL 8 = 1,000
8
VARIABLE ALEATORIA DISCRETA.- Variable que slo puede tener ciertos valores
claramente separados y que es el resultado de contar algn elemento de inters.
49
Mtodos Estadsticos 2014
Ejemplos:
- El nmero de caras que se presentan en tres lanzamientos de una moneda
- El nmero de estudiantes que sacaron 15 en un examen
- El nmero de empleados ausentes en una fbrica determinada
VARIABLE ALEATORIA CONTINUA.-Es aquella que puede tomar uno de una cantidad
infinitamente grande de valores, dentro de ciertas limitaciones
Ejemplos:
- La duracin de cada cancin en el ltimo lbum de Corazn Serrano
- El peso de cada estudiante de esta clase
- La temperatura ambiente al momento que lee estos apuntes
MEDIA:
La media es un valor representativo que sirve para representar una distribucin probabilstica.
Tambin es el valor promedio a largo plazo de la variable aleatoria. La media se denomina
tambin valor esperado o expectativa. E(X), de la variable.
= () = [()]
2 = [( ) 2 ()]
Ejemplo:
Un vendedor, Juan Prez vende automviles nuevos para una empresa. Generalmente negocia
el mayor nmero de autos los sbados. Ha establecido la siguiente distribucin de
probabilidad para el nmero de autos que espera vender en un sbado en particular.
50
Mtodos Estadsticos 2014
Ejemplo:
!
P(X) =
!( )!
Donde:
n: es el nmero de ensayos
X: es el nmero de xitos observados
p: es la probabilidad de xito en cada ensayo
q: es la probabilidad de fracaso que se obtiene de 1- p
np
2 =
51
Mtodos Estadsticos 2014
Ejemplo:
Es una distribucin de probabilidades usada cuando la probabilidad del xito es muy pequea
y n es muy grande.
Lleva ese nombre en honor a SIMON POISSON, quien la estudi y dio a conocer en 1837. Con
frecuencia se denomina ley de eventos improbables, lo cual significa que la probabilidad p que
suceda un evento especfico es bastante pequea. Esta es una distribucin de probabilidades
discreta.
Otros ejemplos:
- El nmero de palabras mal escritas por pgina en un peridico
- El nmero de llamadas telefnicas por hora que recibe la secretaria de la Facultad
- El nmero de vehculos vendidos por da por la marca Toyota en la ciudad de Lambayeque
- El nmero de goles en un encuentro de ftbol escolar
- Nmero de huevos de un insecto por ovoposicin
- Nmero de nematodos por unidad de volumen
- Nmero de pulgones por planta
P(X) = O bien P(X) =
! !
52
Mtodos Estadsticos 2014
Donde:
np
2 =
Ejemplo:
1.- Se sabe que el nmero medio de errores por factura se estim en 0,3 .Cul es la
probabilidad de no encontrar errores en una factura seleccionada al azar? Cul es la
probabilidad de hallar exactamente un error?
2.- Si el nmero promedio de picaduras de gorgojos por semilla es 0,2 (de cada 100 semillas 20
se encuentran picadas) Cuntas de 100 semillas no tendra picaduras?, Cuntas 1
picadura? Y Cuntas 2 ms?
0,5 0,5
50% 50%
%
53
Mtodos Estadsticos 2014
Z=
Donde:
Z = Nmero de desviaciones estndar que hay desde X a la media de la distribucin
X = es el valor de cualquier observacin especfica
= es la media de la distribucin
= es la desviacin estndar de la distribucin
54
Mtodos Estadsticos 2014
Estos conceptos pueden expresarse de manera algo distinta: el rea bajo la curva normal
dentro de ms y menos una desviacin estndar respecto de la media, es 0,6826. El rea
dentro de ms y menos dos desviaciones estndar respecto de la media, es de 0,9544. El rea
dentro de tres desviaciones estndar respecto de la media vale 0,9974
Ejemplo
Una mquina expendedora de gaseosa se ajusta para servir 7.00 onzas de lquido por vaso. La
desviacin estndar es de 0.10 onzas Cul es la probabilidad de que la mquina sirva:
55
Mtodos Estadsticos 2014
Cuando se quiere determinar el tamao de una muestra se debo tomar en cuenta los
siguientes factores: el tipo de muestreo, el parmetro a estimar el error muestral admisible, la
variancia poblacional.
Parmetro.- es una medida de resumen que describe una caracterstica de toda una poblacin
Estadstico.- es una medida de resumen que se calcula para describir una caracterstica de la
muestra
2 2 22
n 2
() ()2
Donde:
2 2 22 1,962 32
n 2
()2
= 0,52
= 138,30
()
56
Mtodos Estadsticos 2014
2 2
n=
2 ( 1)+ 2 2
Ejemplo
Un gerente de personal de una empresa que tiene 3000 empleados desea estimar el tiempo
promedio que les lleva a sus trabajadores trasladarse entre sus casas y la empresa. Desea
construir un intervalo de confianza de 95% y que la estimacin est dentro de un minuto
alrededor de la media verdadera: a travs de una muestra piloto se sabe que la varianza de los
tiempos es de 30 minutos. Determine el tamao de la muestra que se requiere para la
estimacin.
2 2 2
3000(1,96) (30)
n= = 2 = 111,02
2 ( 1)+ 2 2 1 (3000 1)+(1,96)2 (30)
Si deseamos estimar una proporcin de una poblacin a partir de una muestra, puede
presentarse dos situaciones
a.- Para caso de estimar una proporcin de sujetos que posee una caracterstica a travs de
estudios previos
2
n
()2
Donde:
Cuntos sujetos debe tener una muestra si se desea estimar la proporcin de sujetos que
opinan de una determinada manera al nivel de confianza del 99% y un error de estimacin del
5% sabiendo que p es el 25%
z2 pq 2,962 (25)(75)
n
(pP)2
= = 657,12 = 658
52
b.- Que desconozcamos la proporcin de sujetos.-En este caso se asume p= 0,50 y q= 0,50
EJEMPLO:
57
Mtodos Estadsticos 2014
Qu nmero de sujetos debe tener una muestra si se desea estimar la proporcin de sujetos
que posee una determinada caracterstica al nivel de confianza del 99,7% y error admitido del
2%
z2 pq 2,962 (50)(50)
n = = 5476
(pP)2 22
2
n = (
)2 ( 1) + 2
Donde
N = Es el tamao de la poblacin
= Riesgo o nivel de significancia
Z = Puntuacin correspondiente a
P= Porcentaje estudiado
Q= 100 P
(p P) =e = Error permitido
NZ2 2
n
Z2 2 + e2 (N 1)
.Ejemplo
Se desea calcular el nmero de sujetos necesarios para realizar una investigacin en una
provincia en la que 60 000 alumnos terminaron tercero de secundaria. Se establece un nivel de
confianza del 95% y el margen de error es del 3% Estudios anteriores indican que el 50% de los
alumnos del tercero de secundaria optan por la Universidad
2 4 50 50 60000
n (
)2 ( 1) + 2 9(600001)+4 50 50
n= 1090,93 =1091
DISTRIBUCION MUESTRAL DE LA MEDIA
Distribucin de probabilidad que consta de todas las posibles medias de las muestran de
un determinado tamao demuestra de la poblacin y la probabilidad de ocurrencia
Ejemplo
El asociada
tiempo de con cada media
servicio de los muestral
empleados a nivel de ejecutivo de la empresa Per 21 es:
58
Mtodos Estadsticos 2014
Nombre Aos de
servicio
JUAN 20
DIANA 22
ROSA, 26
EDUARDO 24
HUGO 28
Solucin:
Aos de Media Aos de Media
servicio muestral servicio muestral
(n = 2) (n = 2)
20, 22 21 22, 24 23
20, 26 23 22, 28 25
20, 24 22 26, 24 25
20, 28 24 26, 28 27
22, 26 24 24, 28 26
Media f Probabilidad
21 1 0,10
22 1 0,10
23 2 0,20
24 2 0,20
25 2 0,20
26 1 0,10
27 1 0,10
=4
= [()]
Teorema:
=
= Para una poblacin infinita
59
Mtodos Estadsticos 2014
= X Para una poblacin finita
1
= Media de la distribucin muestral
= Desviacin estndar de la media muestral o error estndar de
la media
= Factor de correccin finita
1
con media y desviacin estndar , si las muestras son grandes (n 30). La variable
estandarizada correspondiente ser:
Ejemplo:
Un fabricante declara que la duracin de las bujas que l fabrica sigue una distribucin normal
con media de 36 000 Km y una desviacin estndar de 4 000 Km Para una muestra aleatoria de
diecisis bujas se obtuvo una duracin media de 34 500 Km. Si la afirmacin del fabricante es
correcta, Cul es la probabilidad de obtener una media muestral tan pequea como esta o
menor?
Es una distribucin probabilstica que consta de todos los valores posibles que pueda tomar
de un tamao de muestra dado, junto a su probabilidad de ocurrencia.
60
Mtodos Estadsticos 2014
=
1
Recibe el nombre factor de correccin para una poblacin finita
1
Z= =
Ejemplo
Se ha estimado que el 43% de los Ingenieros Agrnomos consideran que es muy importante
que se imparta el curso de tica en Agronoma para inculcar valores morales a los estudiantes.
Halle la probabilidad de que ms de la mitad de los 80 Ingenieros Agrnomos de una muestra
opinen de este modo.
Toda inferencia que se haga sobre una poblacin tendr necesariamente, que basarse en
estadsticos muestrales, esto es, en funciones de la informacin muestral. La eleccin
apropiada de estos estadsticos depender de cul sea el parmetro de inters de la poblacin.
El verdadero parmetro ser desconocido, y un objetivo ser estimar su valor.
PARMETROS Y ESTADSTICOS
ESTIMACIN PUNTUAL
61
Mtodos Estadsticos 2014
Se dice que:
Ejemplo:
Salario Programa de
anual ($) adiestramiento
Gerencial?
9 094,3 Si
3 263,9 Si
9 643,5 Si
9 984,9 Si
7 621,6 No
5924,0 Si
9 092,3 No
1 404,4 Si
3 957,7 No
5 109,7 No
= = 6 509.63
= 9.09
S 3.01
0.4
62
Mtodos Estadsticos 2014
INSESGO:
Si el valor esperado del estadstico de muestra es igual al parmetro poblacional que se estima,
se dice que este estadstico es un estimador insesgado del parmetro poblacional.
EFICIENCIA.
Suponga que se puede usar una muestra aleatoria simple de n elementos para obtener dos
estimadores puntuales del mismo parmetro poblacional. En este caso, preferiramos usar el
estimador puntual con la menor desviacin estndar, porque tiende a proporcionar estimados
ms cercanos al parmetro poblacional. Se dice que el estimador puntual con la menor
desviacin estndar tiene una mayor eficiencia relativa que el otro.
CONSISTENCIA.
{ - Z + Z } = 1-
63
Mtodos Estadsticos 2014
ERROR MUESTRAL
Para el caso en el que la media de una muestra estima a una media poblacional, el error
muestral es:
E=
Ejemplo.-
1.- Un proceso de envase de bolsas de azcar refinada. El peso del contenido de estas bolsas
tiene una distribucin normal con desviacin estndar de 15 gramos. Los contenidos de una
muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos. Calcule un intervalo
de confianza del 95% para el verdadero peso medio de todas las bolsas de azcar
producidas por el proceso.
{ + } = 1
{94.12
2.- Se desea establecer si la aplicacin de fertilizantes modifica el rendimiento promedio de
una variedad de trigo. Se conoce que la desviacin estndar es = 450Kg. A los fines de
evaluar el efecto de la fertilizacin, se realiz un ensayo que consisti en elegir 20
hectreas (una en cada chacra de la regin), en forma aleatoria a las que se les aplic
fertilizante, evaluando luego su rendimiento a cosecha. La produccin obtenida fue =
2650 Kg. Encontrar un intervalo de confianza al 90% para el verdadero rendimiento
promedio.
64
Mtodos Estadsticos 2014
{ z +z } = 1
Ejemplo.-
Se extrajo una muestra aleatoria de 172 estudiantes de Agronoma y se les pidi que evaluasen
unas determinadas condiciones de trabajo en una escala de 1 (no importante) a 5
(extremadamente importante). La seguridad de trabajo recibi una calificacin media de
4.38 con una desviacin estndar muestral de 0.70. Calcule un intervalo de confianza del 99%
para la media poblacional
{ z +z } = 1
{4.2427 } = 0,99
Una estimacin puntual para una proporcin poblacional se obtiene dividiendo el nmero de
xitos de una muestra entre el nmero total muestreado.
Mientras que para encontrar los intervalos de confianza debemos tener en cuenta lo
siguiente:
{ z + } = 1
Como p no se conoce
(1 )
=
65
Mtodos Estadsticos 2014
Donde:
Valor asignado por el nivel de confianza
= = es la proporcin muestral
n = es el tamao de la muestra
Ejemplo.-
{ + } = 1-
0.0165
{ 1.645(0.0165) }=1
{0.5229 }=1
Ejemplo.-
Se realiz una investigacin de mercado para estimar la proporcin de amas de casa que
puedan reconocer la marca de un limpiador con base en la forma y el color del recipiente. De
1400 personas 420 pudieron reconocer (identificar) la marca del producto. Si se utiliza el grado
de confianza del 99% Cul sern los intervalos de confianza
{ + } =1 -
0,30
66
Mtodos Estadsticos 2014
0.0122
Cuando la poblacin bajo estudio tiene una distribucin normal, o aproximadamente normal,
pero no se conoce la desviacin estndar de la poblacin, y el tamao de la muestra es menor
de 30, no podemos usar la distribucin normal para determinar intervalos de confianza para la
media de la poblacin. En este caso usaremos la distribucin t se Student.
Recordemos que la distribucin de t de Student se utiliza cuando se cumple con las siguientes
condiciones.
t=
67
Mtodos Estadsticos 2014
El intervalo de confianza para la media poblacional usando la distribucin t, est dado por:
{ S + S }=1
{ + }=1
Ejemplo.-
Una tienda est interesada en conocer los gastos en prendas de vestir de los estudiantes
universitarios en el primer mes del ciclo acadmico. La media y la desviacin estndar de una
muestra aleatoria de nueve alumnos fueron de $ 15 782 y $ 3889, respectivamente.
Suponiendo que la poblacin sigue una distribucin normal, calcule el intervalo de confianza
del 95% para el gasto medio poblacional
{ S + S }=1
{ + }=1
{12792.65554 }=1
Cuando una variable aleatoria sigue una distribucin de Chi cuadrado con (n-1). Este resultado
es clave para construir un intervalo de confianza para la varianza poblacional cuando se toman
muestras de una poblacin
68
Mtodos Estadsticos 2014
entonces el intervalo de confianza del 100(1- para la varianza poblacional viene dado por
( 1) 2 2
( 1) 2
2
2 ( 1) 2 ( 1) 1 2
Ejemplo
a.- n 15 g.l. 14
0.05
( 1) 2 2
( 1) 2
2 ( 1) 2 2 ( 1) 1 2
2.99 13.85
Por lo tanto, diremos que el intervalo de confianza del 95% para la variabilidad de impurezas
discurre entre 2.99% y 13.85%
b.- El intervalo de confianza del 99% para la varianza poblacional ser ms ancho
69
Mtodos Estadsticos 2014
Las producciones promedio en una planta qumica que usa materias primas suministradas por
dos proveedores diferentes.
(x1 x2 ) (1 2 )
Z=
2 2
1+ 2
1 2
( ) ( )
Z=
+
{ ( ) z + ( ) + z + } =1-
{ ( ) z + ( )+ z + } =1-
Ejemplo:
Las resistencia al desgaste de dos tipos de llantas para automvil se compararon en muestras
de pruebas de camino de 1 = 2 = 100 llantas para cada tipo. El nmero de millas hasta el
completo desgaste se defini como una cantidad especfica de desgaste de las llantas. Los
resultados de la prueba se muestran a continuacin
LLANTA 1 LLANTA 2
1 = 26400 2 = 25100
12 = 144000 22 = 1960000
70
Mtodos Estadsticos 2014
Solucin:
La estimacin puntual de (1 2 )
(x1 x2 ) = 26 400 25100 = 1300 millas
12 22
El error estndar = +
1 2
12 12
Que se puede estimar como = +
1 2
2 22 2 22
{ (x1 x2 ) z 1 + 2
(x1 x2 ) + z 1 + 2
} =1-{
1 1
2
( 1 2) = (1 2
)
1
La media muestral de ( 1 - 2) es p1 p2
1 1 2 2
El error estndar es= +
1 2
71
Mtodos Estadsticos 2014
1 1 2 2
Que se estima como = +
1 2
La estimacin ser:
{(1 2 ) Z 1 1 + 2 2 < p1 p2 < (1 2 ) + Z 1 1 + 2 2} = 1
1 2 1 2
:
Ejemplo:
La propuesta de un bono para la construccin de una escuela ser enviada a los votantes en la
siguiente eleccin municipal. Una parte importante del dinero derivado de esta emisin de
bonos se emplear en construir escuelas en una zona de rpido desarrollo de la ciudad y lo
dems se usar para renovar y actualizar los edificios escolares del resto de sta. Para evaluar
la viabilidad de la propuesta de un bono, a una muestra aleatoria de 1 = 50 residentes de la
zona de rpido desarrollo y 2 = 100 de las otras partes de la ciudad, se les pregunt si
piensan votar por la propuesta. Los resultados se dan a continuacin:
Estime la diferencia en las proporciones verdaderas a favor de la propuesta del bono con un
99% de intervalo de confianza.
2 2 (0.76)(0,24) (0,65)(0,35)
1 1
1
+ 2
= 50
+ 100
= 0,0770
11 22
{( 2 ) Z 1 1
1
1
+ 2 2
2
< 1 2 < (
1
2 ) + Z
1
+
2
}= 1
72