Sei sulla pagina 1di 72

Mtodos Estadsticos 2014

INTRODUCCION

Hace ms de 100 aos H. G. Wells, escritor e historiador ingls, dijo que el conocimiento
estadstico ser algn da tan necesario para ser un buen y eficiente ciudadano, como la
aptitud de poder leer y escribir.

En la actualidad, probablemente dira: las nociones estadsticas son necesarias no nicamente


para ser un buen y eficiente ciudadano, sino tambin para una toma acertada de decisiones en
diversos aspectos de nuestra vida

Una de las herramientas utilizadas para tomar decisiones es la estadstica. La estadstica no


solo se sirve a la gente dedicada a los negocios; en nuestra vida cotidiana tambin aplicamos
conceptos estadsticos. Por ejemplo, para comenzar el da, usted al baarse abre la regadera y
deja correr el agua unos segundos. Enseguida moja su mano para percatarse si la temperatura
es adecuada o decidir si abre ms la llave de agua caliente o la del agua fra. Ahora suponga
que est en un supermercado y quiere comprar embutidos. Dos marcas tienen un puesto de
promocin y cada uno le ofrece una pequea proporcin. Despus de probar, decide cual
comprar. En ambos ejemplos, usted toma la decisin y elige lo que har a partir de una
muestra.

HISTORIA DE LA ESTADSTICA

La recopilacin sistemtica de datos econmicos y de poblacin se inici en Venecia y


Florencia, las ciudades-Estado italianas, durante el Renacimiento. El trmino ESTADISTICA,
derivado de la palabra Estado, se utiliz entonces para referirse a la obtencin de datos de
inters estatal. Esta idea de recopilacin de datos se extendi desde Italia a otros pases de
Europa occidental. De hecho, durante la primera mitad del siglo XVI, era habitual que los
gobiernos europeos obligaran a las parroquias a que registraran los nacimientos, los
matrimonios y las defunciones. Debido a las muy escasas condiciones de salud pblica, las
estadsticas referidas a estos hechos tenan un especial inters.

El trmino Estadstica que se utiliz hasta el siglo XVII como una abreviatura de la ciencia
descriptiva de los Estados, se identific cada vez ms, en el siglo XIX, con las cifras
cuantitativas. Hacia 1830, en Francia e Inglaterra, el trmino ya fue usado de forma general
como sinnimo de la ciencia numrica de la sociedad. Este cambio de significado se debi a
que, desde 1800, los gobiernos de Europa Occidental y de Estados Unidos comenzaron a
recopilar y publicar sistemticamente una gran cantidad de registros de censos y de otros tipos
de tablas.

Aunque a lo largo del siglo XIX la teora de la probabilidad haba sido desarrollada por
matemticos tales como Jacob Bernoulli, Karl Friedich Gauss y Pierre Simon Laplace, su
aplicacin al estudio de hechos estadsticos fue casi inexistente, ya que la mayor parte de los
estadsticos sociales de la poca se contentaban con dejar que los datos hablaran por s
mismos. En particular, en esa poca los estadsticos no estaban interesados en sacar
inferencias a partir de individuos, ms bien se centraban en la sociedad en su totalidad. Por
consiguiente, no estaban preocupados por el muestreo sino que intentaban obtener censos de

1
Mtodos Estadsticos 2014

la poblacin al completo. Como resultado, la inferencia probabilstica sobre la poblacin a


partir de muestras era prcticamente desconocida en las estadsticas sociales del siglo XIX

No fue hasta finales de este siglo cuando los estadsticos empezaron a preocuparse por inferir
conclusiones a partir de los datos numricos. El movimiento comenz con los trabajos de
Francis Galton sobre el anlisis de la influencia de la herencia a travs de la utilizacin de
tcnicas que actualmente se conocen como anlisis de regresin y correlacin, que alcanzaron
su mayor auge con los trabajos de Karl Pearson. ste, que desarroll los contrastes de bondad
de ajuste, fue el primer director del laboratorio Galton, fundado por Galton en 1904. All,
Pearson lider un programa de investigacin con el objetivo de desarrollar nuevos mtodos en
los que la Estadstica se utiliza con fines inferenciales. Su laboratorio potenci que
investigadores provenientes de distintas reas de la ciencia y la industria aprendieran los
mtodos estadsticos que podan tener aplicacin en sus campos. Uno de los primeros
estudiantes que acudi a su laboratorio fue W. S. Gosset qumico de formacin, que demostr
su devocin por Pearson y public sus propios trabajos bajo el seudnimo de Student. Existe
una famosa leyenda que mantiene que Gosset tema publicar sus trabajos, bajo su propio
nombre por miedo a que, en la fbrica de cerveza Guinnes, donde laboraba, sus jefes
descubrieran que uno de sus qumicos realizaba investigaciones estadsticas. Gosset es famoso
por el desarrollo de los contrastes de t.

Dos de las reas ms importantes de aplicacin de la Estadstica a principios del siglo XX fueron
la biologa y la agricultura; todo ello gracias al inters de Pearson y de otros investigadores de
su laboratorio, y tambin a los logros del cientfico ingls Ronald A. Fisher. La teora de la
inferencia desarrollada por estos investigadores pioneros y otros entre los que se encuentran
Egon Pearson, hijo de Karl Pearson, y el estadstico matemtico polaco Jersy Neyman- fue lo
suficiente general como para tratar una amplia gama de problemas cuantitativos prcticos.
Como resultado, tras los primeros aos del siglo XX, aument muy rpidamente el nmero de
personas, procedente de la ciencia, los negocios y la administracin, que empezaron a
considerar la Estadstica como una herramienta capaz de suministrar soluciones cuantitativas a
una gran variedad de problemas cientficos y prcticos.

En la actualidad, podemos encontrar las ideas estadsticas en muchos mbitos. La Estadstica


Descriptiva puede verse en peridicos y revistas. La Inferencia Estadstica se ha hecho
indispensable en las investigaciones mdicas y de salud pblica, en la investigacin de
mercados y en el control de calidad, en la educacin, la contabilidad, la economa, en la
prediccin meteorolgica o de las votaciones, y en muestreos, deportes, seguros, en juego de
apuestas y en cualquier tipo de investigacin que pretenda ser cientfica. Hoy en da, la
Estadstica se ha convertido realmente en una pieza integrante de nuestra herencia.

LA CAMBIANTE DEFINICION DE LA ESTADSTICA

La Estadstica tiene el objeto de realizar una representacin fiable de un Estado en una poca
determinada (Quetelet, 1849)

La Estadstica es la nica herramienta mediante la cual se puede conseguir una apertura en la


formidable espesura de dificultades que entorpece el camino de aquellos que estudian la
Ciencia del hombre (Galton, 1889)

2
Mtodos Estadsticos 2014

La Estadstica puede considerarse (i) como el estudio de las poblaciones, (ii) como el estudio de
las variaciones y (iii) como el estudio de los mtodos de reduccin de datos (Fisher, 1925).

La Estadstica es la disciplina cientfica relativa a la recopilacin, el anlisis y la interpretacin


de datos obtenidos mediante la observacin o la experimentacin. Tiene una estructura
coherente basada en la Teora de la Probabilidad e incluye muchos procedimientos diferentes
que contribuyen a la investigacin y el desarrollo en todas las ramas de la Ciencia y la
Tecnologa. (E. Pearson, 1936)

La Estadstica es el nombre de la ciencia que trata de llevar a cabo inferencias bajo situaciones
de incertidumbre; para ello, usa los nmeros para averiguar cuestiones relativas a la
naturaleza y la experiencia. (Weaver, 1952).

La Estadstica se caracteriza en el siglo XX como una herramienta matemtica para analizar


datos experimentales u observados. (Ross, 2005).

Estadstica es la ciencia que nos ayuda a recolectar, organizar, presentar, analizar e interpretar
datos para una toma de decisin ms efectiva. (Alvaro Pintado-Agurto Meja, 2009).

CUAL ES LA DEFINICION DE ESTADISTICA?

Nos topamos con ella en el lenguaje cotidiano. En realidad posee dos significados: En su
acepcin ms comn, la estadstica se refiere a informacin numrica. Algunos ejemplos son:
el sueldo inicial de los graduados de Universidad, el nmero de muertos provocados por el
alcoholismo el ao pasado, el nmero de goles en un partido de futbol etc. En estos ejemplos
las estadsticas se refieren a un valor o porcentaje.

Todos estos ejemplos constituyen ejemplos de estadsticas. Una coleccin de informacin


numrica recibe el nombre de estadsticas.

A un dato numrico o valor aislado se la denomina dato estadstico

ESTADISTICA.- ciencia que recoge, organiza, presenta, analiza e interpreta datos


numricos con el fin de propiciar la toma de decisiones ms eficaz

DIVISION DE LA ESTADISTICA

El estudio de la estadstica se divide en dos categoras: la estadstica descriptiva y la estadstica


inferencial.

ESTADISTICA DESCRIPTIVA.- Mtodo para organizar, resumir y presentar datos de


manera informativa. Aqu la estadstica describe el desempeo de los datos pero no hace
ninguna generalizacin

ESTADISTICA INFERENCIAL.- Mtodos empleados para determinar una propiedad de una


poblacin con base en la informacin de una muestra

3
Mtodos Estadsticos 2014

POBLACION.- Coleccin de todos los elementos que se estn estudiando y sobre los cuales
intentamos llegar a conclusiones

MUESTRA.-Coleccin de algunos elementos pero no de todos, de la poblacin bajo estudio,


utilizada para describir poblaciones

TIPOS DE VARIABLE

A.- Segn la naturaleza hay dos tipos de variable

VARIABLE CUALITATIVA O ATRIBUTO es cuando la caracterstica que se estudia es de


naturaleza no numrica (cualidad, caracterstica o atributo) y sus datos se expresan usando
palabras.

Variable cualitativa nominal, es aquellas que estable la distincin de los elementos en


categoras sin implicar el orden entre ellas Ejemplo: Gnero, filiacin religiosa, tipo de
automvil que se posee, color de ojos.

Variable cualitativa ordinal, es aquella que agrupa a los objetos, individuos, en categoras
ordenadas, para establecer relaciones comparativas Ejemplo Nivel de instruccin, nivel de
pobreza

VARIABLE CUANTITATIVA, es cuando la variable que se estudia aparece en forma numrica.


Puede ser discreta y contina.

Variable discreta, es aquella que adopta solo ciertos valores y existe vaco entre ellos,
ejemplo: Nmero de camas en una casa, nmero de estudiante en cada aula. Las variables
discretas son el resultado de un preso de conteo.

Variable contina, es aquella que toma cualquier valor dentro de un intervalo especfico.
Ejemplo, presin de aire de una llanta, duracin de un vuelo entre Lima y Chiclayo. Las
variables continuas son el resultado de mediciones.

Tipos de variable

Cualitativas Cuantitativas

-Marca de PC Discreta Continua


-Estado civil
-Color de cabello
-Hijos en una familia -Peso de un alumno
-Alumnos por aula - Estatura de un alumno

4
Mtodos Estadsticos 2014

B.- Segn su relacin

Variables independientes (VI) son las variables explicativas o predictivas, cuya asociacin,
relacin o influencia en la variable dependiente se pretende descubrir en una investigacin.
Las variables independientes son las que traducen o explican las causas o razones de las
variaciones de la variable dependiente

Variables dependientes (VD) Son aquellas que se explican por otra variable, son los efectos
o resultados respecto a los cuales hay que buscar un motivo, causa o razn de ser. Es la
variable que traduce la consecuencia del efecto de una o varias razones o causas, de otras
variables

Variables intervinientes o interferentes, son aquellas que coparticipan con la variable


independiente condicionando el comportamiento dela variable dependiente

Ejemplo:

La escasa difusin de la importancia la educacin alimentaria en la poblacin, es una de las


causa del incremento de la desnutricin infantil, en las familias con bajos nivel de instruccin.

Educacin alimentaria (VI)


Desnutricin infantil (VD)
Nivel de instruccin (V interviniente)

NIVELES DE MEDICIN DE LOS DATOS

Los datos se clasifican por niveles de medicin. El nivel de medicin de los datos rige los
clculos que se llevan a cabo con el fin de resumir y presentar los datos. Tambin determina
las pruebas estadsticas que se deben realizar.

Por ejemplo, si se compra una caja de lentejas de dulce, encontramos que hay seis colores.
Suponga que se le asigna 1 al caf, 2 al amarillo, 3 al azul, 4 al naranja, 5 al verde y 6 al rojo.
Sume la cantidad de lentejas que hay en la caja, la divide entre el nmero de lenteja e informa
que el color promedio es 3.56. Significa que el color promedio es azul o anaranjado? Desde
luego que no.

Otro ejemplo, en la pista atltica hay ocho competidores para una carrera de 400 metros. Para
indicar el orden en que llegan a la meta se dice que la media es de 4.5 Qu revela este
promedio? Nada. En ambos casos, no se emple adecuadamente en nivel de medicin. Existen
cuatro niveles de medicin: nominal, ordinal de intervalo y de razn

La medicin ms baja o primaria corresponde al nivel ordinal. La ms alta o el nivel que


proporciona la mayor informacin relacionada con la observacin es la medicin de razn.

DATOS DE NIVEL NOMINAL

En el caso del nivel nominal de medicin, las observaciones acerca de una variable cualitativa
solo se clasifican y se cuentan. No existe una forma particular para ordenar las etiquetas
(categoras). La clasificacin de las de lentejas de dulce, simplemente se clasifican por color. No

5
Mtodos Estadsticos 2014

existe un orden natural. Es decir, no se presentan primero las lunetas color caf, las
anaranjadas o las de cualquier color. El gnero representa otro ejemplo del nivel de medicin
nominal. Si contamos en una aula de clase, cuantos hombre y cuantas mujeres hay. Podramos
presentar primero a los hombres o a las mujeres. Para el nivel nominal, la medicin consiste en
contar.

Los datos del nivel nominal poseen las siguientes caractersticas.

1.- Las categoras de datos se encuentran representadas por etiquetas o nombres.


2.- Aun cuando las etiquetas se codifiquen con nmeros, las categoras de datos no tienen
ningn orden lgico.

DATOS DE NIVEL ORDINAL

El nivel inmediato superior de datos es el nivel ordinal. En la siguiente tabla se presentan las
calificaciones que los alumnos del profesor PERICO PEREZ le otorgaron despus de un curso de
introduccin aeroespacial. Cada estudiante de la clase respondi a la pregunta En trminos
generales. Cmo calificas al profesor del curso? Las calificacin variable ilustra el uso dela
escala ordinal de medicin. Una calificacin es la ms alta o mejor, que la siguiente: Superior es
mejor que bueno, bueno es mejor que promedio, etc. Sin embargo no es posible distinguir la
magnitud de las diferencias entre grupos. La diferencia entre superior y bueno es la misma
que entre malo e inferior? No es posible afirmarlo.

Las propiedades del nivel ordinal de los datos son:

1.- Las calificaciones de los datos se encuentran representadas por conjuntos de etiquetas o
nombres (alto, medio, bajo), las cuales tienen valores relativos.
2.- En consecuencia, los valores relativos de los datos se pueden clasificar u ordenar.

DATOS DE NIVEL DE INTERVALO

El nivel de intervalo de medicin es el nivel de inmediato superior. Incluye todas las


caractersticas del nivel ordinal, pero adems la diferencia entre valores constituye una
magnitud constante.

Un ejemplo de nivel de intervalo de medicin es la temperatura. Suponga las temperaturas


mximas durante tres das consecutivos de verano en la ciudad de Chiclayo son 29, 34 y 26
grados Fahrenheit. Estas temperaturas se clasifican fcilmente aunque, es posible determinar
la diferencia entre ellas gracias a que un grado Fahrenheit representa una unidad de medicin
constante. Diferencias iguales entre dos temperaturas son las mismas, sin importar su posicin
en la escala Es decir, la diferencia entre 20 y 25 grados Fahrenheit es de 5: la diferencia entre
40 y 45 grados tambin es de 5. Es importante destacar que 0 es un punto ms en la escala. No
representa la ausencia de algo. Cero grados Fahrenheit no representa la ausencia de calor, sino
sencillamente el hecho que hace frio. De hecho, 0 grados Fahrenheit equivale
aproximadamente a 18 grados en la escala Celsius.

Las propiedades de los datos de nivel de intervalo son las siguientes:

6
Mtodos Estadsticos 2014

1.- Las clasificaciones de datos se ordenan de acuerdo con el grado que posea la caracterstica
en cuestin
2.- Diferencias iguales en la caracterstica representan diferencias iguales en las mediciones.

DATOS DE NIVEL DE RAZN

Todos los datos cuantitativos son registrados en el nivel de razn de la medicin. El


nivel de razn es el ms alto. Posee todas las caractersticas del nivel de intervalo,
aunque, adems el punto 0 tiene sentido y la razn entre dos nmeros es significativa

Ejemplos de la escala de razn de medicin incluye salarios, unidades de produccin,


peso, cambios en los precios de acciones, distancia entre dos ciudades, altura, etc.
El dinero ilustra bien el caso. Si se tiene cero nuevos soles, entonces no tiene dinero.
La razn entre nmeros tambin resulta significativa. Si Diana gana $18 000 anuales vendiendo
seguros y Ral gana $ 36 000 vendiendo automviles, entonces Ral gana el doble de lo que
gana Diana.
Las propiedades de los datos de nivel de intervalo son las siguientes:

1.- Las clasificaciones de datos se ordenan de acuerdo con la cantidad de caractersticas que
poseen.
2.- Diferencias iguales en la caracterstica representan diferencias iguales en los nmeros
asignados las clasificaciones.
3.- El punto cero representa la ausencia de caractersticas y la razn entre dos nmeros es
significativa.

NIVEL DE MEDICIN

Nominal Ordinal Intervalo Razn

Los datos solo Los datos se Diferencia Punto 0


se clasifican ordenan significativa significativo y
entre valores razn entre valores

-Marca de -Su nmero de -Nmero de


-Temperatura
automvil lista en clase pacientes
-Talla
atendidos

DESCRIPCIN DE DATOS
PARTES DE UNA TABLA O CUADRO ESTADSTICO.
Las partes de un cuadro estadstico son: 1 Nmero del cuadro; 2 Ttulo; 3 Cuadro propiamente
dicho; 4 Las notas explicativas o calce; 5 Fuente

7
Mtodos Estadsticos 2014

1.-NMERO DEL CUADRO.- Es el cdigo de identificacin del cuadro. Este nmero se escribe a
continuacin de la palabra cuadro, por ejemplo cuadro No 2.5, indica el quinto cuadro
del captulo dos.
2.- TTULO.- Es la identificacin que preside la tabla y es colocada en la parte superior de la
misma. El ttulo debe reunir las condiciones siguientes: a.- ser completo; b.- ser conciso.
a.- SER COMPLETO: Un ttulo completo debe indicar claramente cul es el contenido del
cuadro estadstico. Debe responder a las preguntas: Qu, Cmo, Dnde y Cundo
QUE: A qu se refiere la tabla que se estudia. Cul es el universo que se investiga.
Ejemplo: Alumnos matriculados
COMO: Cmo se estudia, de acuerdo a cules caractersticas se clasifican los individuos
u objetos estudiados. Las variables ubicadas en las filas se identifican con la
proposicin segn y las de las columnas con la proposicin por
Ejemplo: Por sexo y segn especialidad
CUANDO: Momento o periodo de tiempo a que se refiere el estudio.
Ejemplo: Ciclo 2014 - I
DONDE: Lugar a que se refiere la informacin.
Ejemplo: Universidad Csar Vallejo
b.- SER CONCISO.- El ttulo debe ser breve, lo ms conciso posible, aunque no debe
sacrificarse la claridad a la concisin.
3.- CUADRO PROPIAMENTE DICHO.- Es la parte del cuadro que contiene la informacin y
consta de un conjunto de casillas o celdas, dispuestas en columnas y filas. Sus elementos
esenciales son: encabezamiento de las columnas, columna principal o matriz y cuerpo.
ENCABEZAMIENTO.- Es la primera fila del cuadro, en l se explica las categoras, y el objeto
de cada una de las columnas, es decir indica la naturaleza de los datos inscritos en cada una
de las celdas que se hallan debajo. Deben ser breves y explcitos.
COLUMNA PRINCIPAL O MATRIZ.- Es aquella en que se anotan las categoras o las
diferentes clases de la escala de clasificacin utilizada.
CUERPO.- Es el conjunto de celdas o casillas, que son las intersecciones de filas y columnas,
donde estn anotados los datos numricos.
4.- NOTAS EXPLICATIVAS O CALCE O NOTA DE PIE O LLAMADAS: Se usa para aclarar algunos
trminos o siglas tambin para indicar que elementos estn o no incluidos en algunos de los
conceptos del cuadro.
5.- FUENTE.- Sirve para nombrar la publicacin, entidad, estudio o fuente de donde se
obtuvieron los datos utilizados para construir el cuadro.
Hay dos tipos de fuentes:
a.- Primaria.- Cuando se obtiene directamente de la unidad de anlisis o cuando se
recurre a los propios formularios de una encuesta.
b.- Secundaria.- Cuando se recurre a documentos, boletines o cuadros

CONSTRUCCIN DE UNA TABLA DE FRECUENCIA

TABLA DE FRECUENCIAS.- llamada tambin distribucin de frecuencias es la


agrupacin
TABLA de datos cualitativos
PARA VARIABLE CUALITATIVA en clases mutuamente excluyentes que muestra el
nmero de observaciones en cada clase.

8
Mtodos Estadsticos 2014

En el caso de datos cualitativos, la tabla de distribucin de frecuencias adoptar la siguiente


forma siguiente

Variable Frecuencia Frecuencia Frecuencia


absoluta relativa relativa
porcentual
Caracterstica A 100 %
Caracterstica B 100 %

Caracterstica Z 100 %
Totales n 1 100%

Tabla No 1 Tabla de frecuencia de los vehculos vendidos por VEHICULOS SAC, el mes pasado.

Tipo de automvil Nmero de


automviles
Domstico 50
De importacin 30

El nmero de observaciones en cada clase se denomina frecuencia de clase. Se simboliza

Frecuencia relativa de clase.- Es posible convertir las frecuencias de clase en frecuencias


relativas de clases para mostrar la fraccin del nmero total de observaciones en cada clase.
As, una frecuencia relativa capta la relacin entre la totalidad de elementos de una clase y el
nmero total de las observaciones. Se simboliza

Tabla No 2 Tabla de frecuencia relativa de vehculos vendidos por VEHICULOS SAC el mes
pasado

Tipo de vehculo Cantidad Frecuencia


Vendida relativa
Domstico 50 0.625 50
80
De importacin 30 0.375 30
80
Total 80 1.000

REPRESENTACIN GRFICA DE DATOS CUALITATIVOS

GRFICA DE BARRAS, aqu las clases se representan en el eje horizontal y la frecuencia


de clase en el eje vertical. Las frecuencias de clase son proporcionales a las alturas de las
barras

Una caracterstica distintiva de la grfica de barras es que existe una distancia o espacio entre
las barras. Es decir que, como la variable de inters es de naturaleza cualitativa, las barras no

9
Mtodos Estadsticos 2014

son adyacentes. Por consiguiente, una grfica de barras es una representacin grfica de una
tabla de frecuencias mediante una serie de rectngulos de anchura uniforme, cuya altura
corresponde a la frecuencia de clase

Grfica No 1 Vehculos vendidos por tipo el mes pasado por VEHICULO SAC.

70.00%
60.00%
50.00%
40.00%
30.00%
20.00%
10.00%
0.00%
Domstico De importacin

GRAFICA DE PASTEL Grfica que muestra la parte o porcentaje que representa cada clase
del total de nmeros de frecuencia
Grfica No 2.-

Domstico
37.50%
62.50%
De
importacin

TABLA DE VARIABLES CUANTITATIVAS

TABLAS DE DATOS DISCRETOS

Ejemplo.- Un experimento consisti en contar el nmero de flores por planta de una muestra
de 32 plantas. Los valores resultantes del conteo fueron los siguientes:

1 10 9 7 17 9 25 4
2 8 10 3 18 7 26 6
3 4 11 6 19 8 27 7
4 6 12 7 20 1 28 5
5 5 13 2 21 9 29 7
6 8 14 8 22 10 30 3
7 10 15 2 23 5 31 5
8 3 16 3 24 6 32 8

10
Mtodos Estadsticos 2014

Clasificacin.- En este caso se identifican los distintos valores que tiene y ubicamos el mayor
y menor valor: = 1 = 10

Los diferentes valores que toma la variable los vamos a denotar por

1 = 1 2 = 2 3 = 4 4 = 2 5 = 4 6 = 4 7 = 5 8 = 5 9 = 2 10 = 3
Tabla No 4. Distribucin del nmero de flores por planta. Junio 2014.

No de Flores Tarjas Frecuencia



1 / 1
2 // 2
3 //// 4
4 // 2
5 //// 4
6 //// 4
7 ///// 5
8 ///// 5
8 // 2
10 /// 3
Total 32

TABLA PARA DATOS CONTINUOS

Designemos tambin el conjunto original de datos u observaciones por 1 , 2,. , siendo n


el tamao del conjunto y donde estos datos son del tipo continuo, para construir una tabla de
frecuencia debemos calcular lo siguiente:

CLASES.- (m, K) se llaman clases a cada uno de los grupos en los que se divide el conjunto de
datos. No hay una regla fija para determinar el nmero de clases.
K = 2,5 4
K = 1 + 3,3 log n
5 20

RANGO. - (R) Diferencia entre la observacin que tiene el valor mximo y la observacin que
tiene el valor minino, tambin se conoce como recorrido amplitud total.

R=

INTERVALO DE CLASE (C).- es el cociente que resulta de dividir la amplitud total o rango
entre el nmero de clases.

C

11
Mtodos Estadsticos 2014

0 1 1 1 1 1 1
1 2 2 2 2 2 2

MARCA DE CLASE ( ).-Es el punto medio de un intervalo o clase

FRECUENCIA ABSOLUTA ( ) Llamada tambin frecuencia absoluta simple, es el nmero


de veces que se repite los valores dentro de las diferentes clases (intervalo) en la que est
dividida la informacin.

FRECUENCIA RELATIVA ( ).- se denomina frecuencia relativa del valor al cociente de


la frecuencia absoluta de y el nmero total de observaciones. Se denota por


= =

FRECUENCIA ABSOLUTA ACUMULADA ( ).- Se llama frecuencia absoluta acumulada


correspondiente al valor al nmero de observaciones menores o iguales a se denota
por "

= 1 + 2 + 3 + +

Entonces tenemos
1

1 = = 1
=1
2

2 = = 1 + 2
=1
3

3 = = 1 + 2 + 3
=1
4

4 = = 1 + 2 + 3 + 4
=1
5

5 = = 1 + 2 + 3 + 4 + 5
=1

12
Mtodos Estadsticos 2014

Y as sucesivamente

FRECUENCIA RELATIVA ACUMULADA ( ) .-se llama frecuencia relativa acumulada


del valor a la frecuencia relativa total de las observaciones menores o iguales a . Se
denota como

f1 +f2 +f3 +.+f


= 1 + 2 + . + =

=
=1

Entonces tenemos:
1

1 = = 1
=1
2

2 = = 1 + 2
=1
3

3 = = 1 + 2 + 3
=1
4

4 = = 1 + 2 + 3 + 4
=1
5

5 = = 1 + 2 + 3 + 4 + 5
=1

As sucesivamente

PROPIEDADES DE LAS FRECUENCIAS


1.- Las frecuencias absolutas y las frecuencias acumuladas absolutas son siempre enteros no
negativos

0 y 0 para i = 1, 2, 3,., m

2.- La suma de todas las frecuencias absolutas es igual al nmero total del conjunto de
observaciones.

= 1 + 2 + =
=1

3.- Las frecuencias relativas y las frecuencias relativas acumuladas son siempre nmero
fraccionados no negativos, no mayores de uno.

0 1 0 para i= 1, 2,., m

13
Mtodos Estadsticos 2014

3.- La frecuencia absoluta acumulada correspondiente al valor coincide con el nmero total
conjunto de observaciones.

= =
=1

4.- La frecuencia relativa acumulativa correspondiente al valor coincide con la unidad


= = 1
=1

5.- Las frecuencias absolutas acumuladas cumplen las siguientes desigualdades

1 = 1 2 . Para i = 1, 2,, m

6.- Las frecuencias relativas acumuladas cumplen las siguientes desigualdades

1 = 1 2 . Para i = 1, 2,, m

Ejemplo

Se toma una muestra de 100 espigas de trigo y en cada una de ellas se registra la longitud en
cm. En este caso la variable X es longitud de espiga. Los resultados se presentan a
continuacin:

10,3 12,8 8,3 6,9 10,2 11,1 11,9 8,7 9,5 6,9 8,6 7,0 6,8 11,4
7,3 8,1 6,4 15,9 12,9 8,6 10,6 9,3 14,1 12,8 13,2 6,9 7,9 10,3
11,6 8,7 7,9 8,6 8,9 6,8 7,9 11,6 10,3 11,8 10,9 11,3 12,3 12,6
9,7 12,8 13,1 6,3 8,4 8,9 10,6 11,3 7,8 14,6 9,5 6,3 8,7 10,5
8,7 8,5 9,3 10,6 11,4 13,7 8,5 9,7 10,1 10,8 14,0 13,6 10,1 6,9
6,9 7,5 15,0 9,3 10,0 10,6 11,3 11,4 9,9 7,8 9,9 6,7 7,8 10,9
10,6 11,8 10,5 10,7 10,6 14,9 13,2 10,9 10,6 11,1 10,6 11,3 9,8 9,6
15,0 11,0

A continuacin ordenamos los datos de menor a mayor

6,3 6,3 6,4 6,7 6,8 6,8 6,9 6,9 6,9 6,9 6,9 7,0 7,3 7,5 7,8
7,8 7,8 7,9 7,9 7,9 8,1 8,3 8,4 8,5 8,5 8,6 8,6 8,6 8,7 8,7
8,7 8,7 8,9 8,9 9,3 9,3 9,3 9,5 9,5 9,6 9,7 9,7 9,8 9,9 9,9
10,1 10,1 10,1 10,2 10,3 10,3 10,3 10,5 10,5 10,6 10,6 10,6 10,6 10,6 10,6
10,6 10,6 10,7 10,8 10,9 10,9 10,9 11,0 11,1 11,1 11,3 11,3 11,3 11,3 11,4
11,4 11,4 11,6 11,6 11,8 11,8 11,9 12,3 12,6 12,8 12,8 12,8 12,9 13,1 13,2
13,2 13,6 13,7 14,0 14,1 14,6 14,9 15,0 15,0 15,9

El rango ser
R = 15,9 6,3= 9,6

El nmero de clases o intervalos ser

14
Mtodos Estadsticos 2014

4
K =m = 2,5100 = 7,905 8

La amplitud del intervalo ser


9,6
C= = 1,214 = 1,2
7,905

A continuacin calculamos:

Marca de clase ( ). - es la semisuma de los lmites de clase. Es decir lmite inferior ms lmite
superior entre dos.
Frecuencia absoluta ( ). Es el nmero de observaciones o de datos comprendidos entre los
lmites de clase
Frecuencia relativa ( ) . - se denomina frecuencia relativa del valor al cociente de la
frecuencia absoluta de y el nmero total de observaciones. Se denota por


= =

1 14 2 18
1 = = = 0,14 2 = = = 0,18
100 100
3 13 4 25
3 = = = 0,13 4 = = = 0,25
100 100
5 13 6 8
5 = = = 0,13 6 = = = 0,08
100 100
7 5 8 4
7 = = = 0,05 8 = = = 0,04
100 100

As sucesivamente

Interpretacin

: 0,14 se interpreta como la proporcin de espigas cuya longitud est comprendida entre
6,3 y 7,5 cm. Inclusive
: 0,18 se interpreta como la proporcin de espigas cuya longitud vara desde 7,5 hasta 8,7
cm. inclusive
Y as sucesivamente

Frecuencia absoluta acumulada ( ).- Se llama frecuencia absoluta acumulada


correspondiente al valor al nmero de observaciones menores o iguales a se denota por
"

= 1 + 2 + 3 + +

Para nuestro ejemplo ser:

1 = 1=1 = 1 = 14

15
Mtodos Estadsticos 2014

2 = = 1 + 2 = 14 + 18 = 32
=1
3

3 = = 1 + 2 + 3 = 14 + 18 + 13 = 45
=1
4

4 = = 1 + 2 + 3 + 4 = 14 + 18 + 13 + 25 = 70
=1
5

5 = = 1 + 2 + 3 + 4 + 5 = 14 + 18 + 13 + 25 + 13 = 83
=1
Y as sucesivamente.

Interpretacin.-

2 = 32 Significa que hay 32 espigas de trigo cuya longitud est comprendida entre 7,5 y 8,3
cm. inclusive.

Frecuencia relativa acumulada ( ) .- se llama frecuencia relativa acumulada del valor a la


frecuencia relativa total de las observaciones menores o iguales a . Se denota como

1 +2 +3 +.+
= 1 + 2 + . + =

=
=1

Para nuestro ejemplo


1

1 = = 1 = 0,14
=1
2

2 = = 1 + 2 = 0,14 + 0,18 = 0,32


=1
3

3 = = 1 + 2 + 3 = 0,14 + 0,18 + 0,13 = 0,45


=1
4

4 = = 1 + 2 + 3 + 4 = 0,14 + 0,18 + 0,13 + 0,25 = 0,70


=1
5

5 = = 1 + 2 + 3 + 4 + 5 = 0,14 + 0,18 + 0,13 + 0,25 + 0,13 = 0.83


=1
As sucesivamente

Interpretacin:

= 0,32 es la proporcin de espigas de trigo cuya longitud varia de 7,5 y 8,7 cm. inclusive.
= 0,45 es la proporcin de espigas de trigo cuya longitud vara desde 8,7 y 9,9 cm. inclusive.

As sucesivamente

16
Mtodos Estadsticos 2014

La tabla de distribucin de frecuencias ser


6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1

Interpretacin:

= 14 Espigas de trigo tienen una longitud comprendida entre 6,3 y 7,5 cm


respectivamente.
= 32 espigas de trigo tienen una longitud comprendida desde 7,5 8,7 cm inclusive
= 0.25 25% de las 100 espigas de trigo tienen una longitud comprendida desde 9,9 cm y
11,1 cm inclusive.

REPRESENTACION GRAFICA DE UNA DISTRIBUCION DE FRECUENCIAS

HISTOGRAMA.- grafica en la que las clases se sealan en el eje horizontal y las


frecuencias de clase en el eje vertical. Las frecuencias de clase se representan por medio
de las alturas de barras, estas se dibujan de manera adyacente.

Un histograma que utiliza las frecuencias relativas de cada una de las clases, en lugar de usar la
frecuencia absoluta se conoce como histograma de frecuencias relativas. Este histograma tiene
la misma forma que un histograma de frecuencias absolutas construido a partir del mismo
conjunto de datos

17
Mtodos Estadsticos 2014

POLIGONO DE FRECUENCIAS tambin muestra la forma que tiene una distribucin y es


similar a un histograma. Consiste en segmentos de recta que conectan los puntos
formados por las intersecciones de los puntos medio de clase y las frecuencias de clase

El polgono tambin se puede construir con las frecuencias relativas, a esta figura se le conoce
como polgono de frecuencias relativas.

Las ventajas de un histograma son:


a.- Los rectngulos muestran cada clase de la distribucin por separado
b.- El rea de cada rectngulo, en relacin con el resto, muestra la proporcin del nmero total
de observaciones que se encuentran en esa clase.
Las ventajas del polgono son:
a.- El polgono de frecuencias es ms sencillo que su correspondiente histograma
b.- Traza con ms claridad el perfil del patrn de los datos
c.- El polgono se vuelven cada vez ms liso y parecido a una curva conforme aumentamos el
nmero de clases y el nmero de observaciones

OJIVA O DISTRIBUCIN DE FRECUENCIA ACUMULATIVAS, grafica que resulta de la


unin de las frecuencias acumulativas con las marcas de clase. Nos permite ver cuntas
observaciones estn por encima de ciertos valores

18
Mtodos Estadsticos 2014

DESCRIPCCION DE DATOS

MEDIDAS DE TENDENCIA CENTRAL.- La tendencia central se refiere al punto medio de


una distribucin. Se conocen como medidas de posicin.

LA MEDIA ARITMTICA.- es la suma de todos los valores dividido entre el nmero de


valores.


=1
MEDIA POBLACIONAL: =

En la cual.

representa la media poblacional, letra griega mu


N es el nmero de valores en la poblacin
representa cualquier valor en particular
es la letra griega mayscula sigma e indica la operacin suma
es la suma de X valores en la poblacin

PARMETRO.- Es una medida resumen que describe una caracterstica de toda una
poblacin


=
MEDIA MUESTRAL =

En la cual:

= Media muestral
n= es el nmero de valores de la muestra.

ESTADISTICO.- una medida descriptiva que resume una caracterstica de la muestra

PROPIEDADES DE LA MEDIA ARITMETICA

1.- Todo conjunto de datos de intervalo o de nivel de razn posee una media
2.- Todos los valores se encuentran incluidos en el clculo de la media
3.- La media es nica. Solo existe una media en un conjunto de datos.
4.- Si todos los valores observados X1, X2,. son iguales a b (donde b es una constante)
entonces la media de una constante es la misma constante
M(x) = M (b) = b

19
Mtodos Estadsticos 2014

5.- Si a cada valor de las observaciones X1, X2,Xn se le suma (o se resta) una constante, la
media del nuevo conjunto transformado yi= xi b; es la media aritmtica del conjunto original
ms (o menos) la constante. Es decir

Donde yi = xi b, b= constante, i = 1,2,.,n

6.- Si cada valor de un conjunto X1, X2,.,Xn se multiplica por una constante diferente de
cero, la media aritmtica del conjunto transformado yi = axi, donde i= 1,2,,n es la
media aritmtica del conjunto original multiplicado por la constante. O sea:

7.- La suma algebraica de las desviaciones de cada valor observado X1, X2, X3,.Xn con respecto
a su media es cero. Esta propiedad significa que,

Para datos agrupados esta propiedad se transforma en

m = nmero de clases
= frecuencia absoluta de la clase i
yi = punto medio del intervalo i (marca de clase)

8.- Si X1, X2,,Xn, y ,Y1,Y2,Yn son dos conjuntos de observaciones de n valores cada uno,
de dos variables X y Y, expresados en las mismas unidades, entonces

M(x y) = M(x) M (y)

9.- En casos especiales, esto es cuando es apropiado hacerlo, la media aritmtica se puede
utilizar para estimar la cantidad total de una poblacin. Esta propiedad indica que:

Total = N

MEDIA PONDERADA

La media ponderada de un conjunto de nmeros denotados por 1 , 2 , 3 , , con


ponderaciones 1 , 2 , 3 , . . , , se calcula como sigue:

( )
=

Ejemplo.- Un establecimiento vende gaseosas de tres tamaos: pequeo, mediano y grande. El


pequeo cuesta $0,50 (nuevos soles): el mediano $ 0,75; y el grande $ 1,00. Ayer se
vendieron 20 pequeos, 50 medianos y 30 grandes. Cul es el precio medio
ponderado por refresco?

20
Mtodos Estadsticos 2014

MEDIANA

MEDIANA.- Valor en la posicin central de los valores despus de ordenarlos de menor a


mayor o de mayor a menor. Hay tantos valores por encima de la mediana como por debajo de
ella en la ordenacin de datos

+1
Ubicacin de la mediana
2

Si hay cinco datos, entonces la ubicacin de la mediana (n+1)/2 ser igual a (5+1)/2 igual a 3.
Al ordenar los datos de menor a mayor, se obtiene el valor del tercer elemento, que es 7, la
mediana

Nmero de elemento 1 2 3 4 5
Valor del elemento 2 4 7 8 15

Mediana

En el siguiente ejemplo hay seis elementos de manera que (n+1)/2 ser igual a (6+1)/2 igual a
3,5 Despus de ordenar los datos de menor a mayor se encuentra la semi suma de los valores
3 y 4. Luego la mediana ser 31

Numero de elemento 1 2 3 4 5 6
Valor del elemento 25 29 30 32 35 35

31
Mediana
PROPIEDADES DE LA MEDIANA
1.- La mediana es nica; esto es, a semejanza de la media solo existe una mediana para un
conjunto de datos.
2.- No es difcil determinar la mediana para datos no agrupados. Tan solo se necesita
ordenarlos de menor a mayor o viceversa, y encontrar el valor del elemento central.
3.- No se ve afectada por valores muy grandes o muy pequeos y por tanto, es una medida
valiosa de tendencia central cuando ocurre este tipo de valores.
4.- Puede calcularse para datos de nivel de razn, de intervalo y ordinal

MODA

MODA.- valor de la observacin que aparece con mayor frecuencia

La moda puede determinarse para todos los niveles de datos: nominales, ordinales, de
intervalo y de razn. La moda tambin tiene la ventaja de no verse afectada por valores muy
altos o muy bajos

Hay muchos conjuntos de datos que no tienen moda, porque ningn valor figura ms de una
vez. Pero tambin existen conjunto de datos que tiene ms de una moda.

21
Mtodos Estadsticos 2014

MEDIA GEOMETRICA (M.G.)

LA MEDIA GEOMTRICA de un conjunto de n nmeros positivos se define como: la raz n-


sima del producto de n nmeros.
Si uno de los nmeros es cero o negativo, no se puede calcular la media geomtrica.


M.G. g (1 )(2 )(3 ) . . ( )

Hay dos usos principales de la media geomtrica

1.- Para promediar porcentajes, ndices y cifras relativas


2.- Para determinar el incremento porcentual promedio.

Ejemplo: Supngase que las utilidades obtenidas por una compaa constructora en cuatro
proyectos fueron de 3, 2, 4 y 6% respectivamente Cul es la media geomtrica de las
ganancias?


M.G. (1 )(2 )(3 ) . . ( )
4
M.G. (3)(2)(4)(6)
4
M.G. 144 3,46%

La media geomtrica de trminos positivos es siempre menor o igual que la media aritmtica.
Es igual a la media aritmtica slo en el caso en que todos los trminos sean iguales entre s

La media geomtrica para datos agrupados en clases, es la raz n-sima del producto de las
marcas de clase elevadas a sus respectivas frecuencias



. . = g = 1 1 2 2 .

Desventajas de la media geomtrica

1.- Su clculo es muy engorroso


2.- Est limitado para valores positivos para que pueda ser interpretado
3.- Si algn valor de la variable es cero, la media geomtrica ser igual a cero
4.- Si aparece algn valor negativo, el estadgrafo toma un valor imaginario

MEDIA ARMONICA (h )

LA MEDIA ARMNICA (h = ) de trminos no nulos 1 , 2 , es el reciproco de


la media aritmtica de los recprocos de esos trminos.

22
Mtodos Estadsticos 2014

Es decir

1
= = 1 1

=1 /
=1

Ejemplo

La media armnica de los nmeros 3, 4, 6, y 8

4
= = 1 1 1 1 = 4,57143
+ + +
3 4 6 8

La media armnica para datos agrupados ser



= =

=1

Siempre que se trate del mismo conjunto de datos

VENTAJAS Y DESVENTAJAS

1.- La media armnica se basa en todas las observaciones por lo que est afectado por los
valores extremos. Pero da a los valores grandes un peso menor que el que da la media
geomtrica; mientras que a los valores pequeos, le da un peso mayor que el que da la
media aritmtica y la media geomtrica.
2.- La media armnica no est defino, si alguno de los valores es cero.

Aplicaciones de la media armnica


1.- Cuando se tiene trminos para cuyos recprocos se quiere calcular su media.
2.- Cuando se presenta una relacin inversa entre las variables implcitas, como por ejemplo:

- Entre la productividad y el tiempo.

e=p x t
Donde : e = espacio p = productividad t = tiempo

- La velocidad y el tiempo
e=v x t
Donde: e= espacio v = velocidad t= tiempo

Ejemplos

1.- Suponga que ha gastado usted, un nuevo sol por 3 docenas de naranjas en una tienda, otro
nuevo sol por 4 docenas de naranjas en una segunda tienda y otro nuevo sol ms por 5
docenas en una tercera tienda. Determinar el precio promedio por una docena de naranjas.

23
Mtodos Estadsticos 2014

Solucin:

Obtendremos primero el precio pagado por docena de naranja.


En la primera usted ha gastado 1 nuevo sol por 3 docenas de naranjas o sea 1/3 de sol por
docena.
En la segunda gast 1 nuevo sol por 4 docenas, es decir 1/4 de nuevo sol por docena.
En la tercera tienda gast un nuevo sol por 5 docenas, o sea 1/5 de nuevo sol por docena.
En otras palabras queremos calcular la media de los recprocos de los nmeros 3, 4, 5


= = 1

=1

3
= = 1 1 1 = 0,25
+ +
1/3 1/4 1/5

2.- Cinco secretarias tienen las siguientes velocidades 40, 36, 28, 40, y 35 palabras por minuto.
Si cada una de ellas escribe un mismo texto, calcule la velocidad media

= = 1

=1

5
= = 1 1 1 1 1 = 35,196 palabras/minuto
+ + + +
40 36 28 40 35

MEDIA, MEDIANA Y MODA PARA DATOS AGRUPADOS

MEDIA ARITMERICA PARA DATOS AGRUPADOS (datos tabulados) Si los datos han sido
clasificados en m clases en una tabla de frecuencia con marca de clase yi y frecuencia absoluta
= 1,2,.., m, la media aritmtica de estos datos est definida por:


6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1

MEDIANA PARA DATOS AGRUPADOS





Me = + [ ]

24
Mtodos Estadsticos 2014

Donde:

cj = amplitud de la clase mediana


Fi = Frecuencia absoluta acumulada de la clase medina
n = nmero de observaciones

1 = Lmite inferior de la clase mediana


6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1

100
45
Me = + [


] = , +1,29[
2
70 45
] 10,158

MODA PARA DATOS AGRUPADOS


Mo= + [ ]
( )+ ( +)

Donde:

= lmite inferior de la clase modal


fi-1 = frecuencia absoluta de la clase pre modal
fi = frecuencia absoluta de la clase modal
fi+1 = frecuencia absoluta de la clase pos modal
cj = amplitud de la clase modal


6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1

1 2513
Mo= 1 + [ ( 1 )+ ( +1)
] = 9,9 + 1,2 [(2513)+ (25 13)] 10,5

25
Mtodos Estadsticos 2014

RELACIN ENTRE MEDIA, MEDIANA Y MODA EN DISTRIBUCIONES SIMTRICAS Y


ASIMTRICAS

1.- En una distribucin de frecuencias simtrica cuya representacin grfica es acampanada y


adems unimodal; coinciden exactamente en el mismo valor, media, mediana y moda.

2.- Si la distribucin tiene la forma acampanada, es unimodal, pero no tiene simetra, las tres
medidas toman valores diferentes, y la mediana queda comprendida generalmente entre la
moda y la media aritmtica.

En una distribucin asimtrica positiva (o con sesgo positivo) la media aritmtica es el


mayor de los tres promedios. Esto se debe a que en la media influye ms que en la
mediana y la moda, los valores sumamente altos.

En una distribucin asimtrica negativa, la media es el menor de los tres promedios. La


media se ve afectada por los valores extremadamente bajos

Si se conocen dos promedios de una distribucin de frecuencias con sesgo o asimetra


moderada, el tercer promedio puede aproximarse, de acuerdo con las siguientes frmulas

Moda Media 3(Media Mediana)

3()
Media
2

2()+
Mediana
3

26
Mtodos Estadsticos 2014

MEDIDAS DE POSICIN NO CENTRALES O CUANTILES

Son medidas de posicin que no necesariamente reflejan la tendencia central de la


distribucin de frecuencias: A este tipo de medidas se les llama cuantiles, que son los valores
de la variable que dividen a la distribucin en intervalos que contienen el mismo nmero de
observaciones.

Los cuantiles ms usados son los cuartiles, , los deciles, Dj y los percentiles, .

PERCENTILES

PERCENTIL.- El p simo percentil es un valor tal que, a lo sumo, p por ciento de las
observaciones son menores o iguales que este valor y, a lo sumo, (100 p) por ciento de
las observaciones son mayores o iguales que este valor.

CALCULO DEL I SIMO PERCENTIL PARA DATOS NO AGRUPADOS

Se siguen los siguientes pasos:

1.- Ordenar los datos de forma ascendente.


2.- Calcule un ndice k:

K=[ ]n
100

Dnde i es el percentil de inters y n es la cantidad de observaciones

3.- Si k no es entero, se redondea. El valor del entero inmediato superior que k indica la
posicin del i simo percentil.
Si k es entero, el i simo percentil es el promedio de los valores de los datos ubicados en
los lugares k y k + 1.

Ejemplo

Dada una muestra cuyos valores son:

53 55 70 58 64 57 72 53 69 57 68 53

Calcule los percentiles 30 y 75

Solucin

1.- Se ordenan los datos de menor a mayor, esto es:


53 53 53 55 57 57 58 64 68 69 70 72
2.- Clculo del ndice k

Para percentil 30
30
K = [100]n = [100] 12 = 3.6

27
Mtodos Estadsticos 2014

3.- Como k no es entero, redondeamos. El lugar del percentil 30 es el siguiente entero mayor
de 3.6, es decir, el lugar 4. En este caso el percentil 30 es el valor del dato que ocupa la
posicin cuarta, o sea 55. Esto significa que el 30% de los datos es menor que 55 y el 70%
mayor o igual a 55.

Para percentil 75

75
k = [100]n = [100] 12 = 9

Como k es entero se establece que el percentil 75 es el promedio de los valores de los datos
68 +69
noveno y dcimo; es por lo tanto. [ ] = 68.5 Esto significa que el 75% de los datos, a lo
2
sumo es menor que 68.5 y a lo sumo el 25% mayor o igual que 68.5.

Clculo del i simo percentil para datos agrupados

Se siguen los siguientes pasos:



1.- Se calcula , donde i = 1, 2,3,..,99
100

2.- Se identifica la clase que contiene el por la frecuencia acumulada


3.- Se emplea la frmula

1
100
= 1 + [ ]

Donde:

1 = Lmite inferior de la clase que contiene a
n= Tamao de la muestra o poblacin.
= Tamao del intervalo de clase
1 = Frecuencia acumulada de la clase anterior a la clase que contiene a
f = frecuencia simple de la clase que contiene a
Ejemplo

La tabla siguiente muestra la distribucin de las edades de 120 personas


30 40 1 1
40 50 3 4
50 60 11 15
60 70 21 36
70 80 43 79
80 90 32 111
90 - 100 9 120

Determine la edad mnima del 25% de las personas de ms edad

Solucin

28
Mtodos Estadsticos 2014

La edad minina del 25% de las personas de ms edad es el percentil 75, en ese sentido
tenemos que encontrar las frecuencias acumuladas
75 120
1.- Se calcula 100 = 100
= 90
2.- La clase que contiene al 75 es 70 80
3.- Utilizando la frmula

1
100
= 1 + [ ]

9079
75 = 80 + 10 [ 32
]= 83.44

CUARTILES

CUARTILES.- Dividen a la masa de datos en cuatro grupos iguales. El primer cuartil, 1


deja el 25% de los datos ordenados a su izquierda, y el otro 75% a su derecha. El
segundo cuartil, 2 , deja el 50% de los datos a su izquierda y el otro 50% a su derecha,
este valor coincide con la mediana, mientras que el tercer cuartil, 3 deja el 75% de los
datos ordenados
CALCULO a su izquierda
DE LOS CUARTILES PARAy DATOS
el otro 25% a su derecha.
ORDENADOS.

Los cuartiles son solo percentiles especficos; por lo tanto, los pasos para calcular los
percentiles se pueden aplicar en forma directa para calcular los cuartiles. Esto es:
1 = Primer cuartil o percentil 25
2 = Segundo cuartil o percentil 50
3 = Tercer cuartil o percentil 75

Ejemplo
Los siguientes datos representan los sueldos mensuales para una muestra de 12 Ingenieros
Agrnomos.
2850 2950 3050 2880 2755 2710 2890 3130 2940 3325 2920 2880
Determine el 1 3

Solucin

Cuartil uno,

1.- Se ordenan los datos en forma ascendente

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

2.- Calcular el 1 es igual que calcular el 25 , en ese sentido se calcula el ndice K


25
k = [100]n = [100] 12 = 3

29
Mtodos Estadsticos 2014

Como K es entero se establece que el percentil 25 es el promedio de los valores de los datos
2850 +2880
tercero y cuarto; es por lo tanto [ 2
] = 2865. Esto significa que el 25% de los
Ingenieros Agrnomos tienen un salario mensual superior a 2865.

Cuartil tres, :

Implica calcular el percentil 75, entonces:

1.- Calcular el ndice K

75
k = [ ]n = [ ] 12 = 9
100 100

Como K es entero se establece que el percentil 75 es el promedio de los valores de los datos
2950 +3050
noveno y dcimo; es por lo tanto, [ ] = 3000. Esto significa que el 75% de los
2
Ingenieros Agrnomos tienen un salario menor a 3000 y el otro 25% un salario mensual
superior a 30000
1 2 3

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

2865 2905 3000

CLCULO DE CUARTILES PARA DATOS NO AGRUPADOS





= + [ ] = + [ ]

3
1
= + [ 4 ]

Donde:

1 =Limitre inferior de la clase que contiene al cuartil i
= Nmero de datos
1 = Frecuencia acumulada de la clase anterior de la clase que contiene al cuartil i
f = frecuencia de clase simple de la clase que contiene al cuartil
= tamao del intervalo de clase
Ejemplo

Una empresa decide evaluar a sus empleados. La clasificacin se lleva a cabo mediante la
aplicacin de un test que arroja los siguientes puntajes


0 - 20 94
20 - 40 140
40 - 60 160
60 - 80 98
80 - 100 8

30
Mtodos Estadsticos 2014

Determine:

a.- La puntuacin que es excedida por el 75% de los trabajadores


b.- La puntuacin que supera a las puntuaciones del 75% de los trabajadores.
Solucin

a.- En este caso Se debe calcular el primer cuartil (1 )


1
= + [4 ]

Debemos encontrar las frecuencias acumuladas



1
0 - 20 94 94
20 - 40 140 234
40 - 60 160 394
60 - 80 98 492
80 - 100 8 500
Luego
500
El lugar del cuartil 1 es la posicin = = 125. Es decir, que el cuartil est ubicado en la
4 4
clase 20 40. Por lo tanto:

1
1 = 1
+ [ 4 ] = 20 + 20 [

] = 24.43

Esto quiere decir que el 75% de los trabajadores tienen una calificacin mayor a 24.43

b.- La puntuacin que supera a las puntuaciones del 75% de los trabajadores, corresponde al
valor del tercer cuartil.

3 3 500
El lugar del tercer cuartil es la posicin = = 375. Es decir, que el cuartil est
4 4
ubicado en la clase 40 - 60. Por lo tanto
3
1
3 = 1
+ [ 4
] = 40+ 20 [375160
234
] = 57.625

Esto quiere decir que el 25% de los trabajadores tiene una puntuacin mayor a 57.625

MEDIDA DE DISPERSIN Y ASIMETRA

Existen varias razones por la cual se debe estudiar la dispersin en un conjunto de datos

1.- Al aplicar una medida de dispersin es posible evaluar la confiabilidad del promedio que se
est utilizando. Una dispersin pequea indica que los datos se encuentran acumulados
cercanamente, por ejemplo, alrededor de la media aritmtica. Por tanto, la media se
considera bastante representativa de los datos. Esto es: la media es un promedio confiable.

31
Mtodos Estadsticos 2014

Por el contrario, una dispersin grande indica que la media no es muy confiable, es decir no
es muy representativa de los datos.

2.- Una medida de dispersin permite apreciar cun dispersas estn dos o ms distribuciones.
Por ejemplo veamos la siguiente figura

MEDIDA DE DISPERSIN. DATOS NO AGRUPADOS

A continuacin se muestran dos series de datos, ambos tienen la misma media


aritmtica pero se muestra que tienen diferente dispersin alrededor de ella.

AMPLITUD TOTAL.- se trata de la diferencia entre los valores mayor (o ms alto) y menor (o
ms bajo) de un conjunto de datos

AMPLITUD TOTAL Valor ms alto Valor ms bajo

DESVIACIN MEDIA: Denominada tambin desviacin promedio de los valores


absolutos de las desviaciones con respecto a la media aritmtica

| |
D.M.

Donde:

= Es el valor de cada observacin


= Es la media aritmtica de los valores
n = Es el nmero de observaciones en la muestra

32
Mtodos Estadsticos 2014

La desviacin media tiene dos ventajas. Utiliza en su clculo el valor de cada uno de los
elementos de un conjunto de datos, y es fcil de comprender; y es el promedio en que los
valores se desvan con respecto de la media.

Ejemplo

Los pesos de una muestra de cajas listas para embarcarse a Italia son (en kilogramos): 103,97,
101, 106 y 103

1.- Cul es la desviacin media?


2.- Cmo se interpreta?


= 103+97+101+106+103
= = = 102 Kg
5

|103102|+|97102|+|101102|+|106102|+|103102|
D.M. =
5

D.M. 2,4 Kg

Interpretacin.- En promedio, los pesos de las cajas se desvan 2,4 Kg respecto de la media
aritmtica que es 102

VARIANCIA Y DESVIACION ESTANDAR

VARIANCIA.- Media aritmtica de las desviaciones cuadrticas con respecto a la media.

( )2
Variancia de poblacin: 2 =

2
( )
( )2 2
Variancia de la muestra: 2 = =
1 1

La varianza para datos agrupados ser calculada empleando la siguiente frmula:

PROPIEDADES DE LA VARIANZA

1.- La varianza de un conjunto de observaciones x1,x2,..xn siempre es un nmero no


negativo
V(x) 0

2.- La varianza de una constante es cero. Esto significa que si x1 = x2 =..= xn= b entonces:
V(b) = 0

33
Mtodos Estadsticos 2014

3.- Si a cada observacin x1, x2,,xn se le adiciona o se le resta una constante b 0, la


varianza del nuevo conjunto de valores y1,y2,,yn, donde yi=xi b, i = 1,2,.,n,
coincide con la varianza del conjunto original. Es decir
V(y) = V (x b) = V(x)

4.- Si a cada valor de un conjunto x1,x2,xn, se multiplica por una constante a, la varianza
del nuevo conjunto de valores y1,y2,yn, donde yi = axi, i= 1,2,,n es igual a la
varianza del conjunto original multiplicada por el cuadrado de la constante. Es decir:
V(y) = a2 V(x)
VARIANZA CALCULADA A PARTIR DE SUB MUESTRAS

Si y son las medias aritmticas de dos submuestras de tamao n1 y n2 respectivamente y


sus varianzas correspondientes. Entonces la varianza de la muestra de tamao n = n1
+ n2 est dada por

DESVIACION ESTANDAR

DESVIACION ESTANDAR.- Raz cuadrada de la variancia

Desviacin estndar poblacional

Desviacin estndar muestral S = 2

COEFICIENTE DE VARIACIN (CV)

En algunas ocasiones se requiere un estadstico descriptivo que indique cun grande es la


desviacin estndar en relacin con la media. Es decir nos indica la cantidad de veces que la
desviacin estndar contiene a la media aritmtica.

Esta medida es el coeficiente de variacin (coeficiente de variabilidad) y se representa como


porcentaje.

DESVIACIN ESTANDAR
CV = 100
MEDIA ARITMETICA

Poblacin Muestra


CV = [ 100] CV = [ 100]

CARACTERSTICAS DEL COEFICIENTE DE VARIABILIDAD

1.- No tiene unidad de medida


2.- No aplicable cuando la distribucin tiene media cero

34
Mtodos Estadsticos 2014

3.- Se afecta su valor cuando se suma una constante K a cada observacin de un conjunto
de datos.
4.- No cambia de valor cuando se multiplica por una constante K a cada una de las
observaciones.
Calificacin de una distribucin de datos, segn el grado de dispersin:

Coeficiente de variabilidad (%) Calificacin


0 Completamente homognea
0 < < 10 Muy homognea
10 < < 15 Regularmente homognea
15 < < 20 Regularmente variable
20 < < 25 Variable
CV> 25 Muy variable

TEOREMA DE CHEBYSHEV.- Una desviacin estndar pequea para un conjunto de valores


indica que stos se encuentran localizados cerca de la media. Por el contrario una desviacin
estndar grande revela que las observaciones estn muy dispersas con respecto a la media.

El matemtico ruso P.L. Chebyshev, desarroll un teorema que permite determinar la


proporcin mnima de los valores que se encuentra dentro de un nmero especfico de
desviaciones estndares con respecto a la media.

REGLA EMPIRICA.- Para una distribucin de frecuencias simtrica en forma de campana,


aproximadamente el 68% de las observaciones se encontrar a ms o menos una desviacin
estndar de la media; aproximadamente el 95% de las observaciones se encontrarn a ms
o menos dos desviaciones estndar desde la media; y prcticamente todas las
observaciones (99,7%) se encontrarn a ms o menos tres desviaciones desde la media

95,44%
68,26%

99.74%

35
Mtodos Estadsticos 2014

MEDIDAS DE FORMA

COEFICIENTE DE ASIMETRIA.

Las medidas de asimetra tienen como facilidad elaborar un indicador que permita establecer
el grado de simetra o asimetra, que presenta una distribucin, sin necesidad de llevar a cabo
su representacin grfica.

El coeficiente de asimetra puede calcularse mediante el coeficiente de asimetra de Pearson.

Tambin existen otras frmulas alternativas para el clculo del coeficiente de asimetra.

3( )
=

Asimismo, el coeficiente de asimetra nos describe la forma de un conjunto de datos, es decir,


la manera como se distribuyen, comparando la media y la mediana. Si ambas medidas son
iguales, por lo general, se considera que los datos son simtricos (o con sesgo cero, es decir, el
coeficiente de asimetra es cero). Por lo contrario, los datos o su distribucin es asimtrica o
sesgada, es decir, si la media excede a la mediana, los datos se describen como sesgados a la
derecha, o con sesgo positivo (el coeficiente de asimetra es positivo). Si la mediana excede a la
media, los datos suelen llamarse sesgados a la izquierda, o con sesgo negativo (el coeficiente
de asimetra es negativo)

El sesgo positivo surge cuando la media aumenta debido a algunos valores grandes y poco
usuales: el sesgo negativo ocurre cuando la media se reduce debido a algunos valores muy
pequeos. Los datos son simtricos cuando en realidad no hay valores extremos en ninguna
direccin, de tal manera que los valores grandes y pequeos se equilibran.

Simetra Relacin
Simtrica o insesgada Media = Mediana = Moda
Sesgo positivo o a la derecha Media > Mediana > Moda
Sesgo negativo o a la izquierda Media < Mediana < Moda

COEFICIENTE DE APUNTAMIENTO O CURTOSIS

Analiza el grado de concentracin que presentan los valores alrededor de la zona central de la
distribucin, es decir, estudia la distribucin de frecuencias en la zona central. La mayor o
menor concentracin de frecuencias alrededor de la media y en la zona central de la
distribucin, dar lugar a una distribucin ms o menos apuntada.

As es por lo que a la curtosis tambin se le llama apuntamiento.

Si el valor de la curtosis es positivo, se dice que los datos tienen una distribucin leptocrtica
(es ms apuntada o puntiaguda que la distribucin normal); en caso contrario, si la curtosis es
negativa, se dice que los datos tienen una distribucin platicrtica (es menos apuntada o

36
Mtodos Estadsticos 2014

puntiaguda que la distribucin normal). Si la curtosis es cero, entonces los datos se distribuyen
siguiendo una distribucin normal, y se dice que en este caso la distribucin mesocrtica.

Para medir la curtosis se puede emplear las siguientes frmulas:


4
( ) 1 3 1
k= 3 k= [ ]
4 2 90 .10

Donde

3 = Cuartil tres 90 =

1 = Cuartil uno 10 = Percentil diez

CARACTERISTICAS DEL COEFICIENTE DE CURTOSIS

1.- No tiene unidades de medida


2.- Se aplica a distribuciones unimodales que sean simtricas o ligeramente asimtricas.
3.- No le afecta las operaciones de suma y multiplicacin por una constante c aplicada a cada
observacin.

( )2 ( )4
2 4 16
4 0 0
8 16 256
2 4 16
16 24 288
Media = 4
Varianza 2 = 8

Reemplazamos y calculamos el coeficiente de curtosis


4
( ) 288
k= 3 = (4)(64) - 3 = -1.875
4

Al tener el coeficiente de curtosis un valor negativo, la distribucin ser platicurtica.

37
Mtodos Estadsticos 2014

CARACTERISTICAS DEL COEFICIENTE DE ASIMETRIA DE PEARSON

1.- No tiene unidad de medida


2.- Se aplica a distribuciones unimodales
3.- Su valor debe encontrarse en el intervalo de -3 a 3

Ejemplo

Una muestra de digitadoras de texto revel que su rapidez media de tecleo es de 87 palabras
por minuto, con una media de 73. La desviacin estndar es de 16.9 palabras por minuto.
Cul es el coeficiente de asimetra? Interprete su respuesta.

Solucin

3() 3(8773)
Reemplazando =
= 16.9
= 2.49

Existe considerable asimetra con sesgo positivo en la distribucin de la rapidez de tecleo.


Algunas operadoras muy rpidas hacen que la media sea mayor que la mediana o la moda.

PROBABILIDAD

QUE ES UNA PROBABILIDAD?

PROBABILIDAD es una medida de la posibilidad de que ocurra un evento (o suceso) en el


futuro, solo puede asumir valores entre 0 y 1, inclusive

EXPERIMENTO: Observacin de alguna actividad o la accin de efectuar una medicin. Un


experimento tiene dos o ms resultados posibles y es incierto cul habr de ocurrir

EVENTO: Conjunto de uno o ms resultados de un experimento

RESULTADO: Un acontecimiento particular de un experimento

38
Mtodos Estadsticos 2014

Ejemplos

1.- Experimento: Observar si su auto arranca o no al activar el interruptor principal (llave de


encendido)
Resultado posible: Si, arranca
No, arranca
Evento posible: Arranca
2.- Experimento: Tirar un dado
Resultado posible: Caer un 1
Caer un 2
Caer un 3
Caer un 4
Caer un 5
Caer un 6

Evento posible: Caer un nmero par


Caer un nmero mayor de 4
Caer un nmero 3 o menor
Una probabilidad se expresa como un nmero decimal o como una fraccin.

Cuanto ms se acerca una probabilidad a 0, es ms improbable que suceda el evento al que se


asocia. Cuanto ms se acerca la probabilidad a 1, tanto ms seguros estamos que suceder.

ENFOQUES DE LA PROBABILIDAD:

Se analizarn dos enfoques de la teora probabilstica que son dos puntos de vista: objetivo y
subjetivo.

La probabilidad Objetiva puede subdividirse en: 1) probabilidad clsico o a priori, y 2) el


concepto de frecuencia relativa o probabilidad a posteriori

PROBABILIDAD CLASICA:

Se basa en la consideracin de que los resultados de un experimento son igualmente posibles.


Probabilidad de un evento

Ejemplo:

Se lanza un dado Cul ser la probabilidad de que el resultado sea un dos?


1
Probabilidad de un dos:
6
()
P (A) =
()

MUTUAMENTE EXCLUYENTES.- la ocurrencia de un evento significa que ningn otro


puede ocurrir al mismo tiempo
39
Mtodos Estadsticos 2014

COLECTIVAMENTE EXHAUSTIVO, Por lo menos uno de los sucesos ocurre cuando se


realiza un experimento

PROBABILIDAD EMPIRICA O FRECUENCIA RELATIVA.


Probabilidad de que suceda un evento

PROBABILIDAD SUBJETIVA

PROBABILIDAD SUBJETIVA.- Posibilidad (probabilidad) de que suceda un evento,


asignado por una persona con base en cualquier informacin de que disponga

Ejemplo.-

1.- Estimar la probabilidad de que el equipo del JUAN AURICH, salga campen en el
campeonato de futbol profesional.
2.- Estimar la posibilidad de que usted tenga una calificacin de 20 en este curso.

REGLAS BASICAS DE PROBABILIDAD

REGLA DE LA ADICION

REGLA ESPECIAL DE ADICIN

Si dos eventos A y B son mutuamente excluyentes, la regla indica que la probabilidad de que
ocurra uno u otro de los eventos es igual a la suma de probabilidades.

P (A o B) = P(A B) = P (A) + P (B)

Ejemplo

En el experimento de tirar un dado, el evento "un nmero par" y el evento "un nmero impar"
son mutuamente excluyentes. Si se observ un nmero par, no podra caer un nmero impar
al mismo tiempo.

Para tres eventos mutuamente excluyentes denotados por A, B, C, la regla ser:

P(A o B o C) = P ( ) = P(A) + P (B) + P(C)

REGLA GENERAL DE ADICIN

Es la probabilidad que mide la posibilidad de que dos o ms eventos ocurran en forma


simultnea:

P (A o B) = P(A) +P (B) - P(A y B) o equivalentemente


P (A U B) = P(A) + P (B) - P(A B)
40
Mtodos Estadsticos 2014

A este tipo de probabilidad tambin se le conoce como probabilidad conjunta

REGLA DEL COMPLEMENTO

Sea A un evento cualquiera, entonces se tiene que:

P (A) + P (A') = 1, de donde P (A') = 1- P (A)

Ejemplo

Se ha de entrevistar a un grupo selecto de empleados de la empresa ORION S.A., con


respecto a un plan de pensiones. Se efectuarn entrevistas detalladas a cada uno de los
empleados seleccionados en la muestra. Estos se clasificarn como sigue:

Clasificacin de empleados
Supervisores 120
Mantenimiento 50
Produccin 1460
Gerencia 302
Secretaria 68
Total 2000

Cul es la probabilidad de que la primera persona seleccionada:


a) Sea empleada de mantenimiento o secretaria?
b) No sea de gerencia?
Solucin
Sean los siguientes eventos:
B = El empleado seleccionado al azar es de mantenimiento.
E = El empleado seleccionado al azar es secretaria.
D = El empleado seleccionado al azar es de gerencia.

a) P (B o E) = P (B)+ P (E), por ser mutuamente excluyentes.


50 68
P (B o E) =P (B E) = + = 0.059
200 2000
302
b) P (D') = 1- P (D) = 1- = 0.849
2000

REGLA DE LA MULTIPLICACION

Dos eventos A y B son independientes, cuando la ocurrencia de un evento no tiene efecto en


la probabilidad de la ocurrencia de cualquier otro
Dos eventos son independientes si la ocurrencia de uno no altera la probabilidad de
ocurrencia
Sean deleventos
A y B dos otro. independientes, entonces:

P (A y B) = P(A). P (B)

En el caso de tres eventos independientes, A, B y C, la regla de la multiplicacin utilizada para


determinar la probabilidad de que los tres eventos ocurran es:

P(A y B y C)=P(A).P (B).P(C)

41
Mtodos Estadsticos 2014

Tambin se cumple que si A y B son independientes, entonces:

P (A\B) = P (A)
P (B \ A) = P (B)
Ejemplo

Una moneda es lanzada dos veces al aire, cul es la probabilidad de que las dos veces se
obtenga cara?

Solucin: sea A = Obtener cara en el primer lanzamiento.


B = Obtener cara en el segundo lanzamiento.
1 1
P (A) = 2
P (B) = 2

El que resulte cara en el segundo lanzamiento no depende si sali cara o no en el primero, es


por eso que A y B son eventos independientes. Por la tanto:
1 1 1
P (A y B) = P(A) P (B) = 2 2
= 4

Ejemplo

Una mquina automtica introduce legumbres en una bolsa de plstico. La experiencia indica
que algunos paquetes tuvieron menos peso, y algunos otros pesos de ms, pero la mayora
fueron satisfactorias. Veamos el siguiente cuadro:

Peso del paquete Probabilidad


Insuficiente 0.025
Satisfactorio 0.900
Excedido 0.075

a) Cul es la probabilidad de seleccionar tres paquetes de la lnea de procesamiento de


alimentos y encontrar que a los tres les falta peso?
b) Qu significa esta probabilidad?
Solucin

a) Sea F = Paquete seleccionado que le falta peso.

P (F) = 0.025

P (F y F y F)= P (F) P (F) P (F) = (0.025) (0.025) (0.025)

P (F y F y F) = 0.000015625

b) Descubrir que a los tres paquetes les falte peso es poco probable.

Observacin

Si dos eventos no son independientes, se dice que son dependientes. Con un ejemplo
ilustraremos esta idea:
Supongamos que hay 10 rollos de pelcula fotogrfica en una caja y se sabe que tres estn
defectuosos. Se selecciona uno:

42
Mtodos Estadsticos 2014

3
P (D) = 10 Probabilidad de que sea defectuoso.
7
P (D') = Probabilidad de que no sea defectuoso.
10
Despus se elige un segundo rollo de la caja, sin devolver el primero, la probabilidad de que
este sea defectuoso depender si el primero lo fue, de ser as es:
2
P (2) = 9 Probabilidad de que el segundo rollo extrado sea defectuoso dado que el
primero lo fue.
7
P (2) = Probabilidad de que el segundo rollo extrado no sea defectuoso dado que el
9
primero fue bueno.
Este tipo de anlisis nos ayuda a definir la probabilidad condicional.

PROBABILIDAD CONDICIONAL

Es la probabilidad de que ocurra un evento en particular dado que otro evento ha


ocurrido.
Es la probabilidad de que ocurra un evento en particular dado que otro evento ha ocurrido.
P(A y B) =P(A). P (B\A)

( )
P (B \ A) =
( )
( )
P (B \ A) =
( )
P (B \ A) = Probabilidad de que ocurra B dado que ya ocurri A.

Del ejemplo anterior: cul es la probabilidad de escoger un defectuoso seguido de otro


defectuoso?

P(A y B) = P (A) P (B\A)


3 2
P(A y B) = = O.067
10 9
Donde:

A = Primer rollo defectuoso.


B = Segundo rollo defectuoso.
Ejemplo

De una baraja completa de 52 cartas, se extrae una "mano" de 5 cartas. Cul es la


probabilidad de obtener dos espadas, dos corazones y un diamante?

Solucin

P (1 2 1 2 ) = (1 ) (2 / 1 ) (1 / 1 2 ) P (2 / 1 2 1 ) P ( /
1 2 1 2)
13 12 13 12 13
P (1 2 1 2 ) = 52
51
50
49
48
= 0.001014

43
Mtodos Estadsticos 2014

Pero esta es solo una parte, el total de posibilidades ser una permutacin de ellas, pero es
una permutacin con repeticin ya que las espadas se repiten dos veces y los corazones
tambin dos veces, entonces:
13 12 13 12 13 5 !
P (1 2 1 2 ) = ( ) = 0.0304
52 51 50 49 48 2 ! 2 !

TABLAS DE CONTINGENCIA

Una tabla de contingencia es una distribucin, una matriz, en cuyas filas y columnas los
individuos de una poblacin se clasifican en funcin de dos variables. Tambin se le conoce
con el nombre de tabla de doble entrada.

Por ejemplo, la siguiente es una tabla de contingencia en la que 300 personas se han
clasificado segn el sexo y por su adiccin al tabaco.

Fumadores No fumadores Total


Hombres 120 60 180
Mujeres 50 70 120
Total 170 130 300

En los mrgenes de la tabla se indican las sumas de filas y columnas.

Las tablas de contingencia nos ayudan a calcular los valores de probabilidad. Una tabla de
probabilidad puede crearse dividiendo cada valor de las casillas por el total, que en el ejemplo
anterior sera 300.

Los resultados se muestran en la siguiente tabla:

Fumadores No fumadores Total


Hombres 120/300 60/300 180/300
Mujeres 50/300 70/300 120/300
Total 170/300 130/300 300/300

Por lo tanto, la tabla de probabilidades quedara de la siguiente manera:

Fumadores No fumadores Total


Hombres 0.4 0.2 0.6
Mujeres 0.1667 0.2333 0.4
Total 0.5667 0.4333 1

Los valores en los mrgenes de la tabla se llaman probabilidades marginales. Por ejemplo,
elegida una persona al azar la probabilidad de que esta sea hombre es P (H) = 0.6 y la
probabilidad de seleccionar una mujer es P (M) = O.4

A las probabilidades en las celdas de la estructura principal de la tabla se les denomina


probabilidades conjuntas y muestran la probabilidad de la interseccin de dos eventos. Por

44
Mtodos Estadsticos 2014

ejemplo, la probabilidad de seleccionar una mujer y que esta sea fumadora es P (M y F) =


0.1667.

Tambin se puede calcular probabilidades condicionales por ejemplo, si se ha elegido un


fumador qu probabilidad hay de que sea mujer?

Nos piden que calculemos P (M \ F), esto es:

( ) 0.1667
P (M \ F) = = = 0.2942
() 0.5667

Por lo tanto, hay una probabilidad del 29.42% de que sea mujer dado que es fumador la
persona elegida.

DIAGRAMAS DE RBOL O ARBORIGRAMA

Es una representacin grfica til para organizar clculos que abarcan varios datos. Cada
segmento en el rbol es una etapa del problema.

Para la elaboracin de un arborigrama se empieza trazando un punto en la izquierda, que


representa el punto central de un tronco.

Ilustremos lo anterior mediante un ejemplo:

Ejemplo

Un club nocturno tiene los siguientes datos sobre la edad y el estado civil de 140 clientes.

Estado Civil
Edad civil
Soltero Casado Total
Menor de 30 77 14 91
Mayor o igual a 30 28 21 49
Total 105 35 140

a) Cul es la probabilidad de encontrar un cliente menor de 30 y soltero?

b) Si un cliente tiene menos de 30 aos, cul es la probabilidad de que sea soltero?

Solucin : Sean los siguientes eventos:

A = Cliente menor de 30 aos.


B = Cliente mayor o igual a 30 aos.
S = Cliente soltero.
C = Cliente casado.
Trabajamos un diagrama de rbol para ubicar los datos.

45
Mtodos Estadsticos 2014

Probabilidad Probabilidad
condicionada conjunta
P(S/A)

77 S p(A y S) = p(A)p(S/A) 91 77 = 0.55


91 =
140 91
91 A C P(A y C) = P(A)P(C/A) 91 14 = 0.10
140 14 =
140 91
91
14
91
28 S P (B y S) = P(B)P(S/B) 49 28 = 0.20
49
B
49 =
140 49
140
21 C P (B y C) = P(B)P(C/B) 40 21 = 0.15
=
49 140 49

77
a.-P (A y S) = 140 = 0.55 Probabilidad de que un cliente sea menor de 30 y soltero

77
b.- P (S \ A) = 91 = 0.85 Probabilidad de que un cliente sea soltero dado que es menor de 30
aos.

Tambin se puede asociar a cada diagrama de rbol una tabla de contingencia Y viceversa.
Para el ejemplo se tiene

Estado Civil
Edad civilIVIL
Soltero Casado Totales
A P (A y S) P (A y C) P (A)
B P (B y S) P (B y C) P (B)
Totales P(S) P(C) 1

Los datos obtenidos en el diagrama de rbol los reemplazamos en la tabla, esto es:

Estado civil
Edad civil
Soltero Casado Totales
A 0.55 0.1 0.65
B 0.2 0.15 0.35
Totales 0.75 0.25 1

TEOREMA DE BAYES

P (A \ B) y P (B \ A), pueden parecer similares, en concepto existe diferencia apreciable entre


las probabilidades que representan. Por ejemplo: si A es el evento de que las ventas en poca
navidea sean altas en un rea especfica y B es el evento de que el clima sea bueno, entonces
P (A \ B) es la probabilidad de que las ventas sean altas dado que el clima es bueno, mientras
que P (B \ A) es la probabilidad de que el clima sea bueno dado que las ventas son altas.

Existen muchas probabilidades en Estadstica en que intervienen estas parejas de


probabilidades condicionadas, el teorema de Bayes que se ver a continuacin, permite

46
Mtodos Estadsticos 2014

expresar la relacin matemtica entre las probabilidades de la forma P (A \ B) y P (B \ A), pero


para ello se necesitan algunos conceptos previos.

PROBABILIDAD A PRIORI

Probabilidad inicial con base en el nivel actual de informacin

PROBABILIDAD A POSTERIORI

Es una probabilidad con base en informacin adicional. El teorema de Bayes proporciona un


mtodo para calcular este tipo de probabilidades.

TEOREMA DE BAYES

Si se conoce la probabilidad de B en cada uno de los componentes de un sistema excluyente


de eventos, entonces si ocurre B, se puede calcular la probabilidad (a posteriori) de ocurrencia
de cada A

(1 )( )
1
P(A\B) =
(1 ) ( )+ (2 )( )+ .+( )( )
1 2

Observacin

Si los sucesos 1 , 2 , 3 , , se consideran casos posibles del suceso B, entonces Bayes


permite determinar la probabilidad de que uno de los ocurra siempre que B haya ocurrido.

Ejemplo

La Dra. Blanquita ha estado enseando Estadstica Bsica durante muchos aos. Se sabe que
el 80% de los estudiantes terminarn los problemas asignados. Determin, que de los
estudiantes que cumplen con su trabajo el 90% aprobar el curso. De aquellos estudiantes que
no lo hacen as, el 60% ser aprobado. Eduardo Lpez tom Estadstica durante el ltimo
semestre con la profesora Blanquita y recibi una calificacin aprobatoria. Cul es la
probabilidad de que s haya hecho sus tareas?

Solucin

Sea:

A = Estudiante que cumple con su trabajo.


A' = Estudiante que no cumple con su trabajo.
B = Estudiante que aprueba.
B' = Estudiante que no aprueba.

P (A) = 0.8 => P (A') = 0.2


P (B\A) = 0.9; P (B\A') = 0.6
P (B'\A) = 0.1; P (B'\ A') = 0.4

47
Mtodos Estadsticos 2014

P(B) = 0.9 P(A y B) = P(A)P()

P(A y B) = (0.8)(0.9)= 0.72

P( ) = 0.1

P(A) =0.8 P(A y ) = ()( )

P(A y ) = (0.8)(0.1) = 0.08

P(B) =0.6
P( y B ) = ( )( )

P( ) =0.2 P( y B ) = (0.2)(0.6) = 0.12)

P( ) = 0.4

P( y ) = ( )( )

P( y ) = (0.2)(0.4) = 0.08
Por definicin de probabilidad condicional tenemos:

( )
P () =
()
( ) ()
P () =
( )
Tener en cuenta que p (B) no es discernible de inmediato. Aqu es donde participa el teorema
de Bayes. Existen dos razones por las que Eduardo Lpez haya aprobado el curso. Puede haber
hecho los trabajos asignados y aprobar el curso o puede no haber hecho los trabajos asignados
y tambin aprobar el curso, es decir:

P (B) = P (A y B) +P (A y B)
P (B) = P (A). P (B \ A) + P (A'). P (B \ A')

Cuando se hace la sustitucin en el denominador de la frmula 1 se tiene:

P(A)P()
P () =
() ()+ ( )( )

0.72 0.72
P () = 0.72 +0.12
= 0.84
= 0.86 = 86%

Por lo tanto, hay un 86% de probabilidad de que Eduardo Lpez haya hecho sus tareas dado
que recibi una calificacin aprobatoria.

Ejemplo

El departamento de crdito de la tienda departamental Saga Falabella en Piura, inform que


30% de sus ventas son en efectivo, 30% son pagadas con cheques en el momento de la
adquisicin y 40% son a crdito. Se tiene que 20% de las compras en efectivo, 90% de las
pagadas con cheques y 60% de las adquisiciones al crdito, son por ms de US$50. La Sra.
Milagritos acaba de comprar un vestido que cuesta US$ 120. Cul es la probabilidad de que
haya pagado por l en efectivo?

48
Mtodos Estadsticos 2014

DISTRIBUCIONES PROBABILISTICAS DISCRETAS

QUE ES UNA DISTRUCION DE PROBABILIDADES?

DISTRIBUCIN PROBABILSTICA: Enumeracin de todos los resultados de un experimento


junto con la probabilidad asociada a cada uno

Ejemplo:

Supngase que se est interesado en el nmero de caras que caen al lanzar tres veces una
moneda. Este es el experimento. Los posibles resultados son cero, uno, dos y tres caras. Cul
es la distribucin de probabilidades para el nmero de caras?

Solucin. Hay ocho posibles resultados, los cual son:

Resultado Tirada de la moneda Nmero de


Posible Primera Segunda Tercera caras
1 S S S 0
2 S S C 1
3 S C S 1
4 S C C 2
5 C S S 1
6 C S C 2
7 C C S 2
8 C C C 3

A continuacin se muestra los resultados junto con su respectiva probabilidad:

Nmero Probabilidad
De caras del resultado
X P(X)
0 1 = 0,125
8
1 3 = 0,375
8
2 3 = 0,375
8
3 1 0,125
8
TOTAL 8 = 1,000
8

Existen dos caractersticas importantes:


1.- La probabilidad de un resultado especfico debe estar siempre entre 0 y 1.
2.- La suma de las probabilidades de todos los resultados mutuamente excluyentes es 1

VARIABLE ALEATORIA.- cantidad que es resultado de un experimento aleatorio que,


debido al azar, puede tomar distintos valores.

VARIABLE ALEATORIA DISCRETA.- Variable que slo puede tener ciertos valores
claramente separados y que es el resultado de contar algn elemento de inters.

49
Mtodos Estadsticos 2014

Ejemplos:
- El nmero de caras que se presentan en tres lanzamientos de una moneda
- El nmero de estudiantes que sacaron 15 en un examen
- El nmero de empleados ausentes en una fbrica determinada

VARIABLE ALEATORIA CONTINUA.-Es aquella que puede tomar uno de una cantidad
infinitamente grande de valores, dentro de ciertas limitaciones

Ejemplos:
- La duracin de cada cancin en el ltimo lbum de Corazn Serrano
- El peso de cada estudiante de esta clase
- La temperatura ambiente al momento que lee estos apuntes

MEDIA, VARIANCIA, DESVIACION ESTANDAR DE UNA DISTRIBUCION DE


PROBABILIDADES

MEDIA:

La media es un valor representativo que sirve para representar una distribucin probabilstica.
Tambin es el valor promedio a largo plazo de la variable aleatoria. La media se denomina
tambin valor esperado o expectativa. E(X), de la variable.

= () = [()]

VARIANCIA Y DESVIACION ESTANDAR.- sirven para comparar la variacin en dos


distribuciones que tengan la misma media, pero diferente dispersin.

2 = [( ) 2 ()]

Ejemplo:

Un vendedor, Juan Prez vende automviles nuevos para una empresa. Generalmente negocia
el mayor nmero de autos los sbados. Ha establecido la siguiente distribucin de
probabilidad para el nmero de autos que espera vender en un sbado en particular.

Nmero de automviles Probabilidad


Vendidos P(x)
x
0 0,10
1 0,20
2 0,30
3 0,30
4 0,10
total 1,00

50
Mtodos Estadsticos 2014

1.- Qu tipo de distribucin es sta?


2.- En un sbado comn, Cuntos autos espera vender?
3.- Cul es la variancia de la distribucin?
DISTRIBUCIN PROBABILSTICA BINOMIAL

La Distribucin probabilstica Binomial, es una distribucin de probabilidades discreta.

Una caracterstica de esta distribucin binomial es que se ocupa de experimentos donde


cada resultado puede tomar slo uno de dos formas. Una forma comn de denotar los dos
resultados es como xito y fracaso.

Ejemplo:

Experimento: Seleccionar un juguete mecnico de la lnea de produccin


Resultado: El juguete funciona de manera correcta (xito)
El juguete no funciona en forma correcta (fracaso).
Experimento: Preguntar a un nio de cinco aos si le gusta un cereal de reciente produccin.
Resultado: Le gusta (xito)
No le gusta (fracaso)
Una segunda caracterstica de una distribucin binomial es que los datos recopilados son
resultado de conteos.

Una tercera caracterstica de esta distribucin es que la probabilidad de xito permanece


igual de un ensayo a otro.

Una cuarta caracterstica es que un ensayo es independiente de cualquier otro. Lo que


significa que el resultado de un ensayo no afecta al resultado de algn otro.

La distribucin probabilstica Binomial puede describirse utilizando la siguiente formula:

!
P(X) =
!( )!

Donde:

n: es el nmero de ensayos
X: es el nmero de xitos observados
p: es la probabilidad de xito en cada ensayo
q: es la probabilidad de fracaso que se obtiene de 1- p

MEDIA Y VARIANCIA DE UNA DISTRIBUCION DE PROBABILIDADES BINOMIAL

np

2 =

51
Mtodos Estadsticos 2014

Ejemplo:

Supongamos que se toman 10 semillas de Oryza sativa L. Y se registra el evento germin o


no germin despus de 5 das desde su implantacin. En este experimento las semillas estn
suficientemente aisladas como para asegurar respuestas independientes. Si la probabilidad de
germinacin es (para todas las semillas) igual a 0,25 calculemos:

a.- Cul es la variable aleatoria en este problema?


b.- La variable es discreta o continua? Por qu?
c.- Cul es la probabilidad que germinen al menos 3 de las 10 semillas?
d.- Calcule la media y la variancia y la desviacin estndar de la distribucin

DISTRIBUCION PROBABILISTICA DE POISSON

Es una distribucin de probabilidades usada cuando la probabilidad del xito es muy pequea
y n es muy grande.

Lleva ese nombre en honor a SIMON POISSON, quien la estudi y dio a conocer en 1837. Con
frecuencia se denomina ley de eventos improbables, lo cual significa que la probabilidad p que
suceda un evento especfico es bastante pequea. Esta es una distribucin de probabilidades
discreta.

La distribucin de Poisson se utiliza para describir el nmero de veces que se presenta un


evento durante un intervalo especifico ejemplo, la distribucin de llamadas telefnicas que
llegan a un conmutados, la demanda (necesidades) de los pacientes que requieren servicio en
una institucin de salud, las llegadas de camiones y automviles a una caseta de peaje,
nmero de accidentes registrados en una interseccin de calles. Estos ejemplos tienen en
comn un elemento: pueden ser descritos mediante una variable aleatoria discreta que toma
valores enteros (0, 1, 2, 3, etc.).

Otros ejemplos:
- El nmero de palabras mal escritas por pgina en un peridico
- El nmero de llamadas telefnicas por hora que recibe la secretaria de la Facultad
- El nmero de vehculos vendidos por da por la marca Toyota en la ciudad de Lambayeque
- El nmero de goles en un encuentro de ftbol escolar
- Nmero de huevos de un insecto por ovoposicin
- Nmero de nematodos por unidad de volumen
- Nmero de pulgones por planta

Se calcula de la siguiente manera.


P(X) = O bien P(X) =
! !

52
Mtodos Estadsticos 2014

Donde:

= es la media aritmtica del nmero de ocurrencias (xitos) en un intervalo de tiempo dado


e = es la constante 2,71828 (base de los logaritmos neperianos)
X= es el nmero de ocurrencias (xitos)
P (X) = es la probabilidad que se va a calcular para un valor dado de X

MEDIA Y VARIANCIA DE UNA DISTRIBUCION DE POISSON

np

2 =
Ejemplo:

1.- Se sabe que el nmero medio de errores por factura se estim en 0,3 .Cul es la
probabilidad de no encontrar errores en una factura seleccionada al azar? Cul es la
probabilidad de hallar exactamente un error?

2.- Si el nmero promedio de picaduras de gorgojos por semilla es 0,2 (de cada 100 semillas 20
se encuentran picadas) Cuntas de 100 semillas no tendra picaduras?, Cuntas 1
picadura? Y Cuntas 2 ms?

DISTRIBUCION PROBABILISTICA NORMAL

Es una distribucin de probabilidad continua.


La distribucin probabilstica normal y su curva normal tienen la siguiente caracterstica:
1.- La curva normal tiene la forma de una campana y presenta un solo valor mximo en el
centro. La media, mediana y moda son iguales.
Luego la mitad del rea bajo la curva se encuentra a un lado (o por encima del valor
central) y la otra mitad al otro lado (o por debajo)
2.- La distribucin probabilstica normal es simtrica con respecto a su media, si se corta la
curva normal verticalmente por este valor central, las dos mitades sern como imgenes
reflejadas en un espejo
3.- La curva normal decrece uniformemente en ambas direcciones a partir del valor central. Es
asinttica, lo cual significa que la curva se acerca cada vez ms al eje X, pero nunca llega a
tocarlo. Esto es, los puntos extremos de la curva se extienden indefinidamente en ambas
direcciones.
La distribucin normal estndar tiene media igual a 0 y desviacin estndar igual a 1.

0,5 0,5
50% 50%
%
53
Mtodos Estadsticos 2014

Valor z (o desvi normal z) es la diferencia (desviacin) entre un valor seleccionado,


denotado por X y la media poblacional , dividida entre la desviacin estndar de la
poblacin
Expresado como frmula


Z=

Donde:
Z = Nmero de desviaciones estndar que hay desde X a la media de la distribucin
X = es el valor de cualquier observacin especfica
= es la media de la distribucin
= es la desviacin estndar de la distribucin

AREAS BAJO LA CURVA NORMAL


1.- Aproximadamente el 68% del rea bajo la curva normal est dentro ms una y menos una
desviacin estndar respecto de la media. Esto se expresa as 1
2.-Aproximadamente el 95,5 % del rea bajo la curva normal est dentro ms dos y menos dos
desviaciones estndar respecto de la media. Esto se expresa as 2
3.- Aproximadamente el 99,7 % del rea bajo la curva normal est dentro ms tres y menos
tres desviaciones estndar respecto de la media. Esto se expresa as 3
Mostramos esto en el siguiente diagrama

DETERMINACION DE AREAS BAJO LA CURVA NORMAL

Se usa la tabla de Z, donde se ve que al transformar las mediciones a desvos normales z


cambia la escala. Las conversiones se muestran en la grfica siguiente. Por ejemplo + 1 se
convierte a z de + 1,00

54
Mtodos Estadsticos 2014

Estos conceptos pueden expresarse de manera algo distinta: el rea bajo la curva normal
dentro de ms y menos una desviacin estndar respecto de la media, es 0,6826. El rea
dentro de ms y menos dos desviaciones estndar respecto de la media, es de 0,9544. El rea
dentro de tres desviaciones estndar respecto de la media vale 0,9974

Ejemplo

Una mquina expendedora de gaseosa se ajusta para servir 7.00 onzas de lquido por vaso. La
desviacin estndar es de 0.10 onzas Cul es la probabilidad de que la mquina sirva:

a.- Entre 7.10 y 7.25 onzas de gaseosa


b.- 7.25 onzas ms
c.- Entre 6.8 y 7.25 onzas

QU ES UNA MUESTRA PROBABILISTICA?

MUESTRA PROBABILSTICA.- Muestra que se selecciona de modo que cada integrante


de la poblacin en estudio tengan una probabilidad conocida (no igual a cero) de ser
incluido en la muestra

Al utilizar mtodos no probabilstico no todos los integrantes tiene probabilidad de ser


Incluidos en la muestra .En estos casos los resultados pueden estar sesgados, lo que significa
que tales resultados de la muestra pueden no ser representativos de la poblacin.

METODOS DE MUESTREO PROBABILISTICO

MUESTREO ALEATORIO SIMPLE.- Muestra formulada de manera que cada integrante


dela poblacin tenga la misma probabilidad de quedar incluido

MUESTREO ALEATORIO SISTEMTICO.- Los integrantes de la poblacin se ordenan


alfabticamente, en un archivo segn la fecha en que se reciben, o por algn otro mtodo.
Se selecciona
MUESTREO al azar unESTRATIFICADO
ALEATORIO punto de inicio y despus se elija cada K-simo elemento de la
poblacin para la muestra

MUESTREO ALEATORIO ESTRATIFICADO.- Una poblacin se divide en subgrupos,


denominados estratos y se selecciona una muestra de cada estrato

MUESTREO POR CONGLOMERADOS: Se emplea a menudo para reducir el costo de


muestrear una poblacin dispersa en un rea geogrficamente grande

55
Mtodos Estadsticos 2014

CALCULO DEL TAMAO DE LA MUESTRA

Cuando se quiere determinar el tamao de una muestra se debo tomar en cuenta los
siguientes factores: el tipo de muestreo, el parmetro a estimar el error muestral admisible, la
variancia poblacional.

Parmetro.- es una medida de resumen que describe una caracterstica de toda una poblacin
Estadstico.- es una medida de resumen que se calcula para describir una caracterstica de la
muestra

ERROR DE MUESTREO.-Diferencia entre un estadstico de muestra y su parmetro de


poblacin correspondiente

NIVEL DE CONFIANZA.-probabilidad de que la estimacin efectuada se ajuste a la


realidad. Cualquier informacin que queremos recoger est distribuida segn una ley de
probabilidad

DETERMINACION DEL TAMAO DE MUESTRA PARA POBLACIONES INFINITAS (MS


DE 100 000 INDIVIDUOS)

Se pueden presentar dos situaciones:

Para caso de media muestral

2 2 22
n 2
() ()2

Donde:

n = nmero de elementos que debe tener la muestra


= Riesgo o nivel de significacin
Z = Puntuacin de acuerdo a
= Promedio muestral
= Promedio de poblacin
= e = error
Ejemplo
El gerente de personal de una empresa grande desea estimar, con una confianza del 95%, el
tiempo promedio de capacitacin que recibieron los empleados de la compaa y desea que el
error de estimacin no rebase la 0,5 media hora (30 minutos) :Con base en resultados de
estudios anteriores , estima que la desviacin estndar del tiempo de capacitacin de los
empleados es de 3 horas .Cual ser el tamao de muestra para el estudio.

2 2 22 1,962 32
n 2
()2
= 0,52
= 138,30
()

56
Mtodos Estadsticos 2014

Cuando se incluye el factor de correccin finita

2 2
n=
2 ( 1)+ 2 2

Ejemplo

Un gerente de personal de una empresa que tiene 3000 empleados desea estimar el tiempo
promedio que les lleva a sus trabajadores trasladarse entre sus casas y la empresa. Desea
construir un intervalo de confianza de 95% y que la estimacin est dentro de un minuto
alrededor de la media verdadera: a travs de una muestra piloto se sabe que la varianza de los
tiempos es de 30 minutos. Determine el tamao de la muestra que se requiere para la
estimacin.

2 2 2
3000(1,96) (30)
n= = 2 = 111,02
2 ( 1)+ 2 2 1 (3000 1)+(1,96)2 (30)

Si deseamos estimar una proporcin de una poblacin a partir de una muestra, puede
presentarse dos situaciones

a.- Para caso de estimar una proporcin de sujetos que posee una caracterstica a travs de
estudios previos
2
n
()2

Donde:

n = nmero de elementos que debe tener la muestra


= Riesgo o nivel de significacin
Z = Puntuacin de acuerdo a
P = porcentaje estudiado
q = 100 - p
p P =e= error permitido
Ejemplo:

Cuntos sujetos debe tener una muestra si se desea estimar la proporcin de sujetos que
opinan de una determinada manera al nivel de confianza del 99% y un error de estimacin del
5% sabiendo que p es el 25%

z2 pq 2,962 (25)(75)
n
(pP)2
= = 657,12 = 658
52

b.- Que desconozcamos la proporcin de sujetos.-En este caso se asume p= 0,50 y q= 0,50

EJEMPLO:

57
Mtodos Estadsticos 2014

Qu nmero de sujetos debe tener una muestra si se desea estimar la proporcin de sujetos
que posee una determinada caracterstica al nivel de confianza del 99,7% y error admitido del
2%

z2 pq 2,962 (50)(50)
n = = 5476
(pP)2 22

DETERMINACION DEL TAMAO DE MUESTRA PARA POBLACIONES FINITAS (MENOS


DE 100 000 INDIVIDUOS)

Se pueden presentar dos situaciones

2
n = (
)2 ( 1) + 2

Donde
N = Es el tamao de la poblacin
= Riesgo o nivel de significancia
Z = Puntuacin correspondiente a
P= Porcentaje estudiado
Q= 100 P
(p P) =e = Error permitido

En el caso de que la investigacin desee estimar una media podemos utilizar la


siguiente frmula

NZ2 2
n
Z2 2 + e2 (N 1)

.Ejemplo

Se desea calcular el nmero de sujetos necesarios para realizar una investigacin en una
provincia en la que 60 000 alumnos terminaron tercero de secundaria. Se establece un nivel de
confianza del 95% y el margen de error es del 3% Estudios anteriores indican que el 50% de los
alumnos del tercero de secundaria optan por la Universidad

2 4 50 50 60000
n (
)2 ( 1) + 2 9(600001)+4 50 50

n= 1090,93 =1091
DISTRIBUCION MUESTRAL DE LA MEDIA

Distribucin de probabilidad que consta de todas las posibles medias de las muestran de
un determinado tamao demuestra de la poblacin y la probabilidad de ocurrencia
Ejemplo
El asociada
tiempo de con cada media
servicio de los muestral
empleados a nivel de ejecutivo de la empresa Per 21 es:

58
Mtodos Estadsticos 2014

Nombre Aos de
servicio
JUAN 20
DIANA 22
ROSA, 26
EDUARDO 24
HUGO 28

a.-Formar muestras tamao 2


b.-Organice las medias en una distribucin de muestras
c.- Compare la media de la poblacin y el valor medio de las medias muestrales

Solucin:
Aos de Media Aos de Media
servicio muestral servicio muestral
(n = 2) (n = 2)
20, 22 21 22, 24 23
20, 26 23 22, 28 25
20, 24 22 26, 24 25
20, 28 24 26, 28 27
22, 26 24 24, 28 26

Media f Probabilidad
21 1 0,10
22 1 0,10
23 2 0,20
24 2 0,20
25 2 0,20
26 1 0,10
27 1 0,10

=4

= [()]

= 21 X 0,10+ 22 X 0.10+..+27 X0,10 = 24

Teorema:

Si se extraen varias muestras de tamao n de un universo, con una distribucin cualquiera,


entonces se cumple que:

=

= Para una poblacin infinita

59
Mtodos Estadsticos 2014


= X Para una poblacin finita
1
= Media de la distribucin muestral
= Desviacin estndar de la media muestral o error estndar de
la media


= Factor de correccin finita
1

TEOREMA DEL LIMITE CENTRAL

Se extraen varias muestras de tamao n de cualquier universo, con media y desviacin


estndar ; entonces la distribucin de las medias muestrales se acercar a una de tipo normal


con media y desviacin estndar , si las muestras son grandes (n 30). La variable

estandarizada correspondiente ser:

Ejemplo:

Un fabricante declara que la duracin de las bujas que l fabrica sigue una distribucin normal
con media de 36 000 Km y una desviacin estndar de 4 000 Km Para una muestra aleatoria de
diecisis bujas se obtuvo una duracin media de 34 500 Km. Si la afirmacin del fabricante es
correcta, Cul es la probabilidad de obtener una media muestral tan pequea como esta o
menor?

DISTRIBUCION EN EL MUESTREO DE UNA PROPORCION

Es una distribucin probabilstica que consta de todos los valores posibles que pueda tomar
de un tamao de muestra dado, junto a su probabilidad de ocurrencia.

MEDIA Y DESVIACION ESTANDAR DE PARA UNA POBLACION INFINITA

Supongamos que la proporcin de la proporcin de la poblacin es p y se obtienen muestras


aleatorias de tamao n entonces:

60
Mtodos Estadsticos 2014

MEDIA Y DESVIACION ESTANDAR DE PARA UNA POBLACION FINITA


=
1


Recibe el nombre factor de correccin para una poblacin finita
1

TEOREMA DEL LIMITE CENTRAL, EN LA PROPORCION

Supongamos que el tamao de la muestra es grande n30 y el tamao de la poblacin es


grande, entonces


Z= =




Ejemplo

Se ha estimado que el 43% de los Ingenieros Agrnomos consideran que es muy importante
que se imparta el curso de tica en Agronoma para inculcar valores morales a los estudiantes.
Halle la probabilidad de que ms de la mitad de los 80 Ingenieros Agrnomos de una muestra
opinen de este modo.

ESTIMACIN PUNTUAL Y POR INTERVALO

Toda inferencia que se haga sobre una poblacin tendr necesariamente, que basarse en
estadsticos muestrales, esto es, en funciones de la informacin muestral. La eleccin
apropiada de estos estadsticos depender de cul sea el parmetro de inters de la poblacin.
El verdadero parmetro ser desconocido, y un objetivo ser estimar su valor.

Para estudiar la estimacin de un parmetro desconocido, debe considerarse dos


posibilidades: Estimacin puntual y estimacin por intervalo.

PARMETROS Y ESTADSTICOS

La media y la desviacin estndar de una variable aleatoria poblacional X son conocidos


como parmetros y la media y la desviacin estndar de una muestra son conocidos como
estadsticos. En general a cualquier caracterstica numrica de una poblacin se le conoce
como parmetro y a cualquier cantidad calculada de una muestra aleatoria se le conoce como
estadstico. Los estadsticos se usan para estimar parmetros.

ESTIMACIN PUNTUAL

Es el valor calculado, a partir de la informacin de muestreo, que se emplea para estimar el


parmetro de poblacin.

61
Mtodos Estadsticos 2014

El estadstico muestral usado para estimar un parmetro de la poblacin se llama estimador, y

Un valor observado especfico se denomina estimacin.

Cuando la estimacin de un parmetro de la poblacin est dada solamente por un nmero, se


denomina estimacin puntual. Por ejemplo la media muestral es un estimador de la media
poblacional y un valor simple de es un estimacin puntual.

Se dice que:

es el estimador puntual de la media poblacional


s es el estimador puntual de la desviacin estndar poblacional
= es el estimador puntual de la proporcin poblacional p.

en una determinada muestra se les llama


Luego a los valores numricos obtenidos para , ,
estimados puntuales del parmetro.

Ejemplo:

A continuacin se muestra el salario anual de 10 trabajadores de una fbrica y los datos si


concluyeron con un programa de adiestramiento general:

Salario Programa de
anual ($) adiestramiento
Gerencial?
9 094,3 Si
3 263,9 Si
9 643,5 Si
9 984,9 Si
7 621,6 No
5924,0 Si
9 092,3 No
1 404,4 Si
3 957,7 No
5 109,7 No

= = 6 509.63

= 9.09
S 3.01
0.4

Luego para una muestra de 10 trabajadores de una fbrica, el estimado puntual de es de $ 6


509.63 nuevos soles, el de es de 3.01 y el de p es 0,4

PROPIEDADES DE LOS ESTIMADORES PUNTUALES

Son tres: Insesgo, eficiencia, consistencia

62
Mtodos Estadsticos 2014

INSESGO:

Si el valor esperado del estadstico de muestra es igual al parmetro poblacional que se estima,
se dice que este estadstico es un estimador insesgado del parmetro poblacional.

EFICIENCIA.

Suponga que se puede usar una muestra aleatoria simple de n elementos para obtener dos
estimadores puntuales del mismo parmetro poblacional. En este caso, preferiramos usar el
estimador puntual con la menor desviacin estndar, porque tiende a proporcionar estimados
ms cercanos al parmetro poblacional. Se dice que el estimador puntual con la menor
desviacin estndar tiene una mayor eficiencia relativa que el otro.

CONSISTENCIA.

En trminos generales un estimador puntual es consistente si sus valores tienden a acercarse


al parmetro de la poblacin conforme se incrementa el tamao de la muestra. En otras
palabras, un tamao grande de muestra tiende a proporcionar un mejor estimador puntual
que un tamao pequeo

ESTIMACIN POR INTERVALO DE CONFIANZA

Un intervalo de confianza, es una gama de valores obtenidos a partir de datos de muestreo,


de modo que el parmetro ocurre dentro de esta variedad de valores con una probabilidad
pre establecida llamada nivel de confianza

INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIN NORMAL:


VARIANZA POBLACIONAL CONOCIDA.

Supongamos que tenemos una muestra aleatoria de n observaciones procedentes de una


poblacin con distribucin normal con una media y una varianza . Si es conocida y el
valor observado de la media muestral es , entonces el intervalo de confianza del 100 (1-
para la media poblacional, viene dada por:

{ - Z + Z } = 1-

63
Mtodos Estadsticos 2014

ERROR MUESTRAL

Es el valor absoluto de la diferencia entre un estimador puntual insesgado y el parmetro


poblacional que estima se llama error muestral.

Para el caso en el que la media de una muestra estima a una media poblacional, el error
muestral es:
E=

Ejemplo.-

1.- Un proceso de envase de bolsas de azcar refinada. El peso del contenido de estas bolsas
tiene una distribucin normal con desviacin estndar de 15 gramos. Los contenidos de una
muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos. Calcule un intervalo
de confianza del 95% para el verdadero peso medio de todas las bolsas de azcar
producidas por el proceso.


{ + } = 1

{100 1,96 100 +1,96 } =0,95

{94.12
2.- Se desea establecer si la aplicacin de fertilizantes modifica el rendimiento promedio de
una variedad de trigo. Se conoce que la desviacin estndar es = 450Kg. A los fines de
evaluar el efecto de la fertilizacin, se realiz un ensayo que consisti en elegir 20
hectreas (una en cada chacra de la regin), en forma aleatoria a las que se les aplic
fertilizante, evaluando luego su rendimiento a cosecha. La produccin obtenida fue =
2650 Kg. Encontrar un intervalo de confianza al 90% para el verdadero rendimiento
promedio.

64
Mtodos Estadsticos 2014

INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIN CON VARIANZA


DESCONOCIDA Y TAMAO DE MUESTRA GRANDE

Supongamos que tenemos una muestra de n observaciones procedentes de una distribucin


con media . Sean y s la media y la desviacin estndar de la muestra observada,
respectivamente, entonces si n es grande, n 30 una buena aproximacin de un intervalo de
confianza del 100 (1 ) % para la media dada por:

{ z +z } = 1

Ejemplo.-

Se extrajo una muestra aleatoria de 172 estudiantes de Agronoma y se les pidi que evaluasen
unas determinadas condiciones de trabajo en una escala de 1 (no importante) a 5
(extremadamente importante). La seguridad de trabajo recibi una calificacin media de
4.38 con una desviacin estndar muestral de 0.70. Calcule un intervalo de confianza del 99%
para la media poblacional

{ z +z } = 1

{4.38 2.576 4.38 + 2.576 } = 0.95

{4.2427 } = 0,99

INTERVALOS DE CONFIANZA PARA UNA PROPORCIN DE LA POBLACIN

Una estimacin puntual para una proporcin poblacional se obtiene dividiendo el nmero de
xitos de una muestra entre el nmero total muestreado.

Mientras que para encontrar los intervalos de confianza debemos tener en cuenta lo
siguiente:

{ z + } = 1

Como p no se conoce

(1 )
=

65
Mtodos Estadsticos 2014

Donde:
Valor asignado por el nivel de confianza
= = es la proporcin muestral
n = es el tamao de la muestra
Ejemplo.-

En una muestra aleatoria de 900 votantes, el 55 % prefiere al candidato demcrata de


presidente. Halle un intervalo de confianza aproximado para la proporcin de todos los
votantes que prefieren al candidato demcrata con un nivel de confianza del 90%

{ + } = 1-

0.0165

{ 1.645(0.0165) }=1
{0.5229 }=1
Ejemplo.-

Se realiz una investigacin de mercado para estimar la proporcin de amas de casa que
puedan reconocer la marca de un limpiador con base en la forma y el color del recipiente. De
1400 personas 420 pudieron reconocer (identificar) la marca del producto. Si se utiliza el grado
de confianza del 99% Cul sern los intervalos de confianza

{ + } =1 -

0,30

66
Mtodos Estadsticos 2014

0.0122

{0,30 2.576(0.0122) }=1


{0.2686 }=1
INTERVALOS DE CONFIANZA USANDO LA DISTRIBUCIN t

Cuando la poblacin bajo estudio tiene una distribucin normal, o aproximadamente normal,
pero no se conoce la desviacin estndar de la poblacin, y el tamao de la muestra es menor
de 30, no podemos usar la distribucin normal para determinar intervalos de confianza para la
media de la poblacin. En este caso usaremos la distribucin t se Student.

Recordemos que la distribucin de t de Student se utiliza cuando se cumple con las siguientes
condiciones.

1.- La muestra es pequea


2.- desconocida
3.- La poblacin es normal.

CARACTERSTICAS DE LA DISTRIBUCIN T DE STUDENT


La distribucin t de Student fue desarrollada en 1908 por William S. Gossett, un maestro
cervecero de la Guinness Brewey de Irlanda, quien public su investigacin con el seudnimo
de Student. Gossett desarroll una nueva teora estadstica sobre muestras pequeas al
trabajar con muestras pequeas y en experimentos donde intervenan temperaturas en esta
cerveza. A l le interesaba el comportamiento exacto de la expresin:


t=

Cuando S deba usarse como estimador de . En particular le preocupaba la discrepancia entre


sy cuando se calculaba S a partir de una muestra pequea.

Al igual que la distribucin normal estandarizada, la distribucin t tiene forma de campaa y es


simtrica alrededor de la media cero, pero es ms achatada que la distribucin normal
estandarizada debido a su mayor dispersin.

LA DISTRIBUCIN t TIENE LAS SIGUIENTES CARACTERSTICAS:

1.- Al igual que la distribucin Z, la distribucin t es una distribucin de variable continua.


2.- Es acampanada y simtrica
3.- No hay una sola distribucin t, sino una familia de distribuciones t.
4.- La distribucin t es ms extendida y menos aguda en el centro, que la distribucin Z. Sin
embargo a medida que n aumenta la curva de la distribucin t se aproxima a la
distribucin normal estandarizada.

67
Mtodos Estadsticos 2014

El intervalo de confianza para la media poblacional usando la distribucin t, est dado por:

{ S + S }=1
{ + }=1

Ejemplo.-

Una tienda est interesada en conocer los gastos en prendas de vestir de los estudiantes
universitarios en el primer mes del ciclo acadmico. La media y la desviacin estndar de una
muestra aleatoria de nueve alumnos fueron de $ 15 782 y $ 3889, respectivamente.
Suponiendo que la poblacin sigue una distribucin normal, calcule el intervalo de confianza
del 95% para el gasto medio poblacional
{ S + S }=1

{ + }=1

En las tablas 2.3060

{157822.3060 +2.3060 }=1

{12792.65554 }=1

INTERVALO DE CONFIANZA PARA LA VARIANZA DE UNA POBLACIN NORMAL.

Cuando una variable aleatoria sigue una distribucin de Chi cuadrado con (n-1). Este resultado
es clave para construir un intervalo de confianza para la varianza poblacional cuando se toman
muestras de una poblacin

Supongamos que se dispone de una muestra aleatoria de n observaciones procedentes de una


poblacin con distribucin normal con varianza . Si la varianza muestral observada es ,

68
Mtodos Estadsticos 2014

entonces el intervalo de confianza del 100(1- para la varianza poblacional viene dado por

( 1) 2 2
( 1) 2
2
2 ( 1) 2 ( 1) 1 2

Ejemplo

Un fabricante quiere estimar la variabilidad de los niveles de impurezas de los envos de


materia prima de un determinado proveedor. Extrae para ello una muestra de quince envos y
comprueba que la desviacin estndar muestral en la concentracin de los niveles de
impurezas es de 2.36%. Supngase que la poblacin es normal.

a.- Calcule el intervalo de confianza del 95% para la varianza poblacional.


b.- Sin hacer los clculos, determine si un intervalo de confianza del 99% tendra una longitud
mayor, menor o igual a la del intervalo calculado anteriormente
Solucin

a.- n 15 g.l. 14

0.05

( 1) 2 2
( 1) 2

2 ( 1) 2 2 ( 1) 1 2

2.99 13.85

Por lo tanto, diremos que el intervalo de confianza del 95% para la variabilidad de impurezas
discurre entre 2.99% y 13.85%
b.- El intervalo de confianza del 99% para la varianza poblacional ser ms ancho

ESTIMACIN POR INTERVALO PARA LA DIFERENCIA ENTRE DOS MEDIAS


POBLACIONALES

Se puede hacer comparaciones como:

69
Mtodos Estadsticos 2014

El promedio de dimetros de tallos de plantas tratadas dos tipos diferentes de nutrientes.

Las producciones promedio en una planta qumica que usa materias primas suministradas por
dos proveedores diferentes.

Cuando muestras aleatorias independientes de tamao n1 y n2 observaciones han sido


seleccionadas de entre poblaciones con medias 1 y 2 y variancias 12 y 22 respectivamente,
la prueba estadstica ser:

(x1 x2 ) (1 2 )
Z=
2 2
1+ 2
1 2

Pero si n1 y n2 son grandes (mayores de 30) y 12 , 22 no se conocen, el estimador del


estadstico ser:

( ) ( )
Z=

+

El intervalo de confianza en este caso ser:


{ ( ) z + ( ) + z + } =1-

En caso de que las muestras sean grandes (mayores de 30) y 12 , 22 no se conocen, el


intervalo se podr calcular de la siguiente manera:


{ ( ) z + ( )+ z + } =1-

Ejemplo:

Las resistencia al desgaste de dos tipos de llantas para automvil se compararon en muestras
de pruebas de camino de 1 = 2 = 100 llantas para cada tipo. El nmero de millas hasta el
completo desgaste se defini como una cantidad especfica de desgaste de las llantas. Los
resultados de la prueba se muestran a continuacin

LLANTA 1 LLANTA 2
1 = 26400 2 = 25100
12 = 144000 22 = 1960000

70
Mtodos Estadsticos 2014

Estime (1 - 2), la diferencia en la media de millas hasta el completo desgaste, usando un


intervalo de confianza del 99%. Hay diferencia en el promedio de calidad de desgaste para los
dos tipos de llantas?

Solucin:

La estimacin puntual de (1 2 )
(x1 x2 ) = 26 400 25100 = 1300 millas
12 22
El error estndar = +
1 2

12 12
Que se puede estimar como = +
1 2

1440 000 1960 000


= 100
+ 100
= 184,4 millas

El intervalo de confianza se calcula como:

2 22 2 22
{ (x1 x2 ) z 1 + 2
(x1 x2 ) + z 1 + 2
} =1-{
1 1

1440 000 1960 000 1440 000 1960 000


1300-2,58 + 1300+2,58 + }= 0,99
100 100 100 100

{1300 2,58(184,4) 1300+2,58(184,4)} = 0,99


{824,2 1775,8} = 0,99

ESTIMACIN POR INTERVALO DE LA DIFERENCIA ENTRE DOS PROPORCIONES


POBLACIONALES

Se pueden hacer comparaciones como:

Los porcentajes de germinacin se semillas tratadas y semillas no tratadas con un fungicida


La proporcin de votantes mujeres y la proporcin de votantes hombres que estn a favor de
una enmienda de igualdad de derechos
Suponga que las muestras aleatorias independientes de las observaciones 1 2 han sido
seleccionadas de poblaciones con parmetros 1 2 , respectivamente La distribucin
muestral de la diferencia entre proporciones muestrales:

2
( 1 2) = (1 2
)
1

La media muestral de ( 1 - 2) es p1 p2

1 1 2 2
El error estndar es= +
1 2

71
Mtodos Estadsticos 2014

1 1 2 2
Que se estima como = +
1 2

La estimacin ser:










{(1 2 ) Z 1 1 + 2 2 < p1 p2 < (1 2 ) + Z 1 1 + 2 2} = 1
1 2 1 2
:

Ejemplo:
La propuesta de un bono para la construccin de una escuela ser enviada a los votantes en la
siguiente eleccin municipal. Una parte importante del dinero derivado de esta emisin de
bonos se emplear en construir escuelas en una zona de rpido desarrollo de la ciudad y lo
dems se usar para renovar y actualizar los edificios escolares del resto de sta. Para evaluar
la viabilidad de la propuesta de un bono, a una muestra aleatoria de 1 = 50 residentes de la
zona de rpido desarrollo y 2 = 100 de las otras partes de la ciudad, se les pregunt si
piensan votar por la propuesta. Los resultados se dan a continuacin:

Seccin en Resto de la ciudad


desarrollo
Tamao muestral 50 100
Nmero a favor de la propuesta 38 65
Proporcin a favor de la propuesta 0.76 0.65

Estime la diferencia en las proporciones verdaderas a favor de la propuesta del bono con un
99% de intervalo de confianza.

( 1 2) = 0,76 0,65 = 0,11






2 2 (0.76)(0,24) (0,65)(0,35)
1 1
1
+ 2
= 50
+ 100
= 0,0770



11 22
{( 2 ) Z 1 1
1
1
+ 2 2
2
< 1 2 < (
1
2 ) + Z
1
+
2
}= 1

{0,11 (2,58)(0,0770) < 1 2 < 0,11 + (2,58)(0,0770) } = 0,99


{ 0,089 < 1 2 < 0,309 } = 0,99

72

Potrebbero piacerti anche