Sei sulla pagina 1di 112

Estadística Matemática

Daisy Espallargas Ibarra

Selección de Guías de Estudio: Contabilidad y


Finanzas. ISBN 978-959-16-1339-4
2

Introducción.
Es aspiración de los autores, que estos apuntes para el estudio de Estadística Matemática sea de utilidad tanto
para los estudiantes de curso para trabajadores, como para los de enseñanza libre, es por ello qué este libro
estará estructurada de tal forma que para uno, u otros estudiantes les sea un valioso instrumento de trabajo.
El objeto de estudio de esta asignatura es dotar al alumno de algunos elementos que le servirán para trabajar
con conjuntos de datos para describir situaciones de interés, así mismo se apropiarán de elementos básicos de
la teoría de las probabilidades y la iniciación en el estudio de los fenómenos y experimentos aleatorios
estableciendo el vínculo entre los conocimientos y habilidades de los contenidos de la Estadística Descriptiva y
la Teoría de las probabilidades. Además constituye base para el estudio de la Estadística Matemática II,
conjuntamente con el Análisis Matemático.
Debemos señalar que esta asignatura es eminentemente práctica sin embargo, el alumno necesita del
conocimiento de la teoría que la sustenta para la correcta aplicación de las fórmulas de cálculo y los modelos,
que simplifican la realidad existente.´

OBJETIVOS DE LA ASIGNATURA.
Lograr que el estudiante sea capaz de:
1.- Construir tablas de frecuencias. Construir el Histograma y Polígono de frecuencias. Calcular e interpretar las
fundamentales medidas de posición y dispersión. Aplicar e interpretar los resultados obtenidos en cualquier
paquete de programa estadístico.
2.- Aplicar e interpretar los fundamentos de la teoría de probabilidades en la solución de problemas. Calcular la
probabilidad de ocurrencia de un suceso utilizando la definición clásica y la estadística.
Aplicar las propiedades de la probabilidad axiomática, la probabilidad condicional e independencia.
3.- Conocer los conceptos de Variable Aleatoria discreta y continua y distribución teórica de probabilidad.
Identificar y caracterizar las distribuciones probabilísticas: Binomial, Poisson, Normal, T’Student y Chi Cuadrado
y F de Fisher Calcular probabilidades haciendo uso de las tablas correspondientes.
4.- Saber los conceptos básicos de Población. Muestra, Parámetro y Estimador. Conocer el Muestreo Aleatorio
Simple. Obtener muestras aleatorias simples mediante la tabla de números aleatorios. Aplicar la distribución
muestral de la media, la varianza y de la proporción en la estimación puntual y por intervalos de μ, σ2 , P, así
como también la obtención de una medida probabilística del error y del tamaño de la muestra requerido para la
estimación de μ, y P
5.- Identificar el tipo de prueba: de media con varianza conocida y desconocida, de proporciones, de varianza,
de diferencia de media con varianza conocida y desconocida. Plantear las Hipótesis nula y alternativa. Conocer
el error Tipo I y II y calcularlo para las pruebas de media ) con varianza conocida y desconocida).
Identificar las pruebas no paramétricas para probar normalidad a través de su cálculo por Jarque-Bera tomando
decisiones a partir de salidas del programa de cómputo Eview. Saber identificar y ejecutar la prueba Chi-
Cuadrado no paramétrica para probar supuesto de independencia.
7.- Conocer los elementos básicos del análisis de varianza. Dominar el análisis estadístico para la prueba de
igualdad de tres o más medias. Conocer los supuestos del análisis de varianza.
.
PLAN TEMATICO DE LA ASIGNATURA
Tema I Métodos Descriptivos
Tema II Probabilidades
Tema III Distribuciones Teóricas de Probabilidad
Tema IV Teoría de la Estimación
Tema V Prueba de Hipótesis
Tema VI Análisis de Varianza

La Bibliografía básica de la asignatura es la siguiente:

Estadística: Colectivo de Autores, Con Dr. Guerra como autor principal

Teoría y Problemas de Spiegel and Murray

Estadística I, II y III del Lic. Aristides Calero Vinelo


3
Laboratorios de Estadística Matemática I y II (Colectivo de Autores Dpto. Estadística
Tablas Estadísticas. Selección realizada por el Dpto. de Estadística

Guía de Estadística Matemática para la Municipalización Autora MSc. Daisy Espallargas Ibarra

ORIENTACIONES PARA LA AUTOPREPARACION.


Tema I Métodos Descriptivos

OBJETIVO DEL TEMA:

Que el alumno sea capaz de:


- Describir el comportamiento de datos estadísticos, apoyándose en tablas de frecuencias, univariadas, en
gráficos y en el cálculo de los principales estadísticos.

- Utilizar e interpretar los resultados obtenidos en la computación.

AUTOPREPARACION DEL TEMA I.

El alumno debe conocer que la Estadística se utiliza, en algunas ocasiones, con fines puramente descriptivos,
pues una vez recogido un cierto conjunto de datos, a veces solo interesa conocer las propiedades del fenómeno
que se investiga.

Y en ese caso se sustituye o reduce el conjunto de datos obtenidos por un pequeño número de valores
descriptivos, como por ejemplo: la media, la mediana, la moda, la media geométrica, la varianza, la desviación
típica etc. Estas medidas descriptivas serán capaces de brindar las principales propiedades de los datos
observados.

Esta parte de la Estadística constituye sólo una fase preliminar y a la vez más elemental, que el objetivo
fundamental de la Teoría estadística pero no por ello menos importante y útil en un gran número de situaciones.

LOS ASPECTOS FUNDAMENTALES DE ESTE TEMA SON:

¾ Distinguir entre una observación discreta y continua.

¾ Saber construir una tabla de frecuencia para datos sin agrupar

¾ Conocer que es una clase, límite de clase, tamaño del intervalo marca de clase. Y construir una tabla de
frecuencia para datos agrupados.

¾ Saber calcular tanto para datos sin agrupar como agrupados la media, la mediana, la moda, la varianza,
la desviación típica y el coeficiente de variación

El estudio del tema lo debe hacer por el libro de texto: Estadística capítulo 1 y 2 donde está contenido gran
parte del tema, en las páginas comprendidas de la 18 a la 152, y donde podrá encontrar ejercicios resueltos y
propuestos.

Se debe señalar que en el libro de texto hay notaciones que no son las más adecuadas así como algunas
fórmulas, esto se tratará de resolver haciéndole una explicación detallada de ese aspecto.
4
TEMA I
Tema I. Introducción a los métodos estadísticos. Conceptos básicos. Distribución de frecuencias
Univariada (datos no agrupados). Propiedades de las frecuencias absolutas, relativas y acumuladas.
Observación discreta y continua. Distribución de frecuencia Univariada. (Datos agrupados). Clases.
Límites de clases. Tamaño del intervalo de clase. Marca de clases. Gráficos: Histogramas y Polígonos
de Frecuencias.
Bibliografía. Estadística. Cap. I Página 9 y Spiegel Cap. 1 pag. 1/3
La Estadística se define como: Principios y métodos que se han desarrollado para analizar datos numéricos a
través de las probabilidades.

La estadística (con minúscula) se utiliza para denominar cualquier colección sistemática de datos, por ejemplo: -
cifra de producción de una empresa. - Pasajeros transportados durante un período. - Enfermos recuperados con
ciertos medicamentos

Las estadísticas son tan antiguas como las Sociedades humanas, pero la Estadística, como ciencia comienza a
surgir en el siglo XVI paralelo al desarrollo de las probabilidades. Sus métodos se clasifican en:
- Métodos Descriptivos.
- Inferencia estadística.

Métodos Descriptivos: Describen el comportamiento de los datos estadísticos, se ocupan de: la recolección,
organización, tabulación, presentación y reducción de la información.

Inferencia: Estudia y concluye sobre un fenómeno basado en el análisis e investigación de una parte del mismo.
CONSTITUYE UNA PODEROSA HERRAMIENTA PARA LA INVESTIGACION CIENTIFICA.

CONCEPTOS BASICOS.
Población: Colección de individuos o elementos que presentan el objeto de interés (seres vivos o inanimados).

Censo: Observación y estudio de todos los elementos que componen la población.

Muestra: Cualquier subconjunto de la población.

Muestreo: Procedimiento mediante el cuál se extrae una muestra.

Característica: Es el signo o detalle que interesa observar en la población.

Las características pueden clasificarse en:


Cualitativas: También llamadas atributos, y se refieren a cualidades tales como: el color del pelo, de los ojos, el
estado civil, nivel escolaridad etc.
Cuantitativos: Se refiere a cantidades tales como estatura, peso, ingresos, números de hijos etc.

La magnitud de las características cuantitativas se miden como variables, denotándose, cuando están en su
forma original u organizadas por X1, X2, ....Xn .
Se distinguen dos tipos de datos cuantitativos o variables:
VARIABLES DISCRETAS: Son valores, determinados, definidos y que generalmente representan a
observaciones susceptibles de conteo y son valores enteros.

VARIABLES CONTINUAS: Las que generalmente representan a observaciones susceptibles de medición y por
tanto pueden tomar cualquier valor en un cierto intervalo de los números reales.

ESTADISTICA DESCRIPTIVA.

Ya se había dicho que los métodos descriptivos se ocupan de: la recolección, organización, tabulación,
presentación y reducción de la información.
5
Para poder distinguir posteriormente, el tratamiento que se le da a los datos, se dirá que se puede tener la
información de la siguiente forma.

-Recolección simple o no organizada: es decir listado de los datos, presentación en su forma primaria.

_Organizados: Ordenamiento en tablas: que a su vez pueden estar, no agrupados: es decir se leen
directamente los valores observados.
O agrupados: esto es se construyen intervalos para resumir la información observada.

Datos Organizados en tablas pero no agrupados.


Generalmente este caso se utiliza cuando se tiene una larga lista de valores y sería casi imposible a través de
ella describir la información.
¿Qué quiere decir Organizados?
Cuando los datos se presentan en forma de tablas. Denominadas estas como tablas de frecuencias o
Distribución de frecuencias.
Esto es, se colocan los datos en columnas que representan:
-los distintos valores de la variable.
-las frecuencias (las veces) conque ocurren sus valores.

¿Por qué se dice que los datos están organizados, pero no agrupados?
Porque en esta tabla, se ponen todos y cada uno de los valores que toma la variable.

EJEMPLO #1 Se tiene los datos recopilados acerca de la variable x: número de hermanos que tienen los
estudiantes del grupo 4210

0 1 2 2 1
3 2 1 4 2 DATOS EN SU FORMA SIMPLE O PRIMARIA
4 3 2 0 0 (SIN ORGANIZAR)
2 2 3 0 3

¿Qué tipo de variable es esta? ; Discreta.

Generalmente los datos que se organizan en tablas pero no se agrupan, son las variables discretas, sobre todo
con fines teóricos, por su propia características, (Toma valores determinados, definidos, susceptible de conteo y
que por tanto generalmente son valores enteros).

TABLA DE FRECUENCIA O DISTRIBUCION DE FRECUENCIAS.

# de # de estudiantes
Hermanos Con esas características
Xi tarjado ni fi Ni Fi
0 //// 4 0.20 4 0.20
1 /// 3 0.15 7 0.35
2 //// /// 7 0.35 14 0.70
3 //// 4 0.20 18 0.90
4 // 2 0.10 20 1.00
Se definirá entonces:
ni = frecuencia absoluta: # de veces que se repite el í-ésimo valor de la variable.
k = # de valores diferentes
k
∑ ni = n : # total elementos de la muestra
i=1

Interpretación: "ni" indica las veces que se repite el valor de la variable, así:
n1 = 4 indica que hay 4 alumnos del grupo que no tienen hermanos.
n3 = 7 indica que hay 7 estudiantes del grupo que tienen 2 hermanos.
6
Este tipo de tabla se puede construir no solo con respecto a las frecuencias absolutas, sino también respecto a
otros tipos de frecuencias
fi = frecuencia relativa : proporción de veces que se repite el í-esimo valor de la variable, donde fi = ni/n y
donde ∑ fi = 1

EL LIBRO DE TEXTO DESIGNA ESTA VARIABLE POR hi, SIN EMBARGO EN CASI TODO LOS LIBROS DE
ESTADISTICA APARECE POR fi .

Interpretación de las frecuencias relativas: indican las veces que se repite el valor de la variable pero en
porciento
f4 = 0.20 indica que el 20% de los estudiantes tienen 3 hermanos
f5= 0.10 indica que el 10% de los estudiantes tienen 4 hermanos

Frecuencias Acumuladas:

Ni = frecuencia absoluta acumulada, acumula hasta el í-esimo valor de la variable y donde N1 = n1, N2 = n1 +
n2, N3 = n1 + n2 + n3 y así sucesivamente hasta Nk = n. Así se interpreta como el número de observaciones
menores o iguales al í-esimo valor de la variable.

Fi = frecuencia relativa acumulada: es el número de observaciones menores o iguales al í-esimo valor de la


variable pero en forma relativa. Así F1 = f1, F2 = f1 + f2, F3 = f1 + f2 + f3, y así sucesivamente hasta Fk = 1

Interpretación:
N2 = 7 indica que hay 7 estudiantes que tienen HASTA 1 hermano (como se observa, va acumulando)
N3 = 18 indica que hay 18 estudiantes que tienen HASTA 3 hermanos

H2 = 0.35 indica que el 35% de los estudiantes tiene HASTA 1 hermano.


H3 = 0.70 indica que el 70% de los estudiantes tienen HASTA 2 hermanos.

Observe que las frecuencias son siempre números no negativos y pueden considerarse como propiedades las
siguientes proposiciones:
1.- ni ≥ 0 , Ni ≥ 0
k
2.- ∑ni = n
i=1

k
3.- ∑ fi = 1
i=1

4.- 0 ≤ fi ≤ 1; 0 ≤ Fi ≤ 1

5.- Nk = n

6.- Fk = 1

7.- N1 = n1

8.- F1 = f1

9.- n1 = N1 < N2 < N3 ...< Nm

10.-f1 = F1 < F2 < F2 ...< Fm

Representación gráfica: ni --- Diagrama de frecuencias, pueden estudiarlo por el texto página 22 (para
frecuencias absolutas o relativas).
Representación gráfica: Ni --- gráfico acumulativo de frecuencias pueden estudiarlo por el texto página.23
(para frecuencias absolutas o relativas acumuladas).
7
Pueden hacer los ejercicios 2/4 del Laboratorio de Estadística I.
Recuerde lo que se dijo anteriormente en relación con la forma de presentación de los datos y la naturaleza de
las variables.
No organizados: Datos simples

No agrupados
Organizados
Agrupados

Se verá ahora los datos agrupados, es decir con información de variables cuantitativas llevadas a intervalos de
clases.

Se les denomina intervalos de clases a: agrupaciones parciales del recorrido de la variable. Generalmente se
agrupan las observaciones correspondientes a variables continuas, ya que estas son aquellas que pueden
tomar cualquier valor en un intervalo, y prácticamente es imposible considerar todos y cada uno de los valores
que toma la variable, como es el caso de la variable discreta.
No obstante definitivamente no se puede decir que no se agrupa la variable discreta y se agrupa la variable
continua, porque esto depende de la cantidad de información que se tiene y el tipo de análisis que se va a hacer,
ya que se podría presentar la situación, de que se tiene una variable discreta, y se tienen tantos datos que es
necesario agruparla, o el caso de que se tenga una variable continua que es poca la información pero que
además todas resultaron valores enteros y se podría presentar en una tabla de frecuencia de datos no
agrupados.
Por todo ello se insiste que se presentan en tablas de frecuencia sin agrupar la variable discreta, y en tablas de
frecuencias agrupadas, la variable continua sólo con fines teóricos.

Algunas de las formas en que se presentan los intervalos de clases


Caso A Caso B Caso C
10 14.9 10 15 10 15
15 19.9 15.1 20 15 20
20 24.9 20.1 25 20 25 y así sucesivamente

Como se observa la variante A y B se hacen con el objetivo de que no se repita el mismo valor de la observación
pero en cualquiera de los dos casos, es decir entre 14.9 y 15 hay infinitos valores y entre 15 y 15.1 también hay
infinitos valores, es por ello mejor, utilizar la variante C, considerando el siguiente convenio, cuando una
observación coincida con un límite de clase se clasificará donde ésta esté, como límite superior,

También existen los intervalos abiertos atendiendo al tipo de información que se puede presentar.
Menos de 10 10 20 menos de 10
10 20 20 30 10 20
20 30 30 40 20 30
30 40 40 50 30 40
40 50 más de 50 40 50
más de 50
Abierto en la Abierto en Abierto en la primera
primera clase la última clase y en la última clase

Se debe señalar además, que no siempre los intervalos son de igual amplitud, estos se podrían presentar con
amplitudes diferentes, sin embargo no es recomendable porque se podrían en algunos casos presentar algunas
dificultades.

Los pasos que se deben dar para agrupar los valores observados de las variables son los siguientes:
1.- FORMAR LOS INTERVALOS
a.- Determinar el recorrido de la variable.
b.- Definir el número de intervalos
c.- Determinar la amplitud de estos intervalos.
2.- HACER EL TARJADO, es decir clasificar la variable en los intervalos de clase.
3.- CALCULAR LAS FRECUENCIAS
8
a.- Frecuencias absolutas
b.- Frecuencias relativas
c.- Frecuencias absolutas acumuladas.
d.- Frecuencias relativas acumuladas.
4.-DETERMINACION DE LAS MARCAS DE CLASES, valor que representa a la variable a través de un valor.

Partiendo del siguiente ejemplo se estudiarán los nuevos conceptos, para conformar la tabla de frecuencias.
EJEMPLO 2.- Los siguientes valores corresponden al crecimiento en cm de una muestra de 50 plantas, que
fueron tratadas con un abono especial "OQ" en una granja de Ciudad de la Habana.

46 39 34 33 32 36 41 26 32 36
43 28 30 27 32 42 30 31 34 41
28 30 26 21 37 39 25 33 47 28
26 23 30 43 40 36 20 38 38 31
29 30 48 47 23 31 24 38 35 36

¿Cómo se pueden agrupar estos datos en una tabla de frecuencias?

Primeramente se deben formar los intervalos de clases, atendiendo a lo que se veía anteriormente. Y
previamente habiendo decidido el número de intervalos de clases, que se va a considerar. No existe una regla
fija de cuantos son los intervalos que se deben hacer; puede decirse que hay diferentes criterios, se tomará uno
de ello, que es, que se deben considerar entre 5 y 20 intervalos.; ni muy pocos, que se pierda información, ni
muchos que parezcan que no se han agrupados los datos.
Por tanto, ¿ de qué depende? de la cantidad de observaciones, que se tienen, del tipo de información, de que se
persigue con ella, etc.

El número de intervalos se representa por la letra "K"

¿Cuál debe ser la amplitud de estos intervalos?


Se considerará la misma amplitud para todos los intervalos y se representarán por "Ci" aunque, no
necesariamente tiene que ser así.
Para llegar a ello se determina el RECORRIDO DE LA VARIABLE.

R = Xmax. - Xmin. , que en este ejemplo será:


R = 48 - 20 = 28

Supóngase que se decide hacer K = 6 (número de intervalos), entonces la amplitud será:


Ci = R/K = 28 / 6 = 4.67 ≈ 5 redondeando, porque no tendría caso, hacer los intervalos de amplitud
decimal, ya que lejos de facilitar el trabajo lo complicaría.
Y ya se está en condiciones de construir la tabla de frecuencia. Se debe comenzar por el menor valor, toda vez
que es necesario que se incluyan todos los valores.

Se designará, como límite inferior del intervalo, por Li-1 y como límite superior Li.
Li-1 Li Tarjado Xi ni fi Ni Fi
20 25 //// // 22.5 6 0.12 6 0.12
25 30 //// //// //// / 27.5 13 0.26 19 0.38
30 35 //// //// /// 32.5 11 0.22 30 0.60
35 40 //// //// /// 37.5 11 0.22 41 0.82
40 45 //// / 42.5 5 0.10 46 0.92
45 50 //// 47.5 4 0.08 50 1.00
50 1.00
Recordar el convenio, cuando una observación coincide con un límite de clase, se clasifica, donde éste está
como límite superior.
9

En la tabla aparece una columna encabezada por "Xi", esta se denomina "marca de clase" y representa el valor
de la variable, es decir en vez de considerar que la variable es un valor que está entre 20 y 25 se dice que la
variable es 22.5, como promedio.
¿Cómo se calcula la marca de clase? Como el punto medio de cada clase, o bien la semi suma de la clase; esto
es 20 + 25 / 2 = 22.5; 25 + 30 / 2 = 27.5 y así sucesivamente.

Interpretación:
n2 = 13, indica que hay 13 plantas de las tratadas con el abono que crecieron entre 25 y 30 cm.; ó que hay 13
plantas de las tratadas con el abono que crecieron como promedio 27.5 cm. (utilizando la marca de clases)

f3 = 0.22, indica que el 22% de las plantas tratadas con el abono crecieron entre 30 y 35 cm.; ó que el 22% de
las plantas tratadas con el abono crecieron 32.5 cm. como promedio.

N4 = 41, indica que 41 de las plantas tratadas con el abono crecieron HASTA 40 cm. (Tenga en cuenta que las
frecuencias acumuladas se interpretan utilizando el límite superior del intervalo, nunca con la marca de clases.)

H5 = 0.92, indica que el 92% de las plantas tratadas con el abono crecieron HASTA 45 cm. (lo planteado es
válido para la acumulada absoluta).

Se cumplen todas las proposiciones que se hicieron para la tabla de frecuencias para datos sin agrupar.

Se debe señalar, que en caso de datos agrupados SE PIERDE INFORMACION, ya que no se ponen todos y
cada uno de los valores de la variable sino que se forman intervalos y se designa como variable la marca de
clases que es la semi-suma de los intervalos de clase, CLARO QUE ESTA PERDIDA NO ES SIGNIFICATIVA
PARA TRABAJOS FUTUROS CON DICHA DISTRIBUCION.

Representación Gráfica:
Para las frecuencias absolutas y relativas simples, se utiliza como representación gráfica el Histograma y
Polígono de frecuencias considerando en la ordenada: ni ó fi y en la abscisa: los límites de clases.
Verla en el texto página 25.

Para las frecuencias absolutas y relativas acumuladas, se utiliza como representación gráfica la Ojiva,
considerando en la ordenada: Ni ó Fi y en la abscisa: los límites de clases.
Verla en el texto página 27.

Pueden hacer los ejercicios del libro de texto: Estadística del 1 al 12 página.30/32 y del Laboratorio los ejercicios
del 5 al 10 página. 11/15

AUTOEXAMEN

1.- Ponga 3 ejemplos de variables discretas y 3 de variables continuas


2.- ¿Que quiere decir organizar los datos?
3.- ¿Cómo se forma una tabla de frecuencias?

4.- A partir de los siguientes datos, que representan el número de habitaciones de 50 viviendas del Municipio
Plaza, que se están visitando para estudiar el grado de hacinamiento, construya una Distribución de frecuencias
e interprete 3 frecuencias absolutas y relativas simple y 3 frecuencias absolutas y relativas acumuladas.
3 2 3 4 3 5 2 1 3 2
4 3 2 1 1 2 5 2 3 1 2
2 3 2 1 2 2 2 3 3 4 5
3 2 2 3 4 1 1 5 2 3 3
4 4 3 3 2 2 2 1 1 2 3
10
5.- Es absolutamente privativo de esta variable, este tipo de organización de los datos ó Ud. considera que la
variable continua también podría organizarse de esta forma hasta lo que Ud. conoce. Explique.
6.- ¿Qué pasos se deben dar para conformar la tabla de frecuencia?

k k
7.- ¿En casos de datos agrupados se cumple que: ∑ ni = n;
i =1
∑f
i =1
i = 1; Nk = n; Hk = 1 etc .?

Fundamente su respuesta.

8.- ¿Cómo se determina el recorrido de la variable?

9.- ¿Se agrupan en intervalos de clase sólo la variable continua?

10.- ¿Cómo Ud. determina el número de intervalos a considerar en la tabla de frecuencias?

11.- ¿En que casos Ud. utilizaría intervalos de amplitud diferentes?

12.- ¿Si una observación le coincide con un límite de clases, ¿Donde lo clasificaría y por que?

13.- Investigados los precios por habitación de 50 hoteles del país se han obtenidos los siguientes resultados
(en cientos de pesos):
7 3 5 4 5 7 4 7.5 8 5
5 7.5 3 7 10 15 5 7.5 12 8
4 5 3 5 10 3 4 5 7 5
3 4 7 4 7 5 4 7 10 7.5
7 8 7.5 7 7.5 8 7 7 12 8
a) Diga que tipo de variable es.
b) Construya la distribución de frecuencias para esta variable.

14.- Realizada una encuesta en una región del país, se han agrupados los establecimientos hoteleros por el
número de cuartos, obteniéndose la siguiente distribución:
Cuartos No. de Hoteles
0 100 25
100 200 37
200 300 12
300 400 22
400 500 21
500 600 13
600 700 5
700 800 3

Determine:
a.- El número de establecimientos hoteleros con más de 300 cuartos.
b.- El porcentaje de establecimientos que tienen más de 100 cuartos y hasta 400.
c.- Represente gráficamente la distribución.
d.- ¿Que tipo de variable es ésta?
e.- ¿Que argumentos puede dar Ud. para que siendo esa variable, la tabla de frecuencia tenga esta forma?
11
Tema I Medidas descriptivas más importantes: Posición: Media. Propiedades de la media. Moda,
Mediana, Aplicaciones. Medidas de Dispersión: Varianza. Desviación Típica y Coeficiente de variación.
Bibliografía. Estadística. Capítulo II página 33. Capítulo II página 44, para las medidas de dispersión.
Existen 3 propiedades principales que describen un conjunto de datos numéricos, que son:
1.- Tendencia central.
2.- Dispersión
3.- Forma.

En todo análisis y/o interpretación se pueden utilizar diversas medidas descriptivas, que representan las
propiedades de tendencia central, dispersión y forma, para extraer y resumir las principales características de los
datos.

Si se calculan a partir de una muestra se les denomina ESTADISTICO O ESTADIGRAFO. Si se calculan a partir
de una población se les denomina PARAMETRO.

MEDIDAS DE TENDENCIA CENTRAL O DE POSICION.

La mayor parte de los conjuntos de datos, muestran una tendencia a agruparse alrededor de un punto "central" y
por lo general es posible elegir ALGUN VALOR PROMEDIO que describa todo un conjunto de datos.

UN VALOR TIPICO DESCRIPTIVO COMO ESE, ES UNA MEDIDA DE TENDENCIA CENTRAL, O DE


POSICION. Las medidas de posición son promedios y pueden ser de tendencia central o no.

Con frecuencia se utilizan, como las más importantes medidas de tendencia central: la media aritmética, la
mediana, la moda y la media geométrica.

Son medidas de posición pero no de tendencia central: las cuantilas entre las que se encuentran las cuartilas,
las decilas y los percentiles, pero éstas no se van a estudiar, por no estar en el programa de estudio.

MEDIA ARITMETICA.
También denominada media, es el promedio ó medida de tendencia central, que se utiliza con mayor frecuencia.

Se define: como la suma de los valores de la variable entre el número de elementos.

Se representa: En la muestra por X , y en la población por μ ó M(x).

n
Xi
Forma de cálculo: Datos primarios --- X = ∑
i =1 n

n X i ni n
Datos Organizados-- X = ∑
i =1 n
ó X = ∑ X i fi
i =1

La media es el punto de equilibrio de la distribución o el centro de gravedad de la distribución, condición que se


la da la propiedad
M (X - μ ) = 0

A continuación se verá el ejemplo que se realizó para datos organizados, pero sin agrupar, para la variable
discreta: X = número de hermanos de 20 estudiantes del grupo 4210.

Xi ni Xini fi Xifi 0 4 0 0.20 0


12
1 3 3 0.15 0.15
2 7 14 0.35 0.70 n
X i ni
3 4 12 9,20 0.60 X = ∑
i =1 n
= 37/20 = 1.85
4 2 8 0.10 0.40
20 37 1.00 1.85 n
X = ∑ X i f i = 1.85
i =1

Es necesario que el estudiante compruebe, si existe diferencia entre el cálculo de la media en datos organizados
y en los datos en su forma primaria y que sé de respuesta del resultado que obtuvo, comprobándolo en la
bibliografía orientada.

Ejemplo #2. Correspondiente a datos Organizados y agrupados de la variable: X = crecimiento en cm. de una
muestra de 50 plantas.

Li-1 Li Xi ni Xini fi Xifi


20 25 22.5 6 135 0.12 2.7
25 30 27.5 13 357.5 0.26 7.15
30 35 32.5 11 357.5 0.22 7.15
35 40 37.5 11 412.5 0.22 8.25
40 45 42.5 5 212.5 0.10 4.25
45 50 47.5 4 190 0.08 3.8
50 1665.0 1.00 33.30

n n
X i ni
X =∑ = 1665/50 = 33.3 ó X = ∑ X i f i = 33.3
i =1 n i =1
Como se observa no hay diferencia en el resultado al aplicar estas dos fórmulas.

¿Consideran ustedes que podría haber diferencia entre este cálculo, el obtenido en la distribución de frecuencia
anterior y el que se podría obtener en los datos primarios? ¡COMPRUÉBELO! y trate de darse una explicación,
si no la encuentra, búsquela en la bibliografía orientada.

PROPIEDADES DE LA MEDIA: Estas propiedades son de mucha importancia y de utilización práctica en el


desarrollo de las Estadísticas.
1.- M(k) = k La media de una constante es igual a la propia constante

2.- M(kx) = K M(x) La media de una constante por una variable es igual a la constante por la media de la
variable.

3.- M(k + x) = k + M(x) La media de una constante más una variable es igual a la constante más la media de la
variable.

4.- M(x + y) = M(x) + M(y) La media de la suma de dos variables es igual a la suma de las medias de ambas
variables.

5.- M(X -μ) = 0 La media de las desviaciones con respecto a la media es igual a cero.
Desviaciones es la diferencia entre el valor de la variable y un valor fijo, cuando este valor fijo es la
media se le llama desviaciones con respecto a la media.

6.- M(X - μ)2 = mínimo. La media de las desviaciones con respecto a la media al cuadrado, es un mínimo.

Desventajas de la media:
13
La media se ve afectada por la ocurrencia de valores extremos, por su propia definición, esto quiere decir que si
hay algunos valores grandes que difieren del resto, la distribución se deformará a la derecha, por el contrario si
hay algunos valores pequeños que difieren del resto, la distribución se deformará a la izquierda. Y el valor de la
media tiende a buscar la deformación y por tanto no será representativa de esa distribución.
Una distribución se dice que es deformada cuando al dibujarla no se asemeja a una campana boca abajo, sino
que un lado se alarga más que el otro.
Otra desventaja de la media, es que no se puede calcular cuando existen intervalos abiertos, a menos que se
eliminen los mismo y esto aumenta la pérdida de información.

LA MODA
Se define como el valor mas frecuente, en un conjunto de datos. El valor modal es el de mayor
frecuencia.
En datos organizados, donde exista un máximo relativo, esto es donde: ni – 1 < ni >ni + 1, existe un valor
modal.

Se denota por Mo ó Md y puede no existir en una distribución, ó existir más de una.

Se utiliza en ocasiones como medida de tendencia central y se obtiene fácilmente a partir de un arreglo
ordenado. A diferencia de la media. la moda no se afecta ante la ocurrencia de valores extremos.

Ejemplo en datos en su forma primaria: X = las calificaciones de 7 estudiantes del grupo 3220
3 4 3 4 5 4 5
Primeramente se ordenará de menor a mayor, esto es:
3 3 4 4 4 5 5 así el valor modal será el que más se repite Mo = 4
En el ejemplo #1 donde x: número de hermanos de 20 estudiantes del grupo 3210 (datos organizados, no
agrupados, variable discreta).
Xi ni Así el valor modal será el valor de "X" que le corresponde al máximo relativo. (Buscado en las
0 4 frecuencia absolutas).
1 3 Máximo relativo: nj-1 < nj > nj+1 así nj = 7 que es mayor que nj-1 = 3 y mayor que nj+1 = 4
2 7* Así un máximo relativo será aquel valor que supera al que le antecede y al que le sigue en las
3 4 frecuencias absolutas
4 2 Por lo tanto el valor modal será: Mo = 2

En el ejemplo #2 donde x: el crecimiento en cm. de 50 plantas (datos organizados, y agrupados, variable


continua).
L i-1 Li ni
20 25 6 nj-1 n j-1 < nj > nj+1
25 30 13 nj 6 < 13 >11
30 35 11 nj+1 Cuando los datos están organizados y agrupados el cálculo de la moda se
35 40 11 hace a través de una fórmula:
40 45 5 Mo = Lj-1 + Cj [(nj - nj-1)/(nj -nj-1) + (nj - nj+1)]
45 50 4
50 En este caso será: Mo = 25 + 5 [(13-6)/(13-6) + (13-11)] =
25 + 5 [ 7 / 7 + 2] =
25 + 5 (7/9) =
25 + 35/9 =
30 + 3.89 =
Mo = 33.89
Las distribuciones, pueden tener una, dos o tres modas y en dependencia se les dirá que son unimodal, bimodal
o plurimodal.

LA MEDIANA:

Se define como aquel valor que supera a no más del 50% de las observaciones y es superado por no más del
50 % de las observaciones.
14

Se denota por Me

Para calcular la mediana, a partir de un conjunto de datos recolectados en su forma primaria, primero se deben
ordenar de menor a mayor. A este conjunto se le denomina arreglo ordenado. Después se busca la posición del
valor mediano en el arreglo ordenado. Se pudiera decir que hay 2 reglas, para determinar el valor mediano en
los datos primarios. Y estas, están en dependencia del número de observaciones.

REGLA 1 Si el tamaño de la muestra es un número impar, la mediana está representada por el valor numérico
correspondiente a la posición del centro de las observaciones ordenadas.

Ejemplo: si se tienen los valores siguientes:


5 8 3 4 6 2 3, primeramente lo que se hace es ordenarlo de menor a mayor: 2 3 3 4 5 6 8 y a
continuación se obtiene el valor mediano el que será en este caso:
Me = 4
(Por ser el valor del centro, que supera a 3 observaciones que no es más de 3.5 observaciones (que es el 50%
de las observaciones) y es superado por 3 observaciones que no es más de 3.5 observaciones (que es el 50%
de las observaciones)

REGLA 2 Si el tamaño de la muestra es un número par, entonces la posición mediana, será la semi-suma de
los dos valores centrales o la media de los dos valore centrales de las observaciones ordenadas.

Ejemplo: si se tienen los valores siguientes:


5 8 3 4 6 2, primeramente lo que se hace es ordenarlo de menor a mayor: 2 3 4 5 6 8 y el valor
mediano será: Me = 4 + 5/2 = 9/2 = 4.5

Cualquier valor comprendido entre 4 y 5 (incluidos ambos), es un valor mediano, el 4 supera a dos
observaciones que es menor que 3 observaciones (que es el 50 % de las observaciones) y es superado por 3
que no es mayor que 3 observaciones (que es el 50% de las informaciones); al valor 5 le pasa lo mismo supera
a 3observaciones y es superado por 2 observaciones que no son mayores que 3 observaciones que es el 50%
de las observaciones.

Se puede decir que hay infinitos valores medianos, todo valor comprendido entre 4 y 5; pero como se debe dar
un solo valor, se hace un convenio, tomar como valor mediano: LA MEDIA DE LOS DOS VALORES
CENTRALES.

Si los datos están ORGANIZADOS PERO NO AGRUPADOS:


Se busca la clase mediana, en las frecuencias absolutas acumuladas.

1.- Se determina la fracción n/2, que ubica el centro de la distribución.

2.- Se representa por Nj a la menor frecuencia acumulada que SUPERE a


n/2 por tanto quedaría que:
Nj-1 ≤ n/2 < Nj
3.- De la expresión anterior se pueden presentar dos situaciones:

a- Que n/2 > Nj-1; y en ese caso el valor mediano será el valor de la variable que le corresponde a Nj; esto es
Me = Xj

b.- Que n/2 = Nj-1; y entonces el valor mediano, será la media del valor de la variable que le corresponde a Nj y
el valor de la variable que le corresponde a Nj-1, esto es Me = Xj + Xj-1/2

Ahora se verán dos ejemplos donde se puede dar lo que se planteó anteriormente:

Considere la siguiente distribución:


15

Xi ni Ni
10 2 2 Sí n/2 = 20/2 = 10, ahora se busca la menor frecuencia acumulada que SUPERE
20 4 6 Nj-1 a 10, que en este caso es 12, y por lo tanto se designará por Nj. así Nj-1 será 6 que
30 6 12 Nj es la frecuencia acumulada anterior a Nj . Ahora si se cumple que n/2 > Nj-1
40 7 19 entonces la mediana será el valor de “X” ue la corresponde a Nj, es decir el valor
50 1 20 mediano será Me = 30
20

Ahora considérese la siguiente distribución:


Xi ni Ni Así n/2 = 10/2 = 5, ahora se busca la menor frecuencia acumulad que SUPERE a 5,
0 1 1 y se designa por Nj que en este caso es el 8, y la anterior será Nj-1 (5), si se cumple
1 4 5 Nj-1 que n/2 = Nj-1 (5 – 5) entonces el valor Mediano será la semi-suma de los valores
2 3 8 Nj de las variables que le corresponde a Nj y a Nj-1:
3 2 10
10 Me = (2 + 1)/2 = 3/2 =1.5

Si los datos están ORGANIZADOS Y AGRUPADOS: Se utiliza la siguiente fórmula:

Me = Lj-1 + Cj [(n/2 - Nj-1)/ nj] Si n/2 > Nj-1

Y Me = Lj-1 Si n/2 = Nj-1


Ya que el resto de la expresión se hace cero, pues dos cosas que son iguales su diferencia es cero.

Ahora se verá el cálculo de la Mediana en el ejemplo #2 donde x: el crecimiento en centímetros de 50 plantas


analizadas.
L i-1 Li ni Ni n/2 = 50/2 = 25 así Nj = 30 y Nj-1 = 6
20 25 6 6 Me = 30 + 5 [(25-19)/11]
25 30 13 19 Nj-1 = 30 + 5 (6/11)
30 35 11 30 Nj = 30 + 30/11
35 40 11 41 = 30 + 2.73
40 45 5 46 Me = 32.73
45 50 4 50
50

Ventajas de la mediana:
La mediana no se ve afectada por datos extremos, es por ello que en esos casos es más representativa que la
media, como medida de tendencia central.

Observación: Si resulta ser el primer intervalo mediano, se plantea que no existe Nj-1 y no se podría calcular la
Me. No obstante se suele hacer el supuesto de que al no existir intervalo anterior, entonces Nj-1 = 0.

MEDIDAS DE DISPERSION.

Es necesario destacar que las medidas de Posición, no dicen mucho, si no están acompañadas de medidas de
dispersión, porque a través de ellas es que se puede determinar si la medida de posición es significativa o
representativa de la distribución.
Entre las medidas de dispersión o variabilidad, se van a estudiar:
- la varianza
- la desviación típica
- el coeficiente de variación
Dentro de los estadísticos de dispersión, el más utilizado es la varianza, precisamente por sus propiedades.

LA VARIANZA
16
La varianza de un conjunto de datos x1, x2, x3, ... , xn se define como la media aritmética del cuadrado
de las desviaciones de la variable con respecto a su media.
Se denota por S2 en la muestra y por σ2 en la población o también por V(x)
Su cálculo para datos primarios, viene dado por:

( )
n 2 n
S = ∑ Xi − X / n ó también S 2 = ∑ X i2 / n − X
2 2

i =1 i =1
Para datos Organizados: (no agrupados o agrupados)

S =∑ 2
n
(X i )
− X ni
2

ó también S 2 = ∑
n
X i2 ni
−X
2

i =1 n i =1 n
Así si se tiene una muestra compuesta por los valores siguientes: 4 5 6 5 2 3 4 3 calcule la varianza.
X i 32
X = ∑ n
=
8
=4
n
(X −X ) 2
(4 − 4 )2 + (5 − 4 )2 + (6 − 4 )2 + (5 − 4 )2 + [2 − 4 ]2 + (3 − 4 )2 + (4 − 3 )2 + (3 − 4 )2
S 2
= ∑
i =1
i

n
=
8
=

1 + 4 + 1 + 4 + 1 + 1 12
= = = 1 .5
8 8

S2 = 1.5 o también a través de la fórmula:

n
X i2 ni 16 + 25 + 36 + 25 + 4 + 9 + 16 + 9
S2 = ∑
2
−X = − 4 2 = 17.5 − 16 = 1.5
i =1 n 8
S2 = 1.5
Mientras mayor sea la varianza más dispersos estarán los valores alrededor de la media, y mientras más
pequeña, menos dispersión habrá, pero estas son cantidades elevadas al cuadrado y no se puede interpretar
como tal y tampoco da una idea clara.

Veamos el cálculo en datos organizados en el ejemplo #1 donde X: es el número de hermanos de 20


estudiantes del grupo 4210.
Xi ni Xini X 2 n Donde X = 1.85 por tanto es más conveniente usar la formula:
i i
n 2
0 4 0 0 X i ni

2
1 3 3 3 S2 = − X que es más cómoda, menos complicada de trabajar
2 7 14 28 i =1 n
3 4 12 36 S = 99/20 - 1.852 = 4.95 - 3.42 = 1.53
2

4 2 8 32 S2 = 1.53 Este resultado no se puede interpretar por estar las cantidades elevadas
20 37 99 al cuadrado.

Ejercicio #2 Datos organizados, agrupados donde x: el crecimiento en Centímetros de 50 plantas.


Li-1 Li ni Xi Xini Xi2ni
20 25 6 22.5 135 3037.5
25 30 13 27.5 357.5 9831.25
30 35 11 32.5 357.5 11618.75
35 40 11 37.5 412.5 15468.75
40 45 5 42.5 212.5 9031.25
45 50 4 47.5 190 9025.00
50 1665.0 58012.50
S2 = 58012.5/50 – 33.32
= 1160.25 – 1108.89
S2 = 51.36 ⇒ S = 7.17
17
PROPIEDADES DE LA VARIANZA

1.- V(x) ≥ 0 La varianza es un número no negativo

2.- V(k) = 0 La varianza de una constante es igual a cero

3.- V(X ± k) = V(x) La varianza de la suma de una variable más una constante es igual a la varianza de la
variable.

4.- V(kx) = k2 V(x) La varianza del producto de una constante por una variable es igual a la constante al
cuadrado por la varianza de la variable.

Como se ha dicho la varianza no se puede interpretar por estar su resultado elevado al cuadrado, por lo que es
conveniente contar con otro estadístico que basado en el valor de la varianza sirva para dar una medida de la
dispersión en las mismas unidades o dimensiones en que están expresados los datos y este estadístico es: La
Desviación Típica.

LA DESVIACION TIPICA.
La desviación típica se define como la raíz cuadrada positiva de la varianza
Se denota por S en la muestra y por σ en la población.

2 2
S=+ S La desviación típica es una magnitud no negativa, pero no cumple las restantes propiedades de
la Varianza, pues la extracción de la raíz no lo permite.

Así en los ejemplos vistos en datos organizados será:


Ejemplo #1 x: número de hermanos de 20 estudiantes del grupo 4210
S2 = 1.53 lo que implica que S = 2 1.53 = 1.23 indicando que en promedio los datos se desvían de la media en
1.23 unidades. Es decir la desviación típica está en las mismas unidades en que está expresada la variable.

En el ejemplo #2 x: crecimiento en cm. de 50 plantas.


S2 = 51.36 lo que implica que S = 2 51.36 = 7.17 indica que en promedio los datos se desvían de la media en
7.17 centímetros.
En ocasiones resulta necesario contar con un estadístico que refleje la dispersión sin depender de la magnitud
de las observaciones, esto es que sea un valor relativo.

Esta necesidad surge generalmente cuando se comparan las dispersiones entre varios conjuntos expresados en
unidades de tiempo diferentes. Este estadístico es el Coeficiente de Variación y que se verá a continuación.

COEFICIENTE DE VARIACION.

Se define como el cociente entre la desviación típica y la media multiplicada por 100, para dar el
resultado en porciento.
_
Se denota por C.V. y como se dijera anteriormente C.V = S/X * 100 tanto para datos en su forma primaria u
organizados.

Este coeficiente es una medida de dispersión igual que la desviación típica (S), únicamente que éste es una
medida relativa, mientras que S es una medida absoluta.

Así el resultado que se alcanzaría en los dos ejemplos que se han venido realizando para datos organizados no
agrupados y agrupados será de:

Ejemplo #1 donde X: número de hermanos de 20 estudiantes del grupo 4210


18
C.V. = 1.23 /1.85 * 100 = 0.66 * 100 = 66% Los datos están dispersos como promedio con respecto a la
media en un 66%
Es bastante alta la dispersión, sin embargo si se observa S = 1.23 se hubiese podido pensar que era baja.

Ejemplo #2 donde X: crecimiento en centímetros de 50 plantas.

C.V. = 7.17/33.3 * 100 = 0.215 * 100 = 21.5% Los datos están dispersos con respecto a la media en un
21.5%
No es tan alta la dispersión sin embargo se hubiera podido pensar que era una dispersión más alta que en el
ejemplo anterior al observar que: S = 7.17
!Alerta! Recordar que "S" da el resultado en las mismas unidades que la variable y los dos ejemplos anteriores
están dados en unidades de medida diferentes.

Esta es precisamente una ventaja del coeficiente de variación que permite comparar distribuciones que estén
expresadas en unidades de medidas diferentes ya que el resultado viene expresado en porciento.

También se debe señalar que por ser el resultado en porciento, es de más fácil comprensión definir si la
variabilidad dada por el coeficiente de Variación es más alta o más baja, porque en ocasiones a través de la
desviación típica esto se hace más difícil y a veces ni siquiera es posible.
Supóngase que se tienen 2 conjuntos de observaciones:

1er grupo 2do grupo

X = 150 X = 500
S = 50 S = 50
CV = 0.33 CV = 0.10

Como se aprecia a pesar de tener la misma desviación típica, el 2do grupo tiene una variabilidad menor, están
menos dispersos los datos que en el 1er grupo, lo que nos lo permite apreciar, es el coeficiente de variación, ya
que a través de la desviación típica, esto no es posible, debido a que la misma está expresada en las mismas
unidades que la variable.

Pueden hacer los ejercicios 27,28, 30, 32, y 34 hasta 48 del Laboratorio de Estadística Matemática I en lo
concerniente a medidas de dispersión.

AUTOEXAMEN

1.- ¿Qué indican las medidas de Tendencia central?


2.- ¿Cómo se define la Media Aritmética?
3.- ¿Podría Ud. decir las propiedades de la media?
4.- ¿Cómo se define la Mediana?
5.- ¿Cuál de los dos estadísticos considera Ud. que es mejor para representar el promedio? Explique su
respuesta.
6.- ¿Qué desventajas se le pudiera atribuir a la media?
7.- ¿Cómo se define la Moda?
8.- ¿En que casos Ud. considera útil aplicar este promedio?
9.- ¿Qué‚ indican las medidas de dispersión?
10.- ¿Cómo se define la Varianza?
11.- ¿Cómo interpretaría el resultado de la varianza?
12.- Mencione algunas de las propiedades de la varianza.
13.- ¿Cómo se define la desviación típica?
14.- ¿Cómo interpretaría Ud. la desviación típica en general?
15.- ¿Cuándo y porqué utilizaría la desviación típica en vez de la varianza?
16.- ¿Cómo se define el coeficiente de Variación?
17.- ¿Cómo se interpreta este coeficiente?
19
18.- ¿Cuáles son las ventajas del coeficiente de variación sobre la desviación típica?
19.- ¿En que caso puede decirse que el coeficiente de variación tiene una utilidad única?
Ejercicios

20.- Con los siguientes dos conjuntos de datos, ambos con tamaño de muestra n = 7
Lote 1: 10 2 3 2 4 2 5
Lote 2: 20 12 13 12 14 12 15
a.- Calcule para cada conjunto de datos, la media, la mediana y la moda.
a.- Calcule para cada conjunto de datos, la varianza, la desviación típica y el coeficiente de variación.
b.- Compare los resultados para CADA CONJUNTO DE DATOS y comente sus conclusiones.
c.- Con base a los resultados obtenidos: ¿Qué puede generalizar con respecto a las propiedades de tendencia
central y de dispersión?

21.- Un fabricante de pilas para linternas tomó una muestra de 13 piezas de la producción de un día y las utilizó
de forma continua hasta que comenzaron a fallar. El resultado en horas de funcionamiento fue‚
342, 426, 317, 545, 264, 451, 1049
631, 512, 266, 492, 562, 298
a.- Calcule la media, la mediana y la moda. ¿Qué medidas descriptivas parecen ser las mejores y cuales las
peores? ¿Por que?
b.- Calcule la varianza, la desviación típica y el coeficiente de variación.
c.- Utilizando la información anterior ¿qué se aconsejaría al fabricante si él deseara anunciar que sus baterías
duran 400 horas?

22.- Examinando los registros de cuentas mensuales de una Empresa que vende libros por correo, el auditor
toma una muestra de 20 de esas cuentas no pagadas (en cientos de pesos). Los adeudos de la Empresa eran:
Li-1 Li ni a.- Calcule la media, la mediana y la moda.
10 15 4 b.- Calcule la varianza y el Coeficiente de variación e
15 20 6 interprete los resultados.
20 25 7 c.- A que conclusión llegaría Ud. acerca de la Empresa
25 30 2 conociendo que tiene 370 facturas pendientes de
30 35 1 pago.

TEMA II PROBABILIDADES

Orientaciones para la Autopreparación

Objetivo del Tema:


Qué el alumno sea capaz de:
Aplicar e interpretar los fundamentos de la teoría de probabilidades en la solución de problemas. Calcular la
probabilidad de ocurrencia de un suceso utilizando la definición clásica y la estadística. Aplicar las propiedades
de la probabilidad axiomática, la probabilidad condicional e independencia.
Autopreparación del Tema II
El alumno debe conocer que la teoría de las probabilidades es necesaria conocerla, ya que la estadística
matemática, se basa en las probabilidades y únicamente conociendo ésta es factible poder estudiar la inferencia
estadística, la cual tiene determinado grado de incertidumbre que puede ser medido en términos de
probabilidades.
Los aspectos fundamentales de este tema son:
• Distinguir entre fenómeno aleatorio y determinista Conocer los conceptos de suceso, suceso seguro, nulo,
mutuamente excluyente, complementario, espacio muestral.
• Calcular e interpretar probabilidades haciendo uso de la definición clásica, estadística y axiomática.
• Aplicar las propiedades fundamentales de la Teoría de las probabilidades.
20
Tema II
Tema II Probabilidades. Introducción Fenómeno aleatorio. Espacio Muestral. Punto Muestral Suceso o
evento. Suceso Simple, Suceso compuesto. Suceso Seguro o Cierto, Suceso imposible o nulo. Suceso
Complementario. Sucesos Mutuamente excluyentes. Definición clásica o Estadística de Probabilidad.
Bibliografía: Estadística. Capitulo 4 paginas 65/72
La teoría de las probabilidades surge en los siglos XVI-XVIII relacionada con problemas producto de los juegos
de azar, entre los principales precursores de esta Teoría se encuentra, entre otros, el matemático Pascal.
La probabilidad es una medida cuantitativa de que las posibilidades pueden llegar a ser realidades.
La Teoría de las probabilidades es la base de la inferencia estadística, de ahí la necesidad de su estudio, de
modo que se puedan realizar medidas descriptivas, para hacer inferencias de la población.
Para desarrollar las Teorías de las probabilidades es necesario definir algunos, conceptos.
EXPERIMENTO: Los experimentos pueden ser deterministas o aleatorios.
Un experimento es DETERMINISTA, cuando se puede predecir con total exactitud el resultado del experimento,
claro si se conoce perfectamente las condiciones en las que se realiza el experimento.
Ejemplos: Si encendemos un fósforo, y lo sostenemos en la mano, sabemos lo que va ocurrir: se apaga.
Si se toma un vaso y lo deja caer de un 2do piso, se sabe lo que va a ocurrir: se hará añicos.
Un experimento es ALEATORIO, cuando no se puede predecir con exactitud su resultado antes de realizarlo
pero si los posibles resultados y debe ser susceptible de repetición. Ejemplo : En el lanzamiento de un dado; se
conoce los posibles resultados pero no se conoce con exactitud el resultado. Otros ejemplos pudieran ser:
cantidad de lluvia caída, rendimiento de un cultivo, incremento de peso de un animal etc.
Los experimentos aleatorios deben tener la característica de poderse repetir, la experiencia ha demostrado, que
si éste se puede repetir un gran número de veces, la frecuencia relativa tiende a estabilizarse, y a esto se le
llama REGULARIDAD ESTADISTICA.
Se plantea que la estadística es la Tecnología del método científico que proporciona instrumentos para la toma
de decisiones, cuando estas se adoptan en ambiente de incertidumbre y siempre que pueda ser medida en
términos de probabilidad. Luego es una ciencia que estudia los fenómenos aleatorios.
SUCESO O EVENTO Cualquier característica observada del resultado de un experimento.
Es aleatorio si como resultado del experimento él puede ocurrir o no ocurrir.
ESPACIO MUESTRAL. Es el conjunto formado por todos los posibles resultados de un experimento aleatorio.
Se representa por “S”.
Ej. Lanzamiento de una moneda ...S:[C E] donde C: Cara E: Escudo
Ej. Lanzamiento de dos monedas...S:[CC CE EC CC]
Ej. Lanzamiento de un dado ......S:[1, 2, 3, 4, 5, 6 ]

El espacio muestral puede ser finito o infinito según el conjunto tenga un número finito o infinito de elementos.
PUNTOS MUESTRALES. Cada uno de los resultados posibles de un experimento aleatorio.
Los sucesos pueden ser:
Sucesos Simple. Son aquellos que tienen un solo punto muestral.
Suceso Compuesto. Son aquellos que tienen dos o más puntos muestrales.
Suceso seguro o cierto: Un suceso A definido en S es seguro o cierto, si dado un conjunto de condiciones su
ocurrencia es inevitable. Ej Se lanza un dado, suceso salir un número mayor que cero y menor que 7
Suceso imposible o nulo. Un suceso A es imposible si definido un espacio muestral y dado un conjunto de
condiciones, su ocurrencia es imposible. Ej. Se lanza un dado, suceso A: salir el número 7 (que se representa
por el conjunto vacío o nulo).
Subevento: A es un subevento de B si A ⊂ B; en tal caso cada vez que ocurra A ocurrirá B.
Ej. Se lanza un dado.
A ... Salir número impar [1, 3, 5] Recuerden los números impares son los que no tienen mitad.
B ... Salir número primo [1, 2, 3, 5] Recuerden los números primos son los que no se pueden descomponer en
factores.

Suceso complementario: Un suceso A es complementario si su complemento viene dado por todos los puntos
donde no ocurre A y se denota por Ac ó A ó A' indistintamente
Ej. Se lanza un dado.
A ... Salir número impar S:[1, 3, 5]
A'... No salir número impar S:[2, 4, 6]
21
(el símbolo (') está indicando negación hay libros que pone en vez de este símbolo una pequeña c en la parte
derecha superior ó una barrita encima de la letra tal como se mostró anteriormente)
Sucesos Mutuamente Excluyentes. En un mismo experimento aleatorio dos sucesos A y B se dice que son
mutuamente excluyentes, si la ocurrencia de uno excluye la ocurrencia del otro.
Ej. Si se lanza una moneda, la ocurrencia de que caiga cara, excluye la ocurrencia de que caiga escudo.
Ej. El nacimiento de una hembra, excluye el nacimiento de un varón. Por tanto cuando dos sucesos son
mutuamente excluyentes, no tienen elementos comunes, gráficamente:
Por lo tanto si cada círculo representa a A Y B no existe la intersección de AB sino que esta es igual al conjunto
vacío.

A B

Si los sucesos fueran, no excluyentes, gráficamente: estos círculos se verían uno montado en una parte del
otro.

A A AB B

Que los sucesos sean mutuamente excluyentes o no, está relacionado con el experimento aleatorio, se puede
dar el caso que dos sucesos sea mutuamente excluyentes, en un experimento, y no en otro.
Así A y A' son mutuamente excluyentes.

Suceso colectivamente exhaustivo.


Se dice que dos sucesos son colectivamente exhaustivos cuando la ocurrencia de ambos es igual al espacio
muestral.
Ejemplo en un juego de cartas que tiene 26 barajas rojas y 26 barajas negras obtener rojo o negro que son los
únicos colores en una baraja. Como tiene que ocurrir uno de estos sucesos, se consideran que son sucesos
colectectivamente exhaustivo.

OPERACION ENTRE EVENTOS.


OPERACIÓN Intersección:
Se llama intersección o producto de A y B, Al suceso que consiste en la ocurrencia simultánea de A y B. Se
denota por AB, A I B, A.B
Ej. Se lanza un dado. A: número primo [1,2,3,5]
B: número impar [1, 3, 5], por tanto AB: [1, 3, 5], esto es los elementos comunes en ambos sucesos.

OPERACION UNION:
El suceso A unión B, es el que consiste en la ocurrencia de A ó B se denota por A ∪ B; A+B (esto indica que
ocurra al menos uno de los dos, que ocurra A ó que ocurra B, también la palabra al menos uno está indicando
que ocurra uno ó que ocurran los dos).
Ej. Se lanza un dado
A: Que salgan los 4 primeros números [1,2,3,4]
B: Que salgan los 3 últimos números [4,5,6]
Así A ∪ B = [1, 2, 3, 4, 5, 6]

DEBE QUEDAR CLARO QUE CUANDO SE DICE QUE OCURRA “A y B” ESTAN PIDIENDO
INTERSECCION (producto) Y CUANDO SE DICE QUE OCURRA “A ó B” ó “Al menos uno” ESTAN
PIDIENDO UNION (suma)

DEFINICIÓN CLÁSICA DE PROBABILIDAD.


La definición clásica de probabilidad se formula por Laplace en el siglo XIX, concretamente en el año 1812 y
descansa en la equiprobabilidad. Y en la misma se plantea:
22
Si S, es un espacio muestral finito y equiprobable entonces la probabilidad de ocurrencia de cualquier suceso A
definido en S estará dado por la relación:
P(A) = N(A)/N(S) dónde N(A)= casos favorables al suceso A y N(S)= casos totales posibles.
Ejemplo. La probabilidad de obtener el número 6 al lanzar un dado será
P(A) = 1/6 Siendo el suceso A: sacar el número 6
Ejemplo. La probabilidad de sacar un As de un juego de cartas será
P(A) = 4/52 Siendo el suceso A: sacar un As.
Recuerden que el juego de cartas tiene 52 cartas, 13 corazón rojo (♥), 13 diamantes rojos (♦), 13 corazones
negros (♠), 13 trévoles negros (♣), y dentro de cada estos grupos tiene As, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, y K

Esta definición se conoce como definición a “priori” porque no es necesario realizar el experimento para calcular
la probabilidad de ocurrencia. Pero tiene las siguientes limitaciones:
1.- No puede ser aplicada a espacios muestrales infinitos.
2.- No puede ser aplicada cuando los resultados posibles no son igualmente probables.

PROPIEDADES:
P(A) ≥ 0 P(S) = 1 LO QUE IMPLICA 0 ≤ P(A) ≤ 1

Ejemplo #1(que está en el Laboratorio de Estadística Matemática I)


Una cartera contiene un rublo, un forinto y una corona. Si el experimento consiste en la extracción de dos
monedas (sin reposición) se pide:
a.- Describir el espacio muestral
b.- La probabilidad de extraer un rublo y una corona
c.- La probabilidad de que no salga rublo.
d.- La probabilidad que salga un forinto.
e.- La probabilidad de que la primera sea un forinto.
f.- La probabilidad de que la primera sea un forinto y la segunda una corona.

Antes de comenzar el ejercicio se debe aclarar que “sin reposición” quiere decir que se saca la moneda y no se
vuelve a poner en la cartera. Esto indica que lo que ocurre en la segunda extracción está determinado por lo
que ocurrió en la primera extracción.

a.- El espacio muestral a veces es muy fácil describir y contar los puntos como es el caso cuando se lanzan dos
monedas donde S:[CC EE CE EC]. Otras veces se requiere de una organización por la complejidad de imaginar
sólo lo que tiene que ocurrir. Se puede hacer a través del llamado diagrama de árbol, que es un método que se
utiliza cuando las selecciones y los elementos a extraer u observar no es muy grande. Y la misma consiste en ir
poniendo lo que puede ocurrir en cada extracción, luego de poner lo que puede ocurrir en la primera extracción,
partiendo de lo que ocurrió en ella, se va poniendo lo que podría ocurrir en la segunda habiendo ocurrido ese
resultado en la primera, y la combinación de lo que ocurrió en la primera y segunda extracción, da el resultado
del espacio muestral claro está teniendo en cuenta si las selecciones son “con ó sin reposición”, esto es:
a.- Espacio Muestral
1ra 2da
Extrac. Extrac.
F
C
R

C
R
F S: {CF CR RC RF FR FC}

R N(S) = 6
F
C

b.- P(RC) = 2/6 = 1/3


23
c.- P(R’R’) = 2/6 = 1/3
d.- P(F) = 4/6 = 2/3
e.- P(FF’) = 2/6 = 1/3
f.- P(FC) = 1/6

Ejemplo #2 Una cesta contiene un clavel una rosa y una gardenia. Si se


extraen 2 flores (con reposición)se pide:
a.- Defina el espacio muestral.
b.- Defina suceso imposible.
c.- La probabilidad de extraer una rosa y un clavel.
d.- La probabilidad de extraer 1ro una rosa y después un clavel.
e.- La probabilidad de que no salga el clavel.

Se debe aclarar que “con reposición” indica que se hace la extracción se ve lo que es, y se vuelve a reponer a
la cesta, esto está indicando que lo que ocurre en la segunda extracción, no está influenciada por lo que ocurre
en la primera extracción.

a.- Espacio muestral:


1ra 2da
Extrac. Extrac.
R
R C
G
S:[RR RC RG CR CC CG GR GC GG]
R N(S) = 9
C C
G

R
G C
G

Fíjense como a pesar de haber una sola flor de cada clase, se pueden sacar dos rosas o dos claveles o dos
gardenias, y esto es debido a que como las extracciones son con reposición que se saca se mira que tipo de flor
es, y se devuelve a la cesta, existe la posibilidad que en la segunda extracción vuelva a estar los tres tipos de
flores en la cesta mientras que si fuera sin reposición cuando se hace la primera extracción ya esta flor quedaría
fuera de la cesta y en la segunda extracción, no habría la posibilidad de volverla a encontrar, como pasó en el
ejercicio anterior.
b.- Que salga un tulipán.
c.- P (RC) = 2/9 Aquí no señalan orden por lo tanto, hay dos posibilidades rosa, clavel y clavel rosa.
d.- P (R1 C ) = 1/9 Aquí están indicando un orden; 1ro que salga la rosa y en la 2 da extracción que salga un
clavel
e.- P (C’C’ ) = 4/9

DEFINICION ESTADISTICA DE PROBABILIDAD.


Debido a las limitaciones que confronta la definición clásica de probabilidad, se comenzaron a realizar
experimentos con los juegos de azar, surgiendo el concepto de REGULARIDAD ESTADISTICA.
QUE NO ES MAS QUE LA ESTABILIDAD QUE PRESENTAN LAS FRECUENCIAS RELATIVAS AL
CONSIDERAR UN GRAN NUMERO DE VECES UN EXPERIMENTO BAJO LAS MISMAS CONDICIONES.
Ej. Lanzamiento de una moneda “n” veces, ya a partir del lanzamiento 400 y hasta el 1000, el comportamiento
de que caiga cara es de 0.40, 0.505, 0502... Es decir se estabiliza.
Otro ejemplo, es el nacimiento de niños y niñas, que cuando se ve en un número grande de veces, este se
estabiliza.
A partir de la regularidad estadística, surge la definición estadística de probabilidad que plantea:
Si n tiende a infinito la frecuencia relativa ƒ(A), alcanza un cierto valor límite o ideal, y entonces
puede asociarse a un número P(A) tal que ƒ(A), sea iguala P(A) si: P(A) = LIM ƒ(A)
24
n→∞

Ejemplo: Un tirador ha acertado 70 veces en un blanco de un total de 100 intentos. ¿Cuál es la probabilidad de
que en una próxima prueba, el tirador haga blanco?

EXPERIMENTO: Tirar al blanco. n = 100

SUCESO A : ACERTAR EN EL BLANCO m = 70


P(A) = 70/100 = O.70 Se espera que haga blanco un 70% de las veces que se tire, siempre que n sea grande.
Limitaciones de esta definición:
El número de veces tan grande que tiene que repetirse el experimento bajo las mismas condiciones, esto no
siempre se puede cumplir.
Esta definición se conoce como definición “a posteriori”, porque si no se realiza el experimento no se puede
calcular la probabilidad.
Pueden realizar los ejercicios de libro de Estadística, en el capitulo 4 del 1 al 11 y el 25 y del Laboratorio de
Estadística Matemática I 50/68 y del 69/83.

AUTOEVALUACION
1.- ¿Qué es un experimento aleatorio?
2.- Puede calcularse probabilidad a partir de un experimento determinista?. Explique.
3.- ¿Cuáles son los sucesos mutuamente excluyentes?
4.- ¿Cuáles son los sucesos complementarios?
5.- Explique la diferencia entre unión e intersección y proporcione un ejemplo de cada uno.
6.- ¿Cómo se define la Probabilidad clásica? y ¿Bajo que condiciones puede aplicarse?
7.- ¿Cómo se define la probabilidad Estadística?
8.- Limitaciones de ambas definiciones.
9.- En una amplia red metropolitana se seleccionó una muestra de 500 entrevistados para determinar diversas
informaciones relacionadas con el comportamiento del consumidor. Entre las preguntas hechas se
encontraba, “¿disfruta ir de compras?”. De 240 hombres 136 contestaron que sí. De 260 Mujeres 224
contestaron que sí.
a.- De un ejemplo de un evento simple.
b.- ¿Cuál es el complemento de disfrutar ir de compras?.
c.- ¿Cual es la probabilidad de que el entrevistado seleccionado en forma aleatoria ...
c.1Sea hombre?
c.2disfrute ir de compras?
c.3Sea mujer?
c.4no disfrute ir de compras?
c.5Sea mujer y disfrute ir de compras?
c.6Sea hombre y no disfrute ir de compras?
c.7Sea hombre y disfrute ir de compras?
c.8Sea mujer o disfrute ir de compras?
c.9Sea hombre o no disfrute ir de compras?
c.10 Sea hombre o mujer?

Tema II. Definición Axiomática. Propiedades. Probabilidad condicional e independencia estadística.


Sucesos mutuamente excluyentes. Leyes de la Adición y de la Multiplicación.
Bibliografía. Estadística. Capitulo 4 paginas 72/79
La definición estadística, también muestra sus limitaciones, ya que existen experimentos que no se pueden
repetir un número grande de veces y mucho menos, bajo las mismas condiciones, como para que se conozca la
probabilidad.
Es por ello que en 1933 se axiomatiza la probabilidad y se parte de 3 axiomas básicos, para su desarrollo.
Si S es un espacio muestral y A un suceso definido en S, se dirá, que TODO SUCESO “A” DEFINIDO EN “S”
ESTA ASOCIADO A UN NUMERO REAL LLAMADO PROBABILIDAD DE “A”, EL CUAL CUMPLIRA CON LOS
SIGUIENTES AXIOMAS:
25
1.- P(A) ≥ 0
2.- P(S) = 1
3.- P(A1 ∪ A2 ∪A3 ∪... ∪Ak) = P(A1) + P(A2) + ... + P(Ak) si los k sucesos, son mutuamente excluyentes o lo
que es lo mismo si para cada par AiAj = conjunto vacío siendo i diferente de j.
Propiedades.

Propiedad #1 La probabilidad de un suceso imposible o nulo es cero:


P(∅) = 0 A∪∅=A
P(A ∪ ∅ ) = P(A) POR AXIOMA 3
P(A) + P (∅) = P(A) por tanto P (∅) = 0
De esta propiedad y de los axiomas 1 y 2 se evidencia que:
0 ≤ P(A) ≤ 1
Propiedad #2
La probabilidad del suceso complementario al suceso A es igual a 1 menos la probabilidad de que ocurra A.
P(A') = 1 - P (A) A ∪ A' = S
P(A U A') = P (S) por axioma 3
P(A) + P(A') = P(S) por axioma 2
P(A) + P(A') = 1 por tanto
P(A') = 1 - P (A)
Propiedad #3
Si A y B son dos sucesos definidos en S, la probabilidad de que ocurra A y no ocurra B será:
P(AB') = P(A) - P(AB) A = AB ∪ AB’
P(A) = P(AB) U P(AB')por axioma 3
P(A) = P(AB) + P(AB') despejando
P(AB') = P(A) - P(AB)
Propiedad #4
Si A y B son dos sucesos definidos en S entonces:
P(A ∪ B) = P(A) + P(B) - P(AB)
A ∪ B = AB' ∪ AB ∪ A'B
P(A ∪ B) = P(AB' ∪ AB ∪ A'B)por axioma 3
P(A ∪ B) = P(AB') + P(AB) + P(A'B)

P(A ∪ B) = P(A) - P(AB) + P(AB) + P(B) - P(AB)

P(A ∪ B) = P(A) - P(AB) + P(AB) + P(B) - P(AB)

P(A ∪ B) = P(A) + P(B) - P(AB)


Propiedad #5
Si A es un subconjunto de B entonces P(A) ≤ P(B)
Se sabe que P(A'B) = P(B) - P(AB)
Si A es un subconjunto de B entonces AB = A por tanto
P(A'B) = P(B) - P(A) Lo que implica que P(B) > P(A)
Propiedad #6
Si A, B, y C son sucesos definidos en S, entonces:
P(A ∪ B ∪ C) = P(A) + P(B) + P(C)- P(AB) - P(AC) - P(BC) + P(ABC)
como ejercitación haga esta demostración Ud. y le servirá de estudio independiente.
Ejemplo: De un grupo de 1000 habaneros, 420 leen Granma, 105 leen Juventud Rebelde y 45 leen Granma y
Juventud Rebelde.
26
a.- ¿Cuál es la probabilidad de seleccionar un habanero aleatoriamente del grupo y lea Granma ó Juventud
Rebelde.
b.- ¿Qué probabilidad hay de que el habanero seleccionado no lea ninguno de los periódicos?
c.- ¿Qué probabilidad hay que lea sólo Granma?
A: lee Granma; B: lee Juventud Rebelde.
N = 1000
N (A) = 420 POR TANTO P(A) = 0.42
N (B) = 105 “ “ “ P (B) = 0.105
N (AB) = 45 “ “ “ P (AB) = 0.045

a.- P(A U B) = P (A) + P (B) + P (AB)


= 0.42 + 0.105 - 0.045
= O.48
b.- P(A ∪ B)' = 1 - P(A U B)
= 1 - 0.48
= 0.52
c.- P(AB') = P(A) - P(AB)
= 0.42 - 0.045
= O.385

Hasta aquí se ha estudiado el cálculo de probabilidades referido a un suceso (simple o compuesto) que ocurre
en un espacio muestral. Es decir:
P(A) = N(A)/N(S) a esta probabilidad se le podría llamar PROBABILIDAD TOTAL por el hecho de estar
calculada en función de todos los resultados posibles.
En contraposición a este concepto se estudiará ahora la PROBABILIDAD CONDICIONAL, que como su
nombre lo indica será la posibilidad de que ocurra un suceso, bajo la ocurrencia de otro.
Esto implica una referencia, no al espacio muestral en su totalidad, sino a otro suceso o subconjunto del espacio
muestral; esto es al suceso al que esté condicionada.
Se representa esta probabilidad utilizando el símbolo “/” que se lee como “dado que” y después de él se plantea
la condición; así será:
P(A/B) QUE SE LEE LA PROBABILIDAD DE “A” “DADO QUE” “B” YA OCURRIO es decir condiciona la
probabilidad de la ocurrencia de A, a que B ya tiene que haber ocurrido.
Se define la probabilidad condicional, como la probabilidad de la intersección de los sucesos, partido
la condición. Así: P(A/B) = P (AB)/P (B)

Se debe reafirmar que la condición es el suceso que está después (del símbolo “/”) de “dado qué"
Ejemplo. En un aula se forman 4 brigadas de estudiantes con la siguiente composición:
Brig. V H total
1 5 5 10 a.- ¿Cuál es la probabilidad, si se selecciona un estudiante al azar de que
2 6 4 10 sea hembra?
3 3 8 11
4 7 3 10 b.- ¿Cuál es la probabilidad de que se seleccione un estudiante al azar, y
Total 21 20 41 sea hembra de la brigada #2?

a.- P(H) = 20/41 = 0.448

B.-P (H/B2)=4/10=0.4 ó también [N (HB2)/N(S)]/ [N (B2)/N(S) = [4/41]/ [10/41] = 4/10 = 0.4


B

Fíjense que el inciso “a” se trata de una probabilidad total, se refiere a la totalidad de las hembras, mientras que
en el inciso ”b” están pidiendo la probabilidad de las hembras pero “condicionada” a que sea de la brigada 2, es
decir hay una condición por tanto es una probabilidad condicionada.
Se debe señalar que también es posible encontrar la probabilidad condicional no solo de dos sucesos sino de
combinaciones de dos o más sucesos. Y aunque se emplee la definición clásica ésta se cumple también
aplicando la definición estadística.
27
SUCESOS INDEPENDIENTES.
Dos sucesos A y B se llaman independientes, cuando la probabilidad de ocurrencia de uno de ellos, no depende
de la ocurrencia o no del otro, lo cuál puede ser expresada de la siguiente forma:
Dos sucesos son independientes si:
P(A/B) = P(A) ó P(B/A) = P(B)
Si son independientes se cumple que:
P(AB) = P(A) P(B)
Se debe aclarar que sólo se puede comprobar independencia a través de esta última fórmula si se tienen las 3
probabilidades y comprobar si la intersección es igual al producto de la probabilidad de ambos sucesos. Ejemplo
de independencia:
Si se lanza una moneda dos veces, la probabilidad de que salga cara en el primer lanzamiento, no depende de
que salga cara o no en el segundo lanzamiento.

Ejemplo:
Si una caja contiene 100 piezas de las cuáles 20 son defectuosas y se extraen aleatoriamente 2 piezas una a
una (con reposición). ¿Cuál será la probabilidad de obtener pieza defectuosa EN LA 1ª EXTRACCIÓN?:
20/100=0.20 ¿Y cuál será la probabilidad En la 2ª EXTRACCION de obtener pieza defectuosa? 20/100=0.20 es
decir exactamente igual, esto es debido a que se repuso la primera. Por tanto cuando las extracciones son
con reposición se puede considerar que son independientes. Ya que lo que ocurre en la 2ª extracción es
independiente de lo que ocurre en la primera.
Pero si no se reemplaza, es decir se hace la extracción “sin reposición”, ¿qué pasa?, Qué la probabilidad de que
salga defectuosa la pieza en la segunda extracción depende de lo que salió en la primera. Si en la primera salió
una pieza defectuosa. La probabilidad de pieza defectuosa en la segunda extracción será 19/99=0.19; pero si lo
que salió en la primera extracción fue‚ una pieza en buen estado, entonces la probabilidad de pieza defectuosa
en la segunda extracción será 20/99.
EN ESTE CASO LO QUE SUCEDE EN LA SEGUNDA EXTRACCION, DEPENDE DE LO QUE OCURRIO EN
LA PRIMERA EXTRACCION PORQUE FUE SIN REPOSICION ESA EXTRACCION, YA LOS SUCESOS
DEJARON DE SER INDEPENDIENTES PARA CONVERTIRSE EN DEPENDIENTES.
Generalmente para los juegos de azar, es fácil decidir si dos sucesos son independientes o no. Para otros
experimentos aleatorios, se debe tener más cuidado.

Ejemplo. Si se tienen 3 sucesos definidos en un espacio muestral S y se conoce que:


P(A)=0.40 P(B)=0.42 P(C)=0.15 P(A/B)=0 P(A/C)=0 P(C/B)=0
Diga si:
a.- A y B son independiente
b.- A y C son mutuamente excluyentes
c.- B y C son independientes
d.- A y B son equiprobables
?
a.- P(A/B) = P(A) ya que para que A y B sean independientes se debe cumplir esta relación.
Pero P(A/B) = 0 y P(A) = 0.40 luego son diferentes por tanto no son independiente.
b.- Para que sean mutuamente excluyentes se debe cumplir que P (AC)=0, ya que al no tener elementos
comunes (AC), la intersección es igual al conjunto vacío.
Como P(A/C)=0 eso implica que P (AC)=0 ya que P(A/C) = P (AC)/P(C) por lo tanto los sucesos A y C son
mutuamente excluyentes.
? ?
c.- P(B/C) = P(B) ó P(C/B) = P(C) ya que para que sean independientes se debe cumplir cualquiera de las dos.
?
P(C/B) = P(C)
0 ≠ 0.15 por tanto no son independientes.

Para que sean equiprobables se debe cumplir que P(A) = P (B) y son diferentes, ya que P(A) = 0.40 y P (B) =
0.42, por tanto no son equiprobables.
REGLA DEL PRODUCTO O MULTIPLICACION
Si A y B son sucesos definidos en S, la probabilidad de AB, de acuerdo a la definición de probabilidad
condicional, se puede expresar como:
28
P (AB) = P(A) P(B/A)
P (AB) = P(B) P(A/B)
De la misma forma:
P (ABC) = P(A)P(B/A)P(C/AB)
LO QUE EVIDENTEMENTE IMPLICA QUE LOS SUCESOS SON DEPENDIENTES.
Luego la regla del producto expresa la probabilidad de que ocurra A y B en un orden determinado:
P (AB)=P(A) P (B/A) que primero salga A y en segundo lugar salga B ó P(AB)=P(B)P(A/B) que primero salga B
y en segundo lugar A
Si no interesa el orden, sino que salga una vez A y una vez B, entonces se tienen que expresar las dos
combinaciones posibles que hay: P (AB) = P(A1 B2 ) + P(B1 A2 )

Ejemplo. De una urna que contiene 4 esmeraldas y 1 brillante, se extraen 2 piedras, una a una, sin reposición.
Calcule la siguiente probabilidad.
a.- Que la 1ra piedra sea esmeralda y la 2da brillante.
b.- Que las dos piedras sean esmeraldas
c.- Solo una sea esmeralda.
Solución: como es sin reposición las extracciones, entonces los sucesos son dependientes, además que piden
orden.
a.- P(E1 B2 )= P(E)P(B/E)
B

= 4/5 . 1/4
= 4/20 = 1/5 = 0.20
b.- P(E1 E2)= 4/5 . 3/4
= 16/20 = 6/10 = 0.6
c.- P(E1 B2 ∪ B1 E2) = P(E)P(B/E) + P(B)P(E/B)
= 4/5 . 1/4 + 1/5 . 4/4
= 4/20 + 4/20 = 8/20 = 4/10 = 0.4

REGLA DE LA ADICION O SUMA DE PROBABILIDAD


Si se tienen dos sucesos A y B, definidos en S, la probabilidad de A U B se expresa como:
P (A ∪ B) = P (A) + P (B) - P (AB)

Y esto indica “al menos uno”, es decir la probabilidad de A ó B ó de ambos AB.


Si A y B son mutuamente excluyentes, entonces P (AB)= 0 y por tanto la
P(A ∪ B) será igual a: P(A ∪ B) = P (A) + P (B)

RESUMEN DE LA INTERSECCION: P (AB)


Excluyentes (no tienen elementos comunes) P (AB)=0
P(A/B)=0
P (B/A)=0
No Excluyentes (tienen elementos comunes) y pueden ser independientes o dependientes.
Independientes: P(A/B) = P(A) ó P (B/A) = P (B)
P (AB) = P(A).P (B)
Dependientes: P(AB) = P(A)P(B/A)
ó = P (B) P(A/B)

RESUMEN DE LA UNION: P(A ∪ B)


Excluyente (no tiene elementos comunes) P (AB)=0
Por tanto P(A U B) = P(A) + P(B)
No Excluyentes (tienen elementos comunes) P (AB) ≠ 0
Por tanto P(A ∪ B) = P(A) + P(B) - P(AB)
Deben hacer los ejercicios del libro de texto Estadística en la pagina 85 los ejercicios 11/17, 21/24 y 27/29 y del
Laboratorio de Estadística Matemática I los ejercicios 63/75, 80/96, y 100/104
29
AUTOEXAMEN
1.- ¿Cuáles son los axiomas sobre los que descansa la Teoría axiomática de la probabilidad?
2.- Diga al menos 3 propiedades de la definición axiomática de probabilidad.
3.- ¿Cuándo dos sucesos son independientes?
4.- ¿Cuándo dos sucesos son mutuamente excluyentes?
5.- Un embarque de 10 muñecos contiene 3 muñecos y 7 muñecas.
a.- Si se seleccionan dos muñecos del embarque, sin reposición ¿cuál es la probabilidad de que:
a1.- ¿los muñecos seleccionados sean muñecas?
a2.- ¿haya una muñeca y un muñeco?
a3.- el primer muñeco seleccionado sea una muñeca y el segundo un muñeco?.
b.- compare la respuesta a.2 y a.3 y explique porque son diferentes.
6.- Con referencia al ejercicio 9 de la autoevaluación de la semana anterior.
a.- Supóngase que el entrevistado seleccionado sea mujer. ¿Cuál es entonces la probabilidad de que no
disfrute ir de compras?
b.- Supóngase que el entrevistado seleccionado disfruta ir de compras. ¿Cuál es la probabilidad de que sea
un hombre?
c.- ¿Son estadísticamente independiente disfrutar ir de compras y el sexo de la persona? Fundamente su
respuesta.
d.- ¿Cuál es la probabilidad de que un entrevistado, seleccionado en forma aleatoria...
d.1.- ¿Sea mujer o disfrute ir de compras?
d.2.- ¿Sea hombre o no disfrute ir de compras?
d.3.- ¿Sea hombre o mujer?
Utilice para el inciso “d” las propiedades de la definición axiomática de probabilidad.

7.- A partir de una investigación realizada, se supo que el 70% de los hombres son fumadores; y que padecen
afecciones respiratorias dado que son fumadores un 50%. Además se conoció que no siendo fumadores, dado
que padecen de afecciones existen un 40%, Si se realiza el experimento de seleccionar un individuo del grupo al
azar, diga:
a.- Probabilidad de que no sea fumador.
b.- Probabilidad de que sea fumador y padezca de afección pulmonar.
c.- Probabilidad de que fume dado que padece de los pulmones.
d.- Probabilidad de que no padezca de afecciones pulmonares dado que fuma
e.- Probabilidad de que padezca de afección respiratoria.

TEMA III DISTRIBUCIONES TEORICAS DE PROBABILIDAD


Objetivos del Tema
Lograr que el estudiantes sean capaz de:
- Conocer los conceptos de variable aleatoria, variable aleatoria discreta y continua y distribución teórica de
probabilidad.
- Identificar y caracterizar las distribuciones probabilísticas: BINOMIAL, POISSON, Y NORMAL. Y calcular
probabilidad haciendo uso de las tablas correspondientes.
- Conocer las distribuciones Chi-Cuadrado, t de Student y F de Fisher y el cálculo de probabilidad haciendo uso
de las tablas correspondientes.

Autopreparación del Tema III


El alumno debe conocer que debe dominar lo que es una variable aleatoria, y poder identificar las variables
aleatorias discretas y continuas, así como dominar que es una función de probabilidad y como a través de ellas
puede calcular probabilidad. En el caso de las variables aleatorias discretas se calcula probabilidad sumando,
mientras que en el caso de las variables aleatorias continuas se calcula probabilidad integrando. Debe saber
que la función de distribución tiene marcada importancia en las variables aleatorias continuas ya que permite el
cálculo de probabilidad a través de las propiedades de la misma sin necesidad de integrar.

Particular importancia tienen las distribuciones Binomial, Poisson y Normal, ya que conociendo las
características de estas distribuciones el cálculo de probabilidad se hace muy fácil utilizando las tablas que
existen para cada distribución. Debe quedar muy claro para ustedes que en el caso de la distribución normal,
30
que es una distribución que corresponde a variable continua, está tabulada la Función de distribución, de ahí la
importancia de conocer sus propiedades para el cálculo de probabilidades.

En el caso de las distribuciones Chi-cuadrado, T'Student, y F de Fisher, el objetivo fundamental está en el


manejo de la tabla para el cálculo de probabilidades ya que su aplicación se estudiará en la Estadística
Matemática II. Estas dos distribuciones también son variables aleatorias continuas, por lo que, lo que está
tabulada en la tabla es la función de distribución, por lo tanto es válido lo planteado en el párrafo anterior.

Los aspectos fundamentales de este tema son:


1. Determinar el espacio muestral de un experimento aleatorio mediante el uso de variables aleatorios.
2. Calcular probabilidades utilizando las Funciones de Probabilidad y de Distribución.
3. Identificar las principales distribuciones probabilísticas.
4. Utilizar las Tablas para el Cálculo de probabilidades.

Tema III. Distribuciones Teóricas de probabilidad. Definición de Variable Aleatoria. Definición de Función
de Probabilidad Univariada. Caso discreto y continuo. Propiedades. Función de Distribución.
Propiedades. Valor Esperado de una variable aleatoria.
Bibliografía. Estadística. Capitulo 5 paginas 88/92

En el Tema I estudiamos las distribuciones empíricas de frecuencias, que son distribuciones obtenidas por
observaciones tomadas de la experiencia.

En el Tema II se establecieron varias reglas de probabilidad, en este Tema se utilizará esta información para
desarrollar el concepto de Esperanza matemática y explorar varios modelos de la probabilidad que representan
fenómenos discretos y continuos.

En este tema que se comienza ahora, se estudiarán las distribuciones teóricas de probabilidad las cuales son
"MODELOS TEORICOS ESTABLECIDOS", basados en las probabilidades y que se utilizaran si las
características del problema planteado son las requeridas para el uso de estas.

Primeramente se verán algunas cuestiones básicas, antes de estudiar los modelos antes planteados, se
comenzará con el concepto de Variable aleatoria.

VARIABLE ALEATORIA.
Una variable aleatoria "X" es una aplicación definida en un espacio muestral S, que toma valores reales, o sea
es la transformación del Espacio Muestral en un conjunto numérico, mediante X.
También se pudiera decir que una variable aleatoria es un fenómeno de interés cuyas respuestas o resultados
se pueden expresar numéricamente.

Ejemplo. Experimento: lanzar una moneda dos veces.


Si lo que interesa es conocer la cantidad de caras que pueden aparecer. ¿Cuál será el espacio muestral?
S:[ CC EE CE EC ] X: número de caras que aparecen. X = 0, 1, 2

Las variables aleatorias se pueden clasificar en: discreta y continua DISCRETA: Si toma un conjunto finito o
infinito numerables de valores.
CONTINUA: Si toma cualquier valor real de un intervalo.
FUNCION DE PROBABILIDAD. Es la correspondencia que hay entre el valor de la variable y la probabilidad de
ocurrencia de cada valor. Se denota por f (x).
Si la función de probabilidad [f (x)] es discreta se le denomina Función de Cuantía. Para que sea una función de
probabilidad, la función de cuantía, debe cumplir las siguientes propiedades:
n
1.- f (x) ≥ 0 2.- ∑ f (x) = 1
i=1

Debemos señalarse que hay autores que la función de cuantía la representan por p(x).
31
Ahora bien, si la función de probabilidad [f (x) ] es continua se le denomina Función de densidad. Para que sea
una función de probabilidad, la función de densidad, deben cumplirse las siguientes propiedades:

xn b
1.- f (x) ≥ 0 2.- ∫ f ( x)dx
xo
=1 3.- p{a < x ≤ b} = ∫ f ( x)dx 4.- P (X = X ) = 0
k
a
Esta última propiedad nos indica que la probabilidad de un punto no existe por lo tanto se cumplirá, para las
variables continuas lo siguiente:
b

∫ f ( x)dx = P{a ≤ x ≤ b} = {a < x ≤


a
b} ={a ≤ x < b} = {a < x < b}

es decir no se tiene en cuenta si es menor ó igual; ó menor, ya que da lo mismo; ó mayor; ó mayor ó igual.
FUNCION DE DISTRIBUCION.
Existe una función que está íntimamente relacionada con f (x), la cual se denota por F(x) y se denomina
Función de Distribución, y se define como:

La probabilidad de que "x" tome valores menores o iguales a un valor determinado (Xk). Es decir
acumula hasta un valor determinado: F(x) = P(X ≤ Xk)
Si la función de distribución corresponde a variable aleatoria discreta:
xk
F(x) = ∑ f (x)
x < xk

Toda función de distribución de variable aleatoria discreta cumple las siguientes propiedades:
1.- 0 ≤ F(x) ≤ 1 4.- F(x) es una función no decreciente, esto es si X1 ≤ X2 implica F(x1) ≤ F(x2)
2.- lim. F(x) = 0 5.- Si X1 < X2 entonces:
x→ -∞ P(X1 < X ≤ X2) = F(x2) - F(x1)
3.- lim F(x) = 1
x→ ∞

De esta 5ta propiedad se deriva:


P(x1 ≤ x ≤ x2)= F(x2) - F(x1) + f (x1)
P(x1 < x < x2) = F(x2) - F(x1) -f (x2)
P(x1 ≤ x < x2) = F(x2) - F(x1) + f (x1) - f (x2)

Y si la Función de distribución corresponde a variable aleatoria continua:

xk

F(x) = ∫ f ( x)dx
x

Toda función de distribución de variable aleatoria continua cumple las siguientes propiedades:
1.- lim F(x) = 0 4.- P(X1< X ≤ X2)= F(X2) - F(X1) y como P(X = Xk) = 0 entonces
x→ -∞ P(X1 < X ≤ X2) = P(X1 ≤ X ≤ X2)= P(X1 < X < X2)=P(X1 ≤ X <X2)
2.- lim F(x) = 1 5.- La derivada parcial de F(x) decreciente, esto es si:
x→ ∞ X1 ≤ X2 entonces F(x1) ≤ F(x2)
3.- F(x) es una función no respecto a X
es igual f (x)

De su definición y sus propiedades se puede concluir que para calcular probabilidad a partir de la función de
distribución sería:
P(X ≤ Xk) = F(x)
P(X > Xk) = 1 - F(x)
32
P(X1 < X ≤ X2) = F(x2) - F(x1)

Las desigualdades de mayor, o mayor igual se tendrán en cuenta si se le aplica a variables discretas. En
variables continuas recuerden que no es necesario, ya que no existe la probabilidad de un punto.
Ejemplos:
1.- Un determinado experimento aleatorio tiene como función de probabilidad la relación:
f (x) = (1 + X) / 10 para X = 0, 1, 2, 3
Se pide:
a.- Verifique las propiedades de f(x)
b.- P(x >1)
c.- F(1)
d.- Probabilidad de que x tome por lo menos valor 1
e.- Probabilidad de que x tome a lo sumo valor 2
f.- F(3)

Solución:
a.- Propiedad f (x) ≥ 0
f (x0)= 1/10; f (x1)= 2/10; f (x2)= 3/10; f (x3)= 4/10; por tanto f (x) > 0

Propiedad que la suma de f (x) desde 0 a 3 = 1


f (x)= 1/10[(1+0)+(1+1)+(1+2)+(1+3)] = 10/10 = 1

3
b.- P(X > 1) = ∑ f (x ) = (1+2)/10 + (1+3)/10 = 3/10 + 4/10 = 7/10=0.7
x =2

c.- X f (x) F(x)


0 1/10 1/10 F(1) = 3/10 = 0.3 esto nos indica que x es menor ó igual a 1
1 2/10 3/10 .
2 3/10 6/10
3 4/10 10/10
Deben fijarse que F(x), se determina y representa lo mismo que Ni, es decir las frecuencias absolutas
acumuladas.
3
d.- P(X ≥ 1) = ∑ f (x) = 1 - f (X = 0) = 1 - 1/10 = 9/10 = 0.9
x=1

También se podría hacer, sumando, en vez de por el complemento:


= 1/10[(1+1) + (1+2) + (1+3) ] =
= 1/10 (2 + 3 + 4) = 9/10 = 0.9
2
e.- P(X ≤ 2) = ∑ f (x) = 1 - f (x = 3) = 1 - 4/10 = 6/10 = 0.6
x=0

También se podría hacer sumando en vez de por el complemento:


= 1/10[(1+0) + (1+1) + (1+2)] =
= 1/10 (1 + 2 + 3) = 6/10 = 0.6
f.- F(3)= 1 Esto indica que x es menor o igual a 3.

2.-Sea f (x) = 1/18(3 + 2x) una función de densidad para 2 < X < 4
a.- Verifique si se cumplen las propiedades de f (x)
b.- Calcule P(x < 3)
c.- P(X ≥ 3)
d.- P(X = 3)
e.- Halle F(x)
f.- Calcule P(2 < X ≤ 3) haciendo uso de la F(x)

Solución:
33
4

a.- f (x) = 1/18 ∫ (3 + 2x)dx = 1/18[ 3x + 2x /2 ]= 1/18[(12+16) - (6+4)]


2
2

= 1/18 (28 - 10) = 18/18 = 1


3

b.- P(x < 3)= 1/18 ∫ (3 + 2 x)dx


2
= 1 / 18(3x + 2x 2 / 2] = 1 / 18[(9 + 9) - (6 + 4)]

= 1/18 (18 - 10) = 8/18 = 4/9 = 0.44


4

c.- P(x ≥ 3)=1/18 ∫ (3 + 2 x)dx


3
= 1 / 18(3x + 2x 2 / 2] = 1 / 18[(12 + 16) - (9 + 9)]

=1/18(28 -18) = 10/18 = 5/9 = 0.55


d.- P(x=3) = 0
xk

e.- F(x) = 1/18 ∫ (3 + 2 x)dx


2
= 1 / 18(3x + 2x 2 / 2] = [(3xk + x 2 k ) - (6 + 4)]

= 1/18(3xk + x2k - 10) por tanto F(x) será


F(x) = 1/18 (x2 + 3x - 10)

f.- P(2 < x ≤ 3) = F(3) - F(2)


= [1/18(9+9-10) ] - [1/18(4+6-10) ]
= 1/18(8 - 0) = 8/18 = 4/9 = 0.44

CARACTERISTICAS NUMERICAS DE UNA VARIABLE ALEATORIA


Las características numéricas son medidas que permiten sintetizar la información de forma tal que ofrecen las
características generales del fenómeno en estudio, es decir, sus rasgos principales. También se conocen como
parámetros de las variables aleatorias.
Las características fundamentales que se estudiarán son: Media y varianza
El valor medio de una Variable aleatoria, se denomina valor esperado ó esperanza matemática se denota por E
(x).
El valor esperado de una variable aleatoria se puede considerar como su promedio ponderado sobre
todos los resultados posibles siendo las "ponderaciones" la probabilidad relacionada con cada uno de
los resultados.

El cálculo del valor esperado está en dependencia si se está trabajando con variables aleatorias discretas o
continuas. En el caso de las variables aleatorias discreta, esta medida de resumen se puede obtener
multiplicando cada resultado posible de xi por su probabilidad correspondiente P(xi) y después sumando los
productos resultantes. Por lo tanto el valor esperado de la variable aleatoria discreta xi se puede expresar de la
siguiente forma
n
μ = E (x) = ∑ x f (x )
i =1
i

En el caso de las variables aleatorias continuas, esta medida de resumen se obtiene integrando desde x0 hasta
xn el producto de la variable x por su función de probabilidad. Por lo tanto el valor esperado de la variable
aleatoria continua Xi se puede expresar de la siguiente forma:
xn
μ = E (x) = ∫ xf ( x)dx
x0

PROPIEDADES DEL VALOR ESPERADO


1.- La esperanza de una constante es igual a la propia constante.
34
E (k) = k
2.- La esperanza del producto de una constante por una variable es igual a la constante por la esperanza de la
variable.
E (kx) = k E (x)

3.- Si x1, x2 , ... , xn son variables aleatorias entonces:


n n
E ( ∑ xi ) = ∑ E (x)
i =1 i=1

4.- La esperanza de la suma (o resta) de una constante y una variable es igual a la constante mas la suma (o
resta) de la esperanza de x.
E (k ± x) = k ± E (x)
5.- Si la media poblacional es igual a la esperanza de x, entonces la esperanza de las desviaciones con respecto
a la media es igual a cero
Si μ = E (x) entonces la E (x -μ)= 0
6.- Si x e y son variables aleatorias independientes entonces, la esperanza del producto de "x" e "y" es igual al
producto de la esperanza de "x" y de la esperanza de "y".
E (xy) = E (x) E (y)
7.- La esperanza del producto de la suma de n, variables y constantes es igual a la suma del producto de las "n"
constantes por las esperanza de las variables.
E (C1x1 + C2x2 + ...+ Cnxn ) = C1 E (x1)+ C2 E (x2)+ ...+ Cn E (xn)
VARIANZA
La varianza es igual a la esperanza de las desviaciones con respecto a la media, al cuadrado:
V(x) = E (x - μ)2

También se simboliza por σ2(sigma al cuadrado, letra griega). Esta definición hace un tanto difícil el cálculo de
la varianza, ya que como se dijo anteriormente en el cálculo de la esperanza, la variable, es lo que está dentro
del paréntesis, y en este caso lo que está dentro del paréntesis, es (x - μ)2.
Por lo tanto para el cálculo de la varianza para una variable aleatoria discreta sería ∑(x - μ)2 f(x) y en el caso de
variables aleatorias continuas sería ∫ ( x − μ) 2
f ( x )dx .
Haciendo transformaciones matemáticas se puede llegar a obtener una fórmula de cálculo para la varianza que
es mucho más cómoda.

V(x) = E (x2) - [E (x)]2 en el caso de la variable discreta la:

xn

E(x ) = ∑ x f (x) y en el caso de variables continua E (x )=


2 2 2
∫x
x1
2
f ( x )dx

PROPIEDADES DE LA VARIANZA
1.- La varianza de una variable es igual o mayor que cero.
V(x) ≥ 0
2.- La varianza de una constante es igual a cero.
V(k) = 0
3.- La varianza del producto de una constante por una variable es igual a la constante al cuadrado por la
varianza de la variable.
V(kx) = k2 V(x)
4.- La varianza de la suma de una constante más una variable es igual a la varianza de la variable.
V(k+x) = V(x)
5.- Si x1 , x2 , ...xn son variables aleatorias independientes, entonces la varianza de la suma de "n" variables es
igual a la suma de las varianza de las variables..
n n
V(∑ xi) = ∑ V(xi)
i=1 i=1
35
6.- La varianza de la suma del producto de "n" variables por "n" constantes es igual a la suma del producto de
las "n" constantes al cuadrado por las varianzas de las variables.
V(C1 x1 + C2 x2 + ... + Cn xn) = C 21 V(x1) + C22 V(x2) + ... + C2n V(xn)

Ejercicios.
Ejemplo 1.- La función de una variable aleatoria x, esta dado por:
x=1 2 3 4
f(x)=1/6 1/3 1/6 1/3
Calcular el valor esperado de x y su varianza.
Solución: Primeramente se debe definir si es una variable aleatoria discreta o continua ya que en dependencia
del tipo de variable así será su cálculo. En este caso es discreta, se sabe, porque la variable toma valores
definidos: 1, 2, 3, y 4
Para ello se debe buscar x f (x) y x2 f (x)
x f (x) = 1/6 2/3 3/6 4/3
x2 f (x)= 1/6 4/3 9/6 16/3
E (x)= μ = ∑ x f (x) = 1/6 + 2/3 + 3/6 + 4/6 = (1+4+3+8)/6 = 16/6
= 2,66

V(x)= E(x2) - [E(x)]2 E(x2) = ∑x2 f (x)


= 8.33 - 2,662 = 1/6 + 4/3 + 9/6 + 16/3
= 8.33 - 7.07 = (1+ 8 + 9 + 32)/6 = 50/6 = 8.33
= 1.26

Ejemplo 2.- Si f (x) = x/2 para 0 < x < 2


a.- ¿Cuál será el valor de la varianza de x?
b.- Hallar E (x+3)
c.- Hallar E (2x2)
d.- ¿Cuál será el valor de V(2x)?
e.- ¿Cuál es el valor de la desviación típica de x?
Solución: ¿Qué tipo de variable es esta? La forma de presentar el recorrido de la variable x, indica que es una
variable continua.
2 2

a.- E (x) = 1 / 2 ∫ x f ( x )dx = 1 / 2 ∫ x dx = 1 / 2[x / 3) = 1 / 2(8 / 3 - 0)


2 3

0 0
=8/6 = 4/3 = 1.33

2 2
2
E (x )= 1 / 2 ∫ x f ( x )dx = 1 / 2 ∫ x 3 dx = 1 / 2( x 4 / 4) = 1 / 2(16 / 4) = 16 / 8 = 2
2

0 0

V(x) = E (x2) - [E (x)]2 = 2 - 1.332 = 2 - 1.77 = 0.23


b.- E(x+3) = E (x) + 3 = 1.33 + 3 = 4.33
c.- E(2x2) = 2 E(x2) = 2 . 2 = 4
d.- V(2x) = 22 V(x) = 4 (0.23) = 0.92
e.- σ = σ = 0,23 = 0,48
2

Recuerde que la desviación típica se representa por la letra griega sigma y que es la raíz cuadrada positiva de
la varianza (V(x) = σ2)

Deben hacer los ejercicios del Laboratorio desde la pagina 95/102, los ejercicios 139/140, 142/144, 145e/148
excepto el d, y el 150 y de la pagina 108 a la 110 los ejercicios 153/155 y 158.Desde la pagina 155 a la 161 los
ejercicios 210/211, 213, 215, 219/225 Desde la pagina 154 a 160 los ejercicios 208, 209, 212, 214, 215, 217,
220 y 226.

AUTOEXAMEN
36
1.- ¿Qué entiende por variable aleatoria?

2.- ¿A que se denomina función de probabilidad?

3.- ¿Cómo se denomina a la función de probabilidad de variable aleatoria discreta y continua y como se denota.
4.- ¿Cómo se define la Función de Distribución?

5.- A partir de la definición de Función de distribución como determinaría las siguientes probabilidades para una
variable aleatoria discreta y para una variable aleatoria continua: (utilizando F(x))
a.- P(x ≤ xk)
b.- P(x > xk)
c.- P(x1 ≤ x < x2)
d.- P(x1< x ≤ x2)
e.- P(x1 < x < x2)
f.- P(x1 ≤ x ≤ x2)

6.- Se conoce la función de densidad f (x)= C (4 + 6x - 3x2) para 0 < x < 2


Calcular:
a.- El valor de C
b.- La función de distribución.
c.- P(x >1)
d.- P(x < x < 1.5)
e.- P(x > 1.9)

7.-El tiempo en trimestres que transcurre entre dos perturbaciones ciclónicas, se ha podido determinar, que tiene
la siguiente función de densidad:
f (x) = 4/9(x - x3 ) para 1 < x < 2 se pide:
a.- Calcule el tiempo esperado que debe transcurrir entre dos ciclones.
b.- De una medida de la desviación típica con que ocurren éstos.

Tema III Distribución Binomial. Utilización de tablas estadísticas. Distribución de Poisson. Utilización de
tablas estadísticas. BIBLIOGRAFIA: Estadística. Capítulo 5 páginas 93/97.

Ya se vio como usar las probabilidades estudiadas en las variables aleatorias, así como para desarrollar el
concepto de Esperanza matemática y llegar a los MODELOS como síntesis de los resultados anteriores en un
plano de mayor nivel. Esto es, los modelos se producen a partir de un riguroso estudio de los más importantes
resultados del comportamiento de diferentes procesos aleatorios (experimentos), y para todo aquello que pueda
presentarse como analogía a las características que exige dicho modelo, además de que brindan una aplicación
simplificada de la realidad.

Se debe señalar que todo modelo contiene:

• Características del experimento: Condiciones que tienen que cumplirse para su aplicación.
• Definición de la variable aleatoria y su recorrido.
• f(x) ....Su función de probabilidad.
• F(x) ....Su función de distribución.(destacando importancia en V.A.C )
• Parámetros (características numéricas) al menos μ y σ2

Para lograr una identificación con las distribuciones (o modelos) fundamentales en este Tema, los
mencionaremos y marcaremos con un asterisco (* ) los que estudiaremos.

Bernoulli Como resumen de los experimentos estudiados en el Tema


Binomial (*) Probabilidades
37
V.A.Discreta Hipergeométrica
_______________________________________________________
Poisson (*) Como interés formativo para la teoría de las Colas y empleo en la asignatura
Programación Matemática

Exponencial
________________________________________________________
V.A.Continua Normal (*)
Chi-Cuadrado (*) Plataforma para el estudio de la Inferencia Estadística
T'Student (*)
F de Fisher (*)

DISTRIBUCION BINOMIAL

La distribución Binomial es una de las distribuciones discretas más utilizadas. Su nombre se debe a la relación
que tiene la misma con el desarrollo del binomio:
n
(p+q)n = C x px qn - x

Esta distribución está relacionada con la distribución de Bernoullí, que es la distribución de la variable aleatoria
x, que toma solamente valores cero y uno (fracaso y éxito), cuando se realiza un solo experimento. Sin embargo
existen con frecuencia experimentos de carácter repetitivos en que interesa registrar la ocurrencia o no
ocurrencia de un suceso.

Considérese que "p" es la probabilidad de que el suceso ocurra, esto es, él éxito. Y que "q" es la probabilidad de
que el suceso no ocurra, es decir el fracaso y donde q =1- p

Si se realizan "n" repeticiones independientes del experimento en cuestión y se representa por x, el número de
éxitos obtenidos en las n repeticiones del experimento entonces se puede decir que la probabilidad de que
ocurran "x" éxitos, viene dada por:
n
f (x) = C x px qn - x donde X= 0, 1, ... , n

Distribución Binomial: Antecedentes: los experimentos son con reposición e independientes (del Tema 2)

1.- Características:
- Que el resultado del experimento se pueda clasificar en una de dos categoría mutuamente excluyentes y
colectivamente exhaustiva conocidas por éxito y fracaso (donde p = probabilidad de éxito y q = probabilidad
de fracaso siendo p conocida).
- Qué se realicen "n" pruebas (finitas)
- Que las pruebas sean independientes.
- Que la probabilidad de éxito sea constante de una observación a otra.
2.- Definición de la variable:
X # de veces que ocurren los éxitos en n pruebas.
X = 0, 1, 2, ... , n
n
3.- Función de Probabilidad: f(x) = C x px qn - x
xk
4.- Función de Distribución: F(x) = ∑ f ( x)
x=0

5.- Parámetros:
38
n
μ = E(x) = ∑ xf ( x) = np
x =0
σ2 = V(x) = E(x2) - [E(x)]2 = npq

6.- Representación: X ∑ B (n, p)


La distribución BINOMIAL ha sido utilizada en numerosas aplicaciones:
- EN JUEGOS DE AZAR.
¿Qué probabilidad hay que aparezca el color azul al girar 15 veces o más la rueda de una ruleta?.
- EN EL CONTROL DE LA CALIDAD DE UN PRODUCTO.
¿Qué probabilidad hay de que en una muestra de 20 conos de hilo del mismo tipo ninguno está‚ defectuoso, si
el 10% de todos los conos de hilo producido en cierta planta son defectuosos?
- EN LA EDUCACION.
¿Qué probabilidad tiene un estudiante de aprobar un examen de 5 preguntas de opción múltiple (cada una de
ellas contiene 4 opciones) si adivina en cada pregunta? (Aprobar se define como lograr correcto el 60% de las
preguntas; es decir, acertar por lo menos 3 preguntas)
- EN LAS FINANZAS.
¿Cuál es la probabilidad de que cierta acción mostrar un aumento en su precio al cierre, en una base diaria
durante 10 sesiones (consecutivas) de operaciones, si en realidad los cambios de precios en el mercado
accionario son aleatorios?

Fíjense que esta distribución queda definida por dos parámetros "n" y "p" y cada vez que se especifican estos
parámetros se puede presentar una distribución de probabilidad Binomial particular.

FORMA.
Una distribución binomial puede ser simétrica ó sesgada. Siempre que
p = 0.5, la distribución binomial será simétrica, sin tomar en cuenta que tan grande o pequeño sea el valor de
“n”. Sin embargo, cuando “p” es diferente de 0.5, la distribución será sesgada. Cuanto más cerca se encuentre
“p” de 0.5 y mayor sea el número de observaciones “n”, menos sesgada será la distribución, por otra parte, con
una “p” pequeña la distribución tendrá un gran sesgo a la derecha y para una “p” muy grande la distribución
tendría un gran sesgo a la izquierda.

Los cálculos de probabilidad a partir de la función, pueden llegar a ser muy tediosos, en especial cuando
aumenta “n”, sin embargo se pueden obtener las probabilidades directamente de la tabla Binomial, que está en
la Selección de tablas estadísticas y de esta forma evitar cálculos fatigosos. Esta tabla proporciona, para
diversas combinaciones de n y p, las probabilidades de que la variable aleatoria binomial tome valores x = 0, 1,
2, ..., n

Sin embargo debe tenerse en cuenta que no están todos y cada uno de los valores de “p” que se necesitan, y
hay casos en que sería necesario invertir la probabilidad de éxito por la de fracaso y volver a enunciar la variable
y buscar en la tabla los valores equivalentes de x que piden, esto se verá concretamente en un ejercicio.

¿Cómo está estructurada esta tabla?


Tiene en la primera fila los valores de “p”; en la primera columna los valores de “n” y en la segunda columna los
valores de x, pero están representados en ella por una k.
39

Y así sucesivamente.

Si se quiere tener el resultado de la probabilidad se combinan los valores de n y p y dentro de ellos se busca el
valor de x que se necesita digamos que se tiene una distribución binomial donde n = 2 y p = 0,15 y quiere
obtener la P(x = 1) donde se interceptan estos valores se obtiene la probabilidad, que en este caso es igual a
0.2550.

Ejemplo.
En la industria "Rayonera" de Matanzas se está realizando una investigación acerca de la disciplina laboral.
Las estadísticas demuestran que el 5% de los obreros son ausentistas, si se selecciona una muestra aleatoria
de 5 trabajadores. Calcule la probabilidad que:
a.- 2 de ellos sean ausentistas.
b.- entre 3 y 5 sea ausentistas.
c.- de que todos asistan.
d.- al menos 4 sean ausentistas

Aquí se puede observar que la distribución binomial se ajusta, ya que:


- el resultado se puede clasificar en éxito y fracaso (ausentistas y no ausentistas respectivamente)
- las pruebas son independientes, es decir que un obrero sea ausentista es independiente de que otro lo sea.
- n es finito, 5 trabajadores ausentistas.
- p es constante, el 5% de los trabajadores son ausentistas.

Por tanto puedo decir que X ∑B(5, 0.05)


Solución
X: número de obreros ausentistas de 5
a.- P (x = 2) = f(2) = C 2 0.05 0.95 = 10(0.0025)(0.8574) = 0.0214
5 2 3

n! 5! 5 * 4 * 3!
ya que C x = = C 25 = = = 10
n

(n − x)! x! 3!*2! 2 * 1 * 3!
Sin embargo esto se resuelve muy fácil utilizando la tabla, buscando para n = 5, y para una p = 0.05 y dentro de
ellos x = 2 donde se interceptan se obtiene este valor encontrado, es decir 0.0214. Luego podemos concluir que
únicamente será necesario hacer el cálculo a través de la función de probabilidad cuando no exista en la tabla la
probabilidad de éxito que se tiene (p)
b.- P(3 ≤ x ≤ 5) = f(3) + f(4) + f(5)
= 0.011 + 0 + 0
40
=0.011
c.- P (x=0) = f(0) = 0.7738
d.- P (x ≥ 4) = f (4) + f (5)
= 0 + 0
=0
También si no se tuviese la tabla habría que sustituir en la función de probabilidad los valores y resolverla.

Ejemplo.
La probabilidad de que un avión de combate regrese de una misión sin sufrir daños es de 0.85 y se envían 4
aviones a una misión, hallar la probabilidad de que:
a.- De 2 a 4 regresen sin sufrir averías.
b.- Al menos 3 regresen sin sufrir daños.
c.- A lo sumo dos regresen sin sufrir daños.
d.- Promedio de aviones sin sufrir daños.
e.- Probabilidad de que todos regresen dañados.

Se aprecia en este ejercicio que cumple las características de una distribución binomial, no obstante llegue Ud. a
sus propias conclusiones.

X: número de aviones de combate que regresan sin sufrir daños.

n = 4 y p = 0.85 q = 0.15. Como en la tabla no está p = 0.85 tendría que usar la función y sustituir los valores
en ella para calcular las probabilidades que piden. No obstante existe otra opción para utilizar la tabla y sería
nombrar la variable invertida es decir plantear como probabilidad de éxito, lo que tal como dan la información
es la de fracaso, que es igual a 0.15, que si está en la tabla. Pero esto a su vez implicaría buscar una
equivalencia entre lo que pide el problema y la forma en que está expresada la variable.

Y esto se hace así sencillamente para no hacer el cálculo de la probabilidad a través de la función, que sin lugar
a dudas es un tanto fatigoso, y poderlo hacer a través de la tabla.

X: # de aviones de combate que regresan dañados


n = 4 p = 0.15 y q = 0.85 Para BUSCAR la equivalencia entre lo que pide el problema y como se tiene
expresada la variable se debe hacer una tabla que ayude a ver claramente lo que se va a calcular.
Sin sufrir Daños Dañados
0 4
1 3
2 2
3 1
4 0
¿Qué regrese 1 avión sin sufrir daño? ¿No es lo mismo que decir que regresen 3 dañados?
¿Qué regresen 3 aviones sin sufrir daño? ¿No es lo mismo que decir que regrese 1 avión dañado?
Es decir se busca la equivalencia entre lo que pide el problema y la forma en que se tiene definida la variable

a.- p(2 ≤ x ≤ 4) ≡ p(x ≤ 2) = f (0) + f (1) + f (2)


= 0.5220 + 0.3685 + 0.0975
= 0.9880
b.- p(x ≥ 3) ≡ p(x ≤ 1) = f (0) + f (1)
= 0.5220 + 0.3685
= 0.8905
c.- p(x ≤2) ≡ p(x ≥2) = f(2) + f(3) + f(4)
= 0.0975 + 0.0115 + 0.0005
= 0.1095
d.- np = 4(0,85) = 3.4 = μ

npq = 0.85(0.15)(4) = 0.1275(4) = 0.51 = σ2


41
e.- p(x = 4) = 0.005 Esta pregunta está realizada tal como está designada la variable, de ahí que no haya que
buscar equivalencia. De haber estado formulada la variable como al inicio habría que haber buscado p(x = 0).

Realizar los ejercicios 251 al 268, del Laboratorio de Estadística Matemática I que están en las páginas 181 a
186.

DISTRIBUCION DE POISSON.
Esta distribución se refiere a aquellas situaciones en las cuales el suceso ocurre repetidamente, pero al azar, es
decir sin seguir una periodicidad dada, se produce aleatoriamente.
A la ocurrencia del suceso se le denomina CAMBIO.

Estos cambios pueden ocurrir en el tiempo, o en puntos aleatorios, o en una línea de espera. Es decir pueden
formularse en función del tiempo, unidades de longitud, área o volumen etc..
El interés estará centrado en: número de cambios que ocurren en un intervalo dado. Ejemplo: Número de
barcos que llegan al puerto de la Habana en una semana. Ejemplo: Número de negocios que cierran, por
semana, en Ciudad de la Habana.

La variable aleatoria discreta: X = # de éxitos por unidad (es decir, por intervalo de tiempo, longitud, área,
etc.).
Se dice que se da un proceso de Poisson si se pueden observar sucesos o eventos discretos, en un intervalo
continuo (de tiempo, longitud, área etc.), de forma tal que si se acorta el intervalo lo suficiente:
1.- La probabilidad de observar exactamente un cambio ó un éxito en el intervalo, es estable.
2.- La probabilidad de observar dos o más cambios ó éxitos en el intervalo es cero.
3.- La ocurrencia de un cambio ó éxito en cualquier intervalo es estadísticamente independiente de sucesos en
cualquier otro intervalo.

Ejemplo: Supóngase que se estudian las llamadas recibidas por hora en la Central telefónica de una estación
de policía. Cualquier llamada que se reciba es un evento discreto en un punto determinado durante un intervalo
continuo de una hora.
En una hora se recibirán 180 llamadas como promedio. Ahora si se dividiera el intervalo de una hora en 3600
intervalos consecutivos de un segundo, se tendría: λ = 180/3600 = 0.05/segundos
1.- La cantidad esperada (ó promedio) de llamadas recibidas en cualquier intervalo de un segundo sería 0.05, es
decir sería estable.

2.- La probabilidad de recibir más de una llamada en cualquier intervalo de un segundo es cero.

3.- Recibir determinada llamada en cualquier intervalo de un segundo no tiene efecto (es decir es
estadísticamente independiente) sobre recibir una llamada en cualquier otro intervalo de un segundo.

1.- CARACTERISTICAS: Sin antecedentes, importancia para su uso en programación Matemática.


- Número de observaciones finitas pero no numerables, n → ∞
- Se observa si ocurre un suceso que se denomina cambios
- Las observaciones de cambios asociados a un intervalo (Esto es, el suceso ocurre repetidamente en el
tiempo, pero al azar sin seguir una periodicidad dada, se produce aleatoriamente)
2.- Definición de la Variable:
x: # de cambios que se producen en un intervalo "t"
X : 0, 1, 2, ..., ∞

3.- Función de probabilidad: f (x) = e− λ λx / x ! Donde λ = promedio (histórico)de cambios en una unidad
"t" y “e” es una constante (2.71828)
xk
4.- Función de Distribución: F(x) = ∑ f (x )
x =0
5.- Parámetros:
μ =λ Coinciden numéricamente aunque por supuesto μ está expresada en
σ2 = λ unidades lineales y σ2 en unidades cuadráticas.
42
6.- Simbólicamente se expresa como:
X∼ P ( λ)
Esta distribución queda definida por un solo parámetro, “λ” .

FORMA:
La distribución de Poisson estará sesgada hacia la derecha cuando λ es pequeña. Se acercará a la simetría
(con su punto más alto en el centro) según aumente λ.

De la misma forma que se planteó en la distribución binomial que el cálculo de probabilidad se hacía fatigoso a
través de la función, sucede con esta distribución, pero esta distribución también está tabulada, encontrándose
su tabla en la Selección de Tablas estadísticas.

¿Cómo está estructurada la tabla?


Tiene en la primera fila los valores de λ, y en la primera columna los valores de x designados en esta tabla por
k.
En ella aparecen grupos de valores para valores de λ desde 0.1 hasta 8, estando estos grupos definidos hasta
donde "x" puede tomar valores, proporciona los valores de λ con aproximación hasta la décima.

Se debe señalar que para ejercicios con valores de λ mayores de 8 se debe usar la tabla de "e a la menos x"
que está en la pagina 20 de la Selección de tablas estadísticas; sustituyendo en la fórmula de la función los
valores correspondientes.

Ejercicio.#1
Una pizarra telefónica recibe 480 llamadas en una hora, pero no puede recibir más de 12 llamadas en un minuto.
Determine:
a.- La probabilidad de que se produzcan 10 llamadas en un minuto.
b.- La probabilidad de que la pizarra quede saturada en un minuto dado.
c.- La probabilidad de que se produzcan a lo sumo 1 llamada en un minuto.
d.- La probabilidad de que se produzcan mas de 2 llamadas en un minuto.
43
e.- El número de llamadas esperadas en un minuto.
x: # de llamadas que se reciben en un minuto
λ = 480/hora Se tiene que llevar λ a las mismas unidades que piden la probabilidad: en minutos.

Se puede hacer a través de una simple regla de 3


480 ------ 60 mts
λ ------ 1 mt 480/60 = 8 por mt
λ = 8 /mt
Ahora se va a la tabla y se busca un λ = 8, y dentro de este grupo se busca el valor de la X o las X que se
necesitan.
a.- P(x =10) = f (10) = 0.0993
b.- P(x > 12) = Porque como la pizarra no puede recibir más de 12 llamadas en un minuto, quedaría saturada si
recibe más de 12 llamadas
P(x >12) = 1 - P(x ≤ 12)
= 1 - [p(x=0)+ p(x=1)+ p(x=2)+ p(x=3)+ .... +p (x =12)
= 1 - 0.9362
= 0.0638
Deben darse cuenta que en la distribución de Poisson "x" toma valores desde 0 hasta ∞, por tanto NUNCA SE
PUEDE CALCULAR p(x > ó p(x ≥ que un valor cualquiera directamente, sino que siempre en estos casos hay
que trabajar con el complemento. Y tener en cuenta que si la igualdad está en la parte izquierda de la expresión
no debe estar en la derecha ó si la igualdad no está en la parte izquierda deber estar en la derecha, esto es,
debe estar en uno de los dos lados de la expresión.

c.- P(x ≤1) = f (0) + f (1)


= 0.0003 + 0.0027
= 0.0030
d.- P(x >2) = 1 - P(x ≤2)
= 1 - [f (0)+ f (1)+ f (2)]
= 1 – (0.0030 + 0.0027 + 0.0107
= 1 – 0.0137 = 0.9860
e.- μ = λ = 8 en un minuto.

Ejercicios #2
Sea f (0)= e-λ λ/0! = 0.00674
Se pide:
a.- Hallar el valor de λ
b.- calcule la probabilidad de que X = 5 , en 1.5t
Solución:
ε − λ λ0
a.- Se sabe que en f (0 ) = , λ0 = 1; 0! = 1 por propiedades de los factoriales.
0!

Por tanto se busca e- λ = 0.00674 en la tabla de e-x que está en la pagina 20 de la selección de tablas
estadísticas.
Y se obtiene que e-5 = 0.00674 lo que implica que λ = 5

b.- P(X = 5) = f (5) = 0.0141 para un λ =1.5

Pueden hacer los ejercicios desde el 286 a 303 del Laboratorio de Estadística Matemática I, que están en las
páginas desde la 202 a 206.

AUTOEXAMEN

1.- ¿Cuales son las características de una distribución Binomial?


44
2.- ¿Qué parámetros define la distribución Binomial?
3.- ¿Cuales son las características de una distribución de Poisson?

4.- ¿Qué parámetros define la distribución de Poisson?

5.- ¿Diga cuál es la media y la varianza en la distribución Binomial?

6.- ¿Diga cuál es la media y la varianza en la distribución de Poisson?


7.- ¿Estas dos variables, corresponde a variables aleatorias discretas o continuas?

8.-¿Qué representa λ en la distribución de Poisson?

9.- Diga que expresa la variable X en la distribución binomial, y cual es su recorrido.

10.-Diga que expresa la variable X en la distribución de Poisson, y cuál es su recorrido.

11.- Sobre la base de la experiencia anterior, la impresora principal del centro de cómputo de cierta universidad
funciona adecuadamente el 90% del tiempo. Si se hace una muestra aleatoria de 10 inspecciones:
a.- ¿Cuál es la probabilidad de que la impresora principal funcione en forma apropiada...
a.1.- exactamente nueve veces?
a.2.- por lo menos nueve veces?
a.3.- cuando más 9 veces?
a.4.- más de 9 veces?
a.5.- menos de 9 veces?
b.- ¿Cuantas veces se puede esperar que funcione en forma apropiada la impresora principal?

12.- El número promedio de automóviles que se detienen por minuto para tomar gasolina en cierta gasolinera
perteneciente a CUPET de Ciudad de la Habana es 1.2. ¿Cuál es la probabilidad de qué en determinado minuto
se detengan ...
a.- menos de dos automóviles?
b.- más de tres automóviles?
c.- menos de dos automóviles ó más de tres?
d.- dos ó tres automóviles para tomar gasolina?
e.- al menos dos automóviles?

Ahora se pasará a estudiar las distribuciones correspondientes a variables aleatorias continuas que se imparten
en este programa, se comenzará por la distribución Normal.

Tema III.- Distribución Normal. Utilización de tablas estadísticas.


Distribución Ji-Cuadrado T'student.y F de Fisher. Utilización de tablas estadística de las diferentes
distribuciones. BIBLIOGRAFIA: Estadística capitulo 5 páginas de la 98/108
DISTRIBUCION NORMAL
Luego de estudiar dos distribuciones de probabilidad discreta se prestará atención a las funciones continuas de
densidad de probabilidad, las que se producen por algún proceso de medición en diversos fenómenos de
interés.
Los modelos continuos tienen aplicaciones importantes en los negocios y en las ciencias sociales, además de en
la Ingeniería y la Física.
Muchas de las técnicas utilizadas en estadística aplicada se basan en la distribución Normal o de Gauss.

1.- CARACTERISTICAS.
- Tiene la forma de una campana boca a bajo.
- Es simétrica con respecto a X = μ
- La función está definida en todo el eje X
- La función tiene un máximo en X = μ = Me = Md
- Tiene dos puntos de inflexión en μ +σ y μ - σ
- Su variable aleatoria asociada tiene rango infinito (− ∞ < Χ < ∞ )
45

−∞ μ − 2σ μ − σ μ μ+σ μ + 2σ ∞
Me
Md

2.- FUNCION DE PROBABILIDAD

f ( x ) = 1 / σ 2π e −1/ 2 ( x − μ /σ ) Donde: e = 2.71828 y π =3.14159


2

3.- FUNCION DE DISTRIBUCIÓN


xk
F(x) = f ( x )dx La función de distribución tiene una marcada importancia en las distribuciones
−∞
continuas ya que a partir de sus propiedades es factible calcular fácilmente probabilidad, además de que las
tablas estadísticas lo que tiene tabulada es la Función de distribución.
Para calcular P(X ≤ Xk) = F(X)
P(X > Xk) = 1 - F(X)
P(a < X ≤ b) = F(b) - F(a) Recuerde que en variables continuas no interesa si es < ó ≤ , ó > ó ≥ , ya
que no existe la probabilidad de un punto.
4.- PARAMETROS. La media en esta distribución es μ y la varianza es σ2 por lo que la misma queda definida
por estos dos parámetros ya que "e" y " π " son constantes matemáticas.
5.- REPRESENTACION
X ∼ Ν(μ, σ) Por lo tanto habrá tantas curvas normales, como valores o combinaciones particulares de
μ, y σ haya
Como es una variable continua para calcular probabilidad se tendría que integrar la función de X, en el intervalo
que se quiere hallar la probabilidad.
¿Cómo se podría hacer una tabla, para no tener que integral?
La única forma de hacer una tabla para evitar este cálculo sería estandarizando la variable, es decir cualquier
variable aleatoria normal X, se convierte en una variable aleatoria estandarizada "Z" que siempre tendría como
media cero y desviación típica 1; y así se tendría la posibilidad de tabular los resultados.

1
1 − 2 z2
Pues bien Z→ N(0,1) y su función de probabilidad es: f ( z) = l

x−μ
Donde: Z =
σ
Toda distribución normal con media μ y desviación típica σ tiene la característica de tener el área bajo la curva
de su función de densidad, distribuida de la siguiente forma:
a.- P(μ −σ < Χ < μ+σ) = 68.27% del área bajo la curva normal
b.- P(μ −2σ < Χ < μ+2σ) = 95.45% " " " " " "
c.- P(μ −3σ < Χ < μ+3σ) = 99.73% " " " " " "

A estas tres expresiones se les llaman comúnmente propiedades de las 3sigmas, las cuales representan áreas
bajo la curva de la función de la distribución normal.
46

ESTRUCTURA Y MANEJO DE LA TABLA:


La tabla de esta distribución está en las páginas 15 y 16 de la selección de tablas estadísticas.
Su estructura es la siguiente: En la primera columna tienen los valores de Z, hasta la aproximación de la décima
y en la primera fila la aproximación de la centésima. En la hoja #15 están tabulados los valores de Z negativos, y
en la hoja #16 los valores de Z positivos. Como se dijo anteriormente en esta tabla están registrados los valores
de la función de distribución, por tanto son valores acumulados, es decir acumula desde menos infinito(-∞) hasta
el valor de Z que se busca, de ahí la importancia de aplicar las propiedades de la función de distribución
planteadas anteriormente para buscar las probabilidades. En el cuerpo de la tabla están las probabilidades
correspondientes.
Los valores de Z negativos, corresponden a la cola izquierda, y los valores de Z positivos corresponden a la cola
derecha, tenga en cuenta que Z puede tomar valores negativos ó positivos ¡PERO LA PROBABILIDAD
SIEMPRE ES POSITIVA!

Así para una Z = -2.82 la probabilidad acumulada hasta ese valor es .0024 es decir desde menos infinito hasta
donde está ubicado Z=-2.82

A continuación se presentará la Tabla correspondiente a la parte derecha de la Distribución Normal, es decir los
valores positivo de la Variable tipificada “Z”
47

EJERCICIOS: Ejemplo. 324 página.223 del Laboratorio Estadística Matemática I


En una distribución normal con μ = 23 y σ2 = 25, hallar:
a.- P(X < 23,5) e.- P(25 < X < 30)
b.- P(X > 10) f.- P(X < 20)
c.- P(X >23) g.- P(X < 25)
d.- P(8 < X < 21) Se le recomienda al estudiante hacer el gráfico de lo que le piden en cada caso.
Solución: TENGA EN CUENTA QUE LE DAN EL VALOR DE LA VARIANZA, Y UD DEBE TRABAJAR CON LA
DESVIACION TIPICA (RAIZ CUADRADA DE LA VARIANZA).
a.- P(X < 23,5) = P(Z < (23,5 - 23)/5) = P(Z < 0,5/5) = P(Z < 0,1) =
= Fz(0,1) = 0,5398

b.- P(X > 10) = 1 - P(X < 10)= 1 - P(Z < (10-23)/5)= 1 - P(Z < -13/5)
= 1 - P(Z < -2,6) = 1 - Fz(-2.6) = 1 - 0.0047 = 0.9953

c.- P(X > 23) = 0.50 Esto no hay ni que buscarlo en la tabla porque el área bajo la curva es 1 por tanto de la
mitad al final de la distribución será la mitad, (0.50) pero además, en este punto "Z" es igual a cero, y buscando
Z=0 daría también Fz(0) = 0.50

d.- P(8 < X < 21) = P[(8-23)/5 < Z < (21-23)/5]= P(-15/5 < Z < -2/5)=
= P(-3 < Z < -0.4)= Fz(-0.4) - Fz(-3) =
= 0.3446 - 0.0013 = 0.3433

e.- P(25 < X < 30) = P[(25-23)/5 < Z < (30-23)/5]= P(2/5 < Z < 7/5)=
= P(0.4 < Z < 1.4) = Fz(1.4) - Fz(o.4) =
= 0.9192 - 0.6554 = 0.2638
f.- P(X < 20) = P(Z < (20-23)/5) = P(Z < -3/5) = P(Z < -0.6) =
= Fz(-0.6) = 0.2743

g.- P(X < 25) = P(Z < (25-23)/5) = P(Z < 2/5) = P(Z < 0.4) =
= Fz(0.4) = 0.6554
48

Ejemplo. 332 página 226 del Laboratorio


La Empresa de Jabonería y perfumería tiene una máquina para llenar cajas de polvo facial. En un informe del
departamento de control estadístico, se plantea que la variable, llenar cajas con polvo facial, está distribuida
normalmente con media igual a 15 onzas y desviación típica (ó Estándar) igual a 0.8.
.- ¿Qué proporción de las cajas tendrá pesos netos mayores que 14 onzas?
b.- ¿Qué proporción de las cajas tendrá pesos netos entre 13 y 14 onzas?
c.- ¿Cuál es el peso mínimo del 20% de las cajas más pesadas?

Solución: En este caso a pesar de que el cálculo de la distribución normal está enmarcada en el contexto de
una situación concreta, se hace igual al ejercicio anterior, según sea el caso, excepto el último inciso que como
se verá no pide probabilidad, si no el número, esto se explicará en el propio inciso. Se debe significar también
qué cuando le piden proporción sólo multiplican por 100 la probabilidad y así obtienen dicha proporción.

a.- P(X > 14) = 1 - P(X < 14) = 1 - P(Z < (14-15)/0.8) =
= 1 - P(Z < -1/0.8) = 1 - P(Z < -1.25)=
= 1 - Fz(-1.25) = 1 - 0.1056 = 0.8944 el 89.4% de las cajas tendrá pesos netos mayores de 14
onzas.

b.- P(13 < X < 14) = P[(13-15)/0.8 < Z < (14-15)/0.8] =


= P(-2/0.8 < Z < -1/0.8)= P(-2.5 < Z < -1.25) =
= Fz(-1.25) - Fz(-2.50)=
= 0.1056 - 0.0062= 0.0994 el 9.94% ó el 10% de las cajas tendrán pesos netos entre 13 y 15
onzas.
c.- En este inciso, piden el peso mínimo del 20% de las cajas más pesadas. ¿Dónde están las cajas más
pesadas? ¿En la parte izquierda o derecha de la curva? por supuesto que en la parte derecha de la curva, dibuje
o sombree esa punta:

0.20 Como Z = (x - μ)/σ y lo que interesa es “X” se puede buscar despejando


ya que se tiene el valor de μ y σ; y como se tiene el valor del área (0.20)
___________________________ se puede obtener “Z” en la tabla
μ = 15 ? x

" Se podría decir el área que se busca está en la cola derecha, entonces el signo que lleva Z, es positivo” pero
¿de donde se obtendría el valor de Z?. Del cuerpo de la tabla, ¿por qué? Porque si se tiene un área qué es el
20% eso es equivalente a una probabilidad igual a 0.20, por tanto se buscaría en el cuerpo de la tabla (no en la
primera columna) una probabilidad igual o muy próxima a 0.20 y se toma la Z que le corresponde, considerando
hasta la aproximación a la centésima, PERO SIN TOMAR EL SIGNO QUE TENGA "Z" EN LA TABLA, ya que si
el área que se busca está en la cola derecha, como se dijo anteriormente, Z llevará el signo positivo y si está
en la cola izquierda llevará el signo negativo, esto es muy importante para llevar a cabo bien el cálculo de "x". En
este caso el valor que más se aproxima a 0.20 en el cuerpo de la tabla es la Z = -0.8, columna 4, por tanto es -
0.84, pero, ¿porque digo que esto es una probabilidad de 0.20?, Porque debemos de recordar que esta es una
distribución simétrica y nos da el área acumulada. Luego ya se tienen todos los elementos para sustituir en la
formula; en este caso se está trabajando con la cola derecha por lo tanto la Z es positiva (0.84). Sustituimos:

Zσ+μ=x
0.84 (0.8) + 15 = X
0.672 + 15 = X
15.67 = X
Fíjense que cuando el área que se busca está a la derecha, evidentemente el valor de X que se busca debe ser
mayor que “μ”, mientras que si es el izquierdo debe ser menor que “μ”
También esto lo podría hacer haciendo corresponder la Función de Distribución con lo que está tabulado se lo
que le piden cola derecha , entonces tendría 1 – la probabilidad pedida y el valor de “Z” le saldrá directamente
con el signo, es decir si el 20% se refiere a la cola derecha entonces 1 – 0.20 = 0.80 y busca la Z que le
corresponde a un área del 80% y le daría directamente el signo con que se debe plantear el valor de “Z”.
49

Se podría hacer otro inciso de este mismo corte:


¿Cuál será el peso máximo del 10% de las cajas menos pesadas?
¿Dónde se encontrarían las cajas menos pesadas? ¿A la izquierda ó a la derecha? Una vez ubicado ¿El valor
de Z será negativo ó positivo? ¿El valor de X será mayor ó menor que 15?
Teniendo en cuenta todas estas interrogantes trate de resolver este inciso.

0.10

_______________________________
? μ=15

Pueden realizar los ejercicios desde el 321 al 338, que están en la paginas desde la 221 a 229 del Laboratorio
de Estadística Matemática I.

DISTRIBUCION T'STUDENT, CHI-CUADRADO y F DE FISHER


El estudio de estas tres distribuciones se circunscribe al manejo de las tablas, ya que su aplicación se verá
posteriormente

DISTRIBUCIÓN T'STUDENT.

Es una distribución continua de considerable importancia práctica, muy utilizada en la teoría de muestras
pequeñas, con la que se trabajará en el campo de la inferencia.

La distribución t'student es la distribución de la variable:

X
t=
Y /ν
Donde ν es la letra griega nu, que es un entero positivo, conocida por grados de libertad. Las variables "X" y "Y"
son variables aleatorias independientes, donde "X" está normalmente distribuida con media cero y desviación
típica uno, y "Y" sigue una distribución Ji'Cuadrado con nú grados de libertad.

Siendo su función de probabilidad:


f (t ) = Kν Constante que depende de ν
(1 + t / ν ) (ν +1)/ 2
2

En esta distribución μ = 0 para ν = 2, 3; σ2 = ν /( ν - 2) para ν =3, 4


Cuando ν (nu) crece la variable t tiende a la distribución normal con μ = 0 y σ = 1, es decir coincide con la
normal estandarizada. Y ν (nu), representa los grados de libertad ¿Qué es esto? Lo veremos a continuación
Se dice que esta distribución tiene (n -1) grados de libertad, y esto nos indica que solo n - 1 de los valores de la
muestra están libre para variar. Es decir hay n-1 grados de libertad.
Se puede demostrar este concepto de la forma siguiente. Suponga que sé tiene una Muestra de 5 elementos
con un media igual a 20 ¿Cuantos valores diferentes se necesitarían conocer antes de poder obtener el resto?
n
El hecho de que n = 5 y de que X = 20 también indica que ∑X
i =1
i = 100
Por lo tanto una vez que se conocen 4 valores el quinto no tendrá "libertad de variar" puesto que la suma tiene
que ser 100. Digamos que 4 de los valores son: 18, 24, 19, y 16, el quinto solo puede ser 23 para que todos
sumen 100.

Esta distribución es simétrica, como la normal, pero es un poco más achatada que ella.
Está tabulada la función de distribución, como ustedes saben que acumula desde - ∞ hasta un punto, en este
caso la tabla de t'student que está en la selección de tabla estadística está tabulada desde menos infinito hasta
50
la mitad positiva de t. Aquí pasa lo mismo que en la distribución normal que como μ = 0 los valores de t a la
izquierda son negativos y a la derecha son positivos, PERO LA PROBABILIDAD SIEMPRE ES POSITIVA.

La estructura de esta tabla es la siguiente: Tabla limitada para algunos valores de ν (nu), grados de libertad ya
que no es posible el total de valores. Estos están ubicados en la primera columna. NOVEDAD: el área se
encuentra en la primera fila (las probabilidades), y en el cuerpo de la tabla los valores de "t".

La razón apuntada anteriormente, de que está tabulada la función de distribución, pero sólo los valores positivos
de "t", lleva a tener que hacer algunas transformaciones cuando aparece un percentil con signo negativo, es
decir si se tiene que buscar un área que corresponde a la cola izquierda, evidentemente el valor de "t" es
negativo, en ese caso, se le cambia el sentido del signo de la desigualdad, lo que está apoyado en la simetría de
la distribución. De la misma forma si se trabaja con las propiedades de la función de distribución y se tiene el
caso de una Ft evaluada para algún valor de "t" negativo, como en principio cambia la desigualdad, entonces
será [1 - Ft] (con el valor correspondiente positivo).

Ejemplo:
Se tiene una Variable aleatoria "x", con distribución t'student, resuelva las siguientes proposiciones:
a.- Represente gráficamente y calcule P(t(17) > -0.392)
b.- Halle P(t(17) < 0.863)
c.- Resuelva P(-1.07 < t(17) < 2.9)
d.- Diga el valor de P(t(17) < - 0.534)
e.- Calcule P(-1.74 < t(17) < -0.257)
f.- Halle tk las que P(t(17) < tk) = 0.75
g.- Halle entre que valores t1 y t2 se encuentra una probabilidad central del 0.70 si t(17).
Solución:
a.- P(t(17) > -0.392) = P(t(17) < 0.392)
= Ft (0.392) = 0.65
Se busca en 17 grados de libertad un valor igual o próximo a 0.392 y el valor que le corresponde ubicado en la
primera fila es la probabilidad buscada.
Y así se procede en todos los casos.
Gráficamente se puede observar según figura A y B:
Fig. A Esto es lo que piden, el área sombreada
51

t = -0.392

Sin embargo la fig. B muestra lo que calcula la tabla, el área sombreada en la cola izquierda.

μ = 0 t = 0.392
Fig. B
Esto es, la tabla calcula desde -∞ hasta el área positiva, gracias a la simetría de la distribución, el área marcada
en cada figura son iguales por tanto se obtiene de esta forma la probabilidad buscada.
b.- P(t(17) < 0.863) = Ft(0.863) = 0.80 POR DEFINICION DE Fx
c.- P(-1.07 < t(17) < 2.9) = Ft(2.9) - Ft(-1.07) por propiedad de Fx
= Ft(2.9) - [1 - Ft(1.07)] por ser "t" negativa
= 0.995 - (1 - 0.85)
= 0.995 - 0.15
= 0.845
d.- P(t(17) < -0.534) = P(t(17) > 0.534)
= 1 - Ft(0.534) por propiedad de Fx
= 1 - 0.70
= 0.30
e.- P(-1.74 < t(17) < -0.257) = Ft(-0.257) - Ft(-1.74) por propiedad de Fx
=[1 - Ft(0.257)] - [1 - Ft(1.74)] por estar las dos "t" negativas
= (1 - 0.60) - (1 - 0.95)
= 0.40 - 0.05
= 0.35
f.- P(t(17) < tk) = 0.75 ====> tk = 0.689
g.- P(t1 < t(17) < t2) = 0.7 para buscar estos dos valores, se grafica la distribución, se dibuja un área central
igual a 0.70 y los 0.30 restantes se dividen para las dos colas:
0.85

0.15 0.70 0.15


Buscando esta área se obtiene el valor de "t" positivo en la tabla (es decir de t2) y el valor de t1 es el mismo con
signo negativo, debido a la simetría de la distribución.

t1 0 t2

De esta parte pueden hacer los ejercicios 368 a 376, que están en la página 249 a 253.

DISTRIBUCION JI-CUADRADO
Esta distribución fue introducida por Helmert en 1876.
52
Si X1, X2, ... Xv, son variables aleatorias normalmente distribuidas e independientes con media cero y varianza
1, la suma de sus cuadrados, se representan en general por χ2 (Ji-Cuadrado ó Chi-cuadrado) y donde :

χ2 = X21 + X22 + ... + X2v


A la distribución, se le llama distribución de Ji-cuadrado, siendo su función de densidad:
f ( x ) = Kν χ (ν − 2 )/ 2 e -x/2
Cuando x > 0
y ƒ(x ) = 0 Cuando x ≤ 0
En esta función ν (nu), es un entero positivo, que se le llama grado de libertad de la distribución y Kν es una
constante que depende de ν
Para ν > 2 la curva de ƒ(x) tiene un máximo en X = (ν - 2)

La distribución χ2 tiene como μ = ν y σ2 =2ν


Cuando ν(nu) es grande (ν > 30) la distribución χ2 se puede aproximar a la distribución normal. Observe que
esta distribución depende de un sólo parámetro ν(nu).
La función de distribución viene dada por:
xk
F ( x) = ∫ f ( x)dx
0
Y está tabulada para distintos valores de los grados de libertad (el número de variables independientes que
intervienen en una expresión dada)

Es una distribución deformada a la derecha:

0 ∞
Estructura de la tabla: Tabla limitada para algunos valores de ν(nu), no es posible el total en el recorrido 0
<x<∞
Novedad: El área o probabilidad se encuentra en la primera fila y en la primera columna los grados de libertad, y
en el cuerpo de la tabla están los valores de ji-cuadrado.
Como lo que está tabulado en la función de distribución, la misma proporciona el área desde cero hasta un
punto.
53

EJEMPLO:
Se conoce que una variable en estudio tiene una distribución χ2, resuelva las siguientes proposiciones:
a.- Calcule P (χ2(17) >10.1) y represente el área en un gráfico.
b.- Halle P(5.7 < χ2(17) < 21.6)
c.- Diga el valor de P(χ2(17) < 27.6)
d.- Hallar Xk si P(χ2(17) > χ2k) = 0.8
e.- Calcule la P(7.56 < χ2(17) < 16.3)
f.- Hallar los g.l. que satisfacen P(χ2 > 8.9) = 0.99
g.- De la lectura de los valores en la tabla de F(x) diga que valores χ21 y χ22 alrededor de χ2(21) = 20.3 forman
probabilidades de áreas centrales.
Solución:
a.- P(χ217) > 10.1) = 1 - P(χ2(17) < 10.1)
= 1 - Fχ2(10.1) se busca en la tabla a partir de ν = 17
= 1 - 0.10 el valor en esa línea = 10.1 y el valor
= 0.90 que le corresponde en la primera fila
es la probabilidad buscada, resultando en este caso igual a 0.10. Y así se procede en todos los casos. Esta tabla
es similar a la de t'student en la forma de proceder para obtener la probabilidad.
(Aquí en este inciso se aplicó una de las propiedades de la F(x).

b.- P(5.7 < χ2(17) < 21.6) = Fχ2(21.6) - Fχ2(5.7) por propiedad de Fx
= 0.80 - 0.005 = 0.755

c.- P(χ2(17) < 27.6) = Fχ2(27.6) = 0.95 por definición de F(x)

d.- P(χ2(17) > Xk) = 0.8 ===> P(χ2(17) < Xk) = 0.20 por tanto Xk = 12

e.- P(7.56 < χ2(17) < 16.3) = Fχ2(16.3) - Fχ2(7.56)


= 0.50 - 0.025 = 0.475 por propiedad de Fx
54
f.- P(χ > 8.9) = 0.99 ===> P(χ < 8.9) = 0.01 por tanto ν = 21 esto se obtiene recorriendo los valores de χ
2 2 2
0.01 y
donde esté 8.9 ó un valor próximo a él, y se busca el grado de libertad que le corresponde a este valor.

g.- Puntos χ21 y χ22 simétricos que forman un área central con χ221 = 20.3 son:

χ21 χ22 Probabilidad área


17.2 23.9 0.30 0.70 0.40
15.4 26.2 0.20 0.80 0.60
13.2 29.6 0.10 0.90 0.80
11.6 32.7 0.05 0.95 0.90
10.3 35.5 0.025 0.975 0.95
8.9 38.9 0.01 0.99 0.98
8.03 31.4 0.005 0.995 0.99

De esta distribución puede hacer los ejercicios 360 a 366 del laboratorio de Estadística Matemática I en las
páginas desde la 243 a 246.

DISTRIBUCIÓN “F” DE FISHER


Otra de las distribuciones importantes asociadas a la normal en la que se define como cociente de distribuciones
χ2 independientes. Sean X ∼ χ n e Y∼ χ m variables aleatorias independientes decimos entonces que la variable:
2 2

1 / nX m X
F= = ∼ Fn , m ≠
1 / mY n Y
Sigue una distribución de probabilidad de Fisher, con (n. m) grados de libertad. Obsérvese que Fn , m ≠ Fm ,n
Su función de densidad es:
⎛ n + m ⎞ n/2 m/2
Γ⎜ ⎟n m
f ( x) = ⎝ 2 ⎠
x −( m − 2 ) / 2 (m + nx) −( n + m ) / 2
⎛n⎞ ⎛m⎞
Γ⎜ ⎟Γ⎜ ⎟
⎝2⎠ ⎝ 2 ⎠

Es obvio que esta distribución no es simétrica y sólo tiene densidad de probabilidad distinta de cero los puntos
+
de ℜ
Otra propiedad interesante de esta distribución es:
1
F ∼ Fn ,m ⇔ ∼ Fm , n
F
Una aplicación importante de la misma es la relación entre dos varianzas de poblaciones diferentes, por lo que
tiene dos conjuntos de grados de libertad, uno en el numerador y otro en el denominador. Así cada par de
grados de libertad determina una distribución F y, para señalar lo que indica si escribimos Fn, m , podemos decir
que “n” representa los grados de libertad del numerador y “m” los grados de libertad del denominador.

A continuación plantearemos una de las Tablas donde aparecen los valores críticos de Fn, m , Para un 5%,
también está exactamente igual para un 1%.
Manejo de la Tabla:
En esta tabla debe entrarse con 3 valores, el nivel de significación apropiado, el número de grados de libertad
del numerador, que en la tabla están en la primera fila, el número de grados de libertad del denominador que
están en la primera columna(a la izquierda).

Se presentan dos tablas separadas, una para las proporciones acumulativas del 95% y otra del 99% (F0.95
, F0.99). También se marcan con el 5% y el 1 % y estos porcentajes se refieren a la proporción de área
encerradas por las curvas a la derecha de los valores dados en las tablas. Lo que nos indicaría si n= 10 y m =12,
en una tabla de un 1% que el 1% del área bajo la curva F10.12 está a la derecha de 4.30, y en 5% está a la
derecha de 2.75. Y recordar siempre que F10, 12 ≠ F12, 10 y análogamente aparecen números diferentes en la
55
Tabla, en la intersección de la columna 12 y la fila 10 de los que aparecen en la intersección de la columna 10 y
la fila 12.

Ejemplo:
Si se reconoce que la variable aleatoria en estudio sigue una distribución F de Fisher, resuelva las siguientes
proposiciones:
a) P(F(4,15) < 3.06)
b) P(F(4,15) > 4.89)
c) El valor de Xk, tal que P(F(10,20) < Xk) = 0.99
d) El valor de Xk, tal que P(F(12,8) > Xk) = 0.95
e) El valor de Xk, tal que P(Xk < F(15,15) < 2.40) = 0.90
f) P(0.2123 < F(10.12) < 4.30)
g) Hallar X1 y X2 tal que P(X1 < F(20,30) < X2) = 0.98 y P(X < X1) = P(X > X2)

Solución:
Recuerden que la F de Fisher, se puede calcular con una probabilidad del 95% ó del 99%, por que se tendrá que
buscar en ambas tablas, para poder resolver estos ejercicios y poder decir la probabilidad correspondiente,
además recordar que se debe tener en cuenta los grados de libertad de numerador. (el primero que está
expresado en la F, y que este está en la primera fila de la tabla, y los grados de libertad del denominador, que es
el segundo que está en la “F” y que este se encuentra en la primera columna.

a) P(F(4,15) < 3.06) = 0.95


b) P(F(4,15) > 4.89) = 1 – 0.99 = 0.01
c) El valor de Xk, tal que P(F(10,20) < Xk) = 0.99 ⇒ Xk = 3.37
d) El valor de Xk, tal que P(F(12,8) > Xk) = 0.95 ⇒ Xk = 3.28
e) El valor de Xk, tal que P(Xk < F(15,15) < 2.40) = 0.90
0.05
0.95
56

0.90

0.05.
En 0.95 F15, 15 = 2.40, por tanto si en este percentil la Probabilidad es 0.95, en 0.05 F15,15 = 0.416, luego el área
entre estos dos valores es 0.90.

f) P (0.2123 < F(10.12) < 4.30


En este caso lo que no están pidiendo es el área entre estos dos valores es decir:

0.2123 4.30

Si la P (F (10, 12) < 4.30) = 0.99 y P (F(10, 12) < 0.2123 ) = 0.01 entonces el área de la primera, menos el área de la
segunda, nos daría el área central es decir: 0.99 – 0.01 = 0.98.
De la misma forma la P(X < X1 = 0.2123) = 0.01 que es igual a la P(X > X2 = 4.30) = 1 – 0.99 = 0.01, esto es los
dos tienen la misma probabilidad.

De esta parte pueden hacer los ejercicios que están en el Laboratorio desde el número 378 a 386.

AUTOEVALUACION
1.- ¿Cuáles son las características de la distribución normal

2.- ¿Qué parámetros la definen?

3.- ¿Qué distribución tiene Z, y cuáles son su media y varianza?

4.- ¿A qué tipo de variable corresponden estos tres modelos: Normal, T'Student y Ji-Cuadrado?

5.- El análisis estadístico de 1000 llamadas telefónicas de larga distancia realizadas desde las oficinas centrales
de la Corporación Cimex, señala que la duración de estas llamadas está distribuida normalmente con μ = 240
segundos y desviación típica igual a 40 segundos.
a.- ¿Qué porcentaje de llamadas duró menos de 180 segundos?
b.- ¿Cuál es la probabilidad de que una llamada en particular durara entre 180 y 300 segundos?
c.- ¿Cuantas llamadas duraron menos de 180 segundos ó más de 300 segundos?
d.- ¿Qué porcentaje de las llamadas duró entre 110 y 180 segundos?
e.- ¿Cuál es la duración mínima del 1% de las llamadas más largas?

6.- Determine el valor de Xo en cada uno de los siguientes casos:


a.- P(Xo < X < 26,2) = 0.98 conociendo que X sigue χ212
b.- P(Xo < X < 2,76) = 0.98 conociendo que X sigue t (10)

7.- Calcule cada uno de los valores siguientes:

Con 15 grados de libertad:


57
a.- t0.90 b.- t0.10 c.-t0.95 d.-t0.05 e.-t0.975 f.-t0.025
g.- t0.99 h.- t0.01 i.-t0.995 j.-t0.005

Con 25 grados de libertad:


a.- χ20.90 b.- χ20.10 c.- χ20.95 d.- χ20.05 e.- χ20.99 f.- χ20.01
g.- χ 0.975
2
h.- χ 0.025
2
i.- χ 0.995 j.- χ 0.80
2 2

8.- Calcule cada uno de los valores siguientes:


a.- P(F6, 8 < 3.58) b.- P( F12, 20 < 3.23) c.- P(F9, 10 < 3.02) d.- P(F40, 120 < 1.50) e.- P(F2, 20 < 5.85)

f.- P(F8, 10 > 3.07) g,. P( F4., 25 > 2.76) h.- P(F30, 10 > 2.70) i.- P(F15, 5 > 4.62) j.- P(F3, 15 > 5.42)

TEMA IV TEORÍA DE LA ESTIMACIÓN.

Objetivo del Tema:

Qué el alumno sea capaz de:


1.- Saber los conceptos básicos de población, muestra, parámetro y estimador. Conocer el muestreo aleatorio
simple. Obtener muestras aleatorias simples mediante la tabla de números aleatorios. Aplicar la distribución
muestral de la media, la varianza y de la proporción en la estimación puntual y por intervalos de μ, σ2, y P, así
como también la obtención de una medida probabilística del error y del tamaño de muestra requerido para la
estimación de μ y P.

Autopreparación del Tema IV

Para la preparación de este Tema el alumno debe utilizar dos bibliografías, el libro de texto que se venía usando
hasta ahora, Estadística el capitulo 6 para todo lo que está planteado en el epígrafe 1 de los objetivos del tema
y lo planteado en el epígrafe 2 debe utilizar el libro de Muestreo ó Estadística III, ambos del Lic. Aristides Calero
Vinelo.

Este tema tiene marcada importancia para el estudio de la Estadística ya que posibilita extraer de los datos
estadísticos Inferencias válidas, elaborando los métodos mediante los cuáles puedan obtenerse dichas
inferencias.

En el estudio de este Tema donde se comienza la teoría de la estimación el alumno debe tener en cuenta que
los métodos de Inferencia estadística, constituyen métodos de razonamiento inductivos, pues van de lo
particular, (la muestra) a lo general (la población). Este hecho trae como consecuencia que las inferencias así
obtenidas tengan asociados un cierto grado de error o incertidumbre, por lo que uno de los objetivos de los
métodos de inferencias Estadística es elaborar métodos para MEDIR LAS PROBABILIDADES DE ERROR DE
LAS INFERENCIAS.

La Teoría de la estimación, tema que se comienza a estudiar ahora, es aquella parte de la Inferencia Estadística
que se ocupa de los métodos para ESTIMAR el valor de los parámetros poblacionales.

En ocasiones se encuentra la situación donde los principales parámetros poblacionales son desconocidos. No
resulta generalmente, ni posible, ni económico observar toda la población para calcular el valor de dichos
parámetros, en tales situaciones el estadístico ó el investigador tendrá que estimarlos sobre la base de lo que
tiene posibilidad de conocer, la muestra aleatoria, de aquí la importancia que tiene la toma correcta de la
muestra y el Tema en general, porque además da la posibilidad de estudiar los principales métodos de
muestreo y su aplicación práctica.

Los aspectos fundamentales de este Tema son:

- El Muestreo Aleatorio Simple.


58
- Uso de la tabla de números aleatorios.
- Determinación de los estimadores y sus propiedades.
- Distribuciones muestrales de X , S2, y P
- Error máximo permisible y tamaño de muestra necesario para la estimación de μ y P.
- Intervalo de confianza para la media, proporción y Varianza poblacional.

Tema IV. Muestreo y Estimación. Muestreo Aleatorio Simple. Conceptos básicos, Población, Muestra,
Parámetro. Características. Uso de la tabla de números aleatorios. Ejemplos.
BIBLIOGRAFIA: Estadística, Capitulo 6 páginas 118/122

Con este tema se inicia el estudio de la parte de la estadística que se ocupa de la Inferencia, recuerde que al
inicio de este curso se planteó que la estadística se podía estructurar en dos partes: en los métodos descriptivos
y de Inferencia.

Qué los métodos descriptivos se ocupan de la recolección, Organización, reducción y medición de la información
mientras que los métodos de Inferencia se ocupan de la Teoría de la Estimación, Pruebas de Hipótesis, Análisis
de Varianza, Análisis de Regresión y las Series de Tiempo, esto es técnicas que permiten hacer análisis,
pronósticos y llegar a conclusiones.

En la Inferencia estadística se emplea el método inductivo (de lo particular a lo general), lo que tendrá como
consecuencia, que la conclusión o inferencias obtenidas tendrá asociado un grado de error o incertidumbre y es
necesario por tanto estudiar los métodos que ofrezcan una medida confiable del mismo, y que será expresada
en términos probabilísticos.

Se recordaran algunos conceptos:


POBLACION: Se denomina al conjunto de individuos o cosas que poseen una característica determinada.

MUESTRA: Una parte o subconjunto de la población.

CARACTERISTICA: El signo o detalle que interesa estudiar.

Con estos antecedentes se iniciará la Teoría de la estimación.

Antes de la imposibilidad material o económica de realizar un Censo, se determina tomar una muestra y a partir
de ella estimar, es decir dar un valor aproximada de los parámetros que interesa estudiar.

Los métodos de muestreo, es decir los métodos para obtener una muestra pueden ser:

Opináticos o no aleatorios y los Aleatorios. Dentro de los primeros están aquellos métodos que no permite
medida probabilística del error, mientras que en entre los segundos están los que permiten mediciones del error
y que son:
- Muestreo Aleatorio Simple.
- Muestreo Irrestricto Aleatorio.
- Muestreo Sistemático.
- Muestreo Estratificado.
- Muestreo por Conglomerado, y
- Muestreo de razón

El uso de uno u otro (de los muestreos aleatorios), está en dependencia de como aparece la característica de
la población objeto de interés. Sin embargo lo más importante será siempre que la muestra sea representativa
de la población, para obtener buenas estimaciones, lo que indica que debe usarse el método de muestreo
adecuado y tener el tamaño necesario.
A continuación se justificará científicamente la base sobre la cual descansa la teoría de la estimación, dando los
elementos para conocer la precisión y confiabilidad de estos métodos.

NUEVOS CONCEPTOS BASICOS.


59
- Estimador
- Estimación
- Error de muestreo.

Se llamará ESTIMADOR, a cualquier función de "n" variables, donde después de sustituir en ella los valores
muestrales, el resultado obtenido puede servir como sustituto del valor del parámetro poblacional.

Se expresa por θ$ (sita circunflejo, este símbolo ^ circunflejo, denota estimación).

Como de una población de tamaño N, se pueden sacar muchas muestras, tantas como: MN = n para muestras
sin reposición y Mn = N para muestras con reposición

Debe quedar claro que los estadísticos o medidas que se determinan en cada muestra, son variables aleatorias,
que varían de una muestra a otra, aún de la misma población.
2
Ejemplo de estimadores: X , S , p̂

Se denominará ESTIMACION al valor numérico concreto que resulta de un estimador, cuando se haga la
sustitución de los datos muestrales, en el estimador.

Se llamará ERROR DE MUESTREO, a la diferencia entre el valor del estimador y del parámetro. (Es evidente
que si se estima el parámetro poblacional, a partir de un estimador muestral, hay implícito un error, que es el
error de muestreo).

em = θ$ − θ o em = x − μ Donde em = error de muestreo.


Así:
em: Constituye una variable aleatoria, variará, de estimación a estimación. Pero además es un valor que no se
puede conocer, pues habría que conocer el parámetro poblacional, y si se conociera éste, no habría necesidad
de estimarlo.

Todo lo cual lleva a buscar una medida del ERROR DE MUESTREO, para ello se va a iniciar el estudio del
MAS (muestreo aleatorio simple).

El Muestreo Aleatorio Simple.


El MAS es el procedimiento mediante el cuál se eligen por sorteo "n" elementos de una población tamaño N,
haciendo las extracciones o selección con reposición.
Supóngase una población finita, tamaño N, formada por los elementos, donde X representa la variable o
característica en estudio. Y donde se seleccionaría (Mn = Nn ) N muestras distintas, obteniéndose:
x1, x2, ...xn variables independientes (como la selección se hace con reposición eso equivale a que los valores de
“xi” son independientes)
Como “xi” es una variable aleatoria tendrá asociada una función de probabilidad f (x1), f (x2), ... , f(xn) y se
podrá llegar a la definición del MAS.

Sea x1, x2, ...,xn , n variables aleatorias independientes que representan una sucesión de "n" valores observados
de una variable poblacional x.. Se dice que x1, x2, ... ,xn es una muestra aleatoria obtenida a través del muestreo
aleatorio simple si se cumple que:

1.- f (x1)=f (x2)= ...=f (xn)=f (x)


2.- f (x1,x2, ...,xn)= f (x1)f (x2) ... f(xn)
3.- E(x1)=E(x2)= ...=E(xn)=E(x)
4.- V(x1)=V(x2)= ...=V(xn)=V(x)

Ejemplo:
Dada una población finita con 3 elementos cuyos valores en la variable son x = 1,2,3 obtenga todas las muestra
aleatorias simples de tamaño 2 y verifique sus propiedades.
60

ACLARACION: EL TENER UNA POBLACION TAMAÑO 3 ES UN ABSURDO, Y TAMBIEN EL TOMAR TODAS


LAS MUESTRAS POSIBLES ES UN BSURDO. SE TRATA SOLO DE UN DESARROLLO TEORICO. SE DICE
ABSURDO PUES PORQUE SERIA UN TRABAJO MAYOR TOMAR TODAS LAS MUESTRAS POSIBLES, QUE
HACER UN CENSO.

Solución:
Población: X = 1 2 3 N = 3 como hay un solo valor de cada elemento se puede plantear:

xi f (x) x f (x) x2 f (x)


1 1/3 1/3 1/3 así f (x) = 1/3
2 1/3 2/3 4/3 E(x) = 6/3 = 2
3 1/3 3/3 9/3
//// 1 6/3 14/3

V(x) = E(x2) - [E(x)]2 = 14/3 - (6/3)2 = 14/3 - 36/9 =(42 -36)/9 =


= 6/9 = 2/3 = 0.67
El conjunto de todas las muestras posibles tamaño 2

Muestra posibles
1 1 Se definirá:
1 2 X1 = valores que toma el 1er elemento de la muestra
1 3
2 1 X2 = valores que toma el 2do elemento de la muestra
2 2 N(S)=9.
2 3
3 1
3 2
3 3

x1 f (x1) x1 f(x1) x 21 f (x1) x2 f (x2) x2 f(x2) x22 f (x2)


1 3/9 1/3 1/3 1 3/9 1/3 1/3
2 3/9 2/3 4/3 2 3/9 2/3 4/3
3 3/9 3/3 9/3 3 3/9 3/3 9/3

1ra propiedad: f (x1) = f (x2) = f (x) = 1/3

2da propiedad:
f(x1 x2) = f (x1)f (x2) Según espacio muestral
f(x1) = 1/3 f (x2) = 1/3
x1
f (x1 x2) = 1/9 por tanto: x2 1 2 3 nx2
? 1 1/9 1/9 1/9 3/9
f (x1 x2) = f (x1)f (x2) 2 1/9 1/9 1/9 3/9
1/9 = 1/3 1/3 3 1/9 1/9 1/9 3/9
Con lo que queda demostrada nx1 3/9 3/9 3/9 1
3ra propiedad:

E(x1) = E(x2) = E(x)


2 = 2 = 2 (ver ∑ x1 f(x1) y ∑ x2 f(x2) que es igual en ambos casos
6/3 = 2)
4ta propiedad:
V(x1) = V(x2) = V(x) (A partir de la fórmula V(x)=E(x2) - [E(x)]2 y los resultados de las sumatorias anteriores
2/3 = 2/3 = 2/3 y x21 f(x1) y x22 f(x2) Obtenemos V(x1) = 2/3 y V(x2) = 2/3

En lo adelante se podrán resolver preguntas como la siguiente:


61
Si en una población se conoce que x sigue una N (10, 2) ¿Qué podría afirmarse de la distribución y los
parámetros de la variable aleatoria xi, que se definen en el MAS?

Que cada xi sigue una distribución normal con la misma media y la misma varianza y que su función conjunta es
igual al producto de las funciones de cada variable:
f (x1, x2, ..., xn) = f (x1)f(x2) ... f(xn)

TABLA DE NUMEROS ALEATORIOS.


¿Qué es la tabla de números aleatorios? La forma de elegir los "n" elementos de una población, mediante
"sorteo". Esto quiere decir que esta tabla está hecha, como si se introdujeran cartones con números en un
bombo y se fuera tomando valores sin mirar.

Estas tablas pueden ser aleatorias de forma horizontal, o de forma vertical o pueden ser aleatorias de ambas
formas horizontal y vertical. La tabla de números aleatorios que está en la selección de tablas estadística es
aleatoria solamente de forma horizontal, por tanto solo puede ser utilizada de esta forma.

Estructura de la tabla.
Esta tabla está formada por 4 bloque de a 1000 y están numeradas las filas y columnas, en el caso de las filas
están numeradas consecutivamente a partir de 1, mientras que las columnas dicen 1 - 4 de 5 - 8, lo que indica la
columna 1, 2, 3, 4, y en el otro grupo de 4, están las columna 5, 6, 7, y 8 y así sucesivamente.

Tabla 5
Randon Numbers
First and Seconnd Thousands
First Thousand
1-4 5-8 9-12 13-16 17-20 21-24 25-28 29-32 33-36 37-40
1 23 15 75 48 59 01 83 72 59 93 76 24 97 08 86 95 23 03 67 44
2 05 54 55 50 43 10 53 74 35 08 90 61 18 37 44 10 96 22 13 43
3 14 87 16 03 50 32 40 43 62 23 50 05 10 03 22 11 54 38 18 34
4 38 97 67 49 51 94 15 17 58 53 78 80 58 01 94 32 42 87 16 95
5 97 31 26 17 18 99 75 53 08 70 94 25 12 58 41 24 88 21 15 13

6 11 74 26 93 81 44 33 93 18 72 32 79 73 31 18 22 64 70 68 50
7 43 36 12 88 59 11 01 64 56 23 93 00 90 04 99 43 64 07 40 36
8 93 80 62 04 78 38 26 80 44 91 55 75 11 89 32 58 47 55 25 71
9 49 54 01 31 81 08 42 98 41 87 69 53 82 96 61 77 73 80 95 27
10 36 76 87 26 33 27 94 82 15 69 41 95 96 86 70 45 27 48 38 80

11
12
13
14
15

16
17
18
19
20

21
22
23
24
25

Seconnd Thousand
1-4 5-8 9-12 13-16 17-20 21-24 25-28 29-32 33-36 37-40
1
2
3
4
5
¿Como se trabaja?
62
1.- Se enumera de forma consecutiva, los N elementos de la población. (Para que cada elemento esté
identificado con una etiqueta, que puede aparecer o no en la tabla de números aleatorios).

2.- Se elegirá al azar, el bloque, fila y columna por donde se comenzará en forma consecutiva las "n" números
aleatorios.
Aquí se seguirán las siguientes indicaciones:
a.- Los números que formarán la muestra, se elegirán en forma horizontal o vertical, en dependencia del sentido
que la tabla sea aleatoria.

b.- Cada número seleccionado deber tener tantos dígitos, como dígitos tenga N (ej. si N = 3000 se seleccionan
4 dígitos)

c.- Si él número seleccionado de la Tabla es > N puede ser desechado, este criterio obliga a trabajar más. Otro
criterio es, no desecharlo, sino transformarlo ¿Cómo?, se divide el número obtenido en la tabla entre N y se
toma como valor EL RESTO.
Ej. Si el número aleatorio encontrado es 5820 y N = 3000 entonces se divide 5820/3000 =1 y sobra 2820,
entonces se toma como número 2820, que es el resto. Si el resto es cero, se toma como valor aleatorio el valor
que tenga N.
d.- Para garantizar que cada uno de los N elementos de la población tenga la misma posibilidad de ser
seleccionado, se debe elegir un intervalo de trabajo que esté comprendido entre (1 KN) donde K es el entero
que resulta de dividir el mayor múltiplo de N (que tenga la misma cantidad de dígito que N) entre N.
Ej. Si N = 3000 el mayor múltiplo de 4 dígitos es 9999, por tanto K será igual K = 9999/3000 = 3.3 así K = 3
que es el entero, no se tiene en cuenta los decimales. Por tanto KN = 3(3000) = 9000 luego el intervalo de
trabajo será (0001 9000).

Esto se debe a:
En cada partición hay 3000 unidades, mientras que en la última partición sólo hay 998 unidades y este grupo de
valores tendría más posibilidades de ser seleccionados

/_________/___________/___________/_________/
0 3000/3001 6000/6001 9000/9001 9999
c.- Obtención de la muestra.
Se toman los valores que están etiquetados con los números aleatorios.
Ejemplo. Ejercicio 423 pagina 289
X: # de televisores que llegan con roturas en una semana a 20 talleres.
3 8 9 8 5 7 5 4 6 8
5 7 9 4 7 3 8 6 4 5
Primeramente se etiquetea la población:
31 82 93 84 55 76 57 48 69 810 511 712 913 414

715 316 817 618 419 520.


El "supuesto exponente" son las etiquetas que se le ha puesto a la población, para después elegir la muestra.
a) Seleccione una muestra aleatoria de tamaño 5, utilizando 1er bloque, fila 3 columna 25.

N = 20 ⇒ 2 dígito K = 99/20 = 4.9 ⇒ K = 4 luego KN = 4(20) = 80 por lo tanto el intervalo de trabajo estará
entre (01 80) todo valor mayor que 80 se elimina y el que esté entre 20 y 80 se rectifica dividiéndolo entre 20 y
tomando como número aleatorio rectificado, el resto de la división.
# aleatorio #aleatorio elemento de la
Rectificado muestra (Xi) X2i
10 - 8 64
03 - 9 81
22 2 8 64
11 - 5 25
54 14 4 16
34 250
63
b.- X = 34/5 = 6.8 aproximadamente 7 televisores como promedio llegan all taller.
S2= [250 - 5(6.8)2]/4 = [250 -5(46.24)]/4 = (250 - 231.20)/4 =
= 18.80/4 = 4.7
= 4.7
S = 2.1679
Fíjense que aquí se ha calculado S2 dividido por n-1 esto se aclarará él porque en la próxima conferencia.

S 2
=
∑X i
2

−X
2
Siempre se calculó n mientras que ahora al utilizarla dividida por n-1 se transforma en:

S 2
=
(∑ X 2
i−n − nX
2
)
n −1
Pueden hacer los ejercicios desde 421 a 427 que están en la página desde la 287 hasta 291 de la segunda parte
del Laboratorio de Estadística Matemática I.

Tema IV Estimadores. Propiedades. Distribución muestral. Distribución muestral de la media con σ2


conocida y desconocida. Distribución Muestral de las proporciones y de la Varianza. Bibliografía:
Estadística. Capitulo 6 página 131/133

Los aspectos que se abordarán a continuación se enmarcan dentro de un tópico conocido por Estimación
Puntual, en la actividad anterior se vio los aspectos más generales sobre el concepto de estimación.

La estimación puede ser Puntual y por Intervalo, la primera es cuando se estima el parámetro, a través de un
valor; y por intervalo a través de dos valores ó un intervalo.

ESTIMACION PUNTUAL
El objetivo que se persigue con esta estimación es obtener valores específicos del parámetro desconocido, el
cual puede ser utilizado en su lugar.
Se trata pues de que para estimar los parámetros de la población:
1.- Elegir un buen estimador
2.- Calcular una estimación puntual que sustituya al parámetro desconocido.
Ahora ¿Cómo obtener un estimador si cualquier estadígrafo puede serlo? ¿Entre dos estimadores cual es el
preferible? ¿Cuál debe ser el criterio de selección de estimadores?

BUENOS ESTIMADORES.

Las ventajas y desventajas de los estimadores hay que juzgarlas, partiendo de las propiedades deseables para
un estimador, que como es natural debe ser, que los valores posibles del estimador estén todo lo más cerca que
se pueda del parámetro desconocido. Se debe destacar la necesidad de una buena evaluación pues se va a
desarrollar u obtener con una muestra una estimación del parámetro, lo que evidentemente conlleva a un posible
error, ya que la muestra no contiene exactamente la misma información que la población, siendo solamente un
reflejo de ella y en ocasiones un reflejo bastante pálido.
Para hablar de un buen estimador se definirá que las cualidades que este debe tener son:
a.- Ser insesgado.
b.- Ser consistente.
c.- Ser eficiente.

INSESGADO.
Se dice que un estimador del parámetro es insesgado si se cumple que:
E(θ$ ) = θ , La esperanza del estimador es igual al parámetro.
64
Si el estimador no es insesgado, o sea E (θ$ ) ≠ θ se dice, que es sesgado, y se llamará sesgo a la cantidad en
que difiere el estimador del parámetro. Sesgo = E(θ$ ) - θ
Por ejemplo: ¿Será X un estimador insesgado de μ ?
?
E( X )=μ
E(∑ Xi/n) = 1/n E(∑ Xi) = 1/n∑.E(Xi) = 1/n ∑μ=
= (1/n)nμ = μ
Por tanto X es insesgada
Hay que decir que S2 no es un estimador insesgado de σ2, ya que:
E(S2) = (n-1)/n σ2 tiene un sesgo, una diferencia con σ2. La varianza no es un estimador insesgado, pero si
ésta se calcula dividiendo por (n –1) en vez de por “n”, entonces si se puede considerar como un estimador
insesgado de σ2.

CONSISTENTE.
Se dice que un estimador es consistente si al hacer "n" cada vez más grande de manera que n → N, el
estimador tiende a estar más cerca del parámetro. En términos rigurosos debe decirse:

lim P (| θˆ − θ | ≤ ε ) = 1 para todos los valores de θ y ε > 0


n→∞
Este límite, constituye lo que se denomina convergencia en probabilidad. Es decir, si un estimador es
consistente, converge en probabilidad al valor del parámetro que está intentando estimar, conforme el tamaño
de la muestra crece, implica que la varianza de un estimador consistente disminuye a medida que “n” crece y la
media del estimador tiende hacia donde “n” crece.

También ésta condición se puede probar a través de:


Si θ$ es un estimador de θ en el MAS se dice que es consistente si se cumple que:
1.- lim E (θ$ ) = θ 2.- lim V(θ) = 0
n→ ∞ n→ ∞

La x y s2 son estimadores consistente.


EFICIENTE.
Se dice que un estimador es eficiente si su error cuadrático medio es menor que él de cualquier otro estimador,
con el que se le compara:

ECM (θ$ ) = V (θ$ ) + ( E (θ$ ) − θ ) 2 , Esta última expresión se conoce como sesgo al cuadrado.
Así el procedimiento tiene que ser calcular el ECM para todos los estimadores que se propongan, y de la
comparación elegir cuál es el más eficiente.

Si los estimadores que se comparan son todos insesgados, entonces el error cuadrático medio de sita será:
ECM (θ$ ) = V (θ$ ) y el eficiente será él de menor varianza.

Las propiedades estudiadas permitirán, evaluar partiendo de la definición de estimador, cuál es el mejor
estimador; aunque hay otros métodos más complejos.
Se utilizan como estimadores de, μ , σ , y P a X, S , p
2 2
$ por ser los mejores estimadores. Recuerde que en el
caso de S2, se considera insesgado cuando está dividido por (n-1).
65
PROPIEDADES

1.- En el MAS la x es un estimador consistente de μ.


2.- En el MAS la s2 es un estimador consistente de σ2.
3.- Un estimador insesgado puede o no ser consistente.
4.- Todo estimador eficiente es consistente.

Se ha visto una de las formas de obtener resultados muestrales para generalizarlo a la población, que en
estadística se conoce como inferencia estadística.
Hipotéticamente al usar el estadístico muestral para estimar el parámetro poblacional se debe examinar todas
las muestras posibles que se pudieran obtener. Si en realidad se tuviera que hacer esta selección de todas las
muestras posibles, a la distribución de los resultados se le conocería como una DISTRIBUCION MUESTRAL.

En la práctica sólo se selecciona una de esa muestra y se tiene que examinar el concepto de distribución
muestral PARA PODER APLICAR LA TEORIA DE LA PROBABILIDAD Y HACER INFERENCIAS SOBRE LOS
VALORES DE LA POBLACION.

DISTRIBUCIONES MUESTRALES.
Ya se había dicho que si de una población cualquiera se tomaban todas las muestras posibles a través del MAS,
de tamaño n, y si a todas ellas se les calculaba, la media muestral, se obtendrían valores diferentes de la media
en cada muestra, y por tanto constituirían variables aleatorias, lo mismo pasaría con la varianza; por tanto se
puede llegar a una conclusión muy importante:

Todo estimador es una variable aleatoria, y al ser variable aleatoria, tiene asociada:
- Característica numérica o parámetros y
- Distribución de probabilidad.
Y a las distribuciones de probabilidad de estos estimadores se les denomina: DISTRIBUCION MUESTRAL

Por tanto la distribución muestral del estimador se conforma a partir de las "n" muestras posibles tomadas de la
población y en las cuales se determinó θ$ , que por constituir variable aleatoria se le puede determinar su
función, su esperanza y su varianza.

Así E ( x ) = μ y la V( x ) = σ2/n, ver demostración página 123 del libro de texto.

Estas características informan:


1.- El centro de la distribución poblacional y de la distribución muestral de x media, coinciden μ(x) =μ ( x )

2.- Qué la varianza del estimador x es n veces menor que la varianza de la población:
V (xi)= σ y V ( x ) = σ /n
2 2

Lo que permite concluir que a medida que "n" aumenta los valores de la media muestral se concentran más
alrededor de μ.

3.- Se sabe que la V ( x ) = σ2/n, y esto se podría escribir también como:


V ( x ) = 1/n ∑ ( x - μ)2 y esta última expresión Σ( x - μ)2, se conoce como error de estimación, por lo tanto:

LA DESVIACION TIPICA DE LA MEDIA va a indicar una medida del error promedio de estimación.

Ahora quedaría por conocer la función de probabilidad del estimador para poder sacar conclusiones respecto al
error.

Así se plantea el estudio de la función de probabilidad del estimador según dos consideraciones:
1.- a.- Cuando la σ2 es conocida → esto es un planteamiento teórico porque es absurdo decir conocer σ2, sin
conocer μ.
66
b.- Cuando la σ es desconocida
2

2.- a.- Cuando la población de "x" tenga distribución normal.


b.- Cuando la población de "x" no tenga distribución normal.

DISTRIBUCION MUESTRAL DE X PARA σ2 CONOCIDA (Estadística página123/126)


Hay un teorema que plantea:
Qué si "x" tiene una distribución normal, con media μ y varianza σ2 y se selecciona una muestra aleatoria
tamaño "n" por el procedimiento del MAS; entonces la media muestral tendrá una distribución normal con media
μ y varianza σ2 /n. por tanto si X →N(μ ,σ) entonces X →N(μ ,σ /
n ); y para calcular la probabilidad de
x−μ
cierto comportamiento de la media, se utilizará la variable estandarizada: Z =
σ/ n
¿Pero y si X no tiene una distribución normal?
Esto lo resuelve el Teorema Central del Límite en el que descansa, la gran importancia y el poder de aplicación
de la distribución normal que plantea que:
Si X es una variable aleatoria con media μ y varianza σ2 y X es la media de una muestra aleatoria simple de
tamaño "n", entonces la variable
( X - μ)/ σ/n Tiene una distribución que se aproxima a la normal estandarizada a medida que n → ∞
Esto es si X→? (μ ,σ ) y n → ∞ entonces X = N (μ ,σ / n )

EN LA PRACTICA SE HA DEMOSTRADO QUE SIEMPRE QUE N ≥ 30 LA APROXIMACION A LA NORMAL ES


BUENA, POR LO QUE SE UTILIZARA E ESTE CRITERIO PARA CONSIDERAR QUE n → ∞
_
DISTRIBUCION MUESTRAL DE X PARA σ2 DESCONOCIDA.
Recordar que cuando sea necesario estimar σ2, se hace a través de s2 (dividido por n-1 y no por n) que es un
estimador insesgado, consistente y más eficiente.
Hay un teorema que plantea que si: t = V.A. →N (0 1) / V.A. →χ2 /ν y que ambas son independientes entonces la
variable t tiene una distribución t'student con "n" grados de libertad.

Una aplicación muy útil de la misma es la siguiente: Si se tiene una población N (μ σ) de la cual se ha extraído
una muestra aleatoria de tamaño "n" y donde:
( X - μ)/ σ / n → N (0, 1)
y (n-1)S2/σ2 → χ2(n-1) grados de libertad, donde la media y la varianza muestral son independientes se puede
afirmar que:
( X - μ) /S / n = t (n-1)
Así, si se quiere hallar probabilidad de cierto comportamiento de la media, cuando se desconozca la varianza de
la población, se hace, si se cumple que la variable original X → N (μ , ?) y n < 30 a través de t'student (formula
anterior)
Cuando n > 30 o cuando n → ∞ la distribución t'student tiende a la normal estandarizada, esto es a Z → N (0, 1)
y por tanto t se aproxima a través de Z y en este caso se dirá que:
X → N(μ S / n √ n) ya que σ se aproxima a través de s Resumiendo:
Estimador E (θ$ ) V (θ$) f (θ$ )
X μ σ2/n si X → N (μ , σ ) ⇒ X → Ν( μ, σ/ n )

- si X → ? (μ, σ ) y n → ∞ ⇒ X ≈ N (μ, σ / n )

- si X → N (μ ?) y n < 30 entonces:

( X - μ) / s / n → t(t - 1)
67

- si X→ ? (μ ?) y n ≥ 30 ⇒
X → N(μ , s/ n )

Antes de hacer algún ejercicio se debe plantear que significan los grados de libertad, muy sencillamente.
La varianza de la muestra requiere del cálculo de:

∑ (X )
n 2

S = 2
i −Xi /n
i =1

Por lo tanto para calcular S2 se necesita conocer primero X . Por consiguiente se puede decir que solo n - 1 de
los valores de la muestra están libre para variar. Es decir hay n-1 grados de libertad.

Se puede demostrar este concepto de la forma siguiente. Suponga que sé tiene una
Muestra de cinco elementos con un media igual a 20. ¿Cuantos valores diferentes se necesitarían conocer antes
de poder obtener el resto?
n
El hecho de que n = 5 y de que X = 20 también indica que ∑X
i =1
i = 100
Por lo tanto una vez que se conocen 4 valores el quinto no tendrá "libertad de variar" puesto que la suma tiene
que ser 100. Digamos que 4 de los valores son: 18, 24, 19, y 16, el quinto solo puede ser 23 para que todos
sumen 100.

Ahora se verá un ejercicio de cada tipo:

Ejercicio 450 del Laboratorio pagina 317

a.- X →N (60 4), n = 4, μ = 60 σx = σ / n = 4/ 4 = 4/2 = 2


b.- _
1.- P(X < 64) = P(Z < (64 - 60)/2)
= P(Z < 2)
= Fz (2) = 0.9772
_
2.- P(X < 62) = P(Z < (62 - 60)/2)
= P(Z < 1)
= Fz(1) = 0.8413
_ _
3.- P(X > 60) = 1 - P(X < 60)
= 1 - P(Z < (60 -60)/2)
= 1 - P(Z < 0)
= 1 - Fz (0)
= 1 - 0.5 = 0.5
_
4.- P(58 < X < 62) = P [(58 -60)/2 < Z < (62 -60)/2]
= P ( -1 < Z < 1)
= Fz (1) - Fz (-1)
= 0.8413 - 0.1587
= 0.6826
Ejercicio 482 del Laboratorio pagina 338.

∑ (X )
n n

∑ X i ni = 482
2
n = 16, i − X ni = 60
i =1 i =1
68
n
a.- X = ∑X n
i =1
i i / n = 482/16 = 30.12

n
(X − X ni)2
2
b.- S = ∑
i =1
i

n −1
= 60/15 = 4
i =1

c.- σx = σ / n = 4/ 4 √ 4 = 4/2 = 2 σ x = error promedio de estimación

_
d.- si μ = 32 entonces e m = (x -μ) = 30.1 - 32 = 1.9
_
e.- P (⏐ X - μ⏐< 0.5) = P ( -0.5/( 2/ 16 ) < t(15) < 0.5/(2/ 16 ) )
= P ( -0.5/0.5 < t(15) < 0.5/0.5)
= P ( -1 < t < 1)
= Ft (1) - Ft (-1)
= 0.85 - (1 - 0.85)
= 0.85 - 0.15
= 0.70
Se trabajó con t'student porque se desconocía la varianza de la población.

DISTRIBUCION MUESTRAL DE PROPORCIONES.

Un caso particular del Teorema Central del Límite, es cuando la distribución de la variable x, es binomial, y que
plantea:
Sea Xn una variable aleatoria binomial con parámetros, n y p, entonces la variable Yn definida como:

Yn = (Xn - np) / pq / n
Tiene una distribución que se aproxima a la normal estandarizada.
x
Esto permite obtener la distribución de una proporción, pues si p$ = es la proporción de éxitos en n pruebas
n
independientes de Bernoullí, entonces, si se divide por n la expresión anterior se tendrá:
( x / n − np / n) ( x / n − p)
=
npq / n 2 pq / n
x
Luego aplicando el teorema se tiene que: como p$ = , entonces se puede decir que:
n
X/n → N (P, pq / n ) al menos aproximadamente. Se plantea que esta aproximación es realmente
buena cuando n P > 5 y/o n q < 5.

Ej. 493 del Laboratorio pagina 348


P = 0.5, n = 100 y donde X : incremento del rendimiento. Calculemos la desviación típica primeramente:
pq / n = 0.5 /(0.5 / 100) = 0.0025 = 0.05
a.- P (0.40 < P < 0.55)=P [ (0.40 - 0.50)/0.05 < Z < (0.55 - 0.50)/0.05 ]
=P (-0.10/0.05 < Z < 0.05/0.05)
=P (-2 < Z < 1)
=Fz (1) - Fz (-2)
= 0.8413 - 0.0228
= 0.8185
69
b.- μ = n p = 60(0.8185) = 49

DISTRIBUCION MUESTRAL DE LA VARIANZA (S2)


Al estudiar S2 se llega a la conclusión que S2 no sigue una distribución normal, tiene una distribución asimétrica.

En el Tema anterior se estudió la distribución χ2, que fue formulada alrededor de 1900 por Karl Pearson y entre
sus aplicaciones se encuentra el papel tan importante que juega en la distribución muestral de la varianza.
Hay un teorema que plantea qué:
Sea una población normal con media μ y desviación típica σ , entonces la expresión
(n-1)S2/ σ2 sigue una distribución χ2 , con n-1 grados de libertad.
Recuerden que los grados de libertad de la distribución se representan por la letra griega nú (ν) (ya se explicó
anteriormente lo que expresaban).

Ejemplo del laboratorio, 468 página 326


Calcule la probabilidad de que la varianza de una muestra de tamaño 21 obtenida de una población normal con
media 5 y desviación típica 2
a.- Sea superior a 8
b.- Sea inferior a 5
c.- Tome valores en el intervalo (4, 8)
d.- Entre que dos valores se moverá S2 con una probabilidad central de 0.95.

Datos: n = 21, μ = 5, σ=2

a.- P(S2 > 8) = 1 – P(S2 < 8) = 1 - P[ (n-1)s2/σ2 < 20(8)/4] = 1 - P (χ2(20) <160/4)
= 1 - P (χ2(20) < 40) = 1 - Fχ2(20) 40
= 1 - 0.995
= 0.005
b.- P(S2 < 5) = P (χ2(20) < 20(5)/4] = P (χ2(20) < 100/4)
= P (χ2(20) < 25)
= F(χ2) (25) = 0.80
c.- P(4 < S < 8) = P [20 (4)/4 < χ2(20) < 20(8)/4]
2

= P(20 < χ2(20) < 40)


= Fχ2(40) - Fχ2(20)
= 0.995 - 0.50
= 0.495

d.- P(S2a < S2 < S2b) = 0.95

0.025 \ 0.95 / 0.025


χ 2a χ 2b
Ahora bien estos se buscan: χ 2a = χ 2(o.o25) y χ 2b = χ 2(o.975) que serían los valores que le corresponden a S2a y
S2b, a partir de χ 2(n - 1)σ2/(n - 1) = S2
S2a = χ 2(0.025) (4)/20 = 9.59 (4)/20 = 1.918
S2b = χ 2(0.975) (4/20) =34.2(4)/20 = 6.84

Por tanto se considera que los valores de S2a y S2b con una probabilidad central del 95% serán:
P (1.1918 < S2 < 6.84) = 0.95

Esta parte de la materia tiene como objetivo conocer las distribuciones de probabilidad para aplicarla
fundamentalmente en el cálculo de los intervalos de confianza, tamaño de muestra, error máximo admisible y
probabilidad del error de muestreo.
Pueden hacer los ejercicios: 469 a 471, y 481,490
70

AUTOEVALUACION
1.- Si se desconoce la varianza de la población y n < 30 ¿Con que distribución de probabilidad trabajaría en el
cálculo de la probabilidad de la media?.

2.-¿Que supuesto se debe tener en cuenta para trabajar con la distribución de probabilidad de t'student?.

3.- Si se desconoce la varianza de la población y n > 30 ¿Con que distribución de probabilidad trabajaría en el
cálculo de la probabilidad de la media?.

4.- Si se desconoce la distribución de probabilidad que sigue la variable original y n → ∞, ¿Cual sería la
distribución de probabilidad de la media?. Fundamente su respuesta.

5.- ¿Qué distribución de probabilidad tiene la proporción muestral, y bajo cuales condiciones?.

6.- ¿Tiene la varianza muestral una distribución normal?

7.- ¿Con qué distribución calcularía la probabilidad de que la varianza muestral, asuma determinados valores?

Tema III.- Error máximo permisible y tamaño de muestra necesario para la estimación de μ y P.
Bibliografía. Estadística capítulo 6 paginas 136/137

En la conferencia anterior se habló del error de muestreo (em) que está dado por la diferencia entre el estimador
y el parámetro:
em = θ$ − θ y que este error no es factible de determinar entre otras causas por no conocer el valor del
parámetro, pero si se podría calcular una medida probabilística del error y que una vez obtenida una estimación
puntual de un parámetro, es necesario determinar una medida probabilística de que el error no sea mayor que
un determinado valor, que pudiera denotarse por "d" y que posteriormente se definirá.
En el caso de μ aplicando propiedad de módulo:
_ _
P(⏐ X - μ ⏐ ≤ d ) = P (-d ≤ X - μ ≤ d)
Representando los extremos del intervalo entre los cuales se mueve este error, con una probabilidad dada y que
se representa por 1 - α
si X →N(μ ,σ/√n ) se cumplirá que:
P(-d ≤ X - μ ≤ d) = P( μ - d ≤ X ≤ μ + d), dado que siempre se considerará un área central.
Gráficamente:
σ /2 \ 1-α / σ/2
μ -d μ+d

Retomando la idea del cálculo de la probabilidad del error es importante recordar que para realizar estos
cálculos, hay que estandarizar la variable.
¿Cómo?, dividiendo por su desviación típica, todos los elementos:
Por tanto:
−d X −μ d
P( − d ≤ X − μ ≤ d ) = P( ≤ ≤ )
σ/ n σ/ n σ/ n
−d d d −d
= P( ≤Z≤ ) = FZ ( ) − FZ ( )
σ/ n σ/ n σ/ n σ/ n

Ahora bien otra forma para obtener una medida probabilística del error, es la determinación del ERROR
MAXIMO ADMISIBLE, que se denota por "d" y que se define como:
71

El producto del coeficiente de confianza y la desviación típica del estimador

d = (coeficiente de confianza) (desviación típica del estimador)

Estadístico que depende


De la distribución de
Probabilidad del estimador

Según teoremas__
Si X → N (μ, σ ) entonces X → N (μ , σ / n √n) y d = Z(1−α/2) σ / n

Si X→N (μ , ?) y n > 30 entonces X ≈ N(μ S/ n )y d = Z(1−α/2) S/ n )

Si X → N (μ ?) y n < 30 entonces X → t'student y d = t (1−α/2) S/ n )

Si n → ∞ ⇒ n > 30 entonces p$ ≈ N(P pq / n ) y d = Z(1−α/2) pq / n )

Y a partir de estos teoremas hay un corolario que plantea determinar el tamaño de la muestra "n", a partir del
error máximo admisible, a través de un simple despeje.
σ
2 2
⎛z ⎞ ⎛z S⎞
1. − n = ⎜⎜ (1−α / 2 ) ⎟⎟ 2. − n = ⎜⎜ (1−σ / 2 ) ⎟⎟
⎝ d ⎠ ⎝ d ⎠
⎛ z (21−α / 2 ) pq ⎞
2
⎛t S⎞
2. − n = ⎜⎜ (1−α / 2 ) ⎟⎟ 3. − n = ⎜⎜ 2


⎝ d ⎠ ⎝ d ⎠
Ejercicio.
La experiencia adquirida indica que las varillas de alambre producidas por cierta fábrica tienen una resistencia
media a la ruptura de 400Kg y una desviación típica de 16 Kg. Se conoce que la resistencia de dichas varillas
sigue una distribución normal, si se extrae una muestra de tamaño 16.
a.- Calcule la probabilidad de que el error en la estimación de μ no sea mayor de 8 Kg.
b.- Determine con una probabilidad de 0.99, ¿Cuál es el error máximo que se espera cometer al estimar μ, a
través de la media muestral?.
c.- Diga cuantas varillas deberán seleccionarse para que la media resultante tenga un error no mayor de 2 Kg.
con una probabilidad de 0.95.
Solución.
a.- X →N(400 16) entonces X →N(400 16/ 16 ) por tanto:
_
P(⏐ X - μ ⏐ ≤ 8) = P (-8/4 ≤ Ζ ≤ 8/4) = P (-2 ≤ Ζ ≤ 2)
= Fz(2) - Fz(-2)
= 0.9772 - 0.0228
= 0.9544 En el 95% de las muestras tamaños 16 el error que se puede cometer al estimar μ
no va a ser mayor que 8.
72
__
b.- d = (Z(1−α/2) σ/√ n) entonces el valor de “d” será d = 2.58(4) = 10.32
Este valor de Z se encuentra en la tabla que está en la pag.17, que tiene sombreada las dos colas, a partir del
valor que tenga α es decir 1 - α = 0.99 (nivel de confianza) por tanto α = 0.01 buscando este valor en la tabla
se obtendrá directamente el valor de Z , en la misma.

c.- n = [(Z(1−α/2) σ )/d]2 = [1.96(16)/2] = 246 varillas.


(este valor de Z se obtiene buscando α =0.05). Debe significarse que con una muestra de este tamaño se
garantiza que el error en la estimación de μ, no sea mayor de 2 Kg con una probabilidad de certeza del 95%

Ejercicio:
A continuación se brindan los resultados de las entrevistas a 40 personas sobre su preferencia (1) o no (0)
respecto a un nuevo producto que se ha ofertado en el mercado.

0 0 1 1 0 1 0 1 0 1
1 1 0 0 0 1 1 1 0 1
1 0 1 0 1 0 0 1 1 0
0 1 1 0 1 1 0 0 0 0

a) Calcule la proporción muestral de individuos que gustan de este producto. Interprete el resultado.
b) Calcule la probabilidad de que el error máximo en la distribución de P no sea mayor de 0.05.
c) Calcule para una probabilidad de 0.95 ¿Cuál es el error máximo en la estimación de P?
d) ¿diga cuantas personas deben seleccionarse para que la proporción resultante tenga un error no mayor de
0.01 con una probabilidad de 0.99.

Solución:

a.- p$ = Xi/n = 20/40 = 0.5 El 50% de las personas prefieren el producto

b.- La desviación típica de la proporción muestral será:


σ pˆ = pq / n = 0.5(0.5) / 40 = 0.00625 = 0.079 ≈ 0.08
P (⎜ p$ - P ⎜≤ 0.05) = P (-0.05/( (0.5)0.5/40) ≤ Ζ ≤ 0.05/( 0.5)0.5/40)
= P (-0.05/0.08 ≤ Ζ ≤ 0.05/0.08)
= P (-0.625 ≤ Ζ ≤ 0.625)
= Fz (0.625) - Fz (-0.625)
= 0.7234 - 0.2676
= 0.4648 En el 46,48% de las muestras tamaño 40, el error que se puede cometer al
estimar P, no va a ser mayor que 0.05
c.- d = Z(1−α/2) pq / n
= 1.96 (0.5)(0.5)/40
= 1.96 0.00625
= 1.96 (0.08)
= 0.1568 En muestra tamaño 40 con una probabilidad de 0.95, el error en la estimación de la proporción
poblacional, no será superior a 0.1568.

d.- n = Z2(1−α/2) pq/d2 = 2.582(0.5)0.5/ 0.012 = 16641

Se considera necesario puntualizar lo siguiente:


Se había planteado que siempre que se realiza una estimación puntual es necesario determinar una medida
probabilística del error de muestreo, esto es:

P (⏐ X - μ⏐ ≤ d) = P (-d ≤ X - μ ≤ d) = 1 - α , es decir con una probabilidad


1- α, el error de muestreo no será mayor que “d”
73

¿Por qué?. En la práctica como primer paso el investigador, al estimar μ, deberá prefijar el ERROR MAXIMO
que está dispuesto a cometer con una probabilidad dada, es decir, al prefijarse "d" y "1 - α ", la investigación
cumplirá con el requisito siguiente:
P(⏐ X - μ⏐≤ d) = 1 - α
El paso siguiente deberá ser, determinar el tamaño de muestra que satisfaga la condición anterior.
DE OBVIARSE ESTE PASO SE RECOMIENDA JUZGAR LA PRECISION DE LA ESTIMACION OBTENIDA,
CALCULANDO EL ERROR MAXIMO (d) CON LOS DATOS MUESTRALES Y LUEGO COMPARARLO CON EL
PREFIJADO, O TAMBIÉN SE PUEDE HACER A TRAVES DE LA PROBABILIDAD.

Si la "d" calculada ES MENOR O IGUAL QUE LA PREFIJADA LA ESTIMACION CUMPLE CON LOS
REQUISITOS ESTABLECIDOS, por el investigador, de ahí que la estimación obtenida posea la precisión
requerida. Por el contrario si la "d" calculada SUPERA A LA PREFIJADA, tendrá que INCREMENTARSE EL
TAMAÑO DE MUESTRA para aumentar la precisión hasta garantizar el requisito planteado.
Otra forma que pudiera hacerse, es utilizando la probabilidad, es decir se calcula la probabilidad teniendo en
cuenta el error máximo que se está dispuesto a cometer y si la probabilidad resultante es menor que la
prefijada, entonces la estimación de μ, no cumple con la precisión prefijada, si ésta probabilidad calculada es
mayor o igual, entonces si se puede decir que la estimación de μ cumple con la precisión prefijada.

Veámoslo a través de un ejemplo:


De una población normal se extrajo una muestra aleatoria simple de tamaño 25 resultando que: X = 58 y S =
4.72 siendo el error máximo que se está dispuesto a cometer igual a 1, con una probabilidad de 0.95. Utilizando
los datos muestrales, ofrezca una medida probabilística del error y juzgue la calidad de la estimación de acuerdo
con los requisitos planteados.
El análisis sería:
P(⏐ X − μ⏐ ≤ 1) = P(-1 ≤ X − μ ≤ 1) =

"Como S/ n = 4.72/5 = 0.944"

= P (-1/0.944 ≤ X − μ / S/ n ≤ 1/0.944)
= P (-1.06 ≤ t ≤ 1.06)
= Ft (1.06) - Ft (-1.06)
= 0.85 - (1 - 0.85)
= 0.85 - 0.15
= 0.70 Al ser esta probabilidad < 0.95 la estimación de μ no cumple con la precisión
prefijada ya que se desea que:
P( ⏐ X − μ⏐≤ 1) = 0.95
Otra vía del análisis sería a través del cálculo del error máximo permisible.
d = t(1 - α/2) S/ n en este caso cuando se trabaja con t'student es necesario, descomponer (1 - α /2), para
buscar el valor de "t" correspondiente, de la siguiente forma: (1 - α) = 0.95 luego α = 0.05 por tanto: α/2 = 0.025
⇒ 1-α/2 = 0.975 luego se busca una "t" en t(0.975) con 24 g.l = 2.06

d = 2.06 (0.944) = 1.94

Al ser el "d" calculado mayor que el prefijado, 1.94 > 1. Se llega a la misma conclusión ya que esta debía ser
menor o igual.
Para darle solución a este problema evidentemente se debe aumentar el tamaño de la muestra.

AUTOEVALUACION
1.- ¿Qué nos indica el error máximo admisible?
2.- ¿Para que se utiliza el error máximo?
3.- ¿Existe para cada distribución de probabilidad diferentes fórmulas de Calculo? ¿Y de que dependen estas?
74
4.- ¿A partir de que se calcula el tamaño de la muestra?
5.- ¿Cuales son los criterios que se deben tener en cuenta para determinar el tamaño de la muestra?

Tema IV. Estimación por intervalo para la media, Proporción y Varianza poblacional.
Bibliografía. Estadística. Capitulo 6 páginas. 133/142.
ESTIMACION POR INTERVALOS
Los intervalos de confianza se obtienen, partiendo de la distribución asociada al estimador del parámetro
correspondiente.

La estimación puntual, no permite medir cuan cercano está el valor determinado del parámetro, es decir no
permite calcular la precisión de la estimación, ya que no se tiene ninguna indicación del posible error en la
estimación puntual.

Sin embargo la estimación por intervalo o intervalo de confianza, en el que se da un intervalo cuyos extremos
son variables aleatorias, y que de entre ellas se halla el parámetro a estimar con determinada probabilidad, nos
permite medir el error que se comete al hacer la estimación.
La probabilidad de que el intervalo contenga al parámetro a estimar es igual a 1 - α y a esta probabilidad, se le
llama nivel de confianza de la estimación por intervalo. Los valores de 1 - α, deben ser cercanos a 1 y sus
valores más usuales son 0.95, 0.90, 0.99, en este orden, o lo que es lo mismo los valores más usuales de alfa
son 0.05, 0.10, 0.01, no obstante se pueden usar otros niveles de confianza

En general los intervalos de confianza de la media y la proporción se forman:


Estimador ± error máximo (d)
Debido a que por ser intervalos simétricos, el punto medio del intervalo coincide con el valor del estimador
puntual

INTERVALO DE μ CON σ2 CONOCIDA.

Se sabe que si X →N (μ ,σ) entonces X → N (μ , σ/ n ) por lo tanto d

d = Z(1−α / 2) σ / n luego el intervalo será:


X ± d o lo que es lo mismo:
σ σ
P( X − Z (1−α / 2 ) ≤ μ ≤ X + Z (1−α / 2 ) ) = 1− α
n n
Y se plantea que con una probabilidad (1 - α ) se encuentra en dicho intervalo el parámetro.
Se debe aclarar que dado que para la normal estándar Z (α/2) = -Z (1 - α/2) se puede escribir indistintamente.
Esta expresión (la del intervalo) representa un intervalo de extremos variables, ya que estos cambian en
dependencia del valor que tome la media muestral.
En ellos se puede afirmar que (1 - α ) 100% de estos intervalos contendrá a μ, mientras que el α(100)%
restante serán intervalos que no contengan al verdadero valor de μ.
Para tener una idea más clara analice el siguiente gráfico donde cada barra horizontal representa un intervalo de
confianza para μ

Se observa que un % de estos intervalos contendrá el verdadero valor de μ


mientras que otro % no los contiene

μ
75
Concluyendo:
σ σ
1. Al intervalo P( X − Z (1−α / 2 ) ≤ μ ≤ X + Z (1−α / 2 ) ) = 1− α
n n
_
Una vez sustituidos los valores de X, Z, α, y n ya se le denomina intervalo de confianza de μ, y será
incorrecto decir con una probabilidad de 1 - α , se encuentra en dicho intervalo el parámetro.

2. A Z (1 - α /2) se le denomina coeficiente de confianza.


3. A 1- α se le llama nivel de confianza.
4. A los extremos del intervalo se les da el nombre de límites de confianza.
Cuando se construye un intervalo de confianza para μ, lo que se hace es sumarle y restarle al valor de la media
muestral, el error máximo.

Es fácil darse cuenta al examinar el intervalo de confianza para “μ”, que entre más grande es el tamaño de la
muestra más pequeño es el ancho del intervalo; o para un nivel de confianza, 1 - α más grande, mayor es el
ancho del intervalo. Ambos resultados son lógicos ya que un tamaño grande de la muestra disminuirá la
varianza del estimador y un nivel de confianza grande incrementará el valor del coeficiente de confianza, es
decir el estadístico de la distribución de probabilidad del estimador, lo que dará como resultado un intervalo más
amplio.

Otro caso cuando X → ? (μ , σ ) y n > 30 entonces X →N (μ , σ/ n )


σ
y por tanto X ± Z (1−α / 2 )
n
Cuando σ2 es desconocida:
Si X →N(μ ?) entonces ( X - μ) / S/ n →t(n-1) si n < 30

Entonces el intervalo será: X ± t(1−α/2) S / n

Si X →N (μ ?) n > 30 entonces X →N(μ, S / n)

Entonces el intervalo será: X ± Z (1-α /2) S / n


En el caso de la proporción, se sabe que para muestras grandes:

p$ → N (P pq / n ) luego el intervalo será: p$ ± Z(1−α/2) pq / n

Debe señalarse que cuando se va a determinar la muestra a través de “d”, el error máximo, “n” es una función
del valor deseado de P, y como este se desconoce, es decir es el que se está interesado en estimar, entonces el
valor de “n” que se obtiene, es un valor conservador, es por ello que en estos casos se debe considerar P =
1/2 para obtener el tamaño de la muestra seleccionada.
Se puede demostrar que para 0 ≤ Ρ ≤ 1, p q es un máximo cuando P = 1/2

Intervalo de Confianza para la Varianza Poblacional: en este caso la formulación del intervalo se obtiene a
través de una fórmula, es decir no se determina de la misma forma que los intervalos de μ y P, debido
precisamente a que este no es un intervalo simétrico y por tanto el punto medio del intervalo de confianza, no
coincide con el valor del estimador puntual.
Si X → N entonces el estadístico (n -1) S2 /σ2 → χ n −1 y se puede plantear que el intervalo de confianza será:
2

P [(n-1) S2/χ2 (1-α/2) ≤ σ2 ≤ (n-1)S2/χ2 (α/2) ] = 1 - α


76
Y el intervalo de confianza de la Desviación Típica será, la raíz cuadrada positiva del intervalo de confianza de la
varianza.

(n − 1) S 2 ( n − 1) S 2
≤ σ ≤
χ (21 - α / 2 ) χ (2α / 2 )

Ejemplos:
1.- La media y la desviación típica de las cargas medias máximas soportadas por 60 cables, están dadas por 12
y 0.7 Ton, respectivamente. Halle el intervalo de confianza de μ con un 95% de confianza.
Suponga que X →N(μ , σ )
Solución:
Información n = 60 X = 12 S = 0.7 (1 - α) = 0.95

X ± d y d = Z(1 - σ/2)S / n ya que aunque la varianza es desconocida como n > 30 apoyándonos en el


teorema que plantea que a partir del teorema central del límite para muestra grandes se puede considerar que
en ese caso X se puede considerar aproximadamente normal.
Para buscar el valor de Z, utilizamos la tabla de la distribución normal, y se busca donde están las dos colas
sombreadas a partir del valor de α

d = 1.96 0.7/ 60
= 1.96 0.7/7.75
= 1.96 (0.09)
= 0.1764 por tanto X ± d = 12 + 0.1764 = 12.1764 y
12 - 0.1764 = 11.8236 así el intervalo será: (11.8236; 12.1764) se puede decir
que el 95% de las veces el valor de μ se encontrará entre 11.82 y 12.18 ó sólo el 5% de las veces no se
encontrará entre estos dos valores.

2.- En una determinada fábrica de la Industria básica se fabrica un tipo de cable acerado, si la producción del día
fue de 500 cables (en miles de pies) y se toma una muestra de 9 cables seleccionados aleatoriamente,
resultando en la misma, que la rotura media es de 29 y S = 6.73 Kgs.

Determine:
a.- el intervalo de confianza de μ para una confiabilidad del 80%
b.- El error máximo para una probabilidad de 0.99.
Suponga que X → N (μ ?)

Solución. Información n = 9 X = 29 S = 6.73


a.- Error máximo para (1 - α ) = 0.80 ¿Con qué distribución se trabaja?, evidentemente con t'student ya
que se desconoce la varianza de la población, y n < 30, por tanto:
d = t (1−α/2) S n para este caso si se tiene que determinar el valor de (1 - α/2) de la siguiente
forma: 1 - α = 0.80 por tanto α= 0.20 y α/2 = 0.10 luego (1 - α/2)= 0.90 entonces tengo que buscar un t0.90 con
ν = n-1 = 8 g.l. = 1.40 así:
d = 1.40(6.73/ 9) = 1.40 (2.243) = 3.1406
29 ± 3.1406
(25.8594; 32.1406) el 80% de las veces el valor de μ se encontrará entre 25.86 y 32.14
b.- Error máximo para una probabilidad de 0.99
(1 - α ) = 0.99 por lo que α= 0.01 y α/2 = 0.005 por tanto:
(1 - α/2) = 0.995 luego t0.995 con 8 g.l. = 3.36
d = t(1- α /2) S/ n = 3.36 6.73/3 = 3.36(2.243) = 7.53648
77
3.- En una determinada población se obtiene la sgte. muestra aleatoria:
4 2 5 6 6 5 6 6 6 7
5 5 4 4 2 8 4 6 8
5 2 2 5 5 4 3 6 7
6 5 5 5 6 5 4 6 1
Donde Y representa la cantidad de personas por núcleos familiares. Ofrezca una estimación por intervalos de la
proporción poblacional de los núcleos familiares con 4 ó más integrantes para un nivel de confiabilidad del 90%.

X: Núcleos familiares con 4 ó más integrantes.

p$ = X/n = 31/37 = 0.84 y σ p$ = pq / n será: 0.84(0.16) / 37 = 0.0036 = 0.060


p$ ± Z(1−α/2) pq / n = 0.84 ± 1.64 (0.060) = 0.84 ± 0.0988 por lo tanto el intervalo será: 0.7412 ≤ P ≤ 0.9388 lo
que nos indica que el 90% de las veces el valor de la proporción muestral se encontrará entre 0.74 y 0.94

4.- En una muestra simple aleatoria de 64 piezas de tipo A extraídas de un almacén se encontraron 13 piezas
defectuosas. De una estimación por intervalo con nivel de confianza del 95% para la proporción de piezas
defectuosas en el almacén.
n = 64 p$ = 13/64 = 0.20
p$ ± Z(1−α/2) pq / n = 0.20 ±1.96 0.20(0.8) / 64
= 0.20 ± 1.96 0.0025
= 0.20 ± 1.96 (0.05)
= 0.20 ± 0.098 por lo tanto el intervalo será: 0.102 ≤ P ≤ 0.298 indicando que el 95% de las
veces el verdadero valor de la proporción poblacional se encontrará entre 0.102 y 0.298.

5.- Calcule un intervalo de confianza del 95% de la varianza poblacional de una población normal, si en una
muestra aleatoria de tamaño 22 se obtuvo una varianza de 121.

n = 22 S2 = 121 (1 - α ) = 0.95
Como se trata de un intervalo de confianza de la varianza, se trabajará con la distribución de probabilidad χ2.

En este caso si (1 - α ) = 0.95 entonces α= 0.05 y α/2 = 0.025 por tanto:


(1 - α /2) = 0.975, como esta distribución no es simétrica se tendrá que buscar los dos valores de χ2., es decir
χ2(0.025) y χ2(0.0975) con 21 grados de libertad.
χ2(0.025) = 10.3 y χ2(0.0975) = 35.5 por tanto el intervalo vendrá dado por:
(n-1)S2 / χ (21−α / 2) ≤ σ2 ≤ (n-1) S2 χ2(α/2)
21(121)/35.5 ≤ σ2 ≤ 21(121)/10.3
2541/35.5 ≤ σ2 ≤ 2541/10.3
71.57 ≤ σ2 ≤ 246.69 que indica que el 95% de las veces el valor de la varianza poblacional se
encontrará entre 71.57 y 246.69.
Si se quiere sacar el intervalo de confianza de la desviación típica poblacional sólo se le saca la raíz cuadrada al
intervalo de la varianza.
8.46 ≤ σ ≤ 15.71 y se tendrá que la desviación típica poblacional se encontrará el 95% de las
veces entre 8.46 y 15.71

Deben hacer los ejercicios del Laboratorio de Estadística Matemática II desde el 25 al 41.

AUTOEVALUACION

1.-¿Qué ventajas tendrá para Ud. una estimación por intervalo sobre una estimación puntual.?
78
2.-¿En que caso en la estimación por intervalo de μ Ud trabaja con la distribución muestral de t'student?
3.- ¿Qué supuestos se deben hacer para trabajar con la distribución t'student en el cálculo del intervalo de
confianza de μ?
4.- ¿Diga con que distribución de probabilidad se trabaja el intervalo de confianza de la proporción poblacional y
que condiciones se deben dar?
5.- ¿Diga con que distribución de probabilidad se trabaja el intervalo de confianza de la varianza y desviación
típica poblacional?
6.- Se desea estimar el ingreso medio de una población que sigue aproximadamente una distribución normal
constituida por 10 personas y para ello se seleccionó una muestra de 5 personas, recogiéndose de ellos lo
siguiente:
ingresos: 150, 148, 152, 149, y 151
a.- Halle una estimación puntual de μ y de σ2.
b.- Halle una estimación por intervalo del 95% de μ y de σ2.
7.- Si el tamaño de una muestra es de 225 unidades en una población de 3000 elementos y se conoce que la
característica en estudio tiene una varianza de σ2 = 400 ¿diga que error máximo admisible puede obtenerse con
una confiabilidad de un 95%. Para la estimación de la media poblacional.
8.- Se conoce que el número de propietarios de autos de la ciudad de la Habana es de 9000 y se desea estimar
la proporción de ellos que se encuentran retrasados en el pago de impuesto sobre circulación terrestre en el mes
de junio del año 1997, con una d = 0.05, si una muestra arroja una p$ = 0.5
Calcule el tamaño de la muestra necesario para una estimación confiable (utilice un coeficiente de confianza del
95%).
9.- De una población de 200 trabajadores se han muestreado 30 de los cuales 18 son fumadores. De un
estimado de la verdadera proporción de fumadores y del total de fumadores de dicha población.
a.- En estimaciones puntuales
b.- En estimaciones por intervalo con una confianza del 99%

Tema V Pruebas de Hipótesis. Conceptos Básicos. Error tipo I y II. Prueba de hipótesis de media (μ) con
varianza (σ2) conocida y desconocida.
Bibliografía: Estadística de Caridad Bustillo y otros. Capitulo 7 páginas 157/175

La prueba de Hipótesis es parte de la toma de decisiones sobre la distribución de una población o sobre sus
parámetros. Cuando se dice que se refiere a la distribución de una población de lo que se trata es de comprobar
si realmente la distribución que se tiene sigue una distribución de Poisson, Normal, Binomial etc. y esto está
dentro de las llamadas pruebas de hipótesis no paramétricas, como también se encuentra comprobar si dos
variables analizadas pueden considerarse si son independientes o no. Y la otra parte que se refiere a la toma de
decisiones sobre sus parámetros y es conocida como Prueba de Hipótesis Paramétrica lo que se refiere es al
estudio de los parámetros de la población como son: μ, σ2 , σ, y Ρ, entre otros, y es por donde comenzaremos
el estudio de este Tema.

Pruebas de Hipótesis Paramétricas.


¿Dónde puede ser utilizada y para que?
• En la agricultura cuando se quiere conocer si un nuevo fertilizante aumenta el rendimiento o no.
• En la educación cuando se quiere conocer si un método de enseñanza determinado, aumenta la promoción o
no.
• En el deporte cuando se quiere conocer si un estilo de juego mejora o no los resultados.
• En medicina cuando se quiere conocer si un medicamento disminuye o no el tiempo de restablecimiento de
un paciente.
En fin esta técnica puede ser utilizada en cualquier rama de las ciencias.
Cuando se trata de verificar si un conjunto de datos muestrales concuerda con una hipótesis H, se calculará el
estadístico θ$ que mejor estime el parámetro y por medio de la distribución en el muestreo del estimador, se
determinará entonces un valor crítico a partir del cuál la hipótesis H será rechazada.

El procedimiento para determinar este valor crítico, el cuál genera una región de rechazo que denotaremos por
W se explicará posteriormente.
79

Conceptos Básicos
En el proceso de someter a prueba una hipótesis siempre se plantearán dos hipótesis: Una hipótesis nula (Ho) y
otra alternativa (H1)
Hipótesis nula (Ho) es una hipótesis de diferencias nulas. En otras palabras es la hipótesis que contiene la
igualdad, esto es:
Ho: θ = θo ó si fuera una dócima sobre la media poblacional, sería Ho: μ = μo

La prueba se construirá de forma tal que permitirá directamente aceptar o rechazar Ho.
Hipótesis alternativa (H1) es la hipótesis que deberá ser aceptada si Ho es rechazada y puede tomar
cualesquiera de estas 3 formas:
H1 : μ > μo H1: μ < μo H1: μ ≠ μo
Por lo general la hipótesis alternativa, representa la hipótesis de investigación, la que se va a contrastar; y la
hipótesis nula la situación actual, la que existe, por lo tanto es donde siempre está la igualdad, nunca se puede
presentar la igualdad en la hipótesis alternativa.

De todo lo visto anteriormente se puede plantear que Ho se formula con la intención expresa de ser rechazada,
ya que si Ho se rechaza, ello implica que H1 se acepta.

Región Crítica ó Región de Rechazo (W).


Se llama región de rechazo al conjunto de valores del estadístico de prueba a partir de los cuales se rechaza la
hipótesis nula.

La distribución del estadístico de prueba se divide en dos partes la región de rechazo y la región de no rechazo,
estando separadas estas por un valor crítico (C), y su determinación dependerá del tamaño de la región de
rechazo y ésta a su vez de la probabilidad de cometer el error tipo I
Ubicación de la Región crítica.
La ubicación en el gráfico depende de H1, Y las mismas pueden ser unilateral (a la derecha o a la izquierda) o
bilateral (a ambos lados).
1 2 3
Si H1: μ > μo Si H1: μ < μo Si H1: μ ≠ μo

///// \\\\\ \\\\ ////


---------------------------- -------------------------- ----------------------------
C C C1 C2
Siendo W: para cuando σ² es conocida en las 3 situaciones anteriores respectivamente.
(Deben fijarse que la Región Crítica se corresponde con la hipótesis alternativa.)

W = { (X1, X2, ...Xn / x > μo + Z1 - α σ/ n }

W = { (X1, X2, ...Xn / x < μo - Z1 - α σ/ n }

W = { (X1, X2, ...Xn / x > μo + Z1 - α/2 σ/ n ó x < μo - Z1 - α/2 σ/ n }

Siendo W: para cuando σ² es desconocida en las 3 situaciones anteriores respectivamente.

W = { (X1, X2, ...Xn ) / x > µo + t1-α (n-1) S/ n }

W = { (X1, X2, ...Xn ) / x < µo - t1-α (n-1) S/ n }

W = { (X1, X2, ...Xn ) / x > µo + t1-α/2 (n-1) S/ n ó x < µo - t1-α/2 (n-1) S/ n }


80
Errores a cometer
Al tomar una decisión corremos el riesgo de cometer un error, es decir:
Podemos rechazar Ho, siendo cierta ó Podemos aceptar Ho siendo falsa, pues bien, el 1er error se le denomina
Error tipo I y al otro Error tipo II . La probabilidad de un error de tipo I, se conoce como α y la probabilidad de un
error de tipo II, se conoce como β .

Luego interesa medir las magnitudes de esos errores y tratar de que estas sean lo más pequeña posible o sea
que la probabilidad de cometerlos sea lo suficientemente pequeña.

α = Ρ( Rechazar Ho / θ = θo) → α =Ρ( θˆ ∈ W / θ = θo)

β = Ρ( Aceptar Ho siendo falsa ) → β = Ρ( θˆ ∉ W / θ = θR)

Suponga que: Ho: μ ≤ 10 Y Suponga que: Ho : μ ≥ 10


H1: μ > 10 H1 : μ < 10
Si μR = 9 y W =[ x < 8]

μ = 10 α = 0.05

α β

Se planteó que era interés reducir la magnitud de los errores, pero reducir la magnitud de ambos errores es
imposible pues una disminución en uno de ellos, provoca en general un aumento del otro. Observando la figura
anterior se podrá dar cuenta de lo planteado.

La solución está dada en fijar la probabilidad de cometer uno de ellos, preferiblemente la probabilidad de
cometer el error de connotación más grave a un nivel aceptablemente bajo y tratar de hacer mínimo el otro.
Generalmente se conoce como error más grave, al error de tipo I. Se debe señalar que a estos dos tipos de
errores se les llaman riesgo de los Productores (α) y de los consumidores (β). El riesgo de rechazar una
hipótesis verdadera, se le llaman riesgo de los productores, puesto que si la hipótesis se rechaza, los artículos
no se venden y el productor tiene una perdida injustificada. Y la probabilidad de que artículos de mala calidad
sean aceptados para la venta, es una probabilidad de perdida para el consumidor
El error tipo I se fija con un valor suficientemente pequeño,(de forma tal que si el estimador cae en esa zona, es
porque realmente se debe rechazar H0 ; 0.05, 0.01) aceptable para el investigador. A este error se le llama en la
prueba de hipótesis, Nivel de significación y el cual se prefija antes de construir la prueba. Y se le denomina así,
nivel de significación al valor máximo de la probabilidad de cometer el error tipo I cuando θ = θo, el cual se prefija
antes de construir la prueba.
El término de significación se utiliza dado que conociendo el valor de α, se podrá determinar cuál es el valor del
estadístico de prueba a partir del cuál la diferencia entre este y el parámetro se considera significativa.

Regla de decisión: Es la regla en que se formula, lo que se va a hacer partiendo del valor crítico (C) calculado.
Esto es:
81
para el primer caso de H1 Se rechaza Ho, para todo valor del estadístico de prueba que sea mayor que C y se
acepta Ho , para todo valor del estadístico de prueba que sea menor o igual que C.
En el segundo caso de H1 Se rechaza Ho, para todo valor del estadístico de prueba que sea menor que C y se
acepta Ho, para todo valor del estadístico de prueba que sea mayor o igual que C.
En el tercer caso de H1 (Bilateral, dos colas) Se rechaza Ho, para todo valor del estadístico de prueba que sea
menor que C1 ó mayor que C2 y se acepta Ho para todo valor del estadístico de prueba que esté comprendido
entre C1 y C2.
Debemos señalar que en el caso que se acepte Ho, no se debe plantear categóricamente que se acepta Ho sino
“no hay elementos para rechazar Ho” ya que es más aconsejable, si el estadístico de prueba cae en la región de
no rechazo (región de aceptación) plantear que no hay elementos para rechazar Ho, debido a que es mas
factible refutar hipótesis que aceptarlas
Recuerde que tal como se formulan las hipótesis y se realiza la prueba, se hace con la condición expresa de
rechazar Ho.

Toma de Decisión
La decisión se toma utilizando el estadístico de prueba que nos facilitó la muestra y si el mismo cae en la R.C.
se rechaza Ho y por tanto se acepta H1; si cae en la Región de no rechazo (de aceptación) no existen elementos
para rechazar Ho.

Pasos a seguir en la construcción de una prueba de hipótesis


• Formulación de la hipótesis nula y alternativa
• Elección del nivel de significación (α)
• Selección del estadístico de prueba (según parámetro a realizar la prueba)
• Determinación del Valor Crítico (C)
• Formulación de la regla de decisión
• Toma de decisión

Veamos un ejemplo: (Ejercicio 50 página 44 del Laboratorio)


En una fábrica se producen cuerdas cuya resistencia promedio es de 500 kgs. Con una desviación típica
de 40kgs. El jefe de producción plantea que con otra materia prima, la resistencia promedio puede
aumentarse. Para probar su planteamiento, se utilizó de forma experimental la nueva materia prima,
tomándose una muestra de las cuerdas producidas, siendo el ama{o de la misma igual a 64,
obteniéndose x = 510kgs . Se pide realizar la prueba de hipótesis correspondiente para un 5% de
significación.
Al enfrentarnos a un problema de este tipo, lo primero que hacemos es analizar a que parámetro le vamos a
hacer la prueba, y esto está en dependencia de lo que se va a investigar. En este caso se plantea que con una
nueva materia prima, la resistencia promedio PUEDE AUMENTARSE, es evidente que se trata de una prueba
de hipótesis de media ( μ ) pero... ¿es con σ²conocida o desconocida? Para ello lo segundo que hacemos es
sacar la información que nos brinda el problema.
µ = 500 σ = 40 n = 64 x = 510 α = 0.05
A partir de la información, σ2 es conocida, por tanto de acuerdo a un Teorema, visto en la Estadística
Matemática I que dice si x ¬ N (µ ; σ) entonces
x ¬ N (µ ; σ / n ). Luego sabemos que las fórmulas para el cálculo de la R.C. que utilizaremos serán las de
la normal.

Ya podemos comenzar con el 1er paso: Formulación de las hipótesis nula y alternativa.
Recordar que en H0 se plantea la situación actual, la que existe, que es que la resistencia media es de 500 kgs.
Y que en la H1 se plantea la situación que se va a investigar que en este caso es que, con un cambio en la
materia prima la resistencia promedio puede aumentar.
H0 : µ = 500 esta hipótesis nos indica que la resistencia será ≤ 500 kgs
aunque se pone la igualdad implica menor o igual
H1: µ > 500 nos dice que con la nueva materia prima la resistencia pro-
medio aumenta.
82

Nivel de significación: α = 0.05 nos lo dice el problema, si no nos lo dan, nosotros lo ponemos, los que más se
utilizan son o 0.01 ó 0.05.

Estadístico de prueba: x = 510 y sabemos que x ¬ N(500, 40/ 64 )


(que solo se utilizará para tomar la decisión)
Región crítica
x > μo + Z1 - α σ/ n }
W = { (X1, X2, ...Xn /
x = 500 + 1.64 (40 / 64 )
= 500 + 1.64 (5)
= 500 + 8.20
= 508.2 por lo tanto W = { x > 508.2}
Se recomienda hacer el gráfico y ubicar la R.C.
Queremos señalar que el valor de Z, lo pueden buscar en la tabla que está en la pagina 17 de la selección de
tablas estadísticas, donde aparecen dos distribuciones normales, una para R.C. unilaterales (tiene sombreada
solo una cola) y la otra para R.C. bilaterales (tiene sombreada dos colas).
Se busca el nivel de significación y tiene en la misma línea el valor de Z que le corresponde. No se debe tomar
el signo que tiene la tabla, ya que la fórmula tiene el signo, sólo se toma el valor que le corresponde a Z.
Regla de decisión
Se formula de acuerdo al resultado de la R.C.
Se rechaza Ho ∀ x > 508.2
Se acepta H1 ∀ x ≤ 508.2
Toma de la decisión
Como x = 510 que es > 508.2 cae en la R.C. por tanto Rechazo Ho lo que nos indica que aceptamos H1 y por
tanto llegamos a la conclusión que con la nueva materia prima la resistencia promedio puede aumentarse a un
nivel de significación del 5%.

Al tomar esta decisión podemos cometer el error tipo I, rechazar algo que puede ser cierto.
Es bueno significar que la R.C., no sólo se pueden expresar basándose en el estadístico de prueba, sino
también en función de la variable estandarizada Z (en este caso por supuesto, ya que la media sigue una
distribución normal) y así es como está desarrollada en la Bibliografía básica de esta asignatura.
Es conveniente que el alumno sea capaz de realizar estas pruebas por cualquiera de las dos vías.
Para tomar la decisión en función del estadístico Z, hay una pequeña variación a partir del 4to paso.
Región crítica
Se determina buscando el valor de Z que corresponde según tabla
W = { .../Z > Z1 − α} W ={ .../Z > 1.64}

Regla de decisión
Se formula a partir del Valor Crítico determinado, y por tanto de Z
Rechazo Ho ∀ Z > 1.64
Acepto Ho ∀ Z ≤ 1.64
Decisión
Para tomar la decisión se calcula el valor del estadístico Z utilizando el valor de x obtenido en la muestra.
Zo = ( 510 - 500 ) / (40 / 64 ) = 10 / 5 = 2

Así el valor de Zo = 2 es > 1.64 por tanto caemos en la R.C. y se rechaza Ho, por lo que se acepta H1 a un nivel
de significación del 5% y se llega a las mismas conclusiones: que el cambio de materia prima puede aumentar la
resistencia promedio de las cuerdas.

Vamos a ver otro ejercicio, el que estudiamos anteriormente ilustra la situación cuando la varianza de la
población es conocida, veamos un ejercicio que ilustra cuando la σ² es desconocida.
Debemos recordar de los Teoremas vistos en la Estadística Matemática I
83
Que cuando:
X ¬ N(μ , ?) si n > 30 ⇒ x ¬ N(μ , S/ n ) , en este caso se estima σ a través de, ya que la muestra es
grande.
X ¬ N(μ , ?) si n < 30 ⇒ x ¬ t'student con (n-1) g.l.
Ejemplo #2
La producción promedio de leche diaria por vaca en la provincia en los meses de verano ha sido en los años
anteriores de 10.1 litro. Este año en una muestra simple aleatoria de 16 días de los meses de verano se obtuvo
una producción media diaria por vaca de 9.8 litros con una varianza muestral de 1.21. ¿Hay razón para afirmar
que ha variado la producción de leche diaria promedio por vaca?. Considere distribución normal y α = 0.05
Esta es una prueba paramétrica sobre media, ya que de lo que se trata es de verificar si ha tenido variación la
producción diaria promedio de leche por vaca.
La información que nos brinda el problema es la siguiente:
μ = 10.1 σ² = ? n = 16 x = 9.8 S2 = 1.21 ⇒ S = 1.1
Estamos en el caso en que se desconoce la varianza poblacional ( σ ) y n < 30, luego tenemos que trabajar
2

con la distribución t'student, para el cálculo de la R.C.


1.- Formulación de las hipótesis
Ho: μ = 10.1
H1: μ ≠ 10.1
Aquí Ho nos expresa que la producción promedio de leche es de 10.1 y H1 que la producción promedio de leche
varió, es decir puede ser mayor ó menor.
2.- Nivel de significación
α = 0,05
3.- Estadístico de prueba.
x = 9.8, ya que es el mejor estimador de μ , la distribución con la que vamos a trabajar es t'student, según
vimos anteriormente.
4.- Determinación del Valor Crítico de la Región Crítica
Recuerde que la misma está en correspondencia con la hipótesis alternativa.
W = { (X1, X2, ...Xn ) / x > µo + t1-α/2 (n-1) S/ n ó x < µo - t1-α/2 (n-1) S/ n }
Para buscar el valor de t, en la tabla primero tenemos que buscar
( 1 - α/2) esto es: si α = 0.05 entonces α/2 = 0.025 lo que implica que
( 1 - α/2) = 1 - 0.025 = 0.975 por lo tanto tenemos que buscar una “t” en:
- tα/2 (n-1) = t1-α/2 (n-1) = t0.97515 = 2.13 (-t0.02515 = -2.13)
El manejo de la tabla está explicado en la Estadística Matemática I
Así : x = 10.1 + 2.13 (1.1/ 16 )
= 10.1 + 2.13 (0.275)
= 10.1 ± 0.5858
x = 10.6858; x = 9.5142 por lo tanto W : (9.5142 > x > 10.6858 )
5.- Regla de decisión
Rechazo Ho ∀ x < 9.5142 y > 10.6858
No Rechazo Ho ∀ (9.5142 ≤ x ≤ 10.6858 )
6.- Decisión
x = 9.8 > 9.51 y < 10.68 lo que hace que caiga en la región de no rechazo (región de aceptación),
por lo tanto concluyo que no tengo elementos para rechazar Ho a un α = 0,05, lo que implica que no ha variado
la producción de leche diaria promedio por vaca.
El error que se pudo haber cometido es error tipo II

Utilizando el estadístico t'student., cambia a partir del paso 4.


4.- Región Crítica
W = { t > 2.13 ó t < -2.13 }

5.- Regla de Decisión


Rechazar Ho ∀ t >2.13 ó t < -2.13
84
No Rechazo Ho ∀ - 2.13 ≤ t ≤ 2.13

6.- Decisión
Calculamos el estadístico “t”, a partir de los datos muestrales

to = ( x - μ) /(S/ n) to = (9.8 - 10.1)/(1.1/ 16 ) = - 0.3/0.275 = - 1.09

to = - 1.09 > -2.13 y < 2.13 luego cae en la región de no rechazo (región de aceptación), por tanto podemos
concluir que no hay elementos para rechazar Ho a un nivel de significación del 5% lo que implica que no ha
variado la producción de leche diaria promedio por vaca.
Observe que por los dos métodos el resultado es el mismo. Los autores de esta Guía prefieren el primer
método.

Hasta aquí la materia planteada, pueden estudiar en el libro de texto, (Estadística) los ejercicios resueltos en él
capitulo 7, ejercicios 7.4, 7.5, 7.6, 7.8 y 7.11 en las paginas desde 164 /173. También pueden hacer los
ejercicios 19, 20, y 22
Del Laboratorio de Estadística Matemática II, pueden hacer los ejercicios: 47(b), 49, 50, 51(a, b, c), 52(a, b, c, d),
Desde la página 39 a 45, ejercicios de media con varianza conocida y el 71(a), 72(a), 73(a), 74 y 75(a) desde la
página 58 a la 61, ejercicios de media con varianza desconocida.
A continuación plantearemos un autoexamen de esta materia.

AUTOEXAMEN
1.- Explique, con sus palabras que significan los términos hipótesis nula e hipótesis alternativa.
2.- Explique que nos indica el error tipo I y el error tipo II
3.- ¿Cuál es la relación de α con el error de tipo I?
4.- ¿Cuál es la relación de β con el error de tipo II?
5.- Supóngase que se conocen los resultados de una prueba de aptitud para la admisión a estudios de grado en
Administración de Empresas, los cuales tienen una distribución normal con media de 500 y una desviación típica
de 100. Si una muestra aleatoria de 12 solicitantes del Stephan College tiene una media muestral de 537
¿existe evidencia de que su resultado medio sea diferente de la media esperada de todos los solicitantes? Use
α = 0.01
6.- La compañía Acero Valle Verde fabrica barras de acero. Entrega barras de acero con una longitud promedio
de por lo menos 2.8 pies cuando el proceso funciona correctamente. De la línea de producción se selecciona
una muestra de 25 barras. La muestra señala una longitud promedio de 2,43 pies y una desviación típica de 0.20
pies. La compañía desea determinar si se necesita ajustar el equipo de producción. Utilice un α = 0.05 y diga
que error pudo estar cometiendo con la decisión tomada.
7.- La división de inspección del departamento de pesas y medias de la provincia Habana está interesada en
confirmar la cantidad real de refrescos que se envasa en botellas de 2 litros, se conoce que μ = 2.02. La planta
embotelladora ha informado a la división de inspección que se desconoce la desviación típica de la población, y
que al tomar una muestra aleatoria de 100 botellas, mostró un promedio de 1.99 litros y una desviación típica de
0.05 litros. ¿Es posible concluir que la cantidad promedio en las botellas fuera menos de 2 litros? Utilice un α =
0.01
8.- Una gran cadena nacional de electrodomésticos tiene una venta especial por fin de temporada de
podadoras de césped. A continuación se presenta el número de podadoras vendidas durante esta venta en una
muestra de 10 tiendas:
8 11 0 4 7 8 10 5 8 3
A un α = 0.05 ¿Se puede llegar a la conclusión que se haya vendido un promedio de más de 5 podadoras por
tienda durante esta venta?
¿Que suposiciones se requiere para realizar esta prueba?
¿Que error se pudiera estar cometiendo con la decisión tomada?
85
Tema V Pruebas de Hipótesis. Tamaño del error tipo I y tipo II. Tamaño de la muestra. Bibliografía:
Estadística II de Arístides Calero paginas 6 a la 30. Introducción al Análisis Estadístico. Dixon y Massey.
Paginas desde 87 a 98 y de 240 a 250. Y en Teoría y Problemas de Estadística de M. R. Spiegel capítulo
10 Paginas 168 a 171.
Errores Tipo I y II, Función de Potencia.
Error Tipo I
Tradicionalmente el estadístico de prueba controla al Error Tipo I, estableciendo el nivel de riesgo que está
dispuesto a tolerar en términos de rechazar una hipótesis nula verdadera.

Una vez especificado el valor para “α”, se conoce el tamaño de la Región Crítica o de Rechazo, puesto
que α es la probabilidad de rechazo de acuerdo a la hipótesis nula.
Para el cálculo del Error Tipo I, tenemos que partir de los valores de la región de rechazo, es decir, el valor
crítico, que es el que nos indica el inicio de esta región de rechazo; y también el valor hipotético de la media
poblacional. A partir de la siguiente fórmula:

α = Ρ( x ∈ W μ = μo )

Para ver una aplicación y el cálculo de los Errores Tipo I y II, partiremos de una situación determinada.

El gerente de Distribución de determinada fábrica, sabe que la oficina local de protección a los consumidores
hace inspecciones periódicas para conocer si los pesos de los paquetes de cereal, producidos por su fábrica
tienen el peso adecuado(el que establece los parámetros). El sabe que el empaque del proceso de llenado de
los paquetes de cereales, está ajustado de forma tal que la cantidad de cereal por paquete sigue una
distribución normal con media de 368 gramos y la desviación típica de la población es de 15 gramos. Para hacer
los análisis pertinentes, se seleccionó una muestra aleatoria tamaño 25, calculándose el peso promedio el que
resultó igual a 367.6 ( x ).
a) Haga la prueba correspondiente a un α = 0.05, si se desea conocer si ha disminuido el peso promedio
de los paquetes. Y diga que error pudo haber cometido y cuál es su tamaño.
b) El gerente plantea que le interesa conocer de antemano, cual sería el riesgo que se podría cometer al
rechazar Ho si se considera que el valor de x c < 367, debido a que él está interesado en detectar si
existen cambios en la media hipotética y así parar el proceso si el peso promedio es menor que 367.

Vamos a darle solución al problema, para ver que situación es la que existe:
Información que nos proporciona el problema:
μ = 368 n = 25 σ = 15 x = 367.6 α = 0.05

1.- Ho: μ = 368


H1: μ < 368

2.- α = 0.05

3.- x = 367.6 que como x → N(μ ;σ ) entonces x →N((μ ;σ/ n )

4.- W:{x1, x2, ... xn/ x < μ0 - Ζ1 - α σ / n}

x = 368 – 1.64 (15/ 25 )


=368 – 1.64 (3)
x = 368 – 4.92
= 363.08
Por lo tanto la región de rechazo será: W:{ x < 363.08}
86

5.- R:D:/ Rechazo Ho ∀ x < 363.08


Acepto Ho ∀ x ≥ 363.08

6.- D/ x = 367.6 >363.08 ⇒ Que no tengo elementos para Rechazar Ho, lo que nos indica que los paquetes de
cereales tienen un peso promedio de 368 gramos a un α = 0.05.
En este caso, a partir de ésta decisión, ¿Qué error pudiera estar cometiendo? Por supuesto que el error tipo
II. ¿Y que tamaño tendría este error? Calculémoslo:

β = Ρ( x ∉ R.C./ μ = μR)

Este error se calcula a partir del valor Real que debiera tener μ y que es desconocido, por lo tanto se pudiera
tomar como el valor del promedio real cualquier valor que este contenido en la hipótesis alternativa es decir se
pudiera considerar: μR = 320 ó μR = 367, esto es uno muy alejado de μ0 y otro muy cerca de esta.
Veamos:
β = Ρ( x ∉ R.C./ μ = μR) si consideramos μR = 320, entonces

β = Ρ( x > 363.08)= 1 – P( x < 363.8)


363.08 − 320
= 1 – P (Z 〈 )
3
43.08
= 1 - P (Z 〈 )
3
= 1 – P( Z < 14.36)
= 1 – FZ (14.36)
=1–1
=0
Lo que nos indica que existe una probabilidad muy pequeña de considerar que el peso promedio no ha
cambiado, cuando en realidad está cambiado.
Y si consideramos una media real igual a μR = 367
β = Ρ( x > 363.08) = 1 - P( x < 363.08)
⎛ 363.08 − 367 ⎞
= 1 - P⎜Z〈 ⎟
⎝ 3 ⎠
⎛ − 3.92 ⎞
= 1 - P⎜Z〈 ⎟
⎝ 3 ⎠
= 1 – P( Z < - 1.306)
= 1 – FZ(-1.31)
= 1 – 0.0951
β = 0.9049
Este error nos está indicando que existe una probabilidad alta de considerar que el peso promedio no varía,
cuando en realidad está variando.
Lo que nos indica que cuando el valor real está muy próximo al valor hipotético, el tamaño del error tipo II, va a
ser muy grande y en consecuencia el error tipo I es bajo y eso es lo que al gerente le interesa que ocurra, ya que
tomar la decisión de hacer un cambio en la línea de llenado, debe hacerse cuando realmente se esté seguro que
ese cambio nos va a proporcionar beneficios, por lo costosa que pudiera ser esta decisión, y sólo se estará
seguro de ello cuando el tamaño del error tipo I es pequeño.

b) Ahora vamos a ver cual será el riesgo α que cometeríamos si pensamos qué podría haber un cambio en la
media hipotética.. Consideraremos para ello que nuestra R. C. es para valores menores que 367.
87
¿Cómo se calcula el Error Tipo I (α)? ¿Cuál sería el tamaño de “α”? Si el punto crítico W: { x < 367}que es el
que suministró el Gerente de Producción, partiendo del conocimiento que tiene de su planta, tendríamos:
α = Ρ( x ∈ R.C./μ =μo) = P( x < 367/μ = 368)
367 − 368
= P (Z < )
3
= P (Z < - 1/3)
= Fz (-0.33) = 0.3707
α= 0.3707
En este caso se obtiene una probabilidad alta del error tipo I, y el quisiera que esto ocurra cuando lo más
importante para el Gerente fuera estar seguro de detectar los cambios que se podrían producir en la media
hipotética, que de hecho traería por consecuencia que disminuye el error tipo II, que mide que la media
hipotética no ha cambiado, cuando en realidad si lo ha hecho.

En muchas aplicaciones estadísticas el segundo tipo de error (error tipo II), no está controlado, pero aun
entonces el que realiza el experimento debe estar enterado de la existencia de este error y tener una idea
de lo grande que puede ser, ya que como dijimos, la probabilidad de que artículos de mala clase sean
aceptados para la venta, es una probabilidad de perdida para el consumidor.
Este error se puede graficar y se obtiene la Curva Característica de Operación (curvas OC, corresponde a
las iniciales de Operation Characteristic) de gran utilidad en técnicas estadísticas.

Este error es más difícil de determinar su probabilidad, ya que la media de la población puede tomar muchos
valores, tantos como los que contenga la hipótesis alternativa, para lograr la curva característica deben elegirse
varios valores representativos, y la curva dará la posibilidad de evaluar los riesgos que se derivan de no
rechazar una hipótesis nula falsa, es decir muestra la probabilidad de no rechazar una hipótesis nula falsa para
cada valor posible del parámetro poblacional verdadero.

Algunas consideraciones sobre los Errores Tipo I y II


Para un determinado tamaño de muestra, quien deba tomar la decisión tiene que equilibrar los dos tipos de
errores.

Ya sabemos que si se disminuye α aumenta β, esto gráficamente es muy fácil de ver.


α β
Los valores para α y β dependen de la importancia de
cada riesgo en un problema en particular. El riesgo de
un error tipo I, en el problema de llenado de los
paquetes de cereales implica llegar a la conclusión
que la cantidad promedio ha cambiado cuando en
realidad no es así.

El riesgo de un error tipo II implica llegar a la


conclusión de que la cantidad promedio de llenado
no ha cambiado, cuando en realidad si ha
cambiado.

Así la selección de los niveles que deben tener α y β


depende de los costos inherentes a cada tipo de error.

Por ejemplo si fuera muy costoso hacer cambiar la línea de llenado, entonces se querría estar muy seguro de
que un cambio resultaría beneficioso por lo que un error tipo I, pudiera ser lo más importante y α se mantendría
muy bajo.

Por otra parte si se quiere estar seguro de detectar los cambios de una media hipotética, el riesgo de un error
tipo II, sería lo más importante y se seleccionaría un nivel más alto de α.
88
Claro que al aumentar el tamaño de la muestra se podrían controlar tanto α como “β”, pero siempre hay límites
en los recursos disponibles, de ahí la necesidad de tomar en cuenta los pro y contra de cometer errores de tipo I
y II.

A estos dos tipos de errores se les llaman riesgos de los productores al error tipo I (y se considera el más grave)
y riesgos de los consumidores al error tipo II.

Sin embargo hoy, dado el desarrollo de la Ciencia y la Técnica ambos errores deben, con más razón controlarse,
y la única forman de controlar los dos errores, es a través del tamaño de la muestra.

Sin embargo decidir el tamaño del error tipo I, no es muy difícil, teniendo en cuenta que la prueba de hipótesis se
hace utilizando este error como significación de la prueba, y que habíamos dicho que generalmente se plantea
que los valores que se le debe asignar son 0.05 y 0.01. Pero ¿cómo elegir el tamaño que debe tener el error tipo
II?

Esto sin embargo estará en función de la Potencia que queramos que tenga nuestra prueba y que de hecho
siempre será que la potencia de la prueba sea lo más grande que se pueda ( que también se mide en
probabilidad)

Autoexamen

1.-Para probar que una moneda no está trucada, se adopta la siguiente regla de decisión: Acepte la hipótesis si
el número de caras en una muestra simple de 10 lanzamientos está entre 40 y 60 inclusive de lo contrario
rechace la hipótesis. ¿Cuál es la probabilidad de aceptar la hipótesis de que la moneda no esté trucada cuando
la probabilidad real de obtener cara es P = 0.7?

2.- Una empresa fabrica cordel cuya carga de rotura tiene una media de 300 lbs y una desviación estándar de 24
lbs. Se cree que mediante un nuevo proceso de fabricación la carga media de rotura puede ser aumentada.
a) Diseñe una regla de decisión para rechazar el proceso antiguo a un nivel de significación de 0.01 si se
está de acuerdo en probar 64 cordeles
b) Bajo la regla de decisión adoptada en el inciso (a) ¿cuál es la probabilidad de aceptar el proceso
antiguo, cuando en realidad el nuevo proceso ha aumentado la carga media de rotura a 310 lbs.?
Suponga que la desviación estándar sigue siendo 24 lbs.
3.- Si la probabilidad de cometer un error tipo I disminuye, ¿cómo afecta esto a la probabilidad de cometer un
error tipo II?
4..- Si la probabilidad de cometer un error tipo II disminuye, ¿afecta esto a la probabilidad de cometer un error
tipo I?
5.- Que es más importante controlar un error tipo I o el error tipo II?
6.- Cada semana, la policía del Estado de La Florida intercepta un promedio de $56 millones en drogas que se
transportan hacia el norte por una carretera interestatal. Durante 36 semanas elegidas al azar en 1992, la policía
interceptó un promedio de $60 millones en drogas por semana, con una desviación estándar de $20 millones.
¿Indica esta evidencia muestral un aumento en el movimiento de drogas a través de La Florida? Realice una
prueba con un nivel de significación de 0.05. Calcule la probabilidad de que ocurra un error tipo II si la media
poblacional es en realidad $59 millones.
7.- El gerente General de un Hotel, piensa que la cuenta del cliente promedio es de por lo menos $400. La
población sigue una distribución normal con desviación estándar de $60. En el ejercicio 26 se le pidió que
estableciera la regla de decisión para un nivel de significación del 0.15 usando una muestra de 49 cuentas.
También se le preguntó cuál sería la conclusión del Gerente si la media muestral fuera de $375. ¿Cuál es la
probabilidad de un error tipo II si el promedio poblacional es en realidad de $375?
8.- ¿Es posible controlar las probabilidades de error tipo I y tipo II en una prueba de hipótesis particular? Si es
así, ¿cómo se logra?
89

Tema V Prueba de hipótesis. Pruebas de hipótesis de Proporciones y de la varianza


Bibliografía: Estadística. Caridad Bustillo y otros. Capitulo 7. Epígrafe 7.5 páginas 175/185.

Prueba de Hipótesis de Proporciones.


En la Estadística I se estudiaron poblaciones dicotómicas, es decir poblaciones en las cuales una proporción p
de los elementos tiene una cierta característica denominada éxito y una proporción de los elementos (1 - p), no
la tiene, denominada fracaso.

Para muestras grandes, hacemos inferencias en el supuesto de que la distribución muestral de la proporción: p$
= x/n definida como la proporción de la muestra que posee dicha característica, es normal. Donde x =número de
éxitos en la prueba y n tamaño de la muestra. Recuerden que se vio que el número de éxito sigue una
distribución binomial y que si el tamaño de la muestra es grande (n > 30) la proporción de éxito se podía
aproximar por la normal con buenos resultados

Es decir si np ó nq son bastante grandes es decir ≥ 5


el estadístico p$ → N(P, pq / n )
Y por tanto para realizar una prueba de hipótesis sobre el parámetro P, damos los mismos pasos planteados
para la prueba de hipótesis de la media, únicamente cambia el estadístico de prueba, con su correspondiente
distribución de probabilidad a partir de las cuales se calculan los Valores Críticos.
Estadístico de Prueba: p$ , que como sabemos para muestras grandes, tiene una distribución normal por tanto:
Z = ( p$ - P)/ pq / n
Regiones Críticas:
1 2 3
H1: P > Po H1: P < Po H1: P ≠ Po

1 W = { x1, x2, ...xn / p$ > Po + Z1 - α poqo / n }

2 W = { x1, x2, ...xn / p$ < Po - Z1- α poqo / n }

3 W = { x1, x2, ...xn / p$ > Po + Z1 - α/2 poqo / n ó p$ < Po - Z1- α/2 poqo / n }

Veamos un ejemplo:
Se afirma que un lote de piezas contiene menos del 30% de piezas defectuosas. Para comprobarlo se revisan
50 piezas seleccionadas al azar del lote, entre las cuales se detectan 10 defectuosas. ¿Hay razón para
mantener la afirmación a un α = 0.05?
¿De que es esta prueba? Evidentemente es de proporciones, ya que lo que se está investigando es sobre la
proporción de piezas defectuosas.
¿Cuál es la información que nos proporciona el problema?
El lote contiene menos del 30% de piezas defectuosas ⇒ < de 0.30
n = 50 piezas x= 10 piezas defectuosas α = 0.05 por lo tanto
p$ = x/n = 10/50 = 0.2 y Po = 0.30
Se considera una muestra grande siempre que n > 30
1.- Ho : P ≥ 0.30
H1 : P < 0.30

2.- α = 0.05
90
3.- p$ = 0.2 ⇒ →N(P, poqo / n )

4.- W = { x1, x2, ...xn / p$ < Po - Z 1-α poqo / n }


p$ = 0.30 - 1.64 [0.30(0.70)] / 50
= 0.30 - 1.64 0.0042
= 0.30 - 1.64(0.064)
= 0.30 - 0.10496
= 0.19504
W = { ..../ p$ < 0.19504} Se les recomienda hacer el gráfico para ver mejor la región crítica y de
aceptación ó no rechazo.

5.- R.D. Rechazar Ho ∀ p$ < 0.19504


Acepto H0 ∀ p$ ≥ 0.19504

6.- D/ como p$ = 0.2 > 0.19504 (se acepta Ho) No hay elemento para rechazar Ho ⇒ que no se puede afirmar
que el lote contiene menos del 30% de piezas defectuosas a un α = 0.05 (contiene al menos 30% de piezas
defectuosas)

Utilizando el estadístico Z
Tendríamos que Z0.95 = 1.64 (Recordar usar la tabla de la pagina 17 para una sola cola)

W = { .../ Z < -1.64} Siempre que sea < el valor de Z lleva signo negativo
si fuera > el valor de Z lleva el signo + .

R.D./ Rechazar Ho ∀ Z < - 1.64


Aceptar Ho ∀ Z ≥ - 1. 64

D/ Z = ( p$ - P )/ poqo / n = (0.20 - 0.30)/0.064 = -0.10/0.064 = -1.5625

Z = - 1.5625 > -1.64 por tanto (acepto Ho) no se tienen elementos para rechazar Ho ⇒ que la afirmación no es
cierta, el lote contiene al menos un 30% de piezas defectuosas a un α = 0.05

Dócima para la varianza (σ2) de una población con distribución normal, y media desconocida.
Ya estudiamos dócima o prueba de hipótesis de la media y la proporción poblacional, ahora se va a
estudiar la dócima de la varianza, ya que también es de interés determinar si la variabilidad del valor de
una magnitud medida con determinado método no supera ciertos límites o si la varianza de esas
medidas difieren o no de cierto valor dado, con lo que el problema se reduce a realizar una prueba de
hipótesis de la varianza poblacional.

Esta prueba se hará bajo el supuesto de que se tiene una muestra aleatoria de tamaño n procedente de una
distribución normal donde como vimos en la Estadística I que (n - 1)S2/σ2 tiene una distribución χ2 (n - 1).
Por tanto y siguiendo el mismo análisis anterior tendremos que:
Estadístico de Prueba. En este caso será S2 por ser el mejor estimador de σ2 y a través de la distribución Ji-
Cuadrado χ2 (n - 1)., se plantearan las hipótesis.
91

Regiones críticas. Las mismas se corresponden con las hipótesis alternativas:


1 2 3
H1: σ2 > σ2 0 H1: σ2 < σ2 0 H1: σ2≠ σ20

1 W = { x1, x2, ... xn/ S2 > ( σ 0 χ 1−α


2 2 ( n −1)
)/n - 1}

2 W = { x1, x2, ... xn/ S2 < ( σ 0


2 χ α2( n −1) )/n - 1}

3W = { x1, x2, ... xn/ S2 > ( σ 0 χ 1−α / 2 )/n - 1 ó S2 < ( σ 0 χ α / 2


2 2 ( n −1) 2 2 ( n −1)
)/n - 1}

Veamos un ejemplo:
El precio en el mercado mundial de cierto producto A, durante el quinquenio 70-75 exhibió una variabilidad
expresada en σ = 0.4 dólares. Una muestra aleatoria de 30 días correspondiente al quinquenio 75-80
recientemente publicada, mostró una desviación típica S = 0.5 dólares. ¿Hay razón suficiente para creer que el
precio de dicho producto fue menos estable durante el quinquenio 75-80 que durante el quinquenio 70-75?.
Considere un α = 0.05.

¿Sobre que parámetro se va a realizar la prueba?


La prueba se refiere a la varianza de la población, ya que lo que se quiere investigar es la estabilidad del precio,
es decir la variabilidad que éste presentó.

Es bueno significar también que si es menos estable ≡ mayor varianza


más estable ≡ menor varianza
información que nos da el problema:
σ = 0.4 S = 0.5 n = 30 α = 0.05.

1.- Ho: σ2 = 0.16


H1: σ2 > 0.16

Ho nos indica que el precio del quinquenio 70-75 se mantiene en el 75-80 y H1 nos indica que el precio del
quinquenio 75-80 fue menos estable que el del quinquenio 70-75.

2.- α = 0.05.

3.- S2 utilizando para ello la distribución χ2 (n - 1)

4.- W = { x1, x2, ... xn / S2 >( σ 02 χ 12−(αn −1) )/(n-1)}

Si α = 0.05. entonces 1- α = 0.95 por tanto tendrá que buscar un χ20.95(29) = 42.6 luego
S2 = [42.6(0.16)]/29
= 6.816/29
= 0.235 por tanto W = { .../ S2 > 0.235}
Se recomienda graficar la curva y marcar las regiones de rechazo y no rechazo a partir del valor crítico
determinado.

5.- R.D.
Rechazo Ho ∀ S2 > 0.235
Acepto Ho ∀ S2 ≤ 0.235
92
6.- S = 0.25 > 0.235 por tanto rechazo Ho a un α = 0.05. Lo que implica que acepto H1 esto es, el precio de
2

Producto A es menos estable en el quinquenio 75-80 que en el quinquenio 70-75.


O también, utilizando el estadístico χ2 (n - 1)

4.- W ={ .../ χ2 > χ20.95(29) } W = { χ2 > 42.6}

5.- R.D. Rechazo Ho ∀ χ2 >42.6


Acepto Ho ∀ χ2 ≤ 42.6

6.- χ2 = [(n-1)S2] / σ2 = [29(0.25)] / 0.16


= 7.25/0.16
= 45.3 > 42.6 por tanto se rechaza Ho, igual que por el desarrollo anterior, llegándose a las
mismas conclusiones

Pueden hacer del laboratorio los sgtes ejercicios:


79/81, 83/87 a,b 89/90 desde la página 63 a 68 correspondiente a dócima de proporciones; y 96 a / 99, 101 a,b
/104 a ,105 y 116 a,b,c,y d; qué están a partir de la pagina 68 y hasta la pagina 79 correspondiente a dócima de
varianza.

Autoexámen

1.- ¿A que es igual la proporción muestral?


2.- ¿En muestra menor que 30 se puede considerar que la proporción muestral sigue una distribución normal?
3.- Se conoce que en una ciudad, la proporción de hombres es de 0.40. Se supone que después de la
construcción de una gran industria, la proporción de hombres aumentó. Para verificar este supuesto, se extrajo
una muestra aleatoria de tamaño 100, resultando que la misma está integrada por 45 hombres y 55 mujeres. Se
pide hacer la prueba para un α = 0.05
4.- La cadena de tiendas Gaviota, recibe de una firma un embarque de cierta marca de bolígrafos baratos. El
gerente comercial de la cadena desea estimar la proporción de bolígrafos defectuosos; se toma una muestra
aleatoria de 300 bolígrafos y se encuentran que 30 están defectuosas. Se puede devolver el embarque si más
del 5% están defectuosas. ¿Sería probable que la proporción de plumas defectuosas fuera superior a 0.05, y
que pudiera devolverse el embarque?. Utilice un α = 0.05
5.- Un fabricante de aparatos de televisión ha afirmado en su garantía que en el pasado solo el 10% de sus
aparatos necesitaron alguna reparación durante sus dos primeros años de funcionamiento. Para comprobar la
validez de esta afirmación, el Dpto. de Control de la calidad del Ministerio de la Industria Ligera selecciona una
muestra de 100 aparatos y encuentra que 14 de ellos requirieron alguna reparación durante sus primeros dos
años de funcionamiento. Utilizando un α = 0.01. ¿Es válida la afirmación del fabricante o es probable que no lo
sea?

Pruebas no Paramétricas
Tema V Prueba de Hipótesis. Dócima de la Bondad de Ajuste para verificar supuesto de Normalidad.
Bibliografía: Estadística de Caridad Bustillo y otros. Capitulo 7 epígrafe 7.10 paginas 201/208.

Dentro del Tema Prueba de Hipótesis, la prueba que se explicará a continuación, es la única no paramétrica.
Existen muchos problemas donde el interés del investigador se centra en contrastar hipótesis sobre como se
distribuye el número de sucesos que pertenecen a ciertas categorías. Tiene gran importancia el poder conocer si
un grupo de datos sigue o no una distribución normal. La prueba χ2 es adecuada para dar solución a este tipo de
problema, pero no la única, existen otros estadísticos, como son Kolmogorov-Smirnov y el Jarque y Bera entre
otros.

Vamos a comenzar por estudiar la prueba χ2


Por ejemplo, considérese que existen k categorías y que se plantea la hipótesis de que en cada categoría, los
sucesos se presentan con una determinada frecuencia ei ó con una determinada probabilidad Pi para
i = 1,2, ...k .
93
Para probar esta hipótesis, se toma una muestra aleatoria de tamaño "n" y en dicha muestra se obtiene para
cada categoría, las frecuencias observadas Oi .

La prueba persigue el contraste entre las frecuencias esperadas (ei ) planteadas en la hipótesis nula y las
observadas en la muestra (Oi). Si la hipótesis nula es cierta entonces se debe esperar que no existe diferencias
significativas entre ei y Oi .

Suponiendo que existen k categorías y que se obtenga una muestra aleatoria de tamaño n, tal que, cada
observación pertenezca a una y solo una categoría, entonces el estadístico de prueba se define cómo:

∑ (O −e )
i =1
i i
2

χ2 = el que ∑ χ2 (k-1) siempre que ∑ Oi = ∑ ei = n


ei
La hipótesis nula a verificar:
Ho: P1 , P2, ...Pk aparecen explícitamente para cada categoría las probabilidades con que se espera
aparezca cada resultado

∑ (O −e ) i i
2

ei = npi y W={ i =1
/ ei > χ 12−(αk −1) }
ei
De ser cierto Ho el estadístico de prueba deberá estar cercano a cero, mientras que si Ho es falsa el estadístico
de prueba crecerá, alejándose significativamente de cero.
Una aplicación muy importante de la prueba Chi-Cuadrado es la de verificar si en una muestra aleatoria, la
variable observada se ajusta a una distribución de probabilidad especifica, por ejemplo si la variable se
distribuye según la ley Normal, de Poisson, Binomial, Exponencial etc. Esta prueba recibe el nombre de Prueba
de Bondad de Ajuste.

Y en la misma la hipótesis nula se plantearía:


H= : x →Ν(μ, σ)
H1: x no sigue una distribución...

El estadístico de prueba sería:


∑ (O − ei )
2

χ 2
0 =
i
i ∑ χ2 (k-1-m)
donde m = al número de parámetros que son necesarios estimar para
ei
poder calcular las Pi , En Poisson lo que se estima es un solo parámetro (λ) y en la normal dos parámetros
(μ, σ) .

Las frecuencias observadas (Oi) se obtienen de la organización de los datos en tablas de frecuencias, Oi ≡ ni
(frecuencias absolutas simples) mientras que ei = npi siendo pi la probabilidad de ocurrencias para cada valor
posible de x, bajo el supuesto de que Ho sea cierta y debiéndose cumplir que:
k
∑ Pi = 1
i=1

Condición necesaria para poder utilizar estas probabilidades. ( k el número posible de valores de x, esto es
clases o categorías)
Para realizar esta prueba deben cumplirse las siguientes restricciones:
Si k = 2, ninguna frecuencia esperada (ei) debe ser < 5
Si k > 2, solo el 20% de las frecuencias esperadas (ei ) debe ser < 5
Ninguna frecuencia esperada (ei ) debe ser < 1

En tales casos, esta situación se resuelve agrupando categorías adyacentes, cuando las agrupaciones tienen
sentido.
94
Veamos un ejemplo
A partir de la muestra siguiente, verifique para un nivel de significación del 5% si la misma procede de una
población normal.

10 12 13 14 15 22 28 30 30 29
10 11 15 10 15 26 26 28 27 29
16 16 20 17 18 30 28 27 26 30
19 20 17 18 20 29 26 26 28 29
20 19 19 18 17 27 27 26 26 28
17 16 23 24 23 27 31 32 33 33
21 22 22 21 22 29 33 33 32 31
24 23 24 23 21 35 32 31 38 39
24 23 20 21 21 34 37 41 39 41
24 24 23 21 22 31 38 36 36 40

Ya conocemos de la Estadística Matemática I que la distribución normal tiene dos parámetros que son μ y σ2,
Por tanto tenemos que estimarlos a través de x y de S2, que son los dos mejores estimadores que tenemos de
esos parámetros poblacionales.
Como los datos están en su forma primaria, y no podemos definir si son discretos ó continuos y no informan que
tipo de variables es; pero si son muchos datos (100), entonces debo formar intervalos de clases para organizar
la información y me sea más fácil realizar cualquier tipo de cálculo.

Ya sabemos como se forman los intervalos, pero para estos casos, donde se va a probar normalidad, es
aconsejable hacer los intervalos de una forma específica. La distribución normal tiene propiedades donde para
cualquier valor de
μ y σ2 , se cumple que:

----0.6826----
------------0.9544-------------
---------------------0.9998----------------------
_\______\______\_____|_____/______/______/_
μ-3σ μ-2σ μ-σ μ μ +σ μ+2σ μ+3σ
Esto es que el área bajo la curva desde μ-3σ hasta μ +3σ ocupa un 99.98%; que el área bajo la curva desde μ-
2σ hasta μ+2σ ocupa un 95.44% y que el área bajo la curva desde μ-σ hasta μ+σ ocupa un 68.26%.

Por lo que se sugiere, que los intervalos en que se agrupen los datos cuando se va a probar si los mismos
siguen una distribución normal sean estos mismos, ya que esto facilitaría el cálculo de las pi.

Para ello debemos siempre primero estimar μ y σ que son los parámetros que definen esta distribución
En este ejercicio:
∑xi = 2500; ∑(xi - x )2 = 5420 Y sabemos que x = ∑xi/ n y S2 = ∑(xi - x )2/n-1
por tanto la media y varianza poblacional estimada estará dada por:

x = 2500/100 = 25 y S2 = 5420/99 = 54.75 ⇒ S = 7.4


Así entonces tendremos:
95
Buscando la probabilidad a partir de la función de distribución y a partir de sus propiedades, que recordamos
son:
P (x ≤ xk) = F(x) P( x > xk) = 1 - F(x) P(xo < x ≤ x1) = F(x1) - F(xo) tendremos las áreas buscadas y que
siempre serán las mismas.
P1 = P{ x ≤ 10.2 } = P { z ≤ 10.2 - 25/ 7.4} = P { z ≤ -2 } = Fz (-2) = 0.0228
P2 = P{ 10.2 ≤ x ≤ 17.6} = P{ -2 ≤ z ≤ -1} = Fz (-1) - Fz (-2)
= 0.1587 - 0.0228
= 0.1359
P3 = P{ 17.6≤ x ≤ 25 } = P { -1 ≤ z ≤ 0} = Fz (0) - Fz (-1)
= 0.5 - 0.1587
= 0.3413
P4 = P{ 25≤ x ≤ 32.4} = P{ 0 ≤ x ≤ 1} = Fz (1) - Fz (0)
= 0.8413 - 0.5
= 0.3413
P5 = P{ 32.4 ≤ x ≤ 39.8} = P{ 1 ≤ z ≤ 2} = Fz (2) - Fz (1)
= 0.9772 - 0.8413
= 0.1359
P7 = P{ x > 39.8) = 1 - P{ x ≤ 39.8} = 1 - P{ z ≤ 2}
= 1 - Fz (2)
= 1 - 0.9772
= 0.0228
Quedando entonces:
0.0228 0.1359 0.3413 0.3413 0.1359 0.0228
______\______\______|______/______/______
x -2s x -s x x +s x +2s
Ventajas de este criterio de agrupación: que para cualquier conjunto de datos, las pi para los 6 intervalos que se
definen siempre serán las mismas.
Esto quiere decir que no hay que calcular estas áreas, siempre que los intervalos que hagamos sean la media
menos 2 desviaciones típicas, la media menos una desviación típica, la media, la media mas una desviación
típica y la media más dos desviaciones típicas.
Queremos recordar además que en este caso que le hemos dado tratamiento de variable continua, no importa
que se ponga menor ó menor igual o mayor ó mayor igual para el cálculo de la función de distribución.
Intervalos Oi pi ei
x ≤ 10.2 3 0.0228 2.28
10.2 17.6 14 0.1359 13.59
17.6 25 34 0.3413 34.13
25 32.4 33 0.3413 34.13
32.4 39.8 14 0.1359 13.59
x > 39.8 2 0.0228 2.28
Ahora debemos comprobar todas las restricciones que deben cumplirse:
1.- ∑ Pi = 1 se cumple
2.- ∑ 0i = ∑ei en este caso ∑ 0i = ∑ei = 100 también se cumple
3.- Ninguna frecuencia esperada debe ser < 1 también se cumple
4.- Sólo el 20% de las k categorías deben ser < 5; en este caso tenemos 2 categorías que son menores que
5, y estas representan 2/6 = 0.33 por lo tanto hay que agrupar.
Habíamos dicho que siempre se agrupaban categorías adyacentes y donde esta agrupación tuviera sentido.
En este caso se pudieran agrupar la 1ra y 2da categoría y entonces los intervalos quedarían de la forma
siguiente:
Intervalo Oi ei
x≤ 17.6 17 15.87
17.6 25 34 34.13
25 32.4 33 34.13
32.4 39.8 14 13.59
x> 39.8 2 2.28
Después de agrupar, para hacer cumplir las restricciones tenemos que:
96
k = 5; m = 2 (número de parámetros que se estiman, en el caso de la distribución normal siempre hay que
estimar la media y la desviación típica poblacional).

Ya estamos en condiciones de calcular χ2 0


χ 02 = (17 - 15.87)2/25.87 + (34 - 34.13)2/34.13 + (33 - 34.13)2/34.13
+ (14 - 13.59)2/13.59 + (2 - 2.28)2/2.28
= 0.13743 (está muy próximo a cero)
Planteemos las hipótesis:
Ho : x → N ( μ , σ )
H1 : x no sigue N ( μ , σ )

Estadístico de Prueba:
χ 02 = 0.13743
La región crítica quedará:
W = { χ2 > χ2 1-α(k-1-m) } = { χ2 > χ2 0.99(2)} = { χ2 > 9.21}
La Regla decisión:
Rechazar Ho ∀ χ2 > 9.21
Aceptar Ho ∀ χ2 ≤ 9.21

Decisión:
χ 02 = 0.13743 que es < χ2 = 9.21 por lo tanto no tengo elementos para rechazar Ho lo que implica que los datos
analizados siguen una distribución normal a un α = 0.01.

Pueden realizar los ejercicios que están en el laboratorio Desde el 171 al 175, que están desde la pagina 108 a
la 111; y los ejercicios desde el 178 al 180, que están en las paginas desde la 113 a la 114.

Jarque y Bera
Debe señalarse que este estadístico también se utiliza para probar la normalidad de un conjunto de datos,
siendo más potente que el Chi-Cuadrado que acabamos de ver. Y es el que usa el programa estadístico de
computo EVIEW, soportado en Windows que es uno de los más utilizado para este contenido de las
Estadísticas.

Las hipótesis se plantean de la siguiente forma:


H0 : yi → N
H1: yi no sigue una normal

Siendo el estadístico de prueba:


n−k⎛ 2 1 2⎞
J-B = ⎜ S + ( K − 3) ⎟
6 ⎝ 4 ⎠
Donde: n = # de observaciones

k= 0 para una serie ordinaria


# de regresores cuando se examinan residuos a una ecuación

S = asimetría K = kurtosis
En una distribución normal S = 0 y K = 3
(K - 3) representa el exceso de kurtosis.
En muestras grandes y bajo H0 JB → χ (22)
Por tanto la Región Crítica vendrá dada por:
{
W : JB 〉 χ12−(α2 ) }
97
RD/ Rechazar H0 ∀ JB > χ12−(α2 )
No Rechazar H0 ∀ JB ≤ χ12−(α2 )

Si el valor de p computado es > α ⇒ no se rechaza H0

Asimetría(Skeroness)

∑ ( yi − y )
1 n
3
1 n ⎛ yi − y ⎞
S = ∑ ⎜⎜
n i =1
⎟ ó S=
n i =1 ⎝ σˆ ⎟⎠ σ3

en esta formula σ̂ representa el estimador sesgado de la desviación estándar poblacional, es decir:

S=
(y i − y)
2

n
Se debe señalar que este estadígrafo mide la deformación de una distribución, se plantea que si es igual a cero,
es simétrica, tiene una distribución normal, pero si da positivo, nos está indicando que tiene una cola o
deformación a la derecha, y si nos da negativo, entonces la deformación o cola está a la izquierda.
Kurtosis
4

∑ ( yi − y )
1 n
4
1 n ⎛ y − y⎞
K = ∑ ⎜⎜ i
n i =1
⎟ K=
n i =1 ⎝ σˆ ⎟⎠
ó
σ4

En lo que respecta a este estadígrafo, el mismo mide el apuntamiento de una distribución, generalmente se
plantea que si K = 3, entonces la distribución es apuntada como la normal, y se le puede denominar como
mesocúrtica, si K > 3, entonces se dice que es más apuntada que la normal o sencillamente apuntada y se le
denomina leptocúrtica , y si K < 3, entonces se dice que es menos apuntada que la normal o sencillamente
achatada y se le denomina platicúrtica.

Debe señalarse que el Damodar, Texto de Econometría, muy conocido por los estudiantes, utiliza como fórmula
del estadístico de prueba la expresión siguiente:
⎡ S 2 (K − 3)2 ⎤
JB = n ⎢ + ⎥
⎣6 24 ⎦
A continuación vamos a ver un ejercicio:
A partir de los siguientes datos, utilizando la prueba de Jarque Bera, determine si los mismos siguen una
distribución Normal

y (y i − y) (y i − y)
2
(y i − y )/ σ̂ [(y
i − y )/ σˆ ]
3
[(y
i − y )/ σˆ ]
4

2 -6.1 37.21 -1.1469 -1.5086 1.7302


3 -5.1 26.01 -0.9589 -0.8817 0.8455
3 -5.1 26.01 0.9589 -0.8817 0.8455
4 -4.1 16.81 0.7709 -0.4581 0.3531
6 -2.1 4.41 0.3948 -0.0615 0.0243
8 -0.1 0.01 0.0188 0.0000 0.0000
10 1.9 3.61 0.3572 0.0455 0.0163
12 3.9 15.21 0.7332 0.3942 0.2890
14 5.9 34.81 1.1093 1.3650 1.5142
19 10.9 118.81 2.0493 8.6063 17.6369
81 0 282.90 6.6141 23.2550
98
Comencemos hacer los cálculos necesarios:

x =.
∑x i
=
81
= 8.1 y S=
(y i − y)
2

=
282.90
= 28.29 = 5.3188 (Estimador sesgado de
n 10 n 10
σˆ )
Ahora determinemos la Asimetría:
3
1 n ⎛ y − y⎞
⎟⎟ = (6.6194) = 0.66194 , lo que no está indicando que tiene una ligera deformación a la
1
S = ∑ ⎜⎜ i
n i =1 ⎝ σˆ ⎠ 10
derecha, si fuera a utilizar este estadígrafo para analizar simetría, sin formar parte del estadístico Jarque-Bera
de Normalidad.
Determinemos ahora la curtosis o apuntamiento:
4
1 n ⎛ y − y⎞
⎟⎟ = (23.2550) = 2.3255
1
K = ∑ ⎜⎜ i lo que nos indica que está ligeramente más achatada que la
n i =1 ⎝ σˆ ⎠ 10
distribución normal, esto es si lo estuviera determinando a el sólo y no para ser utilizado en Jarque Bera.
Ahora sustituiremos en el Estadístico de Prueba, correspondiente:
n−k⎛ 2 1 2⎞ 10 ⎛ 2⎞ ⎛ 2⎞
⎜ S + (K − 3) ⎟ = ⎜ 0.66194 + (2.3255 − 3) ⎟ = 1.6667⎜ 0.4382 + (− 0.6745) ⎟
2 1 1
JB=
6 ⎝ 4 ⎠ 6⎝ 4 ⎠ ⎝ 4 ⎠


JB= 1.6667⎜ 0.4382 +
1
(0.4550 )⎞⎟ = 1.6667(0.4382 + 0.11374 ) = 1.6667(0.55194)
⎝ 4 ⎠
JB = 0.9199183

H0 : yi → N
H1: yi no sigue una normal

α = 0.05

JB = 0.9199183

{
W : JB 〉 χ12−(α2 ) } Esto es χ2 en 0.95 con 2 grados de libertad = 5.99, por tanto W: {JB > 5.99}
RA

RC

5.99
RD/ Rechazo H0 ∀ JB > 5.99
No Rechazo H0 ∀ JB ≤ 5.99

D/ JB = 0.9199183 < 5.99 ∴No tengo elementos para rechazar H0 ⇒ que la variable sigue una distribución
normal a un α = 0.05

A continuación vamos a mostrar este ejercicio resuelto a través del programa de cómputo Eview, y comparemos
los resultados:
99
4
Series: PRUEBA
Sample 1 10
Observations 10
3
Mean 8.100000
Median 7.000000
Maximum 19.00000
2
Minimum 2.000000
Std. Dev. 5.606544
Skewness 0.662006
1 Kurtosis 2.325505

Jarque-Bera 0.919981
Probability 0.631290
0
0.0 2.5 5.0 7.5 10.0 12.5 15.0 17.5 20.0

Como ven en el mismo se obtiene los valores de la media, la desviación típica(insesgada), la asimetría, la
curtosis, y el estadístico Jarque-Bera, y todos coinciden con los cálculos que acabamos de ver.
Solo debemos agregar, y que ya fue planteado, la decisión también se puede tomar utilizando la Probabilidad,
que proporciona el resultado anterior, y se debe cumplir que:
Si la probabilidad es mayor que el valor de α designado, entonces no se rechaza H0, lo que implica que la
muestra sigue una distribución normal.
Veamos algunos ejemplos donde se presentarán las salidas de máquina para su interpretación(Ejercicios de
este tipo no están en el Laboratorio).

1. Las cuotas anuales de una muestra de 40 compañías para un seguro de $25000 para hombres de 35
años de edad son las siguientes:
82 85 86 87 87 89 89 90 91 91
92 93 94 95 95 95 95 95 97 98
99 99 100 100 101 101 103 103 103 104
105 105 106 107 107 107 109 110 110 111
Pruebe si la variable anterior se distribuye normalmente. Use un α = 0.05

2. Los ingresos netos por cosecha para 50 estados de una nación en 1996, fueron los siguientes:
5952 13647 8681 11771 4963 10207 8043 4626 5119 2892
63855 10630 5332 9378 4543 7627 8972 4845 8621 5405
39362 6644 2304 5992 11177 8992 6480 10452 2290 2789
9692 4438 6859 7000 12292 23811 6824 9922 4973 9300
27611 19106 8441 12543 6695 7657 9554 7683 3904 241
Rechazaría Ud. al nivel de significación del 1% que la muestra anterior proviene de una población normal?

3. Dada la muestra siguiente:


10 12 13 14 15 22 28 30 30 29
10 11 15 10 15 26 26 28 27 29
16 16 20 17 18 30 28 27 26 30
19 20 17 18 20 29 26 26 28 29
20 19 19 18 17 27 27 26 26 28
17 16 23 24 23 27 31 32 33 33
21 22 22 21 22 29 33 33 32 31
25 23 24 23 21 35 32 31 38 39
25 25 20 21 21 34 37 40 39 40
24 24 23 21 22 31 38 36 36 40
Verifique para un 5% si la misma procede de una población normal.

4. Los siguientes datos son los lapsos en minutos, necesarios para que 50 clientes(seleccionados
aleatoriamente) de un banco comercial, lleven a cabo una transacción bancaria:
100
2.3 2.4 3.3 1.8 7.8 3.1 2.4 0.4 4.2 6.3
0.2 4.4 9.7 4.7 0.8 3.7 4.6 1.3 1.2 7.6
2.9 5.8 2.5 0.7 0.9 7.2 3.8 1.1 0.5 1.4
0.4 2.8 5.6 6.2 0.4 1.6 1.5 5.5 6.8 0.5
2.8 3.3 9.5 1.2 1.3 1.9 2.7 3.4 5.2 1.4
Pruebe para un α = 0.01 si la variable Xi se distribuye según la ley normal.

5. La demanda diaria, en unidades de un producto, durante 30 días de trabajo seleccionados


aleatoriamente es:
38 35 76 58 48 59
67 63 33 69 53 51
28 25 36 32 61 57
49 78 48 42 72 52
47 66 58 44 44 56
Al nivel de significación del 5% ¿Rechazaría Ud. el supuesto de normalidad para la variable Xin?

6. Los pesos(en libras) de 40 estudiantes de una Universidad seleccionados aleatoriamente aparecen a


continuación:
138 164 150 132 144 125 149 157 146 158
140 147 136 148 152 144 168 126 138 176
163 119 154 165 146 173 142 147 135 153
140 135 161 145 135 142 150 156 145 128
¿Aceptaría UD. al nivel del 1% que los pesos de los estudiantes de dicha universidad se distribuyen
normalmente?

Salidas del Programa EVIEW para probar normalidad a través del estadístico Jarque-Bera.
1. 3.

8 10
Series: SEGURO Series: ESTUDIANTES
Sample 1 40 Sample 1 40
Observations 40 8 Observations 40
6
Mean 146.8000
Mean 97.90000
6 Median 146.0000
Median 98.50000
Maximum 176.0000
Maximum 111.0000 Minimum 119.0000
4
Minimum 82.00000 4 Std. Dev. 13.05059
Std. Dev. 7.811235 Skewness 0.181406
Skewness -0.116275 Kurtosis 2.736333
2 Kurtosis 2.008609 2
Jarque-Bera 0.335255
Jarque-Bera 1.728224 Probability 0.845669
Probability 0.421426 0
0 120 130 140 150 160 170 180
80 85 90 95 100 105 110
2. 4.
50 8
Series: INGRESOS Series: Y
Sample 1 50
Sample 1 100
40 Observations 50
Observations 100
6
Mean 14282.74
Mean 25.00000
30 Median 7670.000
Median 25.00000
Maximum 238111.0
Minimum 241.0000 Maximum 40.00000
4
20 Std. Dev. 33811.32 Minimum 10.00000
Skewness 6.042449 Std. Dev. 7.399154
Kurtosis 40.10034 Skewness 0.071274
10 2 Kurtosis 2.457714
Jarque-Bera 3171.834
Probability 0.000000 Jarque-Bera 1.309973
0 Probability 0.519449
0 50000 100000 150000 200000 250000 0
10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40
2
5. 6
Series: DEMANDA
8 Sample 1 30
Series: CLIENTES 5 Observations 30
Sample 1 50
Observations 50 4 Mean 51.50000
6 Median 51.50000
Mean 3.260000 Maximum 78.00000
3
Median 2.750000 Minimum 25.00000
Maximum 9.700000 Std. Dev. 14.16832
4 2 Skewness -0.002849
Minimum 0.200000
Std. Dev. 2.481935 Kurtosis 2.212712
Skewness 0.863321 1
Jarque-Bera 0.774818
2 Kurtosis 2.935511
Probability 0.678813
0
Jarque-Bera 6.219685 25 30 35 40 45 50 55 60 65 70 75 80
Probability 0.044608
0
0 1 2 3 4 5 6 7 8 9 10
6.

AUTOEXAMEN

1.- ¿Para que se utiliza la dócima de bondad de ajuste?


2.- ¿Cuales son las restricciones que se tiene en cuenta para aplicar la distribución χ2 a esta prueba no
paramétrica?
3.- ¿Cómo se plantearían las hipótesis en este tipo de prueba?
4.-¿Cómo se calculan las frecuencias esperadas?
5.- ¿Es necesario al calcular las Pi que estas sumen 1? ¿Por que?
6.- Una muestra aleatoria de 500 acumuladores para automóviles mostró la siguiente distribución: de la duración
en años de los acumuladores.
Intervalos ni
0 a 2 12
2 a 4 94
4 a 6 170
6 a 8 188
8 a 10 28
10 a 12 8
Pruebe a un α = 0.05, si dicha distribución sigue una distribución normal. Utilice la prueba de χ2.
7.- La corporación SIMEX, tiene varios miles de trabajadores por horas. La analista de la corporación, quiere
determinar si la distribución normal se puede utilizar para describir la escala de salarios por hora de la
corporación. Selecciona una muestra aleatoria de trabajadores por hora y se registran sus salarios. La analista
encontró que la media y la desviación típica muestral son $8.00 y $0.78 respectivamente. Para un α= 0.05,
determine si la escala de salario por horas de la corporación sigue una distribución normal, a partir de la prueba
de χ2.
Intervalos ni
< 5.66 12
5.66 6.44 38
6.44 7.22 104
7.22 8 131
8 8.78 117
8.78 9.56 98
9.56 10.34 47
> 10.34 13
560
8.- No es necesario plantear ejercicio para probar la normalidad por Jarque-Bera, ya que se presentaron 6
anteriormente.
2
Tema V Prueba de Hipótesis. Dócima Ji-Cuadrado para verificar supuesto de Independencia. Tablas de
Contingencia.
Bibliografía. Estadística de C. Bustillo. capitulo 7 epígrafe 7.10 página 208

Otro problema que requiere de una prueba estadística, es el de contrastar el supuesto de independencia
estadística entre dos variables aleatorias (x,y).

Esta prueba puede ser aplicada para variables cualitativas ó cuantitativas. Las dos variables sobre las que se
plantea la hipótesis de independencia se clasificarán en categorías o clases.

Se denotará por "k" a la cantidad de categorías en que se clasifica la variable "Y" y por "r" a la cantidad de
categorías de la variable "x"

Así en una muestra de "n" observaciones, los datos serán clasificados en "k x r" grupos, tal como aparece en la
tabla que mostramos a continuación y que en estadística se denomina

Tabla de contingencia de r filas y k columnas.


FRECUENCIAS OBSERVADAS (Oi j )
X\Y Y1 Y2 .............. Yk Totales ni .
X1 O11 O12 .............. O1k n1 .
X2 O21 O22 .............. O2k n2 .
. . . .............. .
. . . .............. .
. . . .............. .
Xr Or1 Or2 . . . . . . . . . . . . . . Ork nr .
Totales n. j n.1 n. 2 .............. n.k n
Como se observa, se denota por:
X : tiene "r" categorías (X1, X2, .....Xr )
Y : tiene "k" categorías (Y1, Y2, .....Yk)
Oi j : # de veces que se observa la combinación Xi con Yj donde :
i : indica las filas ( i = 1, 2 ... r)
j : indica las columnas (j = 1, 2, ... k)
n i . : # de veces que se observa X (sin interesar la clasificación de Y)
n . j : # de veces que se observa Y (sin interesar la clasificación de X)
r k
Donde ni . = ∑ Oi j y n. j = ∑ Oi j
i=1 j=1

Debe señalarse, que al igual que en el caso de la Bondad de Ajuste, en este caso de la verificación del supuesto
de independencia, existe la restricción que se debe considerar que nada más se puede admitir celdas donde las
frecuencias esperadas sean menores que 5, en el orden del 20%, situación que se puede resolver uniendo
celdas adyacentes, ya que de no cumplirse esta restricción este χ 02 no se podría considerar una buena

aproximación del χ (21−α(r)−1)(k −1)


Las hipótesis nula y alternativa podrían ser:

Ho : X, Y son estadísticamente independientes


H1 : X, Y están relacionadas
o también:
Ho : Pi j = Pi Pj
H1 : Pi j ≠ Pi Pj
donde P i j : representa la probabilidad de que el elemento observado pertenezca a la clase (i, j)
Pi : que el elemento observado pertenezca a la clase "i" de la variable X
3
Pj : que el elemento observado pertenezca a la clase "j" de la variable Y

Las frecuencias esperadas se calcularán:


n n
.j
eij = n ( Pij ) = n ( Pi Pj ) y como Pi = i. Pj =
n n
n n. j
eij = n ( i. )( )
n n
( n )( n )
i. . j
eij =
n

El estadístico de Prueba

r k (o − e ) 2
χ2 = ∑ ∑
ij ij
⎯→ χ

2(k − 1)(r − 1)
(1 − α )
i =1 j =1 e
ij
Región Crítica:

W:{χ 2
o 〉 χ 12 -(kα- 1)(r - 1) }
Veamos un ejemplo: Una muestra aleatoria simple de 300 estudiantes Universitarios que estudian Estadística,
arrojó los siguientes resultados en las evaluaciones de esta asignatura.
Evaluación (Y) 2 3 4 5 Total
X (Sexo)
Hembra 27 \30.6 85 \77.4 50 \54 18 \18 180
Varones 24 \20.4 44 \51.6 40 \36 12 \12 120
Total 51 129 90 30 300

¿Podemos afirmar basándonos en estos datos, que en la población de los estudiantes universitarios que
estudian Estadística la evaluación no depende del sexo? Utilice un nivel de significación de 0.05.
Solución:
r = 2 número de filas (sexo)
k = 4 número de columnas (evaluaciones)
n = 300
Ho: La evaluación es independiente del sexo
H1: La evaluación depende del sexo
n n
i. j. n1..n.1 51(180)
eij = = e11 = = = 30.6
n n 300
4

n1. n.2 51(120)


e21 = = = 20.4
n 300
n2. n.1 129(180)
e12 = = = 77.4
n 300
n3. n.1 90(180)
e13 = = = 54
n 300
n4. n.1 30(180)
e14 = = = 18
n 300
n2. n.2 129(120)
e22 = = = 516
.
n 300
n3. n.2 90(120)
e23 = = = 36
n 300
n4. n.2 30(120)
e24 = = = 12
n 300

El valor que se encuentra después de la diagonal es el valor esperado calculado


Por tanto el valor de χ²o será:

( 27 − 30.6) 2 (85 − 77.4) 2 (50 − 54) 2 (18 − 18) 2 ( 24 − 20.4) 2 ( 44 − 51.6) 2 ( 40 − 36) 2 (12 − 12) 2
χ 2
o = + + + + + + +
30.6 77.4 54 18 20.4 516
. 36 12

χ 02 = 3.665

R:C: W:{ χ 02 > χ2(2-1) (4-1)0.95} = { χ 02 > 7.81}

R D./ Rechazar Ho ∀ χ 02 > 7.81


Aceptar Ho ∀ χ 02 ≤ 7.81
D/ χ²o = 3.67 ≤ 7.81 por tanto se puede decir que no existen elementos para rechazar Ho lo que implica que
hay independencia entre el sexo y las evaluaciones de los estudiantes universitarios, es decir la evaluación es
independiente del sexo a un nivel de significación del 95%.

Pueden hacer los ejercicios que están en el laboratorio desde el 158 hasta el 165, que están en las páginas
desde la 97 hasta la 102, del Laboratorio de Estadística Matemática II.

Autoexamen

1.- ¿Por qué no se debe resolver la prueba Ji-cuadrado para la independencia cuando las frecuencias esperadas
en algunas celdas sean menores que 5?
2.- ¿Qué acción se puede llevar a cabo en estas circunstancias que permitan analizar esos datos de la tabla de
contingencia?.
3.- El Director de Mercadotecnia de una compañía de televisión por cable está interesado en determinar si hay
alguna diferencia en la proporción de hogares que contratan el servicio de cable por televisión, sobre la base del
tipo de residencia (viviendas para una sola familia, viviendas para 2 o 4 familias y casas de departamento). Una
muestra aleatoria de 400 hogares mostró lo siguiente:
5
Tipo de Res. Una sola De 2 a 4 Casa de n i.
TC cable familia familias Apartamento
Si 94 39 77 210
No 56 36 98 190
n.j 150 75 175 400
A un α = 0.01 ¿Podría considerar que hay relación entre la contratación de Servicios de TV por cable y el tipo de
residencia?
4.- Una gran Corporación esta interesada en determinar si existe asociación entre el tiempo que le toma a sus
empleados trasladarse al trabajo, y el nivel de problemas relacionados con el “Stress” observado en los mismos,
con vista a situarle un ómnibus, si esto se comprueba. Un estudio de 116 trabajadores de la línea de montaje
reveló lo siguiente:
Stress Alto Moderado Bajo Ni.
Tiempo Viaje
Menos de 15 mts 9 5 18 32
De 15 a 45 17 8 28 53
Mas de 45 18 6 7 31
n.j 44 19 53 116
A un α = 0.01 Determine si hay relación entre el tiempo de viaje y el stress.
Dentro del Tema de Prueba de hipótesis que acabamos de estudiar, se vieron las pruebas de hipótesis de
medias, varianzas, proporciones, diferencia de medias y diferencia de proporciones también están la de
diferencia de varianzas de dos poblaciones que no la estudiamos, que también tiene una gran utilización
práctica, pero que con los conocimientos alcanzados hasta aquí bien pudieran utilizarla en caso necesario.

Tema VI Análisis de Varianza. Modelo de Clasificación Simple. Conceptos Básicos. Supuestos. Análisis
Estadístico.
Bibliografía: Estadística. Capítulo 10. Páginas de la 281 a 287 y del libro Análisis de Varianza. Colectivo
de autores del Dpto. de Estadística desde la página 11 a la 51 y de la 56 a la 61

A continuación vamos a comenzar a estudiar un Tema de marcada importancia en las técnicas estadísticas que
se estudian en esta asignatura.

Dentro del Tema de Prueba de hipótesis que acabamos de ver, se estudió la prueba de hipótesis de
comparación de 2 medias, a partir de las muestras de dos poblaciones para conocer si existían diferencias
reales entre ellas o se debía al azar.

Pues bien, hoy vamos a considerar problemas en que debemos decidir si las diferencias observadas entre más
de dos medias se pueden atribuir al azar o si existen diferencias reales entre las medias de las poblaciones de
las que se obtuvieron las muestras.

Y esto se estudia cuando por ejemplo lo que queremos conocer sobre la base de datos muestrales, si en
realidad existe alguna diferencia:
• en la efectividad de 3 métodos de enseñanza de una lengua extranjera, o quizás
• queremos comparar la producción promedio por caballería de distintas variedades de arroz.
• Un investigador agrícola pudiera estar interesado en saber que tipo de fertilizante da mejores
rendimientos,
• ó sí en determinado laboratorio médico se desea evaluar el efecto de diferentes medicamentos en la
presión sanguínea.
El método que utilizamos para este propósito es un instrumento estadístico poderoso conocido como ANALISIS
DE VARIANZA

Claro que estos ejemplos pudieron complicarse haciendonos preguntas adicionales, pero nuestro propósito es
estudiar el modelo más simple, donde se considera un único factor con varios grupos, tal como lo hemos
planteado.
6
Modelo de clasificación simple.(La clasificación está dada según el número de factores).

Incremento del D1 Población 1


Peso de los animales diet D2 Población 2
D3 Población 3

Variable Variable Valores particulares


Dependiente Independiente de la Variable independiente

Característica. Factor Niveles Población


Medible
La variable independiente (el factor), no aparece explícitamente cuantificada sino que refleja su efecto en los
valores de la característica medible.

El análisis de varianza, como técnica de lo que trata es: si se está estudiando la característica cuyos valores
dependen de varias clases de efectos que operan simultáneamente, poder decidir si tales efectos son debido al
azar o si realmente son diferentes.

¿Cómo funciona el análisis de varianza, en el modelo de clasificación simple?


Esta técnica de lo que trata es de expresar una medida de la variación total de un conjunto de datos como una
suma de términos, que se pueden atribuir a fuentes o causas específicas de variación; pues bien esta
descomposición de la varianza total se denomina: Identidad fundamental. Ella junto a la formación del
estadístico de prueba, se refleja en una tabla llamada “Tabla de Análisis de Varianza”, que resume los
principales aspectos teóricos prácticos de la técnica.

¿Cómo podemos comparar medias y tomar decisiones a través de la varianza?


Hay un corolario que plantea que:
Si “k” poblaciones se unen y las varianzas de las “k” poblaciones son iguales a σ2 se tiene que:

k 2

∑ N i (μ i − μ )
σ T2 = σ 2 + i =1
Por lo tanto si todas las medias son iguales entonces:
n
σ T2 = σ 2 , mientras que si alguna es diferente, se puede concluir que σ T2 〉 σ 2
De modo que una comparación de varianza puede conducir a una conclusión sobre la igualdad de medias
poblacionales.

El método que se utiliza es a través de los estimadores de σ2.

Hay un Teorema que plantea que:


Si dos o más muestras proceden de una misma población o de diferentes poblaciones, pero con igual varianza,
entonces un estimador insesgado de σ2 podrá obtenerse a través de la siguiente expresión:

donde E (S D2 ) = σ 2 ∴ es un estimador insesgado


2

∑ (yij − y i )
1 ni
S =
2

n − k j =1
D

A esta varianza se le da el nombre de Varianza dentro del grupo.

Sería bueno comentar que esta varianza como es insesgada proporciona una estimación válida de la varianza
desconocida de la población sin importarle si se acepta o rechaza H0.

Hay otro Teorema, bajo las mismas condiciones que el anterior que plantea que otro estimador de σ2 es:
7

∑ ni ( y i − y )
k k

∑ ni (μi − μ )
2

S E2 = i =1

k −1
( )
donde su E S E2 = σ 2 +
k −1
i =1
por lo que es un estimador sesgado de σ 2

y sólo será insesgado bajo la hipótesis nula cierta ya que es en este caso que (μi − μ ) = 0 y
entonces la E S E2 = σ 2 ( )
Este estimador es conocido como varianza entre grupos.

Esta situación que expresan estos estimadores se pudiera representar gráficamente de la siguiente forma:

Para H0 cierta: Para H0 falsa:


x1 ________ x1

x x

x3 x2 x3
x2
1 2 3 1 2 3

En este caso las x i no son iguales pero Los elementos de las 3 poblaciones
Si casi iguales sus valores están cercanos son muy diferentes y originan medias
muestrales muy diferentes.

Si estamos en caso de H0 falsa, y se nos presenta esta situación se diferencia en la suma de cuadrado entre
grupo esta diferencia, mientras que si estamos en el caso de H0 cierta la diferencia entre los grupos es mínima.

En el caso de la SC, dentro de los grupos lo que hace es comparar cada elemento de la muestra con la media
de su propio grupo, para una u otra conclusión de la hipótesis nula, su cálculo no se refleja, el valor es el mismo.

Como ya dijimos, el análisis de varianza consiste en dividir la suma de cuadrado total en dos fuentes de
variación y proceder al análisis de las mismas, estas son la variación dentro del grupo y la variación entre
grupos. Como son variaciones la vamos a expresar como sumas de cuadrados, es decir:
SCT = SCD + SCE
__ __ __ __
(Yij - Y) = (Yij - Yi) + (Yi – Y)

Representando estas la variación total que es igual a la variación dentro del grupo más la variación entre grupos,
gráficamente se representa de la siguiente forma:
8

.
(Y − Y )
i i .

. (Y − Y )i
_ .
y1 .
.
(Y i −Y ) .
Y
.
_ .
y2 .

Si elevamos al cuadrado ambos miembros, y sumamos por “j” e “i”, llegamos a la Identidad Fundamental,
planteada anteriormente.
2

∑∑(y (
− y) = ∑∑ yij − yi + ∑ni ( yi − y))
k ni k ni k
2 2
ij Donde se considera:
i =1 j =1 i =1 j =1 i =1

Suma de Suma de Suma de


Cuadrado Cuadrado Cuadrado
Total Dentro del Grupo Entre Grupo

De la misma forma resulta de gran importancia en el Análisis de varianza, la relación entre los grados de libertad
(que ya se habló de ellos en el Tema anterior).
Si se aplica el valor esperado en ambos miembros se obtienen, bajo el supuesto de H0 cierto de que, los grados
de libertad asociados a estas sumas de cuadrados serán:
(n – 1) = (n – k) + (k – 1) Esto es,
Para la SCT, = para la SCD y para la SCE

Si dividimos las Sumas de Cuadrados entre los grados de libertad, se obtendrán los estimadores de σ2
2 2 2
planteados, es decir la varianza total ST la varianza dentro del grupo S D , y la varianza entre grupo S E .
También estos cocientes se denominan Cuadrados Medios.

SC D SC E
S D2 = CM D = S E2 = CM E =
n−k k −1
Debido a que el cálculo de varianzas entre y dentro de grupos hay varios pasos, se acostumbra a dar al grupo
completo de resultados en una tabla conocida como tabla de análisis de varianza (ANOVA). Esta tabla incluye
las fuentes de variación, las sumas de los cuadrados(es decir las variaciones), los grados de libertad, las
varianzas(es decir los cuadrados medios) y el valor del estadístico de prueba que veremos más adelante.
9
ANOVA
SUMA DE GRADOS DE CUADRADO ESTADÍSTICO
FUENTE DE CUADRADOS LIBERTAD MEDIO
VARIACIÓN
ENTRE GRUPO 2
K
S E2
∑ ni ( yi − y )
SC E
k–1 F0 =
I =1 n −1 S D2
DENTRO DE 2

∑∑ (y − yi )
k ni
GRUPO SC D
n–k
n−k
ij
i =1 j =1

∑∑ (y − y)
TOTAL K ni
2
n -1
ij
i =1 j =1

Aquí en este caso se utiliza como estadístico de prueba F0, ¿Por qué la Distribución F? . La distribución a utilizar
es la F de Fisher, que se basa en la razón de 2 varianzas.

Con el fin de determinar si las medias de los diversos grupos son todas iguales, se pueden examinar dos
estimadores diferentes de la varianza de la población. Uno de los estimadores se basa en la suma de los
cuadrados dentro de los grupos (SCD); el otro se basa en la suma de los cuadrados entre los grupos (SCE). Si la
hipótesis nula es cierta, estos estimadores deben ser aproximadamente iguales; si es falsa el estimador basado
en la suma de los cuadrados entre grupos debe ser mayor.

El estimado de la varianza entre los grupos no solo toma en cuenta las fluctuaciones aleatorias de una
observación a otra, sino también mide las diferencias de un grupo con otro. Si no hay diferencia de un grupo a
otro, cualquier diferencia en la media muestral se explicará por la variación aleatoria, y la varianza entre grupos,
debe estar cerca de la varianza dentro de los grupos. Sin embargo si en realidad hay una diferencia entre los
grupos, la varianza entre grupos será significativamente mayor que la varianza dentro de los grupos.
Por todo lo anterior, la prueba estadística se basa en la razón de estas dos varianzas: CME/CMD. Si la hipótesis
nula es cierta, esta razón debe estar cercana a uno; si la hipótesis nula es falsa entonces el numerador debe ser
mayor que el denominador y la razón debe ser mayor que uno
Como se aprecia el problema se reduce a buscar un valor a partir del cuál el estadístico de prueba resulte
significativamente mayor que 1, y así se rechazará la hipótesis de que no hay diferencias entre las medias de los
grupos cuando la razón entre las varianzas CME/CMD > F(1 − α) ( k – 1;n – k)

De aquí se infiere que las hipótesis nula y alternativa que se plantearán serán las siguientes:
H0: μ1 = μ2 = . . . = μk
H1: alguna μi diferente

Es bueno señalar que estas hipótesis son equivalentes a decir:


E (S E2 ) E (S E2 )
=1 〉 1
E (S D2 ) E (S D2 )
H0 : H1 :
2
Ya que como se vio anteriormente S E es un estimador sesgado de la VARIANZA y sólo será insesgado si se
2
cumple que H0 es cierta, mientras que S D es un estimador insesgado.
Además es la razón por la cuál la distribución a utilizar es la F de Fisher, que no es más que la relación entre 2
varianzas y siempre considerando, la región crítica hacia la derecha, ya que nuestro problema se reduce a
buscar un valor a partir del cuál es estadístico de prueba resulte significativamente mayor que 1 y así
S E2
Rechazaremos H0 a un nivel de significaciónα, si 〉 F1(−k α− 1 ; n − k )
S D2
Antes de continuar queremos plantear que las fórmulas de cálculo de los estimadores de las varianzas poblacionales
conceptuales o por definición son muy tediosas, sin embargo hay para estos estimadores unas fórmulas de cálculos
abreviadas que son más fáciles.
10
k ni
T2 k k k
SCT = ∑∑ yij2 −
i =1 j =1 n
donde T = ∑ Ti Ti = ∑ yij
i =1 i =1
y donde n = ∑ ni
i =1

Ti 2 T 2
k k ni k
Ti 2
SCE = ∑
i =1 ni

n
SCD = ∑∑ yij2 − ∑
i =1 j =1 i =1 ni
Aunque se debe señalar que dado el carácter aditivo de estas varianzas, se acostumbra a obtener la SCD por
diferencia, es decir como:
SCT = SCE + SCD se obtendría despejando: SCD = SCT - SCE

Para aplicar esta técnica es necesario que se cumplan ciertas suposiciones sobre los datos
investigados.
1.- Las características medibles se distribuyen normalmente en cada población. Esto es
(
Yi → N μ i ;σ i2 ) donde i = 1, 2,K k
2.- Las varianzas de las k poblaciones son iguales: σ 12 = σ 22 = K = σ k2
3.- Las características medibles son estadísticamente independientes, de una población a otra: Y1, Y2, ... ,
Yk.
4.- Las muestras n1, n2, ... ,nk de los k grupos poblacionales deben seleccionarse a través del M.A.S.

Vamos a ver un Ejemplo:


Los datos siguientes corresponden al Costo de Producción de un producto fabricado bajo tecnologías diferentes.
Realice una prueba estadística a un α= 0.05 para decidir si existen diferencias entre las tecnologías, que
puedan afectar los Costos.
Tecnología Yi j ni Ti Ti2 Ti2/ni Y2i j
A 7 4 6 4 9 5 30 900 180 49 16 36 16 81 198
B 2 4 5 6 3 5 20 400 80 4 16 25 36 9 90
C 7 8 7 11 7 5 40 1600 320 49 64 49 121 49 332
15 90 580 620
Hay que tener en cuenta que el subíndice i, representa las filas, y el j las columnas.
Se prepara la tabla atendiendo a lo que se necesita a partir de las formulas abreviadas planteadas, únicamente
hay que tener en cuenta que los niveles se deben planteara en el sentido de fila.

Resumiendo: n = 15; T = 90; k = 3; n1 = n2 = n3 = 5


Luego:
k ni
T2
SCT = ∑∑ Yij2 − = 620 – 902/15 = 620 – 8100/15 = 620 – 540 = 80
i =1 j =1 n

Ti 2 T 2
k
SCE = ∑
i =1 ni

n
= 580 – 540 = 40

k ni k
Ti 2
SCD = ∑∑ yij2 − ∑
i =1 j =1 i =1 ni
= 620 – 580 = 40 o también utilizando la identidad fundamental y en ella se despeja

SCD, esto es:

SCT = SCD + SCE ∴ SCD = SCT – SCE = 80 – 40 = 40


Y ya estamos en condiciones de plantear la tabla de análisis de varianza, para el cálculo del estadístico de
Prueba.
11

ANOVA
Fuente de Suma de Grados de Cuadrado medio Estadístico de
Variación Cuadrado Libertad Prueba
Entre grupo 40 2 20 20
Dentro grupo 40 12 3.33 F0 = = 6.06
3.3
Total 80 14

H0: μ1 = μ 2 = μ3
H1: alguna μi diferente

α= 0.05

S E2
= 6.06
S D2
S E2 S E2 S E2
W:{ > F1- α
(k – 1; n – k)
}= { > Fo.95
(2, 12)
} = { > 3.89 }
S D2 S D2 S D2

3.89
R:D:/ Rechazo H0 ∀ F0 > 3.89
No Rechazo H0 ∀ F0 ≤ 3.89
D/ F0 = 6.06 > 3.89 ∴ Rechazo H0 ⇒ que aceptamos H1 lo que nos indica que existen diferencias significativas
entre los costos de producción para por lo menos una tecnología a un α = 0.05
Si quisiéramos saber cual o cuales tecnologías son diferentes se pudiera completar el análisis con una prueba
T’Student de diferencia de media, probando dos a dos dichas tecnologías.

Pueden hacer los ejercicios que están en el laboratorio desde el número 182 al 186 en las páginas desde la 119
a la 121.

Potrebbero piacerti anche