Sei sulla pagina 1di 156

1

ESTADSTICA DESCRIPTIVA
Y PROBABILIDADES
Notas de clase

FACULTAD DE INGENIERIA
2015 - III
PROFESOR: SANTANA FLORES CARLOS
Correo: C14019@grupoutp.edu.pe

ALUMNO:

ESTADSTICA
La estadstica es una ciencia, con su propio campo de estudio, y tambin un instrumento (conjunto
de tcnicas) que utilizan ampliamente otras ciencias. La estadstica como ciencia es una rama de la
matemtica aplicada, cuyo objeto de estudio es el comportamiento de las variables que pueden
asociarse a una o ms poblaciones.
La estadstica es una ciencia que estudia la recoleccin, anlisis e interpretacin de datos, ya sea
para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn
fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo
estadstica es ms que eso, en otras palabras es el vehculo que permite llevar a cabo el proceso
relacionado con la investigacin cientfica.
Estadstica descriptiva
Se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de
estudio. Los datos pueden ser resumidos numrica o grficamente
Estadstica inferencial
Se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en
cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en
los datos y extraer inferencias acerca de la poblacin bajo estudio.
VARIABLES
Una variable es una caracterstica observable que vara entre los diferentes individuos de la
poblacin, dicha caracterstica debe ser susceptible de ser medido. La informacin que disponemos
de cada individuo es resumida en variables.
Ejemplos:

Peso corporal
Condicin econmica
Tiempo de espera
Utilidades de una empresa
..
..

TIPOS DE VARIABLE
Variable cualitativa o categrica.
Cuando la variable est asociada a una caracterstica cualitativa o atributo. Es decir, son variables
cuyos valores son cualidades. Dependiendo del nmero de categoras pueden ser dicotmicas o
politmicas.
Ejemplos:
Condicin econmica
Marca de auto

3

Dicotmica: Es aquella variable que solo puede adoptar dos atributos o caractersticas.
Ejemplos:
Resultado de un encuentro de vley
.
Politmica: Es aquella variable que solo puede adopta ms de dos atributos o caractersticas.
Ejemplos:
Estado civil
..
Variable cuantitativa o numrica
Cuando la variable est asociada a una caracterstica cuantitativa. Es decir, estas surgen cuando se
puede establecer cunto o qu cantidad posee una determinada caracterstica. Pueden ser discretas
o continuas.
Ejemplo:

Peso corporal.
Gasto por consumo de energa elctrica.
.
.

Discreta: En este caso la variable solo adopta valores enteros.


Ejemplos:
Nmero de televisores en casa
.
.
Continua: En este caso la variable toma cualquier valor real, no necesariamente entero.
Ejemplos:
Estaturas
...
.

MEDICIN
Es asignar un nmero o smbolo a objetos o sucesos de acuerdo a reglas predeterminadas.
ESCALA DE MEDICIN
Es el grado de precisin como se expresa la medida de la variable.

4
Nominal
Son aquellas que establecen la distincin de los elementos en las categoras sin implicar orden entre
ellas.
Ejemplo:
Sexo: Mujer Hombre.
Servicios Hospitalarios: Medicina - Pediatra Neurologa.
..
Ordinal
Son aquellas que agrupan a los objetos, individuos, en categoras ordenadas, para establecer
relaciones comparativas. Es decir, son susceptibles de ordenacin pero no de medicin cuantitativa.
Ejemplo:
Nivel educativo: Primaria Secundaria Tcnico - Universitario
Estado de salud: Muy saludable Saludable - No saludable
.
Intervalar
Se tiene una escala intervalar, cuando los valores asignados a las unidades estadsticas no solo
permiten ordenarlas sino que adems, las diferencias iguales entre estos indican diferencias iguales
en las cuantas de las propiedades a medir. El inicio de la escala (0) es arbitraria, convencional.
Ejemplo:
Temperatura

Razn
Se tiene una escala razn, cuando los valores asignados a las unidades estadsticas no solo permiten
que estas puedan ser ordenadas, sino que adems, las diferencias iguales entre estos indican
diferencias reales en las cuantas de las propiedades a medir. El valor cero representa ausencia de la
caracterstica que se mide.
Ejemplo:
Edad

5
Peso
POBLACIN
Es un conjunto de datos que consta de todas las observaciones concebibles (o hipotticamente)
posibles de un fenmeno determinado.
MUESTRA
Es un subconjunto de individuos extrados de la poblacin con el fin de inferir mediante su estudio,
caractersticas de la poblacin.

PARMETRO
Son todas aquellas medidas que describen numricamente las caractersticas de una poblacin.
Tambin se les denomina valor verdadero, ya que una caracterstica poblacional tendr un solo valor
del parmetro. Sin embargo una poblacin puede tener varias caractersticas y, por tanto, varios
parmetros.
ESTADGRAFOS
Es aquella descripcin numrica de una caracterstica correspondiente a los elementos de una
muestra. De una poblacin se pueden obtener M nmeros de muestra posibles y en cada una de
ellas se puede cuantificar la caracterstica, obtenindose por lo general, valores diferentes para cada
muestra.

6
EJERCICIOS
Clasifique las siguientes variables y seale su escala de medicin:
Variable
Nmero de solicitantes que llega a
diario a una agencia de empleos.
Software estadstico.
Bancos comerciales.
Tiempo cronometrado en los 100
metros planos.
Velocidad de un automvil.
Empresas segn el nmero de
trabajadores.
Nivel socioeconmico.
Partidos polticos.
Producto bruto interno del Per.
Nmero de asistentes a clase.
Pases de la Unin Europea.
Puntuacin de un test de
coeficiente intelectual.

Tipo de variable

Escala

ORGANIZACIN TABULAR DE DATOS Y GRFICOS


Frente a un conjunto de datos, el primer paso a dar, debe ser expresarlo y clasificarlo de acuerdos a
criterios convenientes, de una forma simple que permita ver rpidamente todas las caractersticas
posibles para obtener conclusiones tiles, ya sea directamente o por medio de clculos posteriores.
Se consideran los siguientes pasos:
Revisin y recoleccin de los datos.
Construccin de tablas de frecuencias.
Representacin tabular o cuadros estadsticos y grfica.
REVISIN Y RECOLECCIN DE LOS DATOS
Ningn anlisis estadstico, por acabado y seguro que sea, es capaz de suministrar respuestas
adecuadas a un problema de estudio, si aquel se basa en informacin incorrecta. Por tanto antes de
utilizar los datos muestrales conviene aplicar tcnicas simples para probarlos, como dar respuesta a
las siguientes preguntas:

Los datos apoyan o contradicen la evidencia que se tena?


Es lgica la conclusin?
Hemos obtenido conclusiones que no estn sustentadas por los datos?
Cuntas observaciones se tiene?

TABLA DE DISTRIBUCIN DE FRECUENCIAS


Si los datos que se disponen son numerosos, es indispensable clasificarlos en un cuadro o tabla
resumen de las observaciones originales, a las que en adelante llamaremos tabla de distribucin de
frecuencias.

yi

ni

Ni

hi

Hi

hi%

Hi%

Y1

n1

N1

h1

H1

h1%

H1%

y2

n2

N2

h2

H2

h2%

H2%

y3

n3

N3

h3

H3

h3%

H3%

y4

n4

N4

h4

H4

h4%

H4%

ym

nm

Nm

hm

Hm

hm%

Hm%

8
Donde:

yi: representa los valores de la variable o el valor asignado a algn atributo de la variable
(caso de variables cualitativas).

ni: frecuencia absoluta del valor yi, representa el nmero de veces que aparece este valor en
el conjunto de observaciones.

Ni: Frecuencia absoluta acumulada, representa el nmero de observaciones menores o


iguales a yi.

hi: frecuencia relativa del valor de yi, es el cociente de la frecuencia absoluta de yi y el


nmero total de observaciones.

Hi: frecuencia relativa acumulada, es la frecuencia relativa total de las observaciones


menores o iguales a yi.

hi%: frecuencia relativa porcentual, es decir hi multiplicado por 100%; nos permite observar
la frecuencia absoluta en forma porcentual respecto del total.

Hi%: frecuencia relativa acumulada porcentual, es decir Hi multiplicado por 100%.

CUADROS ESTADSTICOS Y GRFICOS


Cuadro estadstico.- Es un arreglo ordenado, de filas y columnas de los datos o series estadsticas,
por tanto tienen dos entradas. En ellas pueden representarse caractersticas cualitativas,
cuantitativas o una combinacin de ambas. La finalidad es ofrecer informacin resumida de fcil
lectura, comparacin e interpretacin.

Grfico.- Es la representacin de un fenmeno estadstico por medio de figuras geomtricas cuyas


dimensiones son proporcionales a la magnitud de los datos representados. Su objetivo es la
representacin de los datos de forma grfica, que permite de un solo golpe de vista darse cuenta del
conjunto de elementos presentados y de evidenciar sus variaciones y caractersticas.

ORGANIZACIN Y REPRESENTACIN DE DATOS ASOCIADAS A VARIABLES CUALITATIVAS


En el caso de las variables cualitativas se pueden dar dos tipos de tratamiento segn la complejidad
de los datos.
En el caso que slo se tenga el valor de la caracterstica de la variables
Ejemplo:
Se tiene informacin acerca de la composicin de cartera de crditos (en millones de soles) del
Sistema Financiero Peruano para el ao 2010.
CONSUMO

25300

CORPORATIVOS

23364

MEDIANAS EMPRESAS

21428

GRANDES EMPRESAS

21170

HIPOTECARIOS

16006

PEQUEAS EMPRESAS

13941

MICROEMPRESAS

7874

Si se quiere obtener una informacin ms detallada que la que se muestra en la tabla, podemos
representar esos valores en forma porcentual. Primero, obtengamos el total
CONSUMO

25300

CORPORATIVOS

23364

MEDIANAS EMPRESAS

21428

GRANDES EMPRESAS

21170

HIPOTECARIOS

16006

PEQUEAS EMPRESAS

13941

MICROEMPRESAS

7874

TOTAL

129083

10
Luego, obtenemos el valor del hi, este se obtiene dividiendo cada valor entre el total. Una vez
calculado el hi multiplicamos por 100% (hi%), el resultado representar el porcentaje respecto al
total.

Ahora la tabla se puede presentar de la siguiente manera

Interpretaciones:

El 19,6% de los crditos otorgados van a los crditos por consumo.


El 16,4% de los crditos otorgados van destinados a las grandes empresas.
Solo el 6,1% de los crditos son asignadas a las microempresas.

NOTA: En el ejemplo se est trabajando con valores no con frecuencias.

Para una mejor ilustracin de los datos se puede realizar un grfico.


GRFICO DE SECTORES O DE PASTEL
Para construir el grfico de sectores se utiliza una circunferencia, cuyo crculo se divide en sectores,
tales que sus medidas de los ngulos centrales, y por tanto la superficie del sector circular, sean
proporcionales a las magnitudes de los valores de la variable que representan. Al total le
corresponde el crculo completo, es decir los 360 de la circunferencia.

11

Composicin de la cartera de creditos: 2010


6%
20%

11%

CONSUMO
CORPORATIVOS
MEDIANAS EMPRESAS

12%

GRANDES EMPRESAS
HIPOTECARIOS

18%

PEQUEAS EMPRESAS
MICROEMPRESAS

16%
17%

Composicin de la cartera de crditos: 2010


PEQUEAS
EMPRESAS
11%

MICROEMPRESAS
6%

CONSUMO
20%

HIPOTECARIOS
12%
GRANDES
EMPRESAS
16%

CORPORATIVOS
18%
MEDIANAS
EMPRESAS
17%

12
Si los datos no estn contabilizados
Ejemplo:
Se realizo una encuesta en un conjunto habitacional a 45 vecinos, la cual estaba orientada a saber si
estos estaban satisfechos con el servicio de vigilancia y seguridad que brinda una empresa. Se
obtuvieron los siguientes datos.

BBRMMRBRBBMRRMB
BBBRBMBMRBMRMBB
BRBBRMRMBRBBRBB
B: buena

R: regular

M: mala

El primer paso es contabilizarlos mediante alguna marca o palotes

Luego anotamos las frecuencias absolutas de cada caracterstica de la variable y los valores de las
frecuencias relativas de la misma forma que en el ejemplo anterior.

Interpretaciones:

Casi la mitad de los vecinos consideran que el servicio que se les brinda es bueno.
Un 22% cree que el servicio que se les ofrece es malo.

13
GRFICO DE BARRAS
Es aquel en el cual el fenmeno que se estudia queda representado por una serie de rectngulos,
barras o paraleleppedos, los cuales pueden dibujarse horizontal o verticalmente.

Calidad del servicio de vigilancia


60,0

Porcentaje

50,0
40,0
30,0
20,0
10,0
0,0

Buena

Regular

Mala

Calidad del servicio de vigilancia

Mala

Regular

Buena

10

13

22

CUADROS ESTADISTICOS
Se define como el conjunto de datos estadsticos ordenados en filas y columnas, que permiten leer,
comparar e interpretar las caractersticas de una o ms variables. Los datos son el resultado de la
ejecucin de una investigacin estadstica o el aprovechamiento de un registro administrativo con
fines estadsticos.

14

15
EJERCICIOS
1.- Se tiene informacin
(http://www.sbs.gob.pe)

Sistema

de

Privado

de

Pensiones

obtenida

de

la

SBS

a. Realizar un cuadro estadstico mostrando en valores porcentuales del nmero de afiliados


por AFP para cada una de las cuatro semanas y realice el grfico de sectores para la semana
de 30 julio al 3 de agosto.
Del 23 al 27 de
julio

Del 30 de julio al
3 de agosto

Del 6 al 10 de
agosto

Del 13 al 17 de
agosto

Del 23 al 27 de
julio

Del 30 de julio al
3 de agosto

Del 6 al 10 de
agosto

Del 13 al 17 de
agosto

Horizonte
Integra
Prima
Profuturo

Total

Cuadro estadstico

Horizonte
Integra
Prima
Profuturo

16
Grfico de Sectores

b. Realizar un cuadro estadstico mostrando en valores porcentuales de los trabajadores


independientes para cada AFP para cada semana y realice un grfico de barras para la
semana del 13 al 17 de agosto.
Trabajadores
Independientes

Del 23 al 27 de
julio

Del 30 de julio al
3 de agosto

Del 23 al 27 de
julio

Del 30 de julio al
3 de agosto

Del 6 al 10 de
agosto

Del 13 al 17 de
agosto

Horizonte
Integra
Prima
Profuturo

Total
Cuadro estadstico

Horizonte
Integra
Prima
Profuturo

Del 6 al 10 de
agosto

Del 13 al 17 de
agosto

17
Grfico de Barras

c. Muestre un grfico (elija uno a su criterio) donde se puede observar el comportamiento de la


afiliacin al sistema de fondo de pensiones para las cuatro semanas.

18

ORGANIZACIN Y REPRESENTACIN DE DATOS ASOCIADAS A VARIABLES CUANTITATIVAS


En esta parte del curso se trabajar con los datos que se obtengan de las variables cuantitativas,
como sabemos estas pueden ser discretas o continuas. De la misma manera como se organizaron los
datos de las variables cualitativas, tambin organizaremos estos datos mediante una tabla de
distribucin de frecuencias, para luego obtener cuadros estadsticos y las grficas.
ORGANIZACIN DE LOS DATOS DE VARIABLES CUANTITATIVA DISCRETAS
Recordemos que una variable cuantitativa discreta es aquella que solo toma valores enteros, en
funcin a ello se establecen algunas propiedades con los elementos de la tabla de distribucin de
frecuencias.

Propiedad relacionada con la frecuencia absoluta

19
Propiedad relacionada con la frecuencia relativa

Propiedad relacionada con la frecuencia relativa porcentual.

Ejemplo:
A las familias de una comunidad alto andina se le pregunt por el nmero de hijos, obtenindose los
siguientes resultados
2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7
Construiremos la tabla de distribucin de frecuencias para luego realizar algunas interpretaciones.
El primer paso es realizar un conteo o registro de valores de la variable que se repiten, es decir
obtener las frecuencias absolutas.

20

Una vez hecho registro procedemos a completar la tabla

En la cuarta columna lo completamos con las frecuencias relativas y a partir de ella todas las dems
columnas.

Interpretaciones de las frecuencias relativas:

n1=2; Hay dos familias que no tienen hijos.


n2=3; Tres familias que tienen dos hijos.
n3=7; Siete familias que tienen cuatro hijos
n4=4; Cuatro de estas tienen seis hijos.
n5=4; Y cuatro familias con siete hijos.

Interpretaciones de las frecuencias relativas:


N3= 12; significa que el nmero de familias que tienen a lo ms 4 hijos es 12 existen 12
familias que a lo ms tienen 4 hijos.

21
N4 = 16; significa que el nmero de familias que tienen a lo ms 6 hijos es 16 existen 16
familias que a lo mas tienen 6 hijos.
Interpretaciones de las frecuencias porcentuales:

h1% = 10% significa que el 10% de las familias no tienen hijos.


h2% = 15% significa que el 15% de las familias tienen 2 hijos.
h3% = 35% significa que el 35% de las familias tienen 4 hijos.
h4% = 20% significa que el 20% de las familias tienen 6 hijos.
h5% = 20% significa que el 20% de las familias tienen 7 hijos.

Interpretaciones de las frecuencias absolutas porcentuales:


H2% = 25% significa que el 25% de las familias tienen a lo ms 2 hijos.
H3% = 60% significa que el 60% de las familias tienen a lo ms 4 hijos.
H4% = 80% significa que el 80% de las familias tienen a lo ms 6 hijos.

DIAGRAMA DE FRECUENCIAS
Se usa para representar los diferentes tipos de distribuciones de frecuencias de variables
cuantitativas discretas.
Representacin grfica de las distribuciones de frecuencias absolutas y relativas.
Considerando la tabla de distribucin de frecuencias del ejemplo anterior.

Observaciones:
Generalmente los valores de la variable se deben ubicar en el eje horizontal, indicando el
nombre de la variable.
Grficamente los valores estn representados por lneas, esto es debido que se est
trabajando con variables cuantitativas discretas (valores enteros).

22

Representacin grfica de las distribuciones de frecuencias absolutas acumuladas y relativas


acumuladas.

23
EJERCICIOS
1.- La siguiente informacin muestra la inasistencia a la junta de accionistas de 20 accionistas
principales de una empresa de construccin en el ltimo semestre del 2014.
0

1 2 2 1 3 2 1 4 2 4 3 2 0 0 2 2 3 0 3

a. Construye la tabla de frecuencias a partir de estos datos.


b. Construye el grfico que consideres ms adecuado con las frecuencias no acumuladas.

24
2.- El Ministerio de Desarrollo e Inclusin Social encarga a una consultora recabar informacin de una
regin selvtica del pas acerca del nmero de hijos en 50 familias con el fin de brindar apoyo
asistencial por parte del ministerio. Obtenindose los siguientes datos.
2

a.
b.
c.
d.
e.
f.

Construye la tabla de frecuencias a partir de estos datos.


Cuntas familias tienen exactamente tres hijos?
Qu porcentaje de familias tienen exactamente cuatro hijos?
Qu porcentaje de las familias de la muestra tienen ms de dos hijos?
Construye el grfico que consideres ms adecuado con las frecuencias no acumuladas.
Construye el grfico que consideres ms adecuado con las frecuencias acumuladas.

25
3.- En la tabla de frecuencias que se muestra faltan algunos datos. Completarla
yi

ni

Ni

14

hi

Hi

0.7

0.2

4.- Para medir la variable adaptacin sensorial en un trabajo de investigacin se utiliz una prueba
elaborada ad hoc para esta investigacin, donde la puntuacin mxima es 10 (mxima adaptacin) y
la puntuacin mnima 0 (mnima adaptacin). Dicho trabajo se aplic a 36 ingenieros participantes de
un curso de capacitacin en las Fuerzas Armadas.
9

Construya la tabla de distribucin de frecuencias y realice algunas interpretaciones.

26

ORGANIZACIN Y REPRESENTACIN DE DATOS ASOCIADAS A VARIABLES CUANTITATIVAS


CONTINUAS
En este caso debido a que la magnitud de la caracterstica puede tomar, al menos tericamente,
infinitos valores, el proceso de reduccin, agrupacin o condensacin de los datos originales que
conducen a la construccin de tablas de frecuencia, no es tan simple como en el caso de los datos
discretos; es ms bien un problema de clasificacin de los datos donde la subjetividad del
investigador tiene una influencia que no debe de ignorarse.
Mediante un ejemplo se explicar el procedimiento que se debe seguir para la organizacin de estos
datos.
Ejemplo:
La informacin que se muestra a continuacin es referida 50 observaciones referentes a los pesos de
50 lingotes de acero producidos por una empresa minera. La muestra fue obtenida de la produccin
semanal, las unidades estn dadas en Kg.

El primer paso a seguir consiste en determinar el mximo y mnimo valor, esto nos llevar a obtener
la amplitud del recorrido.
Amplitud del recorrido o rango ()

= Xmax Xmin
= 96.4 91.6 = 4.8
Nmero de intervalos (m)
Criterios
5 m 20 (Eleccin subjetiva)
m = 1 + 3,322log n (mtodo de Sturges)
n: nmero de observaciones
Para nuestro ejemplo elegimos m = 5, si en caso se hubiese elegido el mtodo de Sturges m=6.644 la
cual aproximamos a 7.
Amplitud del intervalo (C)

27

Al trabajar con este nmero se nos puede hacer complicado la construccin de los intervalos, debido
a que es un nmero decimal, por ello es preferible trabajar con un nmero entero pero este nmero
debe ser ms prximo y superior a 0.96, en este caso el valor elegido es c = 1, al hacer este cambio
de c hace que el rango se modifique.
Rango = c x m = 1 x 5 = 5 4.8
Para ello modificamos la amplitud del recorrido, como la diferencia es de 0.2 entonces corremos 0.1
a la izquierda y 0.1 a la derecha.

Los lmites de clase vienen a ser los extremos de cada intervalo (o clase) con amplitud c, y
para construir los intervalos se comienza con el mnimo valor, que en nuestro ejemplo ser
con el nuevo mnimo 91.5.
La marca de clase es un valor que representa al conjunto de valores que pertenecen a un
intervalo, este valor se calcula con el propsito de obtener alguna caracterstica de los datos
como la media, mediana, varianza, etc. que ms adelante se calcularan.

28

Se debe tener en cuenta que los intervalos que se construyan deben ser semi-abiertos, es decir en un
extremo abierto y en otro cerrado (o viceversa).
Una vez construido los intervalos se procede a hacer el conteo de cuntos de estos datos pertenecen
a cada intervalo. De esta manera se obtendrn las frecuencias absolutas.

Ahora completamos la tabla:

HISTOGRAMA DE FRECUENCIAS
Se usa para representar grficamente las distribuciones de frecuencias absolutas o relativas de datos
cuantitativos continuos agrupados en clases. Estos estn representados mediantes rectngulos cuya
base es la amplitud de la clase.

29
Histograma de frecuencias: Peso de cincuenta lingotes de acero

POLGONO DE FRECUENCIAS
Los polgonos de frecuencias absolutas o relativas, se obtienen uniendo los puntos medios de las
bases superiores de los rectngulos en el histograma de frecuencias absolutas o relativas,
respectivamente.
Polgono de frecuencias: Peso de cincuenta lingotes de acero

POLGONO DE FRECUENCIAS ACUMULADAS: OJIVAS.


La ojiva es la representacin grfica de una distribucin de frecuencias absolutas acumuladas o
frecuencias relativas acumuladas menor que. En el eje horizontal se ubican los lmites de los
intervalos de clase.

30

Ojiva: Peso de cincuenta lingotes de acero

31
EJERCICIOS
1.- Los sueldos mensuales (en dlares) de 60 operarios de la empresa TELCOM S.A. fueron los
siguientes:
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382

Construya la tabla de frecuencia para estos datos y realice los grficos respectivos.

32
2.- Dada la siguiente distribucin de frecuencias que muestra las utilidades netas (en miles de nuevos
soles) de 200 pequeas empresas del rubro de telecomunicaciones.

Li Ls

ni

12

Ni

- 270
- 300

30

90
126

330 -

50

Cuntas empresas tienen utilidades comprendidas entre 260 y 320?

33
3.- La siguiente tabla muestra las puntuaciones obtenidas mediante una prueba a 36 ingenieros de
una empresa minera luego de recibir una capacitacin, las puntuaciones van de 0 a 80 puntos.
69 68 38 50 57 33 30 38 39 22 20 37 62 35 41 50 43 19
55 30 24 47 21 23 68 60 70 31 28 46 50 48 37 35 42 17
Organice los datos en una tabla de distribucin de frecuencias y realizar el histograma de frecuencias.

34
4.- En el artculo Determination of representative Subdivision (J. of Energy Engr, 1993: 43-55) se
muestran los datos de varias caractersticas de subdivisiones que se podran usar para decidir si se
suministra energa elctrica por medio de lneas areas o subterrneas. A continuacin se dan los
valores de la variable x = longitud total de calles dentro de una subdivisin:
1280 5320 4390 2100 1240 3060 4770 1050 360 3330 3380 340 1000 960 1320
530 3350 540 3870 1250 2400 960 1120 2120 450 2250 2320 2400 3150 5700
5220 500 1850 2460 5850 2700 2730 1670 100 5770 3150 1890 510 240 396
1419 2109
Organice los datos en una tabla de distribucin de frecuencias y realizar el histograma de frecuencias.

35

MEDIDAS DE TENDENCIA CENTRAL


Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, es decir, resumir la informacin con un solo nmero. Este nmero que, para tal fin,
suele situarse hacia el centro de la distribucin de datos y se denomina medida o parmetro de
tendencia central.
MEDIA
Se define como la suma de todos los valores observados de la variable dividida entre el nmero total
de observaciones n. Tambin es conocido como media aritmtica o promedio.
En general

Ejemplo:
El curso de estadstica tiene 15 alumnos y se han registrado el nmero de das que llegaron tarde en
todo el ciclo.

1 2 0 5 3 5 7 1 2 1 3 4 3 3 2

Interpretacin: En todo el ciclo los alumnos llegaron en promedio 2,8 das tarde.
MEDIANA
Se define como aquel valor de la variable que supera a no ms de la mitad de las observaciones y al
mismo tiempo es superado por no ms de la mitad de las observaciones. La mediana es el valor
central.
Ejemplo:
El curso de estadstica tiene 15 alumnos y se han registrado el nmero de das que llegaron tarde en
todo el ciclo.

1 2 0 5 3 5 7 1 2 1 3 4 3 3 2
Caso 1: Cuando el nmero de datos (n) es impar
Primero: Ordenamos los valores de las observaciones de menor a mayor

36

Interpretacin:

El valor central del nmero de tardanzas de los alumnos es de 3 das.

El 50% de los alumnos llegaron como mximo 3 das tarde.

En el ejemplo anterior el nmero de observaciones era 15, un nmero impar. Pero que sucede si el
nmero de observaciones es un nmero par, como por ejemplo:

1 2 0 5 3 5 7 1 2 1 3 4 3 3 2 0
En este caso se tiene 16 observaciones.
Caso 2: Cuando el nmero de datos (n) es par
Ordenando los valores de las observaciones de menor a mayor

Interpretacin:

El valor central del nmero tardanzas de los alumnos es de 2,5 das.

El 50% de los alumnos llegaron como mximo 2,5 das tarde.

MODA
Es aquel valor de la variable que se presenta con mayor frecuencia; es decir es el valor que ms se
repite.
Ejemplo:
El curso de estadstica tiene 15 alumnos y se han registrado el nmero de das que llegaron tarde en
todo el ciclo.

1 2 0 5 3 5 7 1 2 1 3 4 3 3 2
Como se puede observar el valor que ms se repite es de 3 das, entonces el valor modal (Mo) es 3.
En este caso se conoce como unimodal.
Presentamos otra situacin

37
Ejemplo:
El curso de estadstica tiene 15 alumnos y se han registrado el nmero de das que llegaron tarde en
todo el ciclo.
1 2 0 5 3 5 7 2 2 1 3 4 3 3 2
En este caso se tiene dos modas: 2 y 3, se conoce como bimodal. En el caso que haya ms de dos
modas se conocen como multimodal.
A continuacin se presenta las ventajas y desventajas que cada medida de medida de tendencia
central tiene una respecto a otra.
MEDIA
VENTAJAS

DESVENTAJAS

Es un concepto familiar a la mayora


La media puede verse afectada por
de las personas e intuitivamente
factores extremos que no son
claro.
representativos del resto de las
Es una medida que puede ser
observaciones.
calculada y nica.
Para su clculo, es tomada en cuenta Ejemplo:
cada una de las observaciones del
1 0 3 2 2 0 2
M(x) = 1,42
conjunto de datos.
1 0 3 2 2 0 24 M(x) = 4,57

MEDIANA
VENTAJAS
La mediana es fcil de entender y
puede ser calculada a partir de
cualquier tipo de datos.
La mediana est afectada por el
nmero de observaciones y no por la
magnitud de cualquier valor extremo.
Ejemplo:
0 0 1 2 2 2 3 Me(x) = 2
0 0 1 2 2 2 24 Me(x) = 2

DESVENTAJAS
Se debe organizar los datos antes de
realizar algn clculo para obtener la
mediana, esto puede consumir
mucho tiempo.
Ciertos procedimientos estadsticos
que usan a la mediana son mucho
ms complejos que si se usara la
media

MODA
VENTAJAS
Se puede usar como una localizacin
tanto para datos de variable
cualitativas como cuantitativas.
No est afectada por valores
extremos.

DESVENTAJAS
A menudo no hay un valor modal,
porque el conjunto de datos no
contiene valores que se repiten ms
de una vez.
Cuando el conjunto de observaciones
contiene dos, tres o ms modas,
stas son difciles de interpretar y
comparar.

38
Clculo de la media para datos agrupados
En este caso los datos se encuentran organizados en una tabla de distribucin de frecuencias, el
mtodo de obtener la media aritmtica es diferente.
En general

Ejemplo:
A las familias de una comunidad alto andina se le pregunt por el nmero de hijos, obtenindose los
siguientes resultados
2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7

Interpretacin: El nmero promedio de hijos de las familias de una comunidad alto andina es 4,3
Ejemplo:
La informacin que se muestra a continuacin es referida 50 observaciones referentes a los pesos de
50 lingotes de acero producidos por una empresa minera. La muestra fue obtenida de la produccin
semanal, las unidades estn dadas en Kg.

39

En este caso multiplicamos la marca de clase con la frecuencia absoluta

Interpretacin: En promedio el peso de un lingote de acero es de 94,04 Kg.


PROPIEDADES
Propiedad 1
Si todos los valores observados 1 , 2 , , son iguales a b (donde b es una constante), entonces
() = () =
Ejemplo:

Propiedad 2
Si a cada valor de las observaciones 1 , 2 , , se le suma (o resta) una constante, la media
aritmtica del nuevo conjunto transformado = , es la media aritmtica del conjunto original
ms (o menos) la constante.
() = ()
Ejemplo:

40
Propiedad 3
Si a cada valor de las observaciones 1 , 2 , , se le multiplica por una constante diferente de cero,
la media aritmtica del nuevo conjunto transformado = , es la media aritmtica del conjunto
original multiplicado por la constante. () = ()
Ejemplo:

Propiedad 4
De una poblacin de n observaciones se obtiene dos muestras de tamao n1 y n2 respectivamente.
Sean 1 2 las medias aritmticas de las muestras, entonces la media asociada a las n
observaciones est dada por:
Donde n = n1 y n2
Ejemplo:

41
En general
Sean 1 , 2 , , las medias aritmticas de m muestras cada una de tamao 1 , 2 , ,
respectivamente.

Donde:

42
EJERCICIOS
1.- Calcular la media, mediana y moda para los siguientes datos:
11
8
6
7
7

5
9
11
10
3

2.- Determinar la media de la siguiente tabla de frecuencia:

4
8
3
2
8

43
3.- Calcule la media a partir del siguiente histograma:

4.- El precio medio de un centenar de artculos escolares es de S/. 8 570, los artculos se dividen en
dos grupos, con medias S/. 7 580 y S/. 9 780 Cuntos artculos hay en cada grupo?

44
5.- Un grupo de 100 atletas viaja en dos aviones. El primero lleva 40 atletas y el segundo los
restantes. Se sabe que el peso promedio de los 100 atletas es de 186,3 libras y los del segundo grupo
es de 10 libras menos que el de los atletas del primer avin. Cul es el peso medio de los atletas en
cada avin?

6.- Las notas del examen parcial del curso de estadstica de 20 alumnos son:
11 13 09 13 15 13 14 10 12 16 11 08 10 11 14 12 16 17 09 10
Siendo el promedio de 12,2. Debido a los trabajados presentados por los alumnos el profesor decide
aumentarle 3 puntos a cada alumno. Cul ser el nuevo promedio?

7.- De las edades de cuatro personas, se sabe que la media es igual a 24 aos, la mediana es 23 y la
moda es 22. Encuentre las edades de las cuatro personas.

45
8.- Se tiene dos marcas de bombillas Ans y Beluz. Se presenta a continuacin la duracin (en das)
registrada de cierto nmero de bombillas de cada marca.

Qu marca comprara usted y por qu? Sustente su respuesta a base del anlisis de las medidas de
tendencia central

9.- Al calcular la media de 125 datos, result 42. Un chequeo posterior mostr que en lugar del valor
12,4 se introdujo 124. Cul es el valor correcto de la media?

46

CUANTILES
Como una consecuencia del estudio de la mediana, es fcil ampliar este concepto a otros
estadgrafos que dividen a los datos en otras proporciones y no solo en el valor central como lo hace
la mediana.

CUARTILES
Los cuartiles son valores que divide a un conjunto de datos ordenados en forma ascendente o
descendente en cuatro partes iguales. Hay tres cuartiles: Q1, Q2, Q3.

Q1: Debajo primer cuartil se encuentra el 25% de los datos.

Q2: Debajo del segundo cuartil se encuentra el 50% de los datos (Mediana)

Q3: Debajo del tercer cuartil se encuentra el 75% de los datos.

DECILES
Los deciles dividen al conjunto de datos en 10 partes porcentualmente iguales. Hay 9 deciles, D1,
D2,, D9.
PERCENTILES
Divide al conjunto de datos en 100 partes porcentualmente iguales. Por ejemplo: P73 nos dice que
debajo de este valor se encuentra el 73% de los datos.
CLCULO DE LOS PERCENTILES
El percentil k (Pk), es el valor por debajo del cual se encuentra el k% de las observaciones y por
encima el (100-k)% de las observaciones.
Para datos no agrupados:

47
Primero debe ordenarse los datos en forma creciente o decreciente. Para hallar el percentil Pk se
sugiere los siguientes pasos:
Hallar la posicin que ocupa el percentil Pk en la lista de datos ordenados que est determinada por
la expresin:

Ejemplo: Al examinar los registros de facturacin mensual de una empresa que vende al crdito, el
auditor toma una muestra de 11 de las facturas no pagadas. Las sumas (en miles de nuevos soles)
que se adeudan a la empresa son:
4 18 11 7 7 10 21 5 33 9 12
Hallar el percentil 60: P60
Primero se ordenan los datos en forma ascendente

Interpretacin: El 60% de las facturas no pagadas tienen como mximo valor 11 200 soles.
Hallar el Cuartil 1: Q1 = P25
Primero se ordenan los datos en forma ascendente

Interpretacin: El 25% de las facturas no pagadas tienen como mximo valor 7 000 soles.

48

EJERCICIOS
1.- El responsable del rea de logstica de ELECTRO-SAT solicit al rea produccin, el tiempo (en
minutos) de duracin por ensamblado de paneles reflectores que realizaron 10 operarios. Los
resultados se muestran a continuacin:

Operario

10

Tiempo

27

36

36

37

38

45

49

49

54

57

a. Indique el equivalente de cada una de las medidas de posicin en trminos de percentiles.


Medidas de posicin

Percentiles

D2
Q3
D9
Mediana

b. Calcule e interprete el valor del cuartil 3, percentil 80 y decil 6.

Notacin

Clculo

Interpretacin

Cuartil 3

Percentil
80

Decil 6

c. El rea de produccin desea saber el tiempo mnimo que un operario tard para pertenecer al
15% de los operarios que ms se demoraron en ensamblar. Cul es el tiempo mnimo?

49
2.- Los sueldos en una empresa VOLCAN S.A. varan de $300 a $800 distribuidos en forma simtrica
en cinco intervalos de igual amplitud, con el 15%, 20% y 30% de los casos en el primer, segundo y
tercer intervalo respectivamente. Si la SUNAT quisiera aplicar un impuesto a los sueldos localizados
en el cuarto superior, A partir de qu monto de sueldo se paga impuesto?

3.- Al tabular las calificaciones de la primera prctica calificada de Estadstica y Probabilidades se


obtuvieron las siguientes notas: 07; 08; 09; 10; 11; 12; 13; 14; 15; 16; 17 y la cantidad de alumnos
que obtuvieron dichas notas fueron respectivamente: 1; 1; 1; 1; 1, 6; 8; 16; 18; 20; 2. Cul es la nota
mnima para estar en el quinto superior?

50

MEDIDAS DE DISPERSIN
Son cantidades que miden el grado en que los datos numricos tienden a extenderse alrededor de
un valor medio.
La importancia que tienen es porque proporcionan ms informacin que permite juzgar la
confiabilidad de las medidas de tendencia central. Si los datos estn muy dispersos, las medidas de
tendencia central son menos representativas de los datos que cuando estn ms agrupadas
alrededor de la media.
Utilidad
Para medir el grado de variacin de los datos del conjunto; as por ejemplo, si existe poca dispersin
en la productividad de los obreros de una compaa, esto quiere decir, que los obreros tienen un
rendimiento muy homogneo, es decir, que existe poca variabilidad en el rendimiento; pero si la
dispersin es alta, esto quiere decir, que el rendimiento es heterogneo o que existe gran
variabilidad en el rendimiento.
Para complementar un promedio; es decir, entre ms baja sea la dispersin de un conjunto de datos,
ms altamente representativo ser el promedio de ese conjunto. Si se tiene el conjunto 10, 12, 68, 9,
40, 97, 33, 14, 15 y 8, la media aritmtica de este ser 30.6, que no es un promedio representativo,
pues como vemos los datos son muy variables. En ste caso, el clculo de la dispersin nos dara alto,
significando con ello, que existe alta variabilidad entre los datos.
Para comparar dos o ms conjuntos referentes a un mismo fenmeno. Si por ejemplo, tanto el
ingreso promedio mensual de un barrio A como el de un barrio B de una cierta ciudad es $370.000,
pero se sabe adems que existe ms variabilidad de los ingresos en el barrio A que en el barrio B,
entonces podemos afirmar que el promedio de los ingresos en el barrio A es menos representativo
que en el barrio B., es decir que existe peor distribucin del ingreso en el barrio A que en el B.

Rango o recorrido de la variable (R)


R = Xmax - Xmin
Recorrido intercuartlico (RIC)
RIC = Q3 Q1

51
Desviacin del cuartil (QD)

Ejemplo:
Al examinar los registros de facturacin mensual de una empresa que vende al crdito, el auditor
toma una muestra de 11 de las facturas no pagadas. Las sumas que se adeudan a la empresa son:
4 18 11 7 7 10 21 5 33 9 12

Desviacin Media
Es la media aritmtica de los valores absolutos de las desviaciones de los valores observados
respecto a la media aritmtica de stas.

Ejemplo:
Al examinar los registros de facturacin mensual de una empresa que vende al crdito, el auditor
toma una muestra de 11 de las facturas no pagadas. Las sumas que se adeudan a la empresa son:
4 18 11 7 7 10 21 5 33 9 12
En este caso los datos estn sin tabular, primero debemos calcular la media
= 12.45

DM = 6.04
Varianza
Se define como la media aritmtica del cuadrado de las desviaciones de las observaciones con
respecto a su media.

52
Ejemplo:
Al examinar los registros de facturacin mensual de una empresa que vende al crdito, el auditor
toma una muestra de 11 de las facturas no pagadas. Las sumas que se adeudan a la empresa son:
4 18 11 7 7 10 21 5 33 9 12

Nota: el valor de la varianza no es interpretable, porque su valor estn dadas en unidades al


cuadrado.
Ejemplo:
A las familias de una comunidad alto andina se le pregunto por el nmero de hijos, obtenindose los
siguientes resultados 2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7
Se tiene la tabla de distribucin de frecuencias, ya realizada anteriormente, de la cual slo nos
interesa las dos primeras columnas

No olvidemos que la media es 4.3

La varianza para ste conjunto de datos es:

53
Desviacin estndar
Se define como la raz cuadrada de la varianza.

Para el ejemplo anterior, la desviacin estndar es:


Coeficiente de Variacin
Las medidas de dispersin que vimos anteriormente son absolutas y son tiles para describir la
dispersin de un solo conjunto de datos, pero si se quiere comparar ms de dos conjuntos de datos
tendremos que usar una medida de dispersin relativa, como el coeficiente de variacin; la cual est
definida como el cociente entre la desviacin estndar y la media.

Ejemplo:
Se tomaron dos exmenes a estudiantes del primer ciclo en los cursos de matemtica y economa,
las notas estn sobre 100 puntos. En el curso de matemtica la media fue de 72 puntos y una
desviacin estndar de 9 puntos; en el curso de economa se obtuvo una media de 80 puntos y
desviacin estndar 6 En cul de los cursos hay mayor dispersin?

Como se puede observar, la mayor dispersin se dio en el curso de matemtica.


PROPIEDADES
Propiedad 1
Si todos los valores observados 1 , 2 , , son iguales a b (donde b es una constante), entonces
() = () = 0
Ejemplo:

54
Propiedad 2
Si a cada valor de las observaciones 1 , 2 , , se le suma (o resta) una constante, la varianza del
nuevo conjunto transformado = , es la misma del conjunto original, o sea () = ()
Ejemplo:

Propiedad 3
Si a cada valor de las observaciones 1 , 2 , , se le multiplica por una constante diferente de cero,
la varianza del nuevo conjunto transformado = , es la varianza del conjunto original
multiplicado por la constante elevada al cuadrado, es decir () = 2 ()
Ejemplo:

55
EJERCICIOS
1. Como parte de un trabajo de investigacin sobre preferencias a ciertas pginas de internet, los
estudiantes de la facultad de ingeniera de sistemas eligieron a criterio las pginas web:
www.netjoven.pe y www.atractiva.com, con el objetivo de hacer un anlisis de variabilidad del
nmero de visitas por da. A continuacin se presenta el registro de once das elegidos al azar.

Da
N de visitas por da
www.netjoven.pe
N de visitas por da
www.atractiva.com
Clculos

10

11

202

198

236

199

219

204

235

212

197

231

222

301

245

298

277

235

257

287

257

299

287

247

Medida de resumen

Pgina: www.netjoven.pe

Pgina: www.atractiva.com

Media
Desviacin estndar
CV
Cul es ms
homogneo?
Cul es ms variable?
Cul es menos
disperso?
Cul es ms
heterogneo?

2.- Establezca, con base estadstica, en cul de las siguientes empresas el salario (en cientos de
nuevos soles) est repartido de forma menos dispersa.

56

3.- Sean X e Y tales que


X = 5 V(X) = 2
Y = 7 V(Y) = 8 Sabiendo que yi = axi + b
a>0, determinar los valores de estas dos constantes a y b.

y que

4.- Se cuenta con datos del peso y la estatura de un grupo de 20 nios entre 8 y 10 aos, y se desea
saber cul de las dos variables tiene mayor variabilidad.

57
5.- Los salarios de los obreros en una empresa presentaban en el ao 2013 una media de $412 y
desviacin estndar de $62 y para el ao 2014 la empresa decret para cada obrero un aumento de
$41, entonces Podramos decir que la empresa propone una distribucin ms equitativa de los
salarios de sus trabajadores para este ao? Sustente su respuesta.

6.- Los sueldos de 120 trabajadores de una empresa tuvieron un coeficiente de variacin de 4% en
mayo. Para junio se da un aumento de S/. 50 a todos los trabajadores y el coeficiente de variacin
baja a 3,2%.
a. Calcule la media y la desviacin estndar de los sueldos de mayo.
b. Calcule el dinero necesario para pagar los sueldos de junio.

58
7.- Los sueldos de enero de los 43 empleados de VOLCAN S.A. tienen una media de S/. 1 750 y una
desviacin estndar de S/. 350. Para octubre la gerencia de RRHH de la empresa ha determinado un
incremento de los sueldos y debe decidir entre dos alternativas:
Alternativa 1- A cada empleado un incremento de S/. 275 a su sueldo.
Alternativa 2- A cada empleado un incremento del 10% a su sueldo ms S/. 100.
a. Para cada alternativa, calcule cul sera la nueva media y la nueva desviacin estndar de los
sueldos.
b. Qu alternativa sera ms conveniente para los empleados? Justifique su respuesta.

59

MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRA
Nos indica la asimetra de una que presenta un conjunto de datos (o distribucin). Este coeficiente
caracteriza el grado de asimetra de una distribucin con respecto a su media.

Para calcular el coeficiente de asimetra se usa la siguiente frmula:

En funcin al valor que tome esta se presentarn las siguientes situaciones:

CAs < 0: Distribucin asimtrica hacia la izquierda (asimetra negativa)

CAs = 0: Distribucin simtrica.

CAs > 0: Distribucin asimtrica hacia la derecha (asimetra positiva)

Por ejemplo: El caso de las notas de un examen final.

MEDIDA DE APUNTAMIENTO O CURTOSIS


Se entiende por curtosis, la medida de deformacin vertical de una distribucin de frecuencias, es
decir la medida de apuntamiento o achatamiento de una distribucin. La frmula a usar es la
siguiente:

60

A manera de aplicacin de las medidas de forma tomaremos un ejemplo ya trabajado


anteriormente.
Ejemplo:
A las familias de una comunidad alto andina se le
pregunto por el nmero de hijos, obtenindose los
siguientes resultados
2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7
Donde: = 4,3

S = 2,71

n = 20

61

TCNICAS DE CONTEO
Las tcnicas de conteo son usadas para enumerar eventos difciles de cuantificar. Comprende un
conjunto de procedimientos que permite determinar el nmero de resultados de un evento o
experimento aleatorio sin necesidad de utilizar una enumeracin e identificacin directa de todos los
posibles resultados de dicho evento o experimento.
PRINCIPIO DE ADICIN
Si una accin puede realizarse de n1 maneras diferentes y una segunda accin puede realizarse de n2
maneras diferentes, pero no es posible realizar ambas acciones conjuntamente, entonces n1 o n2
pueden realizarse alternativamente de n1 + n2 maneras diferentes.
Ejemplo:
Claudio va a comprar el repuesto de su automvil que se venden en 3 tiendas de La Victoria y 5
tiendas del Rmac. De cuntas maneras diferentes puede adquirir el repuesto?

Por lo tanto Claudio podr adquirir dicho repuesto de 8 maneras diferentes


Este principio aditivo se generaliza para cualquier nmero de acciones alternativas a realizar, esto es,
si una primera accin se puede realizar de n1 maneras diferentes, una segunda accin se puede
realizar de n2 maneras diferentes,..., y una r-sima accin se puede realizar de nr maneras diferentes,
entonces las r acciones alternativas se pueden realizar de n1 + n2 +...+ nr maneras diferentes.
Ejemplo:
Para viajar de Lima al Cusco se puede optar por avin, autobs o tren; existen tres rutas para el
avin, cuatro para el autobs y dos para el tren. Cuntas rutas hay para viajar?

PRINCIPIO DE MULTIPLICACIN
El principio multiplicativo es aplicable cuando el experimento se puede descomponer en un conjunto
de acciones secuenciales o independientes, de modo que cada resultado del experimento se
conforma con una posibilidad de cada una de esas acciones.

62
Si una accin puede realizarse de n1 maneras diferentes y una segunda accin puede realizarse de n2
maneras diferentes, entonces ambas acciones pueden realizarse secuencialmente de n1 x n2 maneras
diferentes.
Ejemplo:
Si Lorena tiene 2 blusas y 3 faldas diferentes, De cuntas maneras se puede vestir de manera
adecuada?

Este principio multiplicativo se generaliza para cualquier nmero de acciones a realizar, esto es, si
una primera accin se puede realizar de n1 maneras diferentes, una segunda accin se puede
realizar de n2 maneras diferentes,..., y una r-sima accin se puede realizar de nr maneras diferentes,
entonces las r acciones se pueden realizar de n1 x n2 x...x nr maneras diferentes.
Ejemplos:

De cuntas maneras pueden repartirse 3 premios a un conjunto de 10 personas,


suponiendo que cada persona no puede obtener ms de un premio?

Aplicando el principio de multiplicacin, tenemos 10 personas que pueden recibir el primer premio.
Una vez que ste ha sido entregado, restan 9 personas para recibir el segundo, y posteriormente
quedarn 8 personas para el tercer premio. De ah que el nmero de maneras distintas de repartir
los tres premios.

Cuntas placas de automvil se pueden hacer utilizando dos letras seguidas de tres cifras?
No se admiten repeticiones.
26 x 25 x 10 x 9 x 8 = 468 000

Se tendran 468 000 placas de automvil.


DIAGRAMA DE ARBOL
Un diagrama de rbol es una herramienta grfica que permite enumerar todas las posibles maneras
de realizar un conjunto de acciones secuenciales o independientes. El rbol se construye a partir de
un nodo, que representa la primera accin a efectuar; de ste se desprenden tantas ramas como
maneras diferentes se pueda realizar esa accin; en las terminales de cada rama se dibujan otros
nodos, que representan la segunda accin a efectuar y de los que se desprenden tantas ramas como

63
maneras lgicas diferentes pueda realizarse esa segunda accin, considerando la manera en que se
realiza la primera. Y as, sucesivamente.

Ejemplo:
Se tienen en un estante de 3 libros; uno de lgebra, uno de Contabilidad y otro de Biologa. De
cuntas formas distintas se pueden ordenar los libros?

= {ACB, ABC, BAC, BCA, CAB, CBA}


Ejemplo:
Considere el experimento consistente en lanzar una moneda tres veces consecutivas y observar, cada
vez, la cara que queda hacia arriba.

64
Ejemplo:
Un hombre tiene tiempo para jugar ruleta cinco veces a lo sumo. En cada juego gana o pierde un
dlar. El hombre empieza con un dlar y dejar de jugar si antes de la quinta vez pierde todo su
dinero o si gana tres dlares, esto es, si tiene cuatro dlares. Realizar un diagrama de rbol para
dicho experimento aleatorio.

PERMUTACIN
Las permutaciones son los diferentes arreglos u ordenamientos que se pueden realizar con una parte
o con todos los elementos de un conjunto.

Permutacin lineal.- Son los diferentes arreglos que se hacen en una lnea referencial.

Ejemplo:
De cuntas maneras diferentes se ordenan A, B, C y D tomados de dos en dos?
Se tienen cuatro elementos: A, B, C y D

Entonces tenemos 12 maneras diferentes de ordenar A, B, C y D


Otra manera

Adems se puede expresar

65
En general

Factorial de un nmero.- Es el producto de todos los nmeros enteros positivos y consecutivos des
de la unidad hasta n. Se denota n!
n! = 1 x 2 x 3 x 4 xx (n-1) x n
Ejemplos:
4! = 1 x 2 x 3 x 4
7! = 1 x 2 x 3 x 4 x 5 x 6 x 7
Nota: Por convencin se asume que 0! = 1

Permutacin Circular.- Es un arreglo u ordenamiento de elementos alrededor de un objeto o


punto de referencia.

Ejemplo:
De cuntas maneras diferentes se pueden sentar 4 personas alrededor de una mesa circular?
Sean A, B, C y D las personas que se van a ubicar alrededor de la mesa.

Se tiene 6 maneras.
En general

Permutacin lineal con elementos repetidos.- Es un ordenamiento lineal cuyos elementos no


todos son distintos entre s, es decir, hay elementos que se repiten.

Ejemplo:
De cuntas maneras diferentes se pueden ordenar en una fila dos fichas iguales de color negro y
dos fichas iguales de color blanco?

66
Sean las fichas N, N, B y B

Se observa que hay seis maneras diferentes de ordenar.


Otra manera

En general

Ejemplo:
Cuntas palabras diferentes se pueden formar con las letras de la palabra CASACA?

Se pueden formar 60 palabras diferentes con la palabra CASACA


COMBINACIN
Viene a ser los diferentes grupos que se pueden formar con una parte o todos los elementos de un
conjunto determinado sin considerar el orden de los agrupamientos.
Ejemplo:
De cuantas maneras diferentes se pueden agrupar A, B, C y D al tomar de 2 en 2?
Tenemos cuatro elementos, la cual se agrupa de 2 en 2.

Se observa que hay 6 maneras diferentes de agrupar de 2 en 2.

67
Otra manera
Es una combinacin de 4 elementos que se toman de 2 en 2 y se obtiene:

En general

Ejemplo:
Un grupo de 7 estudiantes se desea conformar dos comisiones. La primera comisin debe estar
integrada por 4 estudiantes y la segunda comisin por 3 estudiantes. De cuntas maneras diferentes
se puede elegir a los alumnos que deben conformar la primera comisin?
El grupo tiene 7 estudiantes, entonces n = 7
La primera comisin est conformada por 4 estudiantes, entonces k = 4.

68
EJERCICIOS
1.- Un artculo de computo se vende en tres galeras; en el primero se tienen disponibles 4 tiendas,
en el segundo 7 y en el tercero 6 tiendas. De cuntas maneras se puede elegir una tienda para
comprar dicho artculo?

2.- De cuantas maneras pueden ubicarse 8 personas en una banca de capacidad para 5 personas?

3.- Un entrenador de ftbol tiene 16 jugadores a su cargo, de los cuales uno est lesionado y no
puede jugar. De cuntas maneras podr formar su equipo, si cualquiera de los jugadores puede
desempearse en cualquier puesto?

69
4.- En el hipdromo de Monterrico se va alargar una carrera donde competirn 6 caballos. De
cuntas maneras podrn ocupar los primeros 3 puestos? De esta manera se puedan repartir los
premios.

5.- De cuntas maneras distribuiramos 3 monedas de S/.5 y 4 monedas de S/. 2 en una misma
lnea?

6.- En el comedor de la ciudad universitaria se ofrece un men que consiste en una sopa, un
segundo, un postre y una bebida. Cuntos almuerzos son posibles, si podemos elegir 4 tipos de
sopas, 3 tipos de segundo, 5 postres y 4 bebidas?

70
7.- Se debe formar una comisin de tres ingenieros: uno de sistemas, uno de electrnica y otro de
industrial Cuntas posibilidades de formar dicha comisin hay? Si se cuentan con tres de sistemas,
cuatro de electrnica y seis industriales.

71

PROBABILIDADES
El concepto de probabilidad es manejado por mucha gente. Frecuentemente se escuchan preguntas
como las que se mencionan a continuacin:

Cul es la probabilidad de que me saque la lotera?


Qu posibilidad hay de que me pase un accidente automovilstico?
Qu posibilidad hay de que hoy llueva? para llevar mi paraguas o no.
Existe alguna probabilidad de que repruebe el examen final?

Estas preguntas en el lenguaje coloquial esperan como respuesta una medida de confianza
representativa o prctica de que ocurra un evento futuro, o bien una forma sencilla de interpretar la
probabilidad. En este tema lo que se quiere es entender con claridad su contexto, como se mide y
como se utiliza al hacer inferencias.
El conocimiento de la probabilidad es de suma importancia en todo estudio estadstico. El clculo de
probabilidades proporciona las reglas para el estudio de los experimentos aleatorios o de azar, que
constituyen la base para la estadstica inferencial.

Experimento determinstico

Un experimento determinstico es aquel cuyos resultados del experimento estn completamente


determinado y puede describirse mediante una frmula matemtica llamada tambin modelo
determinstico.
Ejemplos:
Lanzar una pelota en un tanque de agua y ver si flota o se hunde.
Soltar una piedra en el aire.

Experimento no determinstico

Un experimento no determinstico se da cuando los resultados de los experimentos no pueden


predecirse con exactitud antes de realizar el experimento.
Ejemplos:
Lanzar una moneda y observar la cara superior (cara o sello)
Lanzar un dado y observar el nmero que aparece en la cara superior.
EXPERIMENTO ALEATORIO
En la vida podemos encontrar situaciones que no se pueden predecir, como cuando se realiza un
partido de ftbol, se lanza una moneda, etc. En todos estos casos no sabemos qu resultado se
tendr y por eso a estas situaciones se les llama experimentos aleatorios.
Un experimento aleatorio, tiene dos propiedades en comn:

Uno de estas es que cada experimento tiene varios resultados posibles que pueden
especificarse de antemano.
La segunda propiedad es que estamos inciertos acerca del resultado de cada experimento.

72
Ejemplos:
Conocer el nmero de alumnos que faltaran a clases, la prxima semana.
Preguntar a un profesor de secundaria la especialidad que tiene (Matemtica, Qumica,
Biologa, etc.)
Verificar la legalidad de un billete de $100 (legal o falso).
ESPACIO MUESTRAL
El espacio muestral asociado a un experimento aleatorio, es el conjunto de todos los resultados
posibles de dicho experimento aleatorio.
Lanzar una moneda y observar la cara superior (cara o sello)
1 = {C, S}
Lanzar un dado y observar el nmero que aparece en la cara superior.
2 = {1, 2, 3, 4, 5, 6}
Tiempo de espera hasta ser atendido en el banco.
3 = { t / 0 t}
EVENTOS
Un evento es un subconjunto del espacio muestral de un experimento aleatorio y lo denotaremos
por A, B, C, D, etc.
SUCESO
Un suceso es todo elemento del espacio muestral y lo designaremos por w, x, y, etc.
Ejemplos:
Consideremos el experimento aleatorio de lanzar un dado
= {1, 2, 3, 4, 5, 6}
Un evento podra ser:

A: ocurre un nmero par


A = {2, 4, 6}

Observar el tiempo de vida del foco de una lmpara.


= { t / 0 t}
Un evento podra ser:

B: el foco dura ms de 200 horas


B = {t / t > 200}

Evento imposible
Evento que no ocurre nunca en un experimento aleatorio. Algunos eventos nunca pueden ocurrir en
el experimento aleatorio, y por eso se llama imposible. Se simboliza con .

73
Ejemplo:
Sea el evento

A: Lanzar dos dados y que la suma del resultado sea 14.


A=

Evento seguro
Evento que siempre ocurre en un experimento aleatorio.
Ejemplo:
Sea el evento

B: Sacar una bola roja, de una urna que contiene 6 bolas rojas
B = Sacar una bola roja es un evento seguro, pues todas son rojas.

OPERACIN CON EVENTOS


Unin de eventos
Dado dos eventos A y B, se llama unin de eventos A U B al evento formado por los sucesos que
pertenecen a A o a B a ambos.
A U B = {w / w A v w B}
Ejemplo:
Se realiza el experimento de lanzar un dado y se dan los siguientes eventos:
Evento B

B: los resultados son mayores o iguales a tres

Evento D

D: los resultados son nmeros impares

Entonces:

Interseccin de eventos
Dado dos eventos A y B, se llama interseccin de A con B A B al evento formado por todos los
sucesos favorables a A y a B. Es decir ambos eventos ocurren.
AB = A B = {w / w A w B}
Evento B

B: Los resultados son mayores o iguales a tres

74

Evento D

D: Los resultados son nmeros impares

Entonces:

Eventos mutuamente excluyentes


Dos eventos A y B definidos en el mismo espacio muestral, se dice que son mutuamente excluyentes
si no pueden ocurrir juntos. Es decir la ocurrencia de uno excluye la ocurrencia del otro.
AB=
Ejemplo:
Evento C

C: Los resultados son nmeros pares.

Evento D

D: Los resultados son nmeros impares

Los eventos C y D son mutuamente excluyentes


CD=
Complemento de un evento
Si A es un evento del espacio muestral , se llama complemento de A, al evento formado por todos
los sucesos que no pertenecen a A. Es decir, no ocurre A.
A= = {w / w A}
Ejemplo:
Evento A

A: Los resultados son mayores o iguales a tres

PROPIEDADES DE LAS OPERACIONES CON EVENTOS

75

DEFINICIN DE PROBABILIDAD
ENFOQUE CLSICO DE PROBABILIDAD
La probabilidad de un evento es la razn entre el nmero de casos (sucesos) favorables y el nmero
total de casos (sucesos) posibles, siempre que nada obligue a creer que algunos de estos sucesos
debe tener preferencia a los dems, lo que hace que sean igualmente posibles.
La probabilidad de un evento A: P(A), es un nmero, que mide el grado de certeza en el que un
evento A ocurre, y se obtiene con la frmula conocida como regla de Laplace.

Ejemplo:
En una urna se tienen tres bolas blancas y siete bolas rojas. Cul es la probabilidad de que cuando se
extraiga una bola este sea de color rojo?

ENFOQUE DE FRECUENCIA RELATIVA


Si un experimento bien definido se repite n veces (n grande) y sea nA el nmero de veces que el
evento A ocurre en los n ensayos (nA < n), entonces la frecuencia relativa de veces que ocurre el
evento A nA/n, es la estimacin de la probabilidad que ocurra el evento A, o sea:

76

Observacin:
La frecuencia relativa de un evento, est comprendido entre 0 y 1, por lo tanto 0 P(A) 1
ENFOQUE SUBJETIVO DE PROBABILIDAD
Este enfoque nos dice que la probabilidad de ocurrencia de un evento es el grado de creencia por
parte de un individuo de que un evento ocurra, basado en toda la evidencia a su disposicin. Bajo
esta premisa se puede decir que este enfoque es adecuado cuando solo hay una oportunidad de
ocurrencia del evento. Es decir, que el evento ocurrir o no ocurrir esa sola vez. El valor de
probabilidad bajo este enfoque es un juicio personal.
Ejemplo:
La probabilidad que apruebe el curso es de 0,86
La probabilidad que mi equipo de futbol gane el campeonato es de 60%
AXIOMAS DE PROBABILIDADES
Independientemente de la forma como definimos la probabilidad, esta cumple los siguientes
axiomas.
Axioma 1

0 P(A) 1, para cada evento A en

Axioma 2

P() = 1

Axioma 3 Para cualquier nmero finito de K eventos mutuamente excluyentes

Si A y B son dos eventos mutuamente excluyentes en , entonces


P[A U B] = P[A] + P[B]

TEOREMA DE PROBABILIDADES
Teorema 1

Si es el evento imposible, entonces P() = 0

Teorema 2

Para cada evento A, se cumple que

77
P[] = 1 P[A]
Teorema 3

P[A] = 1 - P[]

Si A y B son eventos tales que


P[A] P[B]

Teorema 4

Si A y B son dos eventos cualesquiera en , entonces


P[A U B] = P[A] + P[B] - P[A B]

Teorema 5

Si A, B y C son tres eventos cualesquiera en , entonces


P[A U B U C] = P[A] + P[B] + P[C] - P[A B] - P[A C] - P[B C] + P[A B C ]

Ejemplo:
De acuerdo con la tabla cul es la probabilidad de que una familia escogida al azar tenga un ingreso
familiar a) Entre $20 000 y $40 000, b) menor que $40 000, c) en cada uno de los extremos, o sea
menor que $20 000 o cuanto menos de $100 000?

De la tabla, podemos decir que los eventos (categoras) son mutuamente excluyentes.

Ejemplo:
De 300 estudiantes de la facultad de ingeniera, 100 se encuentran inscritos en matemtica y 80
estn inscritos en estadstica aplicada. Estas cifras incluyen a 30 estudiantes que estn inscritos en
ambos cursos. Cul es la probabilidad de que un estudiante elegido de manera aleatoria est
inscrito en matemtica (A) o en estadstica aplicada (B)?
Por lo descrito, podemos concluir que los eventos no son mutuamente excluyentes. Lo pedido se
puede expresar como P(A U B).
P(A U B) = P(A) + P(B) P(A B)

78
EJERCICIOS
1.- Se extraen dos bolas de una urna que se compone de una bola azul, una roja, una verde y otra
negra. Escribir el espacio muestral cuando:
a. La primera bola extrada se devuelve a la urna antes de sacar la segunda (con reposicin).
b. La primera bola extrada NO se devuelve a la urna antes de sacar la segunda (sin reposicin).

2.- En una urna que tiene 10 bolas enumeradas del 0 al 9, se extrae una bola al azar.
a. Cul es el espacio muestral?
b. Describe los eventos:
A: "Mayor que 6" B: "No obtener 6" C: "Menor que 6" escribiendo todos sus elementos.
c. Hallar la probabilidad de los eventos: AUB, AB y B'A'.

79
3.- Se lanzan dos dados y se suman los puntos obtenidos. Calcular la probabilidad de que la suma sea:
a. par
b. mltiplo de 3
c. mltiplo de 5
d. mayor que 6

4.- Dos amigos juegan con dos dados. Uno apuesta a obtener suma igual a 6 y el otro apuesta a
obtener suma igual a 7. Te parece el juego justo?

80
5.- Dos personas eligen al azar, cada una de ellas, un nmero del 1 al 5. Cul es la probabilidad de
que las dos elijan el mismo nmero?

6.- Sean A y B los eventos tales que: P[A] = 0,4

P[A' B] = 0,4

P[A B] = 0,1

Calcula P[A U B] y P[B]

7.- En una clase en la que todos practican algn deporte, el 60% de los alumnos juega al ftbol o al
baloncesto y el 10% practica ambos deportes. Si adems hay un 60% que no juega al ftbol, cul ser
la probabilidad de que escogido al azar un alumno de la clase:
a. juegue slo ftbol
b. juegue slo baloncesto
c. Practique uno solo de los deportes
d. No juegue ni al ftbol ni al baloncesto.

81

8.- En un viaje organizado por Europa para 120 personas, 48 de los que van saben hablar ingls, 36
saben hablar francs, y 12 de ellos hablan los dos idiomas.
Escogemos uno de los viajeros al azar.
a. Cul es la probabilidad de que hable alguno de los dos idiomas?
b. Cul es la probabilidad de que hable francs, sabiendo que habla ingls?
c. Cul es la probabilidad de que solo hable francs?

82
9.- Se hace una encuesta en un grupo de 120 personas, preguntando si les gusta leer y ver la
televisin. Los resultados son:
-

A 32 personas les gusta leer y ver la tele.


A 92 personas les gusta leer.
A 47 personas les gusta ver la tele.

Si elegimos al azar una de esas personas:


a. Cul es la probabilidad de que no le guste ver la tele?
b. Cul es la probabilidad de que le guste leer, sabiendo que le gusta ver la tele?
c. Cul es la probabilidad de que le guste leer?

10.- Considere elegir al azar un alumno de cierta universidad, y sea A el evento de que el individuo
seleccionado tenga una tarjeta de crdito Visa y B el evento anlogo para una MasterCard. Suponga
que P(A)=0.5, P(B)=0.4 y P(AB)=0.25
a. Calcule la probabilidad de que el individuo seleccionado tenga al menos una de las dos
tarjetas (es decir, la probabilidad del evento A U B)
b. Cul es la probabilidad de que el individuo elegido no tenga ninguna de esas tarjetas?
c. Describa, en trminos de A y B, el evento de que el alumno seleccionado tenga una tarjeta
Visa, pero no una MasterCard, y luego calcule la probabilidad de este evento.

83

84

PROBABILIDAD CONDICIONAL
Cuando se defini las probabilidades, en cualquiera de sus enfoques, se relacion a todo el espacio
muestral y utilizamos el smbolo P(A) para denotar la probabilidad de estos eventos; podramos
haber usado el smbolo P(A/), que se lee probabilidad del evento A dado que ha ocurrido .

Frecuentemente estamos interesados en obtener la probabilidad de un evento, donde dicho evento


est condicionado a la ocurrencia de un subconjunto del espacio muestral. Es decir, se da que el
evento B ha ocurrido, y se quiere saber la probabilidad que ocurra el evento A.
Se dice que ya ha ocurrido B, entonces se tiene que el espacio muestral se ha restringido al
subconjunto B.
Por lo tanto sera razonable definir la probabilidad del evento A dado que ha ocurrido B la cual se
denota por P(A/B)

De la misma manera como se hubiera expresado la P(A) como una probabilidad condicional.

Ejemplo:
Si se lanza un dado, cul es la probabilidad de que se observe un nmero impar, dado que el
nmero que ha salido es mayor que 3?
A: se observa un nmero impar
A = {1, 3, 5}
B: se observa un nmero mayor que 3
B = {4, 5, 6}

85
Del grfico adjunto se calculan algunas probabilidades
P(AB) = 1/6 y P(B) = 3/6
Reemplazando en:

Ejemplo:
Una revista especializada en asuntos polticos realiz una encuesta sociolgica acerca de la actitud
poltica (progresista o conservadora), realizada a 375 universitarios de ambos sexos, las cuales estn
registradas en la siguiente tabla.

Cul es la probabilidad de que al seleccionar a uno de los universitarios sea progresista dado que se
sabe que es varn?

REGLA DE MULTIPLICACIN
De la definicin de probabilidad condicional, obtenemos una frmula para hallar la probabilidad de
la interseccin de dos eventos.

Ejemplo:
Una urna contiene 5 bolas rojas y 6 negras; se extraen al azar sucesivamente y sin reposicin dos
bolas, cul es la probabilidad de que las dos resulten rojas?

86

La probabilidad pedida es la del evento E.

E = AB

Entonces P(E) = P(AB) = P(A)P(B/A)


El siguiente paso ser calcular P(A) y P(B/A)

Con estas probabilidades tenemos la probabilidad del evento pedido.

TEOREMA Si A, B y C son eventos en , entonces P(ABC) = P(A) P(B/A) P(C/AB)

PARTICIN DE UN ESPACIO MUESTRAL


Se dice que la coleccin de eventos B1, B2, B3,BK del espacio muestral representa una particin del
muestral , si cumple las siguientes condiciones:
a) Los eventos B1, B2, B3,BK son mutuamente excluyentes Bi Bj = i j i,j=1,2,3 k
b) Los eventos B1, B2, B3,BK son colectivamente exhaustivos

TEOREMA PROBABILIDAD TOTAL


Sean B1, B2, B3,BK una particin del espacio muestral , entonces para cualquier evento A en , se
cumple:

87

Ejemplo:
En un criadero de aves se tienen palomas de color blanco y negro, adems se tienen tres jaulas. En la
jaula 1 hay dos palomas negras y tres blancas, en la jaula 2 cuatro palomas negras y dos blancas y en
la jaula 3 cinco negras y cinco blancas. Se selecciona al azar una jaula y se saca una paloma al azar de
esta jaula. Cul es la probabilidad que la paloma escogida sea blanca?

El espacio muestral est dado por las palomas de las tres jaulas y estas forman una particin del
espacio muestral.
= B 1 U B2 U B3
Adems A = B1A U B2A U B3A, entonces por el teorema de probabilidad total
P(A) = P(B1)P(A/B1) + P(B2)P(A/B2) + P(B3)P(A/B3)
Como se tiene que escoger una jaula al azar, las tres jaulas tienen la misma posibilidad de ser
seleccionadas, entonces P(B1) = P(B2) = P(B3) = 1/3

Si se selecciona la jaula I : P(A/B1) = 3/5


Si se selecciona la jaula II : P(A/B2) = 2/6
Si se selecciona la jaula III : P(A/B3) = 5/10

Reemplazando en el teorema de la probabilidad total


P(A) = P(B1)P(A/B1) + P(B2)P(A/B2) + P(B3)P(A/B3)

Supongamos ahora que la paloma elegida aleatoriamente se ve que es blanco. Cul es la


probabilidad que provenga de la jaula I?

88
Para responder a ello debemos calcular P(B1/A)

El P(A) ya lo calculamos por la probabilidad total y reemplazando los valores, se tiene:

TEOREMA DE BAYES
Si los eventos B1, B2, B3,BK forman una particin del espacio muestral y A es un evento cualquiera
de , entonces:
para r = 1, 2, 3 k

Ejemplo:
La probabilidad de que un autobs que va del Callao a Chosica sufra un accidente en un da lluvioso
es del 9% y en da seco del 0.5%. Durante un perodo de 10 das ha habido 7 das secos y 3 lluviosos.
Sabiendo que se ha producido un accidente en esos das cul ser la probabilidad de que haya
ocurrido un accidente: a) en da lluvioso, b) en da soleado?

a) En da lluvioso

89

b) En da soleado

EVENTOS INDEPENDIENTES
En los ejemplos, sola suceder que P(A/B) era distinta a la probabilidad P(A), indicacin de que la
informacin ocurri B produjo un cambio en la probabilidad de la ocurrencia de A. Sin embargo,
hay otras situaciones en las que la probabilidad de que ocurra, o ya haya ocurrido, A no resulta
afectada si se sabe que ocurri B, as que P(A/B) = P(A). Entonces es natural pensar en A y B como
eventos independientes, lo que significa que la ocurrencia o no ocurrencia de un evento no tiene
nada que ver con la probabilidad de que ocurra el otro.
En conclusin:

Dos eventos A y B, se dice que son independientes cuando se cumple que:


P(B|A) = P(B)

P(A|B) = P(A)

Cuando dos eventos son independientes la probabilidad de su interseccin es igual al


producto de las probabilidades de cada uno de ellos.
A y B independientes P(AB) = P(A)P(B)

Ejemplo
Se sabe que 30% de las lavadoras de cierta compaa requieren servicio mientras est vigente la
garanta, en tanto que slo 10% de sus secadoras necesitan este servicio. Si alguien compra una
lavadora y una secadora de esta compaa, cul es la probabilidad de que ambas mquinas
requieran servicio de garanta?
Sea A el evento en el cual la lavadora necesite servicio mientras est vigente la garanta y sea B el
evento definido de manera anloga para la secadora. Entonces, P(A) = 0.30 y P(B) = 0.10. Suponiendo
que las dos mquinas funcionan de modo independiente, la probabilidad deseada es
P(A B) = P(A) P(B) = (0.30) (0.10) = 0.03
La probabilidad de que ninguna mquina requiera servicio es
P(A B) = P(A) P(B) = (0.70) (0.90) = 0.63

90
EJERCICIOS
1.- Un gato persigue a un ratn. Este puede entrar en uno de los callejones A, B o C. La probabilidad
de que elija cada uno de ellos es del 30%, 50% y 20%, respectivamente. Y de que sea cazado en cada
uno de ellos del 40%, 60% y 10% respectivamente. Calcula la probabilidad de que el gato cace al
ratn. (prob total)

2.- Supongamos, siguiendo con el ejercicio anterior, que vemos al gato perseguir al ratn. Al poco
rato llega con l en la boca, en cul de los tres caminos es ms probable que lo haya cazado?
(bayes)

91
3.- Una comercializadora de ventas de automviles usados ofrece tres tipos de marca de autos. De
las ventas el 50% son de la marca 1, 30% son de la marca 2 y 20% de la marca 3. Cada fabricante
ofrece un ao de garanta en los repuestos y servicio tcnico. Se sabe que 25% de los autos de la
marca 1 requieren garanta, en tanto que los porcentajes correspondientes para las marcas 2 y 3 son
20% y 10% respectivamente. Cul es la probabilidad de que un comprador elegido al azar tenga un
auto que requiera reparacin mientras est en garanta? (prob total)

4.- El 20 % de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de
los ingenieros ocupan un puesto directivo y el 50 % de los economistas tambin, mientras que de los
no ingenieros y no economistas solamente el 20 % ocupan un puesto directivo. Cul es la
probabilidad de que un directivo elegido al azar sea ingeniero? (bayes)

92
5.- Un jugador de baloncesto suele acertar el 75 % de sus tiros desde el punto de lanzamiento de
personales. Si acierta el primer tiro, puede tirar de nuevo a canasta. Calcula la probabilidad de que:
a) haga dos puntos b) haga un punto c) no haga ningn punto (princ de multiplicac)

6.- En una empresa hay 200 empleados: 100 hombres y 100 mujeres. Los fumadores son 40 hombres
y 35 mujeres. Determina las probabilidades P(Mujer/Fumador) y P(Fumador/Mujer) (prob. condic)

93

7.- Una compaa de prospeccin petrolera tiene dos proyectos activos, uno en Asia y otro en
Europa. Sea A el evento donde el proyecto asitico tiene xito y B el evento donde el proyecto
europeo sea exitoso. Suponga que A y B son eventos independientes con P(A) = 0.4 y P(B) = 0.7.
a. Si fracasa el proyecto asitico, cul es la probabilidad de que tambin fracase el proyecto
europeo? Explique su razonamiento.
b. Cul es la probabilidad de que por lo menos uno de los proyectos tenga xito?
c. Dado que por lo menos uno de los dos proyectos es exitoso, Cul es la probabilidad de que
slo el proyecto asitico tenga xito?

94

DISTRIBUCIN DE PROBABILIDADES
Una distribucin de probabilidades muestra los posibles resultados de un experimento y la
probabilidad de que cada uno se presente.
Ejemplo:
Suponga que le interesa el nmero de caras que aparecen en tres lanzamientos de una moneda.
Los posibles resultados son:

Este experimento se esquematiza en la siguiente tabla:

De la tabla obtenemos la distribucin de probabilidad.

A la distribucin de probabilidades tambin se le puede acompaar de un grfico, de esta manera se


puede analizar mejor dicho experimento aleatorio.

95

Caractersticas de una distribucin de probabilidad


1. La probabilidad de un resultado en particular se encuentra entre 0 y 1.
2. Los resultados son mutuamente excluyentes.
3. La lista es colectivamente exhaustiva. As, la suma de las probabilidades de los diversos
eventos es igual a 1.
Algunos experimentos aleatorios dan origen a resultados de ndole cuantitativa (estatura, peso o
nmero de hijos de una familia); otros dan origen a resultados de naturaleza cualitativa (estado civil,
creencia religiosa, gnero, etc.) A los atributos de este tipo de variables se les puede asignar un
nmero, por ejemplo en el caso de gnero (masculino: 1 y femenino: 2)
Cada valor de la variable aleatoria se relaciona con una probabilidad que indica la posibilidad de un
resultado determinado.
VARIABLE ALEATORIA
Cantidad que resulta de un experimento que, por azar, puede adoptar diferentes valores. A
continuacin algunas situaciones.
Si se cuenta el nmero de alumnos ausente a la clase de estadstica, el nmero puede ser 0,
1, 2, 3 El nmero de ausencias es una variable aleatoria.
Si se pesan lingotes de oro, los pesos pueden ser 2453 libras, 2456 libras, 2500 libras, etc. El
peso es una variable aleatoria.
El nmero de focos defectuosos que se puedan contar en una caja de 1000 de estas.
El nmero de taxis que llegan a la estacin del aeropuerto Jorge Chvez al cabo de una hora.
Variable aleatoria discreta.- Es aquella que slo adopta valores claramente separados. Este tipo de
variables pueden asumir cualquier nmero finito de valores o una sucesin infinita de valores como
0, 1, 2,
Por ejemplo
Si hay 100 empleados en una empresa, el recuento de la cantidad de ausentes el lunes slo
puede ser 0, 1, 2, 3, 100
Nmero de automviles que pasarn por las casetas del pago de peaje en la panamericana
sur un fin de semana: 0, 1, 2, 3,

96
Variable aleatoria continua.- Estas pueden tomar una infinidad de valores, con ciertas limitaciones.
Por ejemplo
Si se mide algo, como la anchura de una pizarra, la estatura de una persona o la presin de la
llanta de un automvil.
Los tiempos de vuelos comerciales de Lima al Cusco pueden ser 1.02 horas, 0.987 horas,
1.012 horas, etc. La variable aleatoria es la cantidad de horas.

DISTRIBUCIN DE PROBABILIDAD DISCRETA


Para el caso de una variable aleatoria discreta x, la distribucin de probabilidad se define por medio
de una funcin de probabilidad, denotada por f(x). La funcin de probabilidad proporciona la
probabilidad para cada valor que puede asumir la variable aleatoria discreta.
Consideremos el ejemplo anterior (nmero de caras que aparecen en tres lanzamientos de una
moneda) para poder ilustrar mejor lo explicado:

Nota: En algunos textos la funcin de probabilidad tambin lo denota con P(x).

Media
Constituye un valor tpico para representar la localizacin central de una distribucin de
probabilidad. Alternativamente se podra decir que es un valor promedio de la larga duracin de una
variable aleatoria. Es tambin conocida como valor esperado.
Se trata del promedio ponderado en el que los posibles valores de una variable aleatoria se ponderan
con sus correspondientes probabilidades de ocurrir.

Donde P(x) es la probabilidad de un valor particular x.


Nota.- La media o valor esperado tambin de denota por E(x). Es decir = E(x).

97
Varianza y desviacin estndar
Describe el grado de dispersin en una distribucin de probabilidades.

La desviacin estndar se determina al extraer la raz cuadrada de la varianza.


Nota.- Una alternativa al clculo de la varianza es: 2 = E(x2) [E(x)]2
Ejemplo:
Luis Snchez vende automviles en Maquinarias S.A. Luis sabe que el da de mayores ventas son los
das sbados. Con la experiencia en ventas que tiene llega a elaborar la distribucin de
probabilidades de la cantidad de automviles que espera vender un sbado determinado.

De qu tipo de distribucin de probabilidades se trata?


Si la variable aleatoria es el nmero de automviles vendidos, entonces se trata de una distribucin
de probabilidades discreta.
Cuntos automviles espera vender Luis un sbado normal?
Para ello se debe calcular la media de la distribucin de probabilidades, es decir el valor esperado.

Interpretaciones:

Este valor indica que, a lo largo de una gran cantidad de sbados, Luis espera vender un
promedio de 2.1 automviles un sbado cualquiera.
Si Luis trabaja 10 sbados en un ao, puede esperar vender (10)(2.1) 21 automviles solo
los sbados.

Cul es la varianza de la distribucin?


Haciendo uso de la tabla, se sistematizan los mtodos para el clculo de la varianza.

98

La desviacin estndar:

Interpretacin:

Si su compaero Jos ngeles tiene el mismo promedio de venta los das sbados (2.1) y una
desviacin estndar de 1.830 automviles, concluiramos que hay ms variabilidad en las
ventas sabatinas de Jos que en las ventas de Luis (1.830 > 1.136).

99
EJERCICIOS
1.- Dada una variable aleatoria donde su distribucin de probabilidades est dada por la siguiente
tabla:
x
P(x)
0,25
3
0,50
6
0,25
9
Calcule el valor esperado, la varianza y la desviacin estndar de x, es decir E(x), 2 y .

2.- Se presenta la distribucin de probabilidad para la variable aleatoria x.


x
20
25
30
35

P(x)
0,20
0,15
0,25
0,40

a. Es vlida esta distribucin de probabilidad? Explique por qu.


b. Qu probabilidad existe de que x sea menor o igual a 25?
c. Cul es la probabilidad de que x sea mayor que 30?

100
3.- Una prestigiosa universidad realiz un estudio acerca de la cantidad de veces que postularon sus
alumnos hasta ingresar a la universidad. Dicho estudio se realiz el 2013 y la universidad contaba con
4000 alumnos. La informacin se muestra en la siguiente tabla.
Nmero de Nmero de
veces
estudiantes
309
1
1203
2
2017
3
348
4
123
5

a. Sea X una variable aleatoria de indica el nmero de veces que postul el estudiante hasta
ingresar a la universidad. Muestre la distribucin de probabilidades de esta variable
aleatoria.
b. Cul es la probabilidad de que el alumno haya ingresado luego de 4 intentos?
c. Calcule el valor esperado e interprete, luego obtenga el coeficiente de variacin.

101

DISTRIBUCIN BINOMIAL
En el mbito profesional tenemos muchas situaciones donde se espera que ocurra o no un evento
especfico. ste puede ser de xito o fracaso sin dar paso a un punto medio. Por ejemplo, en la
produccin de un artculo, ste puede salir bueno o malo. Casi bueno no es un resultado de inters.
Para situaciones como stas se utiliza la distribucin binomial.
ENSAYO DE BERNOULLI
Es cualquier ensayo de algn experimento que conduce slo a uno de dos resultados mutuamente
excluyentes.
Ejemplo:

Vivo o muerto
Enfermo o saludable
Positivo o negativo
Ganar o perder
.
.

De una sucesin de ensayos de Bernoulli se obtiene la distribucin binomial.


La formacin de un proceso de Bernoulli se efecta bajo las siguientes condiciones.
1. Se tiene un nmero finito de ensayos.
2. Cada ensayo conduce a uno de dos resultados mutuamente excluyentes. Uno de los
resultados posibles se denomina (arbitrariamente) xito y el otro fracaso.
3. La probabilidad de xito, representada por p, permanece constante de ensayo a ensayo. La
probabilidad de fracaso es (1-p) que tambin se representar por q.
4. Los resultados son independientes, es decir, el resultado de cualquier ensayo particular no es
afectado por el resultado del otro ensayo.

CLCULO DE PROBABILIDADES CON LA DISTRIBUCIN BINOMIAL


Al estudiar la distribucin binomial se tiene inters en calcular la probabilidad de obtener k xitos de
un total de n ensayos de Bernoulli.
FUNCIN DE DENSIDAD DE PROBABILIDAD BINOMIAL

Donde:

P(X = k): Es la probabilidad de k xitos en n ensayos.


X: es la variable aleatoria.
n: nmero de ensayos de Bernoulli.
p: probabilidad de xito en un ensayo (q = 1-p)

102
k: nmero de xitos. k = 0, 1, 2, 3,,n

La distribucin binomial presenta dos parmetros: n y p. En algunas ocasiones se representa de la


siguiente manera: binomial (n,p)

Esperanza: E(X) = np
Varianza: Var(X) = npq

EJERCICIO
Erick y Jos se ponen a apostar jugando con dados. Erick dice que si al lanzar el dado 10 veces y
obtiene 3 veces el nmero 5, Jos le pagara S/. 50, caso contrario Erick pagar la misma cantidad a
Jos Cul es la probabilidad que gane Erick?
Resolucin
Primero, en cada lanzamiento la probabilidad de que Erick obtenga un 5 es 1/6 la cual podramos
representar con p = 1/6 como la probabilidad de xito.
Los lanzamientos que se realizan son independientes y adems la probabilidad de xito permanece
constante. Con esas caractersticas del experimento aleatorio podramos decir que cumple las
condiciones de la distribucin de probabilidades binomial.
Tenemos:
p=1/6 (probabilidad de xito)
n= 10 (nmero de lanzamientos)
k=3 (nmero de xitos requeridos para ganar el juego)

EJERCICIO
Un estudiante, que no asiste frecuentemente a clase, queda sorprendido y muy preocupado al
enterarse que ese da es el examen parcial. El examen consta de 8 preguntas y cada pregunta tiene 3
alternativas de opcin mltiple. Lo nico que le queda a este estudiante es adivinar la alternativa
correcta en cada pregunta. Si para aprobar el examen tiene que responder 5 ms preguntas
correctamente. Cul es la probabilidad de que este estudiante apruebe el examen?
Resolucin
La probabilidad de xito en cada pregunta es: p = 1/3 Dado que son ocho preguntas, entonces n=8 y
para aprobar el examen se necesita como mnimo responder correctamente 5 preguntas de las 8,
entonces se tiene que k = 5, 6, 7 y 8.

103
Nos piden:

La probabilidad de aprobar el examen es de 0.08755

104
EJERCICIOS
1.- Un jugador de tenis tiene 2/3 de probabilidad de ganar. Si se jug 4 partidos, donde cada juego es
independiente de los dems. Hallar la probabilidad que gane 2 partidos.

2.- El gerente de produccin de la compaa record se encuentra realizando una revisin mensual de
la produccin de ollas. Se eligi 10 ollas a la vez y se observa si tiene defectos de fabricacin. Se
conoce que el 2% de la produccin de ollas tiene defectos.
a. Cul es la probabilidad de que en la muestra contenga ms de 2 ollas en defectos de
fbrica?
b. Cul es la probabilidad que ninguna olla en la muestra tenga defectos de fbrica?

105
3.- En una oficina de servicio al cliente se atienden a 100 personas diarias. Por lo general 10 personas
se van sin recibir bien el servicio. Determine la probabilidad de que en una encuesta a 15 clientes 3
no hayan recibido un buen servicio.

4.- El 70% de los ejecutivos que asisten a una reunin de directorio llevan una laptop. Si en un
directorio se renen 10 ejecutivos.
a. Calcule la probabilidad de que al menos tres ejecutivos no lleven su laptop.
b. Cul es el nmero esperado de laptops que llevarn los ejecutivos a la reunin?

106
5.- Una empresa cuando postula a un contrato tiene 1/4 de probabilidad de ganar. Si la empresa
postula a 6 contratos.
a. Cul es la probabilidad que gane ms de 3 contratos?
b. Calcule cuantos contratos espera ganar.

107

DISTRIBUCIN DE POISSON
La distribucin de Poisson debe su nombre al matemtico francs Simen Denis Poisson (1781-1840),
aunque ya haba sido introducida en 1718 por Abraham De Moivre (1667-1754) como una forma
lmite de la distribucin binomial que surge cuando se observa un evento raro despus de un nmero
grande de repeticiones. Ms adelante se detallar dicho lmite o aproximacin a la distribucin
binomial.
La distribucin de Poisson tambin surge cuando un evento o suceso raro ocurre aleatoriamente
en el espacio o el tiempo. La variable asociada es el nmero de ocurrencias del evento en un
intervalo o espacio continuo, por tanto, es una variable aleatoria discreta que toma valores enteros
no negativos (0, 1, 2,...)
El concepto de evento raro o poco frecuente debe ser entendido en el sentido de que la
probabilidad de observar k eventos decrece rpidamente a medida que k aumenta.
UTILIDAD
1. La distribucin de Poisson se utiliza en situaciones donde los sucesos son impredecibles o de
ocurrencia aleatoria. En otras palabras no se sabe el total de posibles resultados.
2. Permite determinar la probabilidad de ocurrencia de un suceso con resultado discreto.
3. Es muy til cuando la muestra o segmento n es grande y la probabilidad de xitos p es
pequea.
4. Se utiliza cuando la probabilidad del evento que nos interesa se distribuye dentro de un
segmento n dado como por ejemplo: distancia, rea, volumen o tiempo definido.
Ejemplos:

La llegada de un cliente al negocio durante una hora.


Las llamadas telefnicas que se reciben en un da.
Los defectos en manufactura de papel por cada metro producido.
Los envases llenados fuera de los lmites por cada 100 galones de producto terminado.
Nmero de fallas en la superficie de una cermica rectangular.
Nmero de bacterias en un volumen de un m3 de agua.
Nmero de accidentes de trabajo que ocurren en una fbrica durante una semana.
El nmero de llamadas que recibe un servicio de atencin a urgencias durante 1 hora.
El nmero de glbulos blancos en un milmetro cbico de sangre.

CONDICIONES
Para que una variable siga una distribucin de Poisson deben cumplir las siguientes condiciones:
1. En un intervalo muy pequeo (p. e. de un milisegundo) la probabilidad de que ocurra un
evento es proporcional al tamao del intervalo.
2. La probabilidad de que ocurran dos o ms eventos en un intervalo muy pequeo es tan
reducida que, a efectos prcticos, se puede considerar nula.
3. El nmero de ocurrencias en un intervalo pequeo no depende de lo que ocurra en cualquier
otro intervalo pequeo que no se solape con aqul.
Estas propiedades pueden resumirse en que el proceso que genera una distribucin de Poisson es
estable (produce, a largo plazo, un nmero medio de sucesos constante por unidad de observacin) y

108
no tiene memoria (conocer el nmero de sucesos en un intervalo no ayuda a predecir el nmero de
sucesos en el siguiente).
FUNCIN DE PROBABILIDAD DE LA DISTRIBUCIN DE POISSON

Donde:

P(X=k): Es la probabilidad de ocurrencia cuando la variable discreta X toma un valor finito k.


: Nmero promedio de ocurrencias esperadas por unidad de tiempo o de espacio.
e: Tiene un valor aproximado de 2.71828183
k: Es el nmero de ocurrencias; k = 0, 1, 2, 3,

Nota.- El parmetro de la distribucin, , se le conoce tambin como la tasa de ocurrencia del


fenmeno que se observa.

Esperanza: E(x) =
Varianza: Var (x) =

La distribucin de Poisson de parmetro se puede utilizar como una aproximacin de la Binomial


(n; p), si el nmero de pruebas n es grande, pero la probabilidad de xito p es pequea, siendo = np;
podemos considerar que la aproximacin Poisson-binomial es buena si n 20 y p 0,05 y muy
buena si n 100 y p 0,01.
EJERCICIO
La gerencia de un banco desea conocer informacin relacionado con la cantidad de personas que se
acercan a retirar dinero de uno de sus cajeros automticos un mircoles por la maana. Si se tiene
informacin que el nmero promedio de personas que llegan al cajero en un periodo de 15 minutos
es 10. Cul es la probabilidad de que 5 personas lleguen al cajero en un periodo de 15 minutos?
Resolucin
En este caso la probabilidad pedida es para un periodo de 15 minutos que coincide con la
informacin que se tiene (un promedio de 10 personas en un periodo de 15 minutos) por lo tanto
tomaremos = 10 y k = 5. Reemplazando en la distribucin de probabilidad Poisson.

La probabilidad de que 5 personas lleguen al cajero en un periodo de 15 minutos es de 0,0378


Siguiendo el ejercicio anterior Cul es la probabilidad que llegue al cajero una persona en un
periodo de 3 minutos?
En este caso sera un error tomar el =10, porque la pregunta es para un periodo de 3 minutos
(antes era de 15 minutos)

109
Para calcular dicha probabilidad se tendra que calcular el nuevo valor de , esto se podra hacer
mediante una regla de tres simples.

En este caso el nmero promedio de personas que llegan al cajero en un periodo de 3 minutos es 2,
es decir = 2.
A la pregunta Cul es la probabilidad que llegue al cajero una persona en un periodo de 3 minutos?
Se tiene que k = 1 y = 2.

La probabilidad que llegue al cajero una persona en un periodo de 3 minutos es de 0,271


EJERCICIO
A una empresa de peajes le interesa saber de defectos importantes un mes despus de
repavimentarla. Si la empresa tiene informacin que la cantidad de defectos importantes ocurre con
una tasa media de 2 por 5 kilometro de autopista. Cul es la probabilidad de no encontrar ningn
defecto en un kilometro de autopista?
Resolucin

En este caso el nmero de defectos en la autopista por cada kilmetro es de 2/5, es decir = 2/5.
Entonces la probabilidad de no encontrar ningn defecto en un kilmetro de autopista se calcula con
k = 0 y = 2/5

EJERCICIO
La probabilidad de que haya un accidente en una compaa de manufactura es de 0,02 por cada da
de trabajo. Si se trabajan 300 das al ao. Cul es la probabilidad de tener 3 accidentes al ao?
Resolucin
En este caso dicha probabilidad se puede calcular con la distribucin binomial con parmetros p =
0,02 y n = 300 como nos piden 3 accidentes al ao, entonces k = 3.

110

Para hacer uso de la aproximacin Poisson-binomial se debe verificar ciertas condiciones: p=0,02
0,05 y n=300 20 podramos decir que la aproximacin ser buena.
Calculamos la probabilidad mediante la distribucin Poisson, para ello el parmetro lo calculamos
como = n*p = 300*0,02 = 6

Nota: como se puede ver la diferencia (0,0883 vs 0,0892) es por milsimas.

111
EJERCICIOS
1.- Al departamento de reservaciones de cierta Aerolnea llegan en promedio 30 llamadas por hora.
a. Cul es la probabilidad de recibir 3 llamadas en un intervalo de 5 minutos?
b. Cul es la probabilidad de no recibir llamada alguna en un intervalo de 2 minutos?

2.- En una academia, las llamadas entran con una frecuencia de una cada dos minutos. Cul es la
probabilidad de recibir 3 llamadas en 5 minutos? y Cuntas llamadas se espera recibir en 30
minutos?

3.- El nmero promedio de camiones que transporta azcar que llegan a un puerto del norte del pas
es de 3 por hora. Las instalaciones del puerto pueden atender cuando mucho a 4 camiones por hora.
Cul es la probabilidad de que en una hora determinada se tenga que regresar los camiones?

112

4.- Se supone que el nmero de defectos en tela de una determinada fbrica de produccin es de
0,15 por metro cuadrado:
a. Calcular la probabilidad de tener 3 defectos en un metro cuadrado.
b. Calcular la probabilidad de tener 1 defecto en cinco metros cuadrados.
c. Calcular la probabilidad de que no haya defectos en 8 metros cuadrados.

113
5.- Un ingeniero que labora en el departamento de control de calidad de una empresa elctrica,
inspecciona una muestra al azar de 200 alternadores de un lote. Si el 2% de los alternadores del lote
estn defectuosos. Cul es la probabilidad de que en la muestra, menos de tres estn con defectos?

114

DISTRIBUCIN HIPERGEOMTRICA
La distribucin Hipergeomtrica surge en situaciones en donde el modelo aproximado de
probabilidad se corresponde con muestreo sin reemplazamiento de una poblacin dicotmica (xito
y Fracaso) finita. Concretamente, las suposiciones que llevan a considerar esta distribucin son:
La poblacin o conjunto de donde deba hacerse el muestreo consta de N individuos o
elementos a seleccionar.
Cada individuo puede ser caracterizado como un xito (E) o fracaso (F).
Se selecciona una muestra de n individuos entre los r individuos marcados como xito y los
(N r) restantes marcados como fracaso.

La diferencia entre la distribucin binomial y la distribucin hipergeomtrica est en la forma en que


se realiza el muestreo. En el caso de la binomial se requiere independencia entre las pruebas, es
decir, el muestreo se realiza con reemplazamiento. Por otro lado, la distribucin hipergeomtrica no
requiere independencia y el muestreo se realiza sin reemplazamiento. Las aplicaciones de la
distribucin hipergeomtrica se encuentran en muchas reas, con gran uso en control de calidad.
Una variable aleatoria X tiene una distribucin Hipergeomtrica, si X representa: El nmero de
individuos de un total de n con cierta caracterstica (xito) si en N hay un total de r"
FUNCIN DE PROBABILIDAD DE LA DISTRIBUCIN HIPERGEOMTRICA

Para k = 0, 1, 2,. . . , n

k r

nk N-r

La distribucin hipergeomtrica presenta tres parmetros: N, r y n. En algunas ocasiones se


representa de la siguiente manera: X H (N, r, n)

Esperanza:

Varianza:

115
EJERCICIO
Un fabricante de dispositivos elctricos para automviles los empaqueta en lotes de 25. El
comprador los inspecciona tomando 3 dispositivos y acepta un lote si encuentra menos de dos
dispositivos defectuosos.
a. Calcular la probabilidad de que el comprador acepte un lote con 6 dispositivos defectuosos.
b. Cul es el nmero esperado y la varianza de los dispositivos defectuosos en los 3 inspeccionados?
Resolucin
Se tiene un conjunto de N = 25 dispositivos, en los que hay r = 6 defectuosos, y N r = 19 no
defectuosos. Extraemos n = 3 sin reemplazo. Considerando la variable aleatoria: X = numero de
dispositivos defectuosos en los 3 seleccionados

X H (N = 25, r = 6, n = 3)

116
EJERCICIOS
1.- Como parte de un estudio de la contaminacin del aire, un inspector decide examinar la emisin
de gases de seis de los 24 camiones de carga de una compaa. Si cuatro de los camiones de la
compaa emiten cantidades excesivas de contaminantes, Cul es la probabilidad de que ninguno
de ellos sea incluido en la muestra del inspector?

2.- Entre los 120 aspirantes para ocupar un empleo, slo 80 estn realmente calificados para hacerlo.
Si se selecciona al azar cinco de estos aspirantes (uno despus de otro) para realizar una entrevista a
fondo, determine la probabilidad de que dos de los cinco estn para el trabajo.

117
3.- Un ingeniero de control de calidad inspecciona una muestra tomada al azar de dos bateras para
laptops de cada lote de 18 unidades que llega y acepta el lote si ambas estn en buenas condiciones
de funcionamiento; en caso contrario, se inspecciona todo el lote y el costo se carga al distribuidor.
Cules son las probabilidades de que este lote sea aceptado sin mayor inspeccin si contiene
a.- tres bateras que no estn en buenas condiciones de funcionamiento.
b.- Once de las bateras en malas condiciones de funcionamiento?

4.- Cul es la probabilidad de que un auditor fiscal halle slo dos declaraciones de impuestos sobre
la renta con deducciones ilegtimas, si selecciona al azar cinco declaraciones de entre 15 de las cuales
nueve contienen deducciones ilegtimas?

118

DISTRIBUCIN DE PROBABILIDAD CONTINUA


La diferencia fundamental entre las variables aleatorias discretas y las continuas radica en la manera
de calcular las probabilidades. Para las primeras, la funcin de probabilidad f(x) proporciona la
probabilidad de que la variable aleatoria asuma un valor particular. Con las segundas, el homlogo de
la funcin de probabilidad es la funcin de densidad de probabilidad, que tambin se denota por
f(x). La diferencia estriba en que la funcin de densidad de probabilidad no proporciona las
probabilidades directamente. Sin embargo, el rea bajo la grfica f(x) que corresponde a un
intervalo dado representa la probabilidad de que la variable aleatoria continua x asuma un valor
dentro de ese intervalo. Esto es, que las probabilidades se obtendrn en su mayora haciendo uso de
las integrales (siempre y cuando estas existan)

Para cualquier constante real a y b con a b


Nota: Siendo f(x) una funcin de distribucin de probabilidad, entonces se debe cumplir que

PROPIEDAD
Si x es una variable aleatoria continua, adems a y b son dos constantes reales con a b, entonces

P(a x b) = P(a x < b) = P(a < x b) = P(a < x < b)

EJEMPLO APLICATIVO
El recorrido (en miles de kilmetros) de los neumticos hasta que
se desgaste el dibujo es una variable aleatoria cuya funcin de
densidad de probabilidad est dada por

Obtenga la probabilidad de que uno de estos neumticos se desgastar cuando mucho a 19 000 km.
Resolucin
Lo que nos piden es: P (0 < x 19)

119

ESPERANZA O VALOR ESPERADO


En el caso de variables aleatorias continuas la esperanza se calcula de la siguiente manera:

Nota.- El clculo de la varianza se podr calcular mediante 2 = E(x2) [E(x)]2

DISTRIBUCIN DE PROBABILIDAD UNIFORME


Consideremos la variable aleatoria x que representa el tiempo de vuelo de un avin que viaja de
Lima al Cusco. Supngase que este tiempo puede ser cualquier valor en el intervalo de 60 y 80
minutos. Dado que la variable aleatoria puede asumir cualquier valor en ese intervalo, x es una
variable aleatoria continua.

Supongamos adems que se cuenta con suficientes datos reales sobre los vuelos para concluir que la
probabilidad de que el tiempo de vuelo est dentro de cualquier intervalo de 1 minuto es igual a la
probabilidad de que est dentro de cualquier otro intervalo de 1 minuto contenido dentro del
intervalo de 60 a 80 minutos. Como cada intervalo de 1 minuto es igualmente probable, se dice que
la variable aleatoria x tiene una probabilidad de distribucin uniforme.
La funcin de densidad de probabilidad, que define la distribucin uniforme para la variable
aleatoria del tiempo de vuelo es:

120
Definida la funcin de densidad de probabilidad podramos decir que es una funcin constante
(uniforme) en el intervalo de 60 a 80, cuya grfica se representara de la siguiente forma:

EN GENERAL
FUNCIN DE DENSIDAD DE PROBABILIDAD UNIFORME

Esperanza:

Varianza:

Retomando el ejemplo anterior:


Se podra plantear la siguiente pregunta Cul es la probabilidad de que el tiempo de vuelo est
entre 65 y 70 minutos? En este caso lo que podramos hacer es usar las integrales, pero no ser
necesario (debido a la simplicidad de la funcin) ya que el rea bajo la grfica de la funcin es un
rectngulo.

La esperanza (o valor esperado) del tiempo de vuelo de Lima a Cusco es de 70 minutos.

La varianza es:

121
EJERCICIOS
1.- La funcin de densidad de probabilidad de la variable aleatoria x est dada por

Determine k y P (0.5 x 1)

2.- El retraso o adelanto (en minutos) de un vuelo de AeroLand a Lima es una variable aleatoria cuya
densidad de probabilidad est dada por

donde los valores negativos son indicativos de que el vuelo llega adelantado y los valores positivos
sealan que el vuelo llega retrasado. Determine las probabilidades de que uno de estos vuelos
llegar

122
a)
b)
c)
d)
e)

Cuando menos dos minutos antes


Cuando menos un minuto retrasado
Entre uno y tres minutos antes
Exactamente cinco minutos tarde
Calcule E(x)

3.- La variable aleatoria x est distribuida de manera uniforme entre 15 y 25.


a)
b)
c)
d)

Trace la grfica de la funcin de densidad de probabilidad.


Calcule P(x<21)
Estime P(18<x<22)
Calcule la E(x) y la Var(x)

123

4.- La distancia de lanzamiento de los 100 mejores golfistas del tour PGA est entre 284.7 y 310.6
yardas (Golfweek, 29 de marzo de 2003). Suponga que la distancia de lanzamiento de estos
deportistas est distribuida de manera uniforme a lo largo de este intervalo.
a) Proporcione una expresin matemtica para la funcin de densidad de probabilidad de la
distancia de lanzamiento.
b) Cul es la probabilidad de que la distancia de lanzamiento de uno de estos golfistas sea
menor 290 yardas?
c) Cul es la probabilidad de que esta distancia de lanzamiento sea como mnimo de 300
yardas?
d) Cul es la probabilidad de que la distancia de lanzamiento est entre 290 y 305 yardas?
e) Cuntos de estos golfistas lanzan la pelota cuando menos 290 yardas?

124

125

DISTRIBUCIN DE PROBABILIDAD EXPONENCIAL


La distribucin de probabilidad exponencial puede usarse para variables como:
El tiempo entre la llegada de un automvil a un auto lavado.

La distancia entre dos defectos importantes en una carretera.

Tiempo de espera hasta ser atendido en la ventanilla de un banco.

FUNCIN DE DENSIDAD DE PROBABILIDAD EXPONENCIAL

Esperanza:

Varianza:

126
Ejemplo:
Supongamos que x representa el tiempo de carga para un camin en el muelle Chalaco y sigue una
distribucin exponencial. Si la media, o promedio, del tiempo de carga es 20 minutos ( = 20), la
funcin de densidad de probabilidad es:

Clculo de probabilidades para la distribucin exponencial


Como en toda distribucin de probabilidad de variable continua, el rea bajo la curva
correspondiente a un intervalo, proporciona la probabilidad de que la variable aleatoria asuma un
valor en ese intervalo. Esta probabilidad, como se dijo anteriormente, se puede calcular mediante
integrales.
Se puede obtener las probabilidades exponenciales de una forma ms directa, haciendo uso de las
probabilidades acumuladas, cuya frmula est dada por:

donde x0 es un valor especifico de la variable aleatoria x.


En ejemplo, del muelle Chalaco; Si se quisiera calcular la probabilidad de que cargar un camin tarde
15 minutos o menos, se procede de la siguiente manera:

Cul es la probabilidad de que la carga del camin tarde 15 a 24 minutos?


Lo pedido se puede expresar como:

Por lo tanto, la probabilidad de que la carga del camin tarde 15 a 24 minutos es:

127
Grficamente:

RELACIN ENTRE LAS DISTRIBUCIONES DE POISSON Y EXPONENCIAL

Si la distribucin de Poisson proporciona una descripcin apropiada del nmero de


ocurrencias por intervalo, la distribucin exponencial provee una descripcin de la duracin
del intervalo entre ocurrencias.
Suponga que el nmero de automviles que llegan a un autolavado durante una hora se describe por
medio de una distribucin de probabilidad de Poisson con una media de 5 automviles por hora. La
funcin de probabilidad de Poisson que da la probabilidad de x llegadas por hora es:

Como el nmero medio de arribos es de 5 automviles por hora, el tiempo medio de los vehculos es

Por tanto, la distribucin exponencial correspondiente que describe el tiempo entre las llegadas
tiene una media de = 0.2 hora por automvil; como resultado, la funcin de densidad de
probabilidad exponencial es

128
EJERCICIOS
1.- Considere la funcin de densidad de probabilidad exponencial siguiente.

para x 0
a) Calcule P( x 3 )
b) Determine P( x 5 )
c) Calcule P( 2 x 6 )

2.- El tiempo entre las llegadas de los vehculos en la interseccin de la Av. Lima con el Jr. Junn sigue
una distribucin de probabilidad exponencial con una media de 10 segundos.
a) Cul es la probabilidad de que el tiempo de llegada entre los vehculos sea menor a 9
segundos?
b) Cul es la probabilidad de 20 ms segundos entre las llegadas de vehculos?

129

130

DISTRIBUCIN DE PROBABILIDAD NORMAL


Esta distribucin es frecuentemente utilizada en las aplicaciones estadsticas. Su propio nombre
indica su extendida utilizacin, justificada por la frecuencia o normalidad con la que ciertos
fenmenos tienden a parecerse en su comportamiento a esta distribucin.
La importancia de la distribucin normal se debe principalmente a que hay muchas variables
asociadas a fenmenos naturales que siguen el modelo de la distribucin normal.
Caracteres morfolgicos de individuos (personas, animales, plantas,...) de una especie.
Ejemplo: tallas, pesos, envergaduras, dimetros, permetros.

Caractersticas fisiolgicas, por ejemplo: efecto de una misma dosis de frmaco a distintos
pacientes, prdida de peso por alguna dieta.

Caracteres sociolgicos, ejemplo: consumo de cierto producto por un mismo grupo de


individuos, puntuacin de exmenes.

Caractersticas psicolgicas, por ejemplo: coeficiente intelectual, grado de adaptacin a un


medio, niveles de estrs.

131
FUNCIN DE DENSIDAD DE PROBABILIDAD NORMAL

Esperanza:

Varianza:

Si la variable aleatoria est asociada a una distribucin normal, se denota de la siguiente manera
X ~ N(, )

DISTRIBUCIN NORMAL ESTANDAR


La distribucin normal con media = 0 y varianza = 1 se conoce como distribucin normal
estndar y su funcin de densidad es:

Para calcular las probabilidades se tiene que integrar la funcin de densidad en un intervalo del
recorrido de la variable aleatoria.

En este caso estamos calculando la probabilidad acumulada de - hasta un valor especfico z.


Para evitar estos clculos engorrosos existen tablas que nos facilitan estos clculos.

132
TABLA DE DISTRIBUCIN NORMAL ESTNDAR
Si X N (0,1)

Ejemplos:

Cmo hacemos si se quiere calcular probabilidades de una variable aleatoria que sigue una
distribucin normal con media y varianza ?
Es decir, cuando la variable aleatoria tiene la siguiente funcin de densidad

133
En este caso a partir de la funcin de distribucin normal realizamos un artificio para que este se
pueda calcular mediante una funcin de distribucin normal estndar como ya sabemos. A este
artificio se le conoce como estandarizacin.

Ejemplo:
Sea X una variable aleatoria asociada a una distribucin normal con media 2 y varianza 9, es decir X
N(2 ; 9). Calcular la probabilidad de que la variable aleatoria sea menor o igual a 2.5 sea P(x 2,5)

EJERCICIO
El peso en Kg de los habitantes de una determinada poblacin sigue una distribucin normal de
media 72 y varianza 7. Calcule la probabilidad de que un individuo de la poblacin pese menos de 80
kg.
Resolucin: Considerando la variable aleatoria X como el peso en Kg de los habitantes de una
poblacin
Piden:

EJERCICIO
Las calificaciones del examen de ingreso a una universidad, estn distribuidos normalmente con una
media de 75 puntos y una desviacin estndar de 5 puntos. Calcular la probabilidad de que al elegir a
un alumno al azar, este haya obtenido un puntaje
a. Mayor a 82 puntos.
b. Menor a 73 puntos.
c. Entre 68 y 81 puntos.
Resolucin:
Parte a

Nos piden: P(x > 82)

134

Parte b
Nos piden: P(x < 73)

Parte c

Nos piden: P(68 < x < 81)

135
EJERCICIOS
1.- Una empresa paga a sus empleados una remuneracin promedio de 800 nuevos soles mensuales
con una desviacin estndar de 90 nuevos soles, se sabe que las remuneraciones sigue una
distribucin normal.
a. Qu porcentaje de los trabajadores reciben salarios entre 750 a menos de 900 nuevos
soles?
b. Si se llegase a seleccionar al 5% de trabajadores con mayores salarios de la empresa, de ese
grupo cul sera el menor valor salarial?

2.- Una compaa de refrescos est determinando el nivel de llenado para las nuevas mquinas
automticas. El nmero de onzas de llenado sigue una distribucin normal con una desviacin
estndar de 0.2 onzas. Cul debe ser el valor de la media que se establezca para que los envases de
ocho onzas se sobrellenen una vez en mil?

136

3.- Una empresa que fabrica focos indica a sus clientes que la duracin de focos para interiores del
hogar tiene una distribucin normal con una media de 2400 horas y desviacin estndar 100 horas. Si
una tienda comercializadora compro 2000 de estos focos. Calcule e interprete:
a. Cuntos focos duraran menos de 2000 horas?
b. Cuntos focos duraran entre 2350 y 2500 horas?

137
4.- La venta de gasolina de un grifo ubicado en la Av. Arequipa sigue una distribucin normal con un
promedio de 40 galones en una hora y con una desviacin estndar de 5,4 galones. Cul es la
probabilidad que en una hora se venda ms de 42 galones?

5.- Los promedio de las calificaciones de los alumnos de secundaria sigue una distribucin normal
con un promedio de 12 y una desviacin estndar de 1,2.
a. Calcule la probabilidad que al seleccionar un alumno tenga menos de 13 de nota.
b. Cual debe de ser la mnima calificacin aprobatoria si solamente se desea que el 60% de los
estudiantes pruebe?

138
6.- Se sabe que los gastos semanales efectuados por las familias sigue una distribucin normal con
una media de 350 nuevos soles y una desviacin estndar de 75.
a. Cuntas familias gastan menos de 300 nuevos soles?
b. Cuntas familias gastan entre 380 y 400 nuevos soles?
c. Si una familia presupuesto para la siguiente semana de 330 nuevos soles Cul es la
probabilidad de que los gastos reales sean mayores a los presupuestados?

139

APROXIMACIN NORMAL DE LAS PROBABILIDADES BINOMIALES


Recordemos que un experimento binomial consiste en una secuencia de n ensayos (de Bernoulli)
independientes, idnticos, cada uno con dos resultados posibles: un xito o fracaso, con la misma
probabilidad de xito para cada ensayo.
Cuando el nmero de ensayos es grande, es difcil evaluar la funcin de probabilidad binomial a
mano o con una calculadora. En los caso que np 5 y n(1-p) 5, la distribucin normal proporciona
una aproximacin fcil de usar de las probabilidades binomiales.
Cuando se usa la aproximacin normal a la binomial, se establece que

Ejemplo
En una empresa comercializadora de artculos de ferretera se cometen errores en el 10% de las
facturaciones realizadas, debido a la rotacin exagerada de su personal. Se tomo una muestra de
100 facturas y se quiere calcular la probabilidad de que 12 contengan errores. Es decir, se desea
determinar la probabilidad binomial de 12 xitos en 100 ensayos.
Al aplicar la aproximacin normal en este caso, se establece

Como sabemos la distribucin normal est asociada a una variable aleatoria continua y la binomial a
una discreta. Por tanto, para aproximar la probabilidad binomial de 12 xitos, se calcula el rea bajo
la curva normal correspondiente entre 11.5 y 12.5. El 0.5 que se resta y suma del 12 se llama factor
de correccin de continuidad.
El factor de correccin se debe porque se est utilizando una distribucin continua para aproximar
una distribucin discreta.
Por tanto, P(x = 12) para la distribucin binomial discreta se aproxima por P(11.5 x 12.5) para una
distribucin normal continua.

Por tanto, el rea entre 11.5 y 12.5 es 0.1052 (= 0.7967 0.6915)

140

La aproximacin normal a la probabilidad de 12 xitos en n ensayos es 0.1052


EJERCICIO
1.- Un hotel de un centro vacacional en Mncora tiene 150 habitaciones. En los meses de verano, la
ocupacin del hotel es de aproximadamente 75%.
a. Cul es la probabilidad de que por lo menos la mitad de las habitaciones est ocupada en un
da determinado?
b. Cul es la probabilidad de que 120 o ms habitaciones estn ocupadas en un da
determinado?
c. Cul es la probabilidad de que 70 o menos estn ocupadas en tal da?

141

MUESTREO
El muestreo es una herramienta de la investigacin cientfica, cuya funcin bsica es determinar que
parte de una poblacin debe examinarse, con la finalidad de hacer inferencias sobre dicha poblacin.
Se denomina censo al recuento de individuos que conforman una poblacin estadstica, definida
como un conjunto de elementos de referencia sobre el que se realizan las observaciones.

Establecer contacto con toda la poblacin requerira mucho tiempo.

El costo de estudiar todos los elementos de una poblacin resultara prohibitivo.

142

Es imposible verificar de manera fsica todos los elementos de la poblacin.

Algunas pruebas son de naturaleza destructiva.

El muestreo debe lograr una representacin adecuada de la poblacin, en la que se reproduzca de la


mejor manera los rasgos esenciales de dicha poblacin que son importantes para la investigacin.
Para que una muestra sea representativa, y por lo tanto til, debe de reflejar las similitudes y
diferencias encontradas en la poblacin, es decir ejemplificar las caractersticas de sta.

Existen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en general
pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticos y mtodos de
muestreo no probabilsticos.

143
MUESTREO PROBABILISTICO
Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamao n tienen la misma probabilidad de ser seleccionadas.
La ventaja del muestreo probabilstico estriba en que, por lo general, se identifica la distribucin de
muestreo del estadstico muestral correspondiente. La distribucin de muestreo permite plantear
afirmaciones probabilsticas acerca del error asociado con el uso de los resultados muestrales al
hacer inferencias de la poblacin.

MUESTREO ALEATORIO SIMPLE (MAS)


El muestreo aleatorio simple selecciona muestras mediante mtodos que permiten que cada posible
muestra tenga una igual probabilidad de ser seleccionada y que cada elemento de la poblacin total
tenga una oportunidad igual de ser incluido en la muestra.
Ejemplo
Se tiene un grupo de trabajo del curso de Estadstica el cual lo constituyen cuatro integrantes (A, B, C
y D), se desea seleccionar a dos de estos para la bsqueda de informacin en la biblioteca nacional.

El procedimiento para la obtencin de la muestra es la siguiente:


1.- Se asigna un nmero a cada individuo de la poblacin.

144
2.- A travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios,
nmeros aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como
sea necesario para completar el tamao de muestra requerido.
Ejemplo
A manera de ejemplo, seleccionemos una muestra a partir del listado de alumnos matriculados en el
curso.

Como se tiene la informacin de todos los alumnos del aula, podemos seleccionar a ocho estudiantes
(muestra de tamao 8) mediante MAS. Haremos uso del Excel para generar los nmeros aleatorios.

145
MUESTREO SISTEMTICO
En el muestreo sistemtico, los elementos son seleccionados de la poblacin dentro de un intervalo
uniforme que se mide con respecto al tiempo, al ordeno o al espacio.
Aun cuando este tipo de muestreo puede ser inapropiado cuando los elementos entran en un patrn
secuencial, este mtodo puede requerir menos tiempo y, algunas veces, tiene como resultado un
costo menor que el mtodo de muestreo aleatorio simple.
La obtencin de una muestra sistemtica de tamao n de una poblacin de N elementos se consigue
mediante el siguiente procedimiento.

Conseguir un listado ordenado de los N elementos de la poblacin.


Determinar el tamao muestral n.
Definir el tamao del salto sistemtico k dado por k = N/n.
Elegir un nmero aleatorio entre 1 y k ( =arranque aleatorio). Este nmero permite
obtener la primera unidad muestral.
A partir de la posicin , dando saltos de k unidades, obtendremos los elementos que
conformaran la muestra.
Ejemplo
A partir del listado de 30 alumnos, seleccionar una muestra de tamao 6 con el mtodo de muestreo
sistemtico.
Secuencia

Listado de N = 30 alumnos
Tamao de la muestra n = 6
Tamao del salto sistemtico k = 30/6 = 5
Eleccin del arranque aleatorio (entre 1 y 5, usando el MAS) = 2

146
Luego se tiene los alumnos que conforman la muestra de tamao 6.

MUESTREO ESTRATIFICADO
En el muestreo estratificado los elementos de la poblacin primero se dividen en grupos, a los que se
les llama estratos, de manera que cada elemento pertenezca a uno y slo un estrato. La base para la
formacin de los estratos, que pueden ser departamento, edad, tipo de industria etc., est a
discrecin de las personas que disea la muestra. Sin embargo, se obtienen mejores resultados
cuando los elementos que lo forman son lo ms parecido posible (homogeneidad dentro de los
estratos).
Una vez formado los estratos utilizamos uno de los dos planteamientos:
o
o

Seleccionar aleatoriamente, en cada estrato, un nmero especfico de elementos


correspondiente a la proporcin del mismo en relacin con la poblacin completa.
Extraemos el mismo nmero de elementos de cada estrato y despus ponderamos los
resultados considerando la proporcin que el estrato representa con respecto a la poblacin
total.

Supongamos que los pacientes de un mdico estn divididos en cuatro grupos de acuerdo con su
edad, como indica la tabla.

El mdico desea averiguar cuantas horas duermen sus pacientes. Para obtener una estimacin de
esta caracterstica de la poblacin, podra tomar una muestra aleatoria de cada uno de los cuatro
grupos de edades y ponderar las muestras de acuerdo con el porcentaje de pacientes en ese grupo.
Nota:
La ventaja de las muestras estratificadas es que, cuando se disean adecuadamente, reflejan de
manera ms precisa las caractersticas de la poblacin de la cual fueron elegidas, en comparacin con
otro tipo de muestras.
MUESTREO POR CONGLOMERADOS
En el muestreo por conglomerado (o clusters) los elementos de la poblacin primero se dividen en
grupos separados, llamados conglomerados o clusters. Cada elemento pertenece a uno y slo un
conglomerado. Se toma una muestra aleatoria simple de los conglomerados. Todos los elementos en
cada conglomerado muestreado forman la muestra.

147
Este muestreo tiende a proporcionar mejores resultados cuando los elementos dentro de los
conglomerados no son semejantes. Lo ideal es que cada conglomerado sea una representacin, a
pequea escala, de la poblacin completa. Si todos son semejantes en este aspecto, tomando en la
muestra un nmero pequeo de conglomerados, se obtendr una buena estimacin de los
parmetros poblacionales.
Una de las principales aplicaciones del muestreo por conglomerados es el muestreo de reas, en el
que los conglomerados son las manzanas de una ciudad u otras zonas bien definidas.

Si en una investigacin de mercado tiene la intencin de determinar por muestreo, el nmero


promedio de televisores por casa en una ciudad grande, podran usar un mapa de la ciudad para
dividir el territorio en manzanas y luego escoger un cierto nmero de stas (conglomerados) para
entrevistar a sus habitantes. Cada casa pertenecientes a cada una de estas manzanas sera
considerada para entrevistar a sus habitantes.

148
EJERCICIOS
1.- Una empresa proveedora de servicio de cable desea seleccionar una muestra de tamao 10 de
toda una manzana de la urbanizacin Miramar del distrito de San miguel, para posteriormente hacer
un estudio de mercadeo. En la tabla adjunta se tiene la informacin del nmero de televisores que
poseen en cada vivienda de la manzana.

Si usted es el encargado de esta seleccin, obtenga los vecinos que compondrn la muestra
mediante la tcnica de muestreo aleatorio simple y el sistemtico.

149
2.- Se tiene el registro de notas de los alumnos del curso de Estadstica Aplicada. Seleccione
mediante el MAS y el sistemtico una muestra de tamao 6 para luego obtener el promedio de notas
de la muestra seleccionada con ambos mtodos.

150
3.- El encargado de recursos humanos de un empresa est interesado en saber el nmero promedio
de hijos que tienen sus empleado que laboran en tres turnos (1er turno: 6am a 2pm, 2do turno: 2pm
a 10pm y 3er turno: 10pm a 6am). Mediante el muestreo estratificado, calcule dicho promedio.

151

DISTRIBUCIN DE LA MEDIA MUESTRAL


En la sesin anterior hemos obtenido muestras acerca de la estatura de los estudiantes (como indica
la tabla). Lo que pretendemos ahora es hacer una comparacin entre los valores de la media
muestral y obtener la distribucin de la media muestral.

Se observa que los valores de cada muestra difieren del valor poblacional. Y adems solo hemos
obtenido tres muestras, imaginemos obtener 100 muestras y calculamos sus medias, es de hecho
que la gran mayora de estos difieren del valor verdadero del parmetro. Si a las medias de estas 100
muestras las organizamos en una tabla de distribucin de frecuencias para luego graficarlas
mediante un Histograma de frecuencias relativas podramos sacar algunas conclusiones.

En este caso las se convierten en variables aleatorias.


Recordemos que en distintas muestras aleatorias simples se obtuvieron valores diferentes para cada
media muestral , como cada variable aleatoria puede tener muchos valores, suele ser de inters
conocer la media de todos los valores de que se obtiene con las diferentes muestras aleatorias. A
) =
la media de la variable aleatoria se conoce como valor esperado de cuya notacin es: E(
la cual se nos indica que: Se espera que el valor esperado de sea igual a la media poblacional

152
La varianza de la media muestral :
NOTA:
En el caso de que la poblacin sea finita la varianza estar dada por:
A la desviacin estndar de la media muestral tambin se le conoce como error estndar.
Es de hecho que cada caracterstica acerca de la media muestral merece una demostracin, pero
para facilitar el anlisis mostraremos un ejemplo donde se pueda verificar lo planteado.
Ejemplo:
Se tiene registro del nmero de meses que dura una llanta de bicicleta hasta antes de su primera
refaccin a cinco nios (N=5).

Por lo tanto tenemos la DISTRIBUCIN DE MUESTREO DE

Donde:
2 : varianza poblacional.
n : tamao de la muestra.
N : tamao de la poblacin.
Los resultados anteriores respecto al valor esperado y la varianza en la distribucin de muestreo de
son aplicables a cualquier poblacin. Lo que queda ahora es identificar las caractersticas de la
distribucin de muestreo, para ello consideraremos dos casos.

153
La poblacin tiene distribucin normal
En muchas situaciones es razonable suponer que la poblacin de la que se selecciona la muestra
aleatoria simple tiene una distribucin normal o casi normal. Cuando esto ocurre, la distribucin de
muestreo de est distribuida normalmente cualquiera que sea el tamao de la muestra.

La poblacin NO tiene distribucin normal

Cuando la poblacin de la que se tom la muestra aleatoria simple no tiene distribucin normal, el
teorema del lmite central ayuda a determinar la forma de la distribucin de muestreo de .
TEOREMA DE LMITE CENTRAL
Cuando se selecciona una muestra aleatoria simple de tamao n de una poblacin, la distribucin de
muestreo de la media muestral puede aproximarse a una distribucin normal a medida que el
tamao de la muestra se hace grande (n 30).

Que para fines prcticos tambin podra decirse que


distribucin normal estndar.

cuando (n ) tiende a una

Ejemplo:
En Lima el precio promedio del kilo de arroz es de S/. 3,2 con una desviacin estndar de S/. 0,4. Si
se selecciona una muestra de 100 tiendas comercializadoras de arroz. Cul es la probabilidad de que
el precio medio muestral del arroz sea menor a S/. 3,3?

154
EJERCICIOS
1.- En una muestra de 25 observaciones a partir de una distribucin normal con media 98.6 y
desviacin estndar 17.2,
< 95)
a) Determine el valor de P (
<102)
b) Calcule P (92<
> 100)
c) Halle el valor de P(

2.- Sofa Lerner, auditora de una compaa de tarjetas de crdito, sabe que el saldo promedio
mensual de un cliente dado es S/. 152 y la desviacin estndar de S/. 66. Si Sofa audita 50 cuentas
seleccionadas al azar, encuentre la probabilidad de que el saldo promedio mensual de la muestra sea
a) Menor que S/. 140
b) Entre S/. 150 y S/. 160

155

3.- El costo promedio de un departamento, segn una revista inmobiliaria, es de $ 58 000 con una
desviacin estndar de $ 4 800. Si se selecciona 35 departamentos al azar Cul es la probabilidad de
que el costo promedio sea igual o menos de $ 60 000?

156
4.- En una distribucin normal con media de 375 y desviacin estndar de 48, de qu tamao debe
tomarse una muestra para que la probabilidad sea un 0.95 de que la media de la muestra caiga entre
370 y 380?

Potrebbero piacerti anche