Sei sulla pagina 1di 100

ESTADSTICA I

Claudio lvaro Cerrn Landeo

Cada autor es responsable del contenido de su propio texto.


De esta edicin:
Universidad Continental S.A.C 2013
Jr. Junin 355, Miraflores, Lima-18
Telfono: 213 2760
Derechos reservados
Primera Edicin: Setiembre 2013
Tiraje: 1000 ejemplares
Autor:
Claudio Alvaro Cerrn Landeo
Impreso en el Per - Printed in Per
Fondo Editorial de la Universidad Continental
Impreso en los Talleres Grficos:
Xprinted Solucin Grfica S.R.L.
Todos los derechos reservados.
Esta publicacin no puede ser reproducida, en todo ni en parte, ni registrada en o
trasmitida por un sistema de recuperacin de informacin, en ninguna forma ni por
ningn medio sea mecnico, fotoqumico, electrnico, magntico, electroptico, por
fotocopia, o cualquier otro sin el permiso previo por escrito de la Universidad.

NDICE
IINTRODUCCIN
PRESENTACIN DE LA ASIGNATURA

COMPETENCIA DE LA ASIGNATURA 9
UNIDADES DIDCTICAS 9
TIEMPO MNIMO DE ESTUDIO 9
UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

11

DIAGRAMA DE PRESENTACIN DE LA UNIDAD I

11

ORGANIZACIN DE LOS APRENDIZAJES

11

Tema N1: INTRODUCCIN

12

1 Ramas y objetivos de la Estadstica

12

2 Fuentes de recoleccin de datos

14

3 Definiciones bsicas

19

Tema N 02: RESUMEN Y GRFICA DE DATOS

21

1 Construccin de tableros de frecuencias cualitativos y cuantitativos

21

2 Tipos de grficos estadsticos. Lectura y anlisis

24

LECTURA SELECCIONADA N 1

31

Seis grados de Kevin Bacon: el estudio original utiliz buenos datos?

ACTIVIDAD N 1

31

Glosario

32

BIBLIOGRAFA DE LA UNIDAD I

32

AUTOEVALUACIN DE LA UNIDAD I

33

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS. INDICADORES ESTADSTICOS

35

DIAGRAMA DE PRESENTACIN DE LA UNIDAD ii

35

ORGANIZACIN DE LOS APRENDIZAJES

35

Tema N1: MEDIDAS DE TENDENCIA CENTRAL

36

1 Media
2 Mediana
3 Moda

Tema N 2: MEDIDAS DE DISPERSIN


1 Rango o recorrido

36

39

43

46
46

2 Recorrido semi intercuartil

46

3 Desviacin media

47

4 Varianza

47

5 Desviacin tpica o estndar

51

6 Coeficiente de variabilidad

53

Tema N 3: MEDIDAS DE POSICIN, ASIMETRA Y CURTOSIS

54

1 Cuantiles

54

2 Medidas de Curtosis

57

3 Medidas de Asimetra

58

LECTURA SELECCIONADA N 2

60

ACTIVIDAD N 2

61

Glosario

62

BIBLIOGRAFA DE LA UNIDAD II

62

AUTOEVALUACIN DE LA UNIDAD II

62

UNIDAD III: PROBABILIDAD

65

DIAGRAMA DE PRESENTACIN DE LA UNIDAD iiI

65

ORGANIZACIN DE LOS APRENDIZAJES

65

Tema N1: FUNDAMENTOS DE PROBABILIDAD Y REGLAS BSICAS

66

1 Definiciones bsicas, sucesos y probabilidades

66

2 Regla de la suma y multiplicacin

69

Los premios de la Academia discriminan por la edad?

Tema N2: PROBABILIDAD TOTAL Y TEOREMA DE BAYES

72

1 Teorema de la probabilidad total


2 Teorema de Bayes

Tema N3: TCNICAS DE CONTEO


1 Tcnicas de conteo

73

76

2 Combinaciones y permutaciones

LECTURA SELECCIONADA N 2

73

76
77

77

Debe preocuparse de que le realicen una prueba de deteccin de drogas cuando solicite un
trabajo? Estadstica. Mario Triola. Pg. 137

ACTIVIDAD N 3

77

Glosario

78

BIBLIOGRAFA DE LA UNIDAD III

79

AUTOEVALUACIN DE LA UNIDAD III

79

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

82

DIAGRAMA DE PRESENTACIN DE LA UNIDAD iV

82

ORGANIZACIN DE LOS APRENDIZAJES

82

tema N 1: DISTRIBUCIONES DE PROBABILIDAD DISCRETA

83

1 Variables aleatorias

83

2 Distribucin de probabilidad binomial

86

3 Distribucin de probabilidad hipergeomtrica

87

4 Distribucin de probabilidad de Poisson

tema N 2: DISTRIBUCIONES DE PROBABILIDAD NORMAL

87

88

89

2 Aplicaciones de la distribucin normal estndar

92

1 Distribucin normal estndar. Valor crtico z

Tablas de Distribucin Normal

95

LECTURA SELECCIONADA N 4

96

Los mtodos estadsticos pueden demostrar que el proceso de seleccin de un jurado es discriminatorio?

ACTIVIDAD N 4

96

Glosario

97

BIBLIOGRAFA DE LA UNIDAD IV

98

AUTOEVALUACIN DE LA UNIDAD IV

98

ANEXO

99

INTRODUCCIN

uando escuchamos el trmino ESTADSTICA lo re-

una buena metodologa y manejo de procesos que nos per-

lacionamos frecuentemente con el trmino datos

mitan alcanzar el conocimiento deseado acerca de la realidad

o datos individuales y porcentajes o cualquier infor-

para realizar una buena toma de decisiones. No hay que dejar

macin relacionada con ellos. Sin embargo la ESTADSTICA

de ver que la ESTADSTICA al brindar apoyo a otras ciencias

es ms que eso, no es slo una serie de datos o un grfico

requiere del buen manejo de procesos dirigidos a la toma y

estadstico, involucra varias etapas que son materia de estudio

anlisis de datos asocindolos con el buen manejo del clculo

del presente manual autoformativo.

de las probabilidades y con ciertos niveles de confiabilidad en

Podemos decir que la funcin principal de la estadstica es jus-

la toma de decisiones.

tamente la recoleccin y agrupamiento de datos de diverso

El presente Manual Autoformativo de ESTADSTICA I est

tipo para construir con ellos informes estadsticos que nos den

diseado para que el lector pueda adquirir los conocimientos

idea sobre diferentes y muy variados temas, siempre desde un

necesarios para poder ejecutar los procesos relacionados con

punto de vista cuantitativo y no cualitativo. Esto es muy im-

la descripcin y anlisis de datos (ESTADSTICA DESCRIP-

portante remarcarlo ya que la estadstica se convierte enton-

TIVA) y el clculo de probabilidades, utilizando con total

ces en una ciencia que nos habla de cantidades (por ejemplo,

autonoma los conceptos, caractersticas y ejemplos sobre el

cuntas personas viven en un pas por metro cuadrado) pero

RESUMEN y Grfica de datos descritos en la Primera Unidad;

no nos da informacin directa sobre la calidad de vida de esas

Anlisis Exploratorio de datos e Indicadores Estadsticos des-

personas.

critos en la Segunda Unidad; Probabilidad descrita en la ter-

Este anlisis numrico que se realiza con los datos es muy importante puesto que con ello fundamentaremos nuestra toma
de decisiones, desde una simple actividad diaria de alguna
persona hasta una complicada gestin en alguna empresa,
en cualquier campo de accin. Es por ello que se requiere
del conocimiento para poder disponer de datos apropiados,
suficientes, oportunos y de buena calidad as como manejar

cera Unidad y Distribuciones de Probabilidad descritas en la


Cuarta Unidad; complementadas en cada unidad con lecturas
seleccionadas, actividades y autoevaluaciones del aprendizaje.
Agradecemos a quienes de antemano tuvieron paciencia y
comprensin en la elaboracin del presente manual y a aquellos alumnos con quienes pudimos optimizar el uso de la informacin presente en esta PRIMERA EDICIN.

Desarrollo
de contenidos

PRESENTACIN DE LA ASIGNATURA
Diagrama

Objetivos

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

Inicio

COMPETENCIA DE LA ASIGNATURA

Desarrollo
Actividades Autoevaluacin
deConoce,
contenidosaplica, analiza e interpreta eficientemente mtodos y tcnicas de estadstica

descriptiva y teora de probabilidades para la toma de decisiones, valorando reflexivamente su importancia como herramienta en los diversos campos de la ciencia,
demostrando tica en el manejo de la informacin.
Lecturas
seleccionadas

Glosario

Bibliografa

UNIDADES DIDCTICAS
UNIDAD IAnotaciones
Recordatorio
Introduccin,
RESUMEN y
Grfica de Datos.

UNIDAD II

UNIDAD III

Anlisis Explorato- Probabilidad.


rio de Datos. Indicadores Estadsticos.

UNIDAD IV
Distribuciones De
Probabilidad.

TIEMPO MNIMO DE ESTUDIO


UNIDAD I

UNIDAD II

UNIDAD III

UNIDAD IV

1a y 2a Semana

3a y 4a Semana

5a y 6a Semana

7a y 8a Semana

16 horas

16 horas

16 horas

16 horas

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Bibliografa

Desarrollo
de contenidos

Diagrama

Objetivos

Desarrollo
de contenidos

Diagrama
Lecturas
seleccionadas

Inicio

Lecturas
seleccionadas

Diagrama
Recordatorio

Actividades

Glosario

Recordatorio

Anotaciones

Autoevaluacin

DIAGRAMA DE PRESENTACIN DE LA UNIDAD I


Objetivos
Glosario

Inicio
Bibliografa

Actividades

EJEMPLOS

Autoevaluacin

ACTIVIDADES

Anotaciones

Glosario

AUTOEVALUACIN
Bibliografa

BIBLIOGRAFA

ORGANIZACIN DE LOS APRENDIZAJES


Objetivos

Inicio

Anotaciones

CONOCIMIENTOS

Tema N 1: Introduccin
1
RamasActividades
y Objetivos
de la
Desarrollo
Autoevaluacin
de contenidos
Estadstica.
2 Fuentes de recoleccin de
datos.
3 Definiciones bsicas.
Lecturas
seleccionadas

Lecturas
seleccionadas

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

CONTENIDOS

Desarrollo
de contenidos
Recordatorio

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Bibliografa

Lectura Seleccionada N 01:


Kresalja J. Baldo. El principio
de subsidiariedad en materia
econmica. Anlisis de las
Recordatorio
Anotaciones
Constituciones
de 1979 y
1993. Palestra. Lima. 2010. pp.
185-199..
Tema N 2: RESUMEN y
Grfica de Datos
1 Construccin de tableros
de frecuencias cualitativos y
cuantitativos.
2 Tipos de grficos estadsticos. Lectura y anlisis.

Autoevaluacin N 1

PROCEDIMIENTOS

ACTITUDES

1. Define los conceptos bsi- 1. Valora de manera reflexiva la


importancia de la Estadstica
cos de Estadstica.
Descriptiva en todo campo
2. Identifica y utiliza los mtode la ciencia.
dos y las fuentes de recoleccin de datos.
3. Identifica tipos de datos.
Actividad N 1:
Construye un organizador de
conocimiento sobre el tema.
4. Construye tableros de frecuencia,
5. Describe, explora y compara diferentes caractersticas
de un conjunto de datos.
Actividad N 2:
Construye y analiza grficos y
tableros de frecuencia.
Control de Lectura N 1:

Bibliografa

11

o
os

as

io

12

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS


TEMA 1: INTRODUCCIN
Anotaciones

Estimado alumno, en este tema conoceremos los conceptos bsicos de la Estadstica que
nos permitirn diferenciar las fuentes de recoleccin de datos as como definir el tipo
de estadstica que estamos aplicando, sobre todo definir la variable y el tipo de variable
que ests estudiando; del mismo modo es importante que diferencies lo que es parmetro y estadgrafo sobre todo cules son y para qu tipo de variables se aplican. Detalles
que son sumamente importantes al momento de plantear un estudio de investigacin
estadstica
1 RAMAS Y OBJETIVOS DE LA ESTADSTICA
1.1 DEFINICIN
Definir la estadstica es una tarea difcil porque tendramos que definir cada
una de las tcnicas que se emplean en los diferentes campos en los que interviene. Sin embargo, diremos, en forma general, que:
La ESTADSTICA es la ciencia que le facilita al hombre el estudio de datos masivos,
proporcionando un conjunto de mtodos cientficos para recolectar, resumir, clasificar,
analizar e interpretar el comportamiento de los datos con respecto a una caracterstica,
materia de estudio o investigacin, pasa de esa manera a sacar conclusiones valederas
y efectuar predicciones razonables de ellos y as mostrar una visin de conjunto clara
y de ms fcil apreciacin con respecto a la fuente de informacin que nos permiten
tomar decisiones ptimas en casos de incertidumbre
Estadstica: Etimolgicamente
El origen etimolgico de la palabra estadstica no est bien determinado,
puesto que existen distintas opiniones y referencias. Para algunos viene de la
voz griega STATERA que significa balanza, otros sostienen que deriva del latn STATUS que significa situacin mientras que algunos autores afirman que
procede del alemn STAAT que significa estado pues era funcin principal
de los gobiernos de los estados establecer registros de poblacin , nacimientos,
defunciones, etc.
1.2 RAMAS DE LA ESTADSTICA
La estadstica se divide en dos ramas que no son independientes; por el contrario, son complementarias y entre ambas dan la suficiente ilustracin sobre
una posible realidad futura, con el fin de que quien tenga poder de decisin,
tome las medidas necesarias para transformar ese futuro o para mantener las
condiciones existentes.
En atencin a su metodologa, por sus procedimientos y alcances bien definidos, la ciencia estadstica se clasifica en:
1.2 .1 ESTADSTICA DESCRIPTIVA O DEDUCTIVA:
Se encarga de la recoleccin, clasificacin y descripcin de datos muestrales o poblacionales, para su interpretacin y anlisis. Su finalidad es
obtener informacin, analizarla, elaborarla y simplificarla y presentndolos en forma clara; eliminando la confusin caracterstica de los datos preliminares lo necesario para que pueda ser interpretada cmoda
y rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que
se desee.
Permite la elaboracin de cuadros, grficos e indicadores bien calculados; suficientemente claros, como para disipar las dudas y la oscuridad
de los datos masivos.

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS Desarrollo

de contenidos

Lecturas
seleccionadas

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

1.2.2. ESTADSTICA INFERENCIAL O INDUCTIVA


La estadstica inferencial sobre la base de la muestra estudiada saca conclusiones, o sea, hace inferencia o induccin, en cuanto al universo Recordatorio
o
poblacin, de donde se obtuvo dicha muestra, basndose en los datos
simplificados y analizados; detectando las interrelaciones que pueden
unirlos, las leyes que los rigen y eliminando las influencias del azar; llegando ms all de las verificaciones fsicas posibles.
Cmo se selecciona la muestra?, cmo se realiza la inferencia?, y qu
grado de confianza se puede tener en ella? son aspectos fundamentales
de la estadstica inferencial, para cuyo estudio se requiere un alto nivel
de conocimientos de estadstica, probabilidad y matemticas. Comprende la teora de estimacin y prueba de hiptesis.
1.3 OBJETIVOS
Los objetivos de la estadstica pueden ser clasificados en tres grandes captulos:
descripcin, anlisis y prediccin.
1.3.1. Descripcin de grandes colecciones de datos empricos reducindolos a
un pequeo nmero de caractersticas que concentra la parte ms importante y significativa de la informacin proporcionada por los datos.
La descripcin supone que los datos que vienen expresados en su forma
natural deben ser clasificados y presentados sistemticamente en cuadros o tablas como una pequea reduccin de datos, esto se obtiene
cuando el comportamiento y caractersticas de los datos se expresan por
un conjunto de indicadores, medidas de resumen o estadgrafos.
La estadstica se inicia estudiando el problema, puesto que es un trabajo
preliminar de casi todas las investigaciones estadsticas; de este modo
tanto como la reduccin como la descripcin de la informacin se estudia en la Estadstica Descriptiva.
Es importante anotar que la descripcin estadstica de los fenmenos o
hechos es el primer aspecto al cual se redujo la ciencia estadstica durante mucho tiempo, aplicndose especialmente a los datos demogrficos,
sociales econmicos, etc.
1.3.2. Anlisis estadstico de datos experimentales y de los fenmenos observados, toda la investigacin estadstica incluye un problema de anlisis, con
el objeto de formarse un concepto de la poblacin o universo y adoptar
decisiones; en este caso no es necesario observar toda a una poblacin sino
que ser suficiente elegir una muestra representativa. La preocupacin del
anlisis estadstico es inferir propiedades para una poblacin sobre la base
de resultados muestrales conocidos. Aqu se presenta varios problemas que
presentan la Estadstica, la estimacin estadstica, el clculo de probabilidades, las pruebas estadsticas, etc. stos son aspectos que corresponde
esencialmente a la Inferencia Estadstica.

Todo anlisis debe suponer la eleccin adecuada de una muestra representativa, la que ser estudiada en detalle para obtener conclusiones o resultados, que dentro de ciertos mrgenes de aceptacin sean vlidas a toda la
poblacin de la cual fue elegida la muestra.

Anotaciones

Bibliografa

13

o
os

as

io

14

Actividades

Autoevaluacin

Glosario

Bibliografa

Anotaciones

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

1.3.3 Prediccin o comportamiento de los fenmenos en el futuro, lo cual


constituye la mxima aspiracin prctica de toda ciencia. Este objetivo de
prediccin y previsin est implcito tanto en la descripcin como en el
anlisis estadstico, puesto que en general interesa orientar la toma de decisiones con vigencia y afecto en el futuro.

Naturalmente que las estimaciones y proyecciones dependen del grado de


conocimiento del comportamiento del pasado y presente de las variables
en estudio.

Para concretar estos objetivos, la Estadstica se vale por una parte del censo, que recopila datos del todo, analiza la distribucin y variacin de las
caractersticas de los elementos que componen una poblacin claramente
definida; por otra parte del muestreo, que permite estimar o inferir caractersticas de un todo considerando una parte representativa. Basndose
en el anlisis de experiencias y evaluaciones pasadas y actuales, hace estimaciones de fenmenos y caractersticas para un futuro, propone valores
esperados. La estadstica tambin se vale de una serie de artificios matemticos y del clculo de probabilidades, para definir sobre la validez de
supuestos, construir modelos y mtodos estadsticos.

2 FUENTES DE RECOLECCIN DE DATOS


Finalmente, el Derecho Empresarial es considerado como el conjunto de normas
que regulan la actividad empresarial, esto es, la de los actos de comercio y los sujetos de comercio.
As, existen varias disciplinas que alimentan el Derecho Empresarial en los distintos
rubros de dicha la actividad empresarial. As tenemos que, los actos de comercio
y los sujetos de comercio son regulados por derecho civil y el derecho comercial;
la organizacin laboral de la empresa est regulada por el derecho del trabajo; la
actuacin de la empresa con agentes extranjeros est regulada por el derecho internacional; las implicancias contables y tributarias de la empresa est regulada por
el derecho tributaria; etc.
1.2 FUENTES DE DATOS
Las fuentes de informacin estn constituidas por cada uno de los lugares de
donde se toman los datos. De acuerdo al tipo del lugar del cual procede esta
informacin podemos clasificarlo de la siguiente manera:
1.2.1. Fuente Primaria
Los datos de la fuente primaria son obtenidos directamente de las unidades de observacin mediante cualquier tcnica o instrumento de recoleccin de datos originales.
1.2.2. Fuente Secundaria
Los datos de la fuente secundaria son aquellos datos que ya han sido publicados con anterioridad, recolectados con fines diferentes de los que la
investigacin especfica necesita.
Estos datos se encuentra como archivos registros administrativos boletines, informes estadsticos requeridos en el mbito nacional o sectorial
elaborados por organismos especializados los que pueden ser pblicos
o privados.

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS Desarrollo

de contenidos

2.1.3 Fuentes Internas

Lecturas
seleccionadas

Los datos procedentes de Fuentes Internas son aquellos que se generan


dentro de la propia organizacin por ejemplo, los recursos de la cantidad de gneros o servicios producidos, el nmero de horas de trabajo
Recordatorio
consumidas en cada unidad de produccin, la cantidad de materiales
utilizados o desperdiciados y el nmero de ausencias al trabajo.
2.1.4 Fuente Externas
Son los datos que se generan fuera de los negocios u organizaciones.
Entre las fuentes ms importantes de esta clase de informacin, estn las
agencias gubernamentales, las asociaciones profesionales y comerciales y
las publicaciones especializadas, empresas privadas.
2.2 MTODOS DE RECOLECCIN DE DATOS
Elegir el mtodo de recoleccin de datos depende de las posibilidades de acceso o contacto con los elementos investigados, del tamao de la poblacin o
muestra, de la oportunidad de obtener datos y del presupuesto y exigencias del
tiempo.
Los objetivos principales para la recoleccin son:
- Obtener los datos o respuestas a las variables analizadas.
- Proporcionar informacin adecuada y oportuna con fines de una ptima
planificacin.
Para seleccionar el mtodo de recoleccin de datos se debe tener en cuenta lo
siguiente:
a. Establecer Objetivos Claros
Antes de recoger la informacin se debe decidir qu se va a hacer con ella.
Cualquier recoleccin de informacin ha de tener un objetivo especfico y
ser seguida por acciones.
La informacin es una gua para nuestras acciones. A partir de la informacin conocemos los hechos pertinentes y adoptamos acciones apropiadas
basadas en esos hechos.
b. Definir su propsito
Una vez que se define el objetivo de la recoleccin de la informacin, tambin se determina los tipos de comparacin que se necesitan, y esto a su vez
identifica el tipo de datos que se deben de recoger.
c. Confiabilidad de las Mediciones
Est directamente relacionada a la adecuada seleccin de la muestra.
2.2.1 CENSO
Es un mtodo de recoleccin de datos mediante el cual la informacin
se obtiene analizando a la totalidad de los elementos que componen la
poblacin o universo bajo estudio. Un censo debe cumplir las condiciones de universalidad (censar a todos los elementos de la poblacin)
y simultaneidad (realizarse en un momento determinado). Un censo es
equivalente a una fotografa de la poblacin bajo estudio.
2.2.2 OBSERVACIN
Es un proceso permanente de investigacin realizado con instrumentos
y tcnicas especficas segn el mbito de estudio. Es necesario que el investigador cuente con un marco terico y referencial sobre las variables
y sus indicadores. Para lograr una observacin cientficamente vlida se
debe:

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografa

15

o
os

as

io

16

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

Preparar estrategia de obtencin de informacin verdica

Determinar controles de las variables.

Planificacin y determinacin de mtodo y tipo de observacin.

Anotaciones

Se pueden considerar los siguientes tipos de observacin:


a. Natural: Es aquel tipo de observacin que no maneja mayores reglas
o procedimientos que las consideradas por el investigador quien se
apoya en la creatividad, imaginacin y capacidad organizativa.
b. Diferencial o selectiva: Es aquel tipo en el cual se determina un sistema de clasificaciones de los datos, destacando la diferencia entre los
objetos o elementos de estudio (tamao, color, categoras, etc.).
c. Experimental: Se caracteriza por existir un proceso pre establecido,
y en el cual el investigador interviene para estimular, alterar algn
componente del ente a estudiar con el fin de obtener un resultado
esperado o reproducir un fenmeno.
d. Ordinaria o No participante: Es aquel tipo de observaciones en la
cual el investigador se encuentra fuera de los sucesos.
e. Participante: Tipo de observacin en la que el investigador est dentro de la poblacin.
De las caractersticas de cada uno de los tipos de observaciones, se puede
concluir que es necesario contar con personal especializado, lo que significar un costo adicional y por otro lado es un mtodo no conveniente
cuando la poblacin a estudiar es numerosa.
2.2.3 ENTREVISTA
Consiste en una interaccin entre dos personas, el entrevistador (quien
investiga) que formula una serie de preguntas relativas al tema de investigacin, y el entrevistado (quien tiene la informacin) que responde
verbalmente o por escrito las informacin que le es solicitada.
Esta tcnica se aplica a informantes claves, es decir, personas representativas que manejan una gran cantidad de informacin referente a un
tema de inters.
La ventaja de realizar una entrevista es que la informacin que se obtiene
puede ser enriquecida con repreguntas, la observacin directa permite
constatar la veracidad de las respuestas. Al ser una interaccin entre dos
personas existen muchos factores que pueden distorsionar las respuestas
del entrevistado por lo que el entrevistador debe ser una persona con
mucho dominio de esta tcnica.
Segn la estructura de la entrevista, estas se clasifican en:
a. Entrevista No Estructurada:

La entrevista no estructurada es flexible y abierta, aunque los objetivos de la investigacin rigen a las preguntas, su contenido, orden
profundidad y formulacin se encuentra por entero en manos del
entrevistador. Si bien el investigador, sobre las bases del problema,
los objetivos y las variables, elabora las preguntas antes de realizar la
entrevista, modifica el orden, la forma de encauzar las preguntas o su
formulacin para adaptarlas a las diversas situaciones y caractersticas
particulares de los sujetos de estudio.

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS Desarrollo

de contenidos

Lecturas

Glosario

Recordatorio

Anotaciones

seleccionadas
Este tipo de entrevista es muy til en los estudios descriptivos y en las
fases de exploracin para el diseo del instrumento de recoleccin
de datos.

Las ventajas de este mtodo son:

Es adaptable y susceptible de aplicarse a toda clase de sujetos en


situaciones diversas.
Permite profundizar en los temas de inters.
Orienta a posibles hiptesis y variables cuando se exploran reas
nuevas.

Entre las desventajas se cita:


Se requiere ms tiempo.
Es ms costosa por la inversin de tiempo con los entrevistadores.
Se dificulta la tabulacin de datos.
Se requiere de mucha habilidad tcnica para obtener la informacin y mayor conocimiento del tema.
An con esas desventajas y dada la utilidad de la entrevista, en sus dos
formas, todo investigador debe familiarizarse con su uso, ya que es
probable que la aplique en cualquier tipo de investigacin.

An con esas desventajas y dada la utilidad de la entrevista, en sus dos


formas, todo investigador debe familiarizarse con su uso, ya que es
probable que la aplique en cualquier tipo de investigacin.

La entrevista no estructurada pueden clasificarse en:


Entrevista formal: Es la modalidad menos estructurada posible de
entrevista, ya que se reduce a una simple conversacin sobre el tema
en estudio. Lo importante no es definir los lmites de lo tratado ni
ceirse a algn esquema previo, sino hacer hablar al entrevistado,
de modo de obtener un panorama de los problemas ms sobresalientes, de los mecanismos lgicos y mentales del entrevistado, y de
los temas que para l resultan de importancia. Lo ms importante es
dar al entrevistado la sensacin clara y definida de que puede hablar
libremente, alentndolo y estimulndolo para que lo haga y cuidando
de no influirlo demasiado con nuestras actitudes o las palabras que
decimos.
Entrevista focalizada: Es prcticamente tan libre y espontnea como
la anterior, pero tiene la particularidad de concentrarse en un nico
tema. El entrevistador deja hablar sin restricciones al entrevistado,
proponindole apenas algunas orientaciones bsicas pero, cuando
ste se desva del tema original, el entrevistador vuelve a centrar la
conversacin sobre el primer asunto.

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Se emplea normalmente con el objeto de explorar a fondo alguna


experiencia vivida por el entrevistado o cuando nuestros informantes
son testigos presenciales de hechos de inters o de acontecimientos
histricos. Requiere de gran habilidad en su desarrollo, para evitar
tanto la dispersin temtica como caer en formas ms estructuradas
de interrogacin.

Entrevista por pautas o guas: Se guan por una lista de puntos que se
van explorando en el curso de la entrevista. Los temas deben guardar
una cierta relacin entre s. El entrevistador hace muy pocas preguntas directas, y deja hablar al entrevistado siempre que vaya tocando
alguno de los temas sealados en la pauta o gua.

Bibliografa

17

o
os

as

io

18

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

b. Entrevista Estructurada

Anotaciones

Se caracteriza por estar rgidamente estandarizada, replantean idnticas preguntas y en el mismo orden a cada uno de los participantes,
quienes deben escoger la respuesta en 2, 3 ms alternativas que
se les ofrecen. Inclusive los comentarios introductorios y finales se
formulan de la misma manera en todas las situaciones. Para orientar
mejor la entrevista se elabora un formulario que contenga todas las
preguntas. Sin embrago, al utilizar este tipo de entrevista el investigador tiene limitada libertad de formular preguntas independientes
generadas por la interaccin personal.

Algunas ventajas que presenta este tipo de entrevista son:


La informacin es ms fcil de procesar, simplificando el anlisis comparativo
El entrevistador no necesita ser entrenado arduamente en la tcnica.
Hay uniformidad en el tipo de informacin obtenida.
Pero tambin tiene desventajas, tales como:
Es difcil obtener informacin confidencial.
Se limita la posibilidad de profundizar en un tema que emerja durante la entrevista.
2.2.4 ENCUESTA
Es una tcnica que permite obtener informacin de una muestra representativa de una determinada poblacin. Es un proceso a travs del cual
conseguimos datos de primera mano y todos ellos que permitan especificar mejor el problema.
2.2.5 CUESTIONARIO
Es un plan formalizado para recolectar datos de los encuestados. La funcin del cuestionario es la medicin del comportamiento pasado, de las
actitudes y de las caractersticas del encuestado.
Es el mtodo que utiliza un instrumento o formulario impreso, destinado a obtener repuestas sobre el problema en estudio y que el investido o
consultado llena por si mismo.
El cuestionario puede aplicarse a grupos o individuos estando presente
el investigador o el responsable del recoger la informacin, o puede enviarse por correo a los destinatarios seleccionados en la muestra.
Algunas ventajas del cuestionario son: su costo relativamente bajo, su
capacidad para proporcionar informacin sobre un mayor nmero de
personas en un periodo bastante breve y la facilidad de obtener, cuantificar, analizar e interpretar los datos.
Dentro de las limitaciones de este mtodo figuran las siguientes: es poso
flexible, la informacin no puede variar ni profundizarse.
Respecto al diseo del cuestionario, este vara segn la experiencia del
investigador, los objetivos a alcanzar, los tiempos de aplicacin, el presupuesto con que se cuenta, el tiempo para el estudio, entre otros.
Generalmente un cuestionario tiene cinco secciones:
a. Solicitud de cooperacin: es un pequeo enunciado, diseado para
obtener la cooperacin del encuestado con relacin a la entrevista, Contiene la identificacin de la organizacin que realiza la encuesta, se ex-

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS Desarrollo

de contenidos

Lecturas

seleccionadas
plica el objeto del estudio y se indica el tiempo que se requiere para
completar la entrevista.

b. Datos de identificacin: generalmente ocupan la primera seccin del


Recordatorio
cuestionario y se relacionan con el nombre, direccin y nmero telefnico del encuestado. Los datos adicionales incluiran elementos tales
como la hora y la fecha de la entrevista, adems del nombre o cdigo del
entrevistador.
c. Datos de clasificacin: Tratan sobre las caractersticas del encuestado.
Estos datos los suministra directamente el encuestado en el caso de una
encuesta por correo. En las personales y telefnicas el entrevistador recolecta los datos o, en algunos casos, puede estimar tipos ms sensibles de
datos basado en la observacin.
d. Instrucciones: Se refieren a comentarios realizados al entrevistador o
encuestado con relacin a la forma de utilizar el cuestionario. Estos comentarios aparecen directamente en el cuestionario cuando se emplea
una encuesta por correo.
e. Informacin solicitada: Constituye la parte ms grande del cuestionario.
3 DEFINICIONES BSICAS
3.1 POBLACIN
Es el conjunto mayor o coleccin completa de todos los elementos (puntajes.
personas, mediciones, etc.) que posee al menos una caracterstica comn observable, cuyo estudio nos interesa o acerca de los cuales se desea informacin.
La poblacin debe estar perfectamente definida en el tiempo y en el espacio,
de modo que ante la presencia de un potencial integrante de la misma, se
pueda decidir si forma parte o no de la poblacin bajo estudio. Por lo tanto,
al definir una poblacin, se debe cuidar que el conjunto de elementos que la
integran quede perfectamente delimitado.
La poblacin puede ser segn su tamao de dos tipos:
a. Poblacin finita: cuando se tiene un nmero determinado de elementos.
b. Poblacin infinita: cuando el nmero de elementos es indeterminado, o tan
grande que pudiesen considerarse infinitos.
Tamao de la Poblacin: Es el nmero total de elementos que tiene la poblacin estudiada y se denota con la letra N

3.2 MUESTRA
Es un subconjunto de la poblacin a la cual se le efecta la medicin con el fin
de estudiar las propiedades de la poblacin de la cual es obtenida.
Una muestra debe ser representativa, esto es, guarda las mismas caractersticas
de la poblacin de donde fue seleccionada y debe ser adecuada en cuanto a la
cantidad de elementos que debe tener con respecto a la poblacin.
Existen diversos mtodos para calcular el tamao de la muestra y tambin para
seleccionar los elementos que la conforman, pero es importante que sea re-

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografa

19

o
os

as

io

20

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

presentativa de la poblacin y sus elementos escogidos al azar para asegurar la


objetividad de la investigacin.
Anotaciones

Tamao de muestra: Es el nmero de elementos de la muestra y se denota con


letra n.
3.3 PARMETROS ESTADSTICOS
Es un nmero que describe alguna caracterstica de la poblacin o medida de
resumen de una poblacin. Se considera como un valor verdadero de la caracterstica estudiada y para determinar su valor es necesario utilizar la informacin poblacional completa, y por lo tanto la decisin se toman con certidumbre
total.
3.4 ESTADGRAFO O ESTADSTICO
Es un nmero que describe alguna caracterstica de la muestra o medida de
resumen de una muestra y la toma de decisin contiene un grado de incertidumbre.
3.5 DATO
Es el valor, respuesta o registro que adquiere una caracterstica o variable asociado a un elemento de la poblacin o muestra, como resultado de la observacin, entrevista o recopilacin en general. Puede ser un nmero, una palabra
o un smbolo.
3.6 VARIABLE
Es una caracterstica estudiada de las unidades estadsticas. Podemos mencionar los siguientes tipos:
a. Segn la Naturaleza de la Variable
a.1 Variables Cualitativas o Estadsticas de Atributos
Cuando expresan una cualidad, caracterstica o atributo, tiene carcter
cualitativo, sus datos se expresan mediante una palabra, no es numrico.
Por ejemplo: estado civil, los colores, lugar de nacimiento, profesiones,
actividad econmica, causas de accidentes, etc.
a.2 Variables Cuantitativas
Cuando el valor de la variable se expresa por una cantidad, es de carcter
numrico. El dato o valor puede resultar de la operacin de contar o
medir; por ejemplo: edad, nmero de hijos por familia, ingresos, viviendas por centro poblado, niveles de desempleo, produccin, utilidades de
empresas, etc.
Las variables cuantitativas pueden ser: Discreta y Continua.
a.1.1 Variable Discreta
Cuando el valor de la variable resulta de la operacin de contar, su
valor est representado slo por nmeros naturales (enteros positivos); Ejemplos: hijos por familia, nmero de accidentes por da,
trabajadores por empresa, poblacin por distritos, habitaciones por
vivienda, etc.
a.1.2 Variable Continua
Cuando la variable es susceptible de medirse, es toda variable cuyo
valor se obtiene por medicin o comparacin con una unidad o
patrn de medida. Las variables continuas pueden tener cualquier
valor dentro de su rango o recorrido, por tanto se expresa por cualquier nmero real; Ejemplos: rea de parcelas, ingresos monetarios, produccin de maz, peso, estatura, tiempo de servicios, horas
trabajadas, niveles de empleo, etc.

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS Desarrollo

de contenidos

b. Segn la Escala de Medicin

Lecturas
seleccionadas

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

b.1 Variables Nominales


Son aquellas variables que establecen la distincin de los elementos en
diversas categoras, sin implicar algn orden entre ellas, distribuye a la
Recordatorio
unidad de anlisis en dos o ms categoras. Ejemplos: sexo, estado civil,
deportes de prctica, profesiones, lugar de nacimiento, etc.
b.2 Variables Ordinales
Aquellas variables que implican orden entre sus categoras, pero no grados de distancia igual entre ellas, estn referidas a un orden de jerarqua,
donde las categoras expresan una posicin de orden. Ejemplo: grado
de instruccin, clases sociales, grado de simpata, rango de agresividad,
orden de merito, etc.
b.3 Variable de Intervalo
Son aquellas que suponen a la vez orden y grados de distancia iguales
entre las diversas categoras, pero no tienen origen natural, sino convencional, tiene un cero relativo. Por ejemplo: coeficiente de inteligencia,
temperatura, puntuacin obtenida en una escala, etc.
b.4 Variables de Razn
Estas variables comprenden a la vez todos los casos anteriores, distincin,
orden, distancia y origen nico natural; el valor se expresa con un nmero real tiene un cero absoluto. Por ejemplo: edad, peso, ingresos, nmero de hijos, produccin, accidentes de trnsito, etc.

TEMA 2: RESUMEN Y GRFICA DE DATOS


Ahora es momento de aplicar todos los conceptos, definiciones y caractersticas aprendidas en el tema anterior para poder realizar la representacin de los datos estadsticos
de manera grfica o a travs de un tablero estadstico. Debes tener en cuenta que antes
de construir un tablero de frecuencias debes verificar quin es la variable, que tipo de
variable es y qu valores asume.

1 CONSTRUCCIN DE TABLEROS DE FRECUENCIA CUALITATIVOS Y

CUANTITATIVOS
La siguiente fase de la Estadstica despus de haber recolectado la informacin a
travs de un trabajo de campo, es la Organizacin y Clasificacin de los Datos que
debe ser consistente y veraz que nos permitir posteriormente realizar una buena
toma de decisiones.
1.1 CONCEPTOS BSICOS
Para iniciar la organizacin de datos definiremos algunos conceptos:
1.1.1 Clase
Es una divisin de la variable. Se denota como subndice con la letra i y
el nmero total de clases con m.
1.1.2 Frecuencia
Es las veces que se repite una clase de la variable. Estas son: Simples y
Acumuladas

Anotaciones

Bibliografa

21

o
os

as

io

22

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

a. Frecuencia Simple: Es aquella frecuencia que slo correspondes a una


clase de la variable entre ellas tenemos:
Anotaciones

a.1 Frecuencia Absoluta Simple


La frecuencia absoluta simple de la clase ci es el nmero fi, de observaciones que presentan una modalidad perteneciente a esa clase.
m

Adems se cumple que:

f
i =1

=n

a.2 Frecuencia Relativa Simple


Frecuencia Relativa Simple de la clase ci es el cociente hi, entre las frecuencias absolutas de dicha clase y el nmero total de observaciones, es
decir:

hi =

fi
n


Obsrvese que fi es el tanto por uno de observaciones que estn en la
clase
m

ci. Tambin cumple:

h
i =1

=1

a.3 Frecuencia Porcentual Simple


Frecuencia Porcentual Simple de la clase ci es el producto de pi, entre
las frecuencias relativas de dicha clase por 100, es decir

pi = hi *100
m

Cumple lo siguiente:

p
i =1

= 100

b. Frecuencias Acumuladas: Aquellas frecuencias que se obtienen por la


suma de dos o ms clases de la variable
b.1 Frecuencia Absoluta Acumulada
Fi, se calcula sobre variables cuantitativas, y es el nmero de elementos de
la poblacin cuya modalidad es inferior o equivalente a la modalidad ci:
i

Fi = f 1 + f 2 + .... + f i = f k
k =1

b.2 Frecuencia Relativa Acumulada


Hi, se calcula sobre variables cuantitativas, siendo el tanto por uno de los
elementos de la poblacin que estn en alguna de las clases y que presentan una modalidad inferior o igual a la ci, es decir:

Hi =

i
Fi
= h1 + h2 + ... + hi = hk
n
k =1

b.3 Frecuencia Porcentual Acumulada

Pi, se calcula sobre variables cuantitativas, siendo el tanto por ciento de


los elementos de la poblacin que estn en alguna de las clases y que
presentan una modalidad inferior o igual a la ci, es decir :

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS Desarrollo

de contenidos

Lecturas
seleccionadas

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

1.2 Distribucin de Frecuencias


Llamaremos distribucin de frecuencias o tabla de frecuencias al arreglo de
filas y columnas que contiene al conjunto de clases junto a las frecuencias coRecordatorio
rrespondientes a cada una de ellas. Una tabla estadstica sirve para clasificar y
ordenar los datos estadsticos.
1.2.1 Tablas Univariantes o unidimensionales
Se denomina as a las tablas de frecuencias que presentan informacin
de una sola variable. Sus formas generales son las siguientes:
a. Variable cualitativa

b. Variable cuantitativa
b.1 Cuantitativa Discreta

b.2 Cuantitativa Continua


Si las clases van a estar conformadas por intervalos se debe seguir
los siguientes pasos:
Determinar el mnimo (Mn) y el mximo (Mx) del conjunto
de datos.
Calcular el Rango (R) de datos mediante: R = Mx Mn
Elegir el nmero de clases (m): se puede utilizar la siguiente
frmula m = 2.54 n siempre es un valor entero, redondear
segn criterios de redondeo. El valor de m se puede elegir tambin a criterio y necesidades del investigador en un intervalo de
5<m<20.
Se calcula la amplitud del intervalo (a) mediante:

a=

R
m

siempre se redondea por exceso (esto es siempre aumentar una


unidad en la cifra de redondeo. Ejemplo si a=1.23 y se desea
redondear a 1 decimal el valor de a = 1.3).
Debido al redondeo por exceso que se realiza en el paso anterior, se debe realizar el ajuste al rango (si el cociente de la
amplitud es exacto no seguir este paso) mediante los siguiente
pasos:

Anotaciones

Bibliografa

23

o
os

as

io

24

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

- Calcular el nuevo rango (R) mediante R = a*m.


- Calcular el exceso del nuevo rango que estar dado por d=R-R.
Anotaciones

- A la diferencia se divide en dos partes (d/2) y se le disminuye al


Mn (Mn d/2) y se le agrega al Mx (Mx + d/2) obteniendo
nuevos lmites.
Construir los intervalos de clase de la siguiente manera:

1.2.2 Tablas bivariantes o bidimensionales


Se denominan as a las tablas que presentan informacin de dos variables
en forma conjunta. Sus formas generales son las siguientes:
Tablas bivariantes de frecuencias absolutas

De igual manera se puede construir tablas bivariantes para frecuencias


relativas o porcentuales de acuerdo a las necesidades de presentacin de
informacin.
Se pueden elaborar tablas de frecuencias de ms variables, como por
ejemplo de tres variables denominadas trivariantes o tridimensionales.
2 TIPOS DE GRFICOS ESTADSTICOS. LECTURA Y ANLISIS
2.1 Cuadro Estadstico:
Se utiliza para presentar la informacin estadstica en forma ordenada y de
fcil lectura para cualquier usuario, se presenta en informes finales y tiene las
siguientes partes:
2.1.1 Componentes de un cuadro
Una grfica, cuadro o una tabla, debe constar de:
Ttulo adecuado: Claro y conciso, que responda a las preguntas: Qu
relaciona?, cmo?, cundo?, y dnde se hicieron las observaciones?.
El cuerpo: o cuadro en s, donde debe considerar el o los tipos de variables a relacionar, el pblico a quien va dirigido y presentarse las frecuencias que sean ms necesarias.

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS Desarrollo

de contenidos

Lecturas

seleccionadas
Notas Explicativas: En ella se presentan aclaraciones respecto a la informacin que se est presentando. Este componente es opcional.

Fuente: Corresponde al rea de la empresa o institucin responsable de


la elaboracin de la informacin.
Recordatorio

2.2 Grfico Estadstico


Una grfica o diagrama estadstico es un dibujo complementario a una tabla
o cuadro, que permite observar las tendencias de un fenmeno en estudio y
facilita el anlisis estadstico de las variables ah relacionadas.
2.2.1 Componentes de una grfica:
Una grfica, cuadro o una tabla, debe constar de:
Ttulo adecuado: Claro y conciso, que responda a las preguntas: Qu
relaciona?, cmo?, cundo?, y dnde se hicieron las observaciones?
El cuerpo: Es el grfico en s, cuya eleccin debe considerar el o los tipos
de variables a relacionar, el pblico a quien va dirigido y el diseo artstico del grfico.
Fuente: Corresponde al rea de la empresa o institucin responsable de
la elaboracin de la informacin.
2.2.2 Principales tipos de grficos
Existe una gran cantidad de grficos para la representacin de datos estadsticos, entre los principales tenemos:
a. Grfico de Barras:
El grfico de barras, como su nombre lo indica, est constituido por barras rectangulares de igual ancho, conservando la misma distancia de
separacin entre s. Se utiliza bsicamente para mostrar y comparar frecuencias de variables cualitativas o comportamientos en el tiempo, cuando el nmero de tems es reducido.
Se construye de la siguiente manera la base de las barra la conforman las
categoras de la variable y su altura se presenta con la frecuencias simples
(absoluta, relativa o porcentual)
Se clasifican por:
Barras Simples: Compara valores entre categoras de una variable
Barras Dobles: Compara valores entre categoras de dos variables
Barras Mltiples Compara valores entre categoras de dos variables
Barras Verticales: Las categoras de la variable deben ubicarse en el eje X
Barras Horizontales: Las categoras de la variable deben ubicarse en el
eje Y
Barras Apiladas: Compara entre categoras el aporte de cada valor en el
total.

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografa

25

o
os

as

io

26

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

Anotaciones

b. Grfico de Sectores Circulares (Pie):

Usualmente llamado grfico de pastel, debido a su forma caracterstica


de una circunferencia dividida en sectores, por medio de radios que dan
la sensacin de un pastel tajado en porciones.
Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el nmero de tems no es superior a 5 y se quiere resaltar
uno de ellos.

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS Desarrollo

de contenidos

Lecturas
seleccionadas

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

c. Grfico de Lneas o Tendencia:


Usado bsicamente para mostrar el comportamiento de una variable
cuantitativa a travs del tiempo. El grfico de lneas consiste en segmenRecordatorio
tos rectilneos unidos entre s, los cuales resaltan las variaciones de la
variable por unidad de tiempo.
Cuando se tienen varias variables a representar, con el fin de establecer
comparaciones entre ellas (siempre que su unidad de medida sea la misma); se utiliza plasmarlos en un slo grfico, el cual es el resultado de
representar varias variables en un mismo plano. A este tipo de grfico se
le conoce como grfico de lneas compuesto.

d. Histograma de Frecuencias:
Es un grfico de barra pero unidas. Se utiliza bsicamente para mostrar
la distribucin de frecuencias de variables cuantitativas. El histograma se
construye dibujando barras contiguas que tienen como base la amplitud
de cada intervalo y como alturas las frecuencias respectivas.
Distribuidora Chespi S.A.: Medicin de la resistencia de conductores.

Fuente: rea de Ingeniera.


e. Polgono de Frecuencias:
Es un grfico poligonal cerrado. Se utiliza bsicamente para mostrar la
distribucin de frecuencias de variables cuantitativas. Para la construccin de un polgono de frecuencias, se marcan los puntos medios (marcas de clase) de cada uno los intervalos en la parte superior de cada barra
del histograma de frecuencias, los cuales se unen con segmentos de recta.

Anotaciones

Bibliografa

27

o
os

as

io

28

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

Distribuidora Chespi S.A.: Medicin de la resistencia de conductores.

Anotaciones

Fuente: rea de Ingeniera.


f. Histograma de Frecuencias Acumuladas:
Se utiliza bsicamente para mostrar la distribucin de frecuencias acumulada de variables cuantitativas. El histograma de frecuencias acumuladas tambin es obtenido a partir de una distribucin de frecuencias, tomando en el eje horizontal las clases de la variable, y en el eje vertical las
frecuencias acumuladas correspondientes a cada intervalo. Se construye de la misma manera que un histograma, pero utilizando frecuencias
acumuladas. Se puede mostrar mediante las barras o bien mediante un
polgono abierto. Para la construccin de un histograma de frecuencias
acumulado, se marcan los lmites superiores de cada uno los intervalos
en la parte superior de cada barra del histograma de frecuencias acumulado, los cuales se unen con segmentos de recta. Este grfico se le conoce
tambin con el nombre de Ojiva de frecuencias.
Distribuidora Chespi S.A.: Medicin de la
resistencia de conductores.

Distribuidora Chespi S.A.: Medicin de la


resistencia de conductores.


g. Diagramas de dispersin o nubes de puntos:
Este tipo de grfico es til para representar la relacin existente entre
dos variables de tipo cuantitativo
La representacin grfica de este tipo de variables es en realidad semejante a la representacin de puntos en el plano, usando unos ejes de
coordenadas. Cada pareja de valores da lugar a un punto en el plano y el
conjunto de puntos que se obtiene se denomina diagrama de dispersin
o nube de puntos.

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS Desarrollo

de contenidos

Televisores: Relacin entre Unidades Vendidas y Precio

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

e
n
t
a

Precio (Dlares)

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

h. Pictograma:
Tiene la caracterstica de que las unidades de la variable se debe representar con smbolos que lo identifique y su tamao va en relacin a la
frecuencia de la categora de la variable

i. Pirmide:
Se utiliza principalmente para presentar la distribucin de la poblacin
por grupos etreos y gnero


j. Diagrama de Pareto
El diagrama de Pareto permite ver que en muchos casos pocos factores
pueden producir la mayora de las consecuencias y se podra resumir en
pocos vitales y muchos triviales. Por ejemplo, en Control de Calidad se
puede mostrar que la mayora de los defectos y el costo de los mismos
surge de un nmero relativamente pequeo de causas.

Bibliografa

29

o
os

as

io

30

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

Anotaciones

k. Tablas de contingencias
Tambin llamadas tablas cruzadas o de doble entrada. Se utilizan cuando
a las observaciones se les asocian con dos variables cualitativas simultneamente.

Diagrama

Objetivos

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS Desarrollo

Inicio

de contenidos

Desarrollo
de contenidos

Actividades

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Autoevaluacin
Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

LECTURA SELECCIONADA N 1
Lecturas
seleccionadas

Recordatorio

Glosario

Anotaciones

Bibliografa

Seis grados de Kevin Bacon:


el estudio original utiliz buenos datos?
Estadstica. Mario Triola. Pg. 3

Seis grados de Kevin Bacon es un juego popular reciente, que consiste en identificar
a un actor o a una actriz de cine, y luego vincularlo con el actor Kevin Bacon. (En el
momento en que se escribi esto, el juego poda jugarse en el sitio Web www.cs.virginia.
edu/oracle). Consideremos a Richard Gere como ejemplo. Gere actu en la pelcula
Cotton Club con Laurence Fishburne, que trabaj en la pelcula Mystic River con Kevin
Bacon. El vnculo Gere-Fishburne-Bacon tiene dos grados de separacin porque no se
cuenta la persona meta.
Este juego, creado por tres estudiantes (Craig Fass, Brian Turtle y Mike Ginelli) de Albright College, es una versin ms especializada de Small World Problem, que plantea
la siguiente pregunta: Cuntos intermediarios (amigos, parientes y otros conocidos) se
necesitan para conectar a cualesquiera dos personas elegidas al azar en la Tierra? Es decir, para cualesquiera dos personas en nuestro planeta, cul es el nmero de grados de
separacin? Este problema de conexin tiene aplicaciones prcticas en muchos campos,
como las redes elctricas, el uso de Internet, las neuronas del cerebro y la propagacin
de enfermedades.
El concepto de seis grados de separacin surgi de un estudio realizado en 1967 por
el psiclogo Stanley Milgram, quien originalmente describi que en Estados Unidos
dos residentes al azar estn conectados por un promedio de seis intermediarios. En su
primer experimento, Milgram envi 60 cartas a personas de Wichita, Kansas, a quienes
les pidi que renviaran esas cartas a una mujer especfica en Cambridge, Massachusetts.
A esas personas se les dio la instruccin de entregar en mano las cartas a conocidos que,
segn ellos, podran contactar a la persona indicada, ya fuera directamente o a travs de
otros conocidos. Participaron 50 de las 60 personas, y tres cartas llegaron a su destino.
Dos experimentos posteriores tuvieron tasas de terminacin ms bajas; pero finalmente
Milgram alcanz una tasa del 35 por ciento, y describi que cada cadena completa tena
un promedio de alrededor de seis intermediarios. Como consecuencia, los datos originales de Milgram produjeron el concepto seis grados de separacin.
Veamos dos preguntas clave: Eran adecuados los datos originales de Milgram? Los
datos originales de Milgram justifican el concepto de seis grados de separacin?
Un principio extremadamente importante en este captulo, en este libro, y en la estadstica en general, es que el mtodo que se utiliza para reunir datos de muestras puede
construir o destruir la validez de las conclusiones basadas en los datos. En la actualidad,
a todos nosotros se nos bombardea con encuestas y resultados de encuestas. Algunas
renen datos de muestras que son tiles porque describen de manera exacta caractersticas importantes de poblaciones. Otras encuestas usan datos muestrales recolectados
de tal forma que condenan los resultados a la creciente pila de basura de la mala informacin.
Diagrama

Objetivos

Desarrollo
de contenidos

Actividades

Inicio

ACTIVIDAD N 1
Autoevaluacin

Esta actividad puede consultarla en su aula virtual.

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

Bibliografa

Bibliografa

31

o
os

as

io

32

Inicio
UNIDAD I: INTRODUCCIN,
RESUMEN Y GRFICA DE DATOS

Actividades

Autoevaluacin

Diagrama

Objetivos

Glosario

Bibliografa

Desarrollo
de contenidos

Actividades

Lecturas
seleccionadas

Glosario

Autoevaluacin

GLOSARIO
Anotaciones

Bibliografa

Arreglo u ordenamiento de datos: Organizacin de los datos sin procesar en orden


ascendente o descendente.
Recordatorio

Anotaciones
Conjunto de datos: Una coleccin de datos.
Distribucin de frecuencias: Presentacin de un conjunto de datos en el que se muestra la frecuencia absoluta y/o relativa de los datos pertenecientes a cada intervalo.
Estadgrafo: Caracterstica de la muestra.
Frecuencia absoluta: Nmero de datos que pertenecen a determinado intervalo.
Frecuencia Relativa: Proporcin representativa de cada intervalo respecto al tamao
total.
Histograma: Grfica de un conjunto de datos compuesta por una serie de rectngulos
cada uno con un ancho proporcional al rango de los valores de cada clase o intervalo
y altura proporcional a la frecuencia.
Intervalo: Conjunto de datos nmricos establecidos entre dos lmites, inferior e inferior.
Marca de clase: Punto medio de cada intervalo, valor representativo de todos los datos
que pertenecen a dicho intervalo.
Muestra: Coleccin de algunos elementos, subconjunto de la poblacin con las mismas caractersticas que la poblacin bajo estudio, utilizada para describir a la poblacin de la cual proviene.
Ojiva: Grfica de una distribucin de frecuencias acumuladas.
Parmetro: Caracterstica de la poblacin.
Poblacin: Coleccin de todos los lementos que se estn estudiando y sobre los cuales
intentamos llegar a conclusiones.
Variable Cualitativa Nominal: Aquella que asume valores cualitativos que no poseen
jerarquas entre si.
Variable Cualitativa Ordinal: Aquella que asume valores cualitativos los cules si poseen jerarquas entre si.
Variable Cuantitativa Continua: Aquella que asume valores cuantitativos que provienen de una medicin.

Diagrama

Objetivos

Inicio

Desarrollo
de contenidos

Actividades

Autoevaluacin

Lecturas
seleccionadas

Glosario

Bibliografa

Variable Cuantitativa Discreta: Aquella que asume valores cuantitativos que provienen
de un conteo.

BIBLIOGRAFA DE LA UNIDAD I

1. Triola Mario F. ESTADSTICA. Pearson Educacin. Mxico 2012

Recordatorio

Anotaciones

2. Berenson, Mark y Levine, David. Estadstica Bsica en Administracin, Conceptos y


aplicaciones. Prentice Hall, Mxico 2010

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS Desarrollo

de contenidos

Objetivos

Inicio

Actividades

Autoevaluacin

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

AUTOEVALUACIN DE LA UNIDAD I
1. A los clientes de un banco se les pide rellenen un cuestionario en el que se hicieron
las siguientes preguntas,
Glosario

Bibliografa

Anotaciones

Cules proporcionan datos cuantitativos o cualitativos? Asigne el cdigo correspondiente:

A= Cualitativos Nominales B= Cualitativos Ordinales

C=Cuantitativos Discretos D=Cuantitativos Continuos


A. DADCB

B. DBCAB

D. ADBCB

E. BCBAC

C. CADCA

2. En la siguiente tabla, se muestra el grado de instruccin de 1000 trabajadores de la


liquidada empresa DOE RUN. Identifica cual de las afirmaciones es incorrecta.

A. El total de trabajadores con estudios superior tcnico son 388.


B. El diagrama de sectores representa mejor este tipo de variable.
C. El 24.5% de los trabajadores son universitarios
D. Ms del 50% tienen estudios bsicos. (Primaria y secundaria).
E. Ms del 60% de los trabajadores tienen estudios superiores o universitarios.
3. En la distribucin de frecuencias

Los valores de A, B, C, D y E en ese orden son:

Bibliografa

33

o
os

as

io

34

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD I: INTRODUCCIN, RESUMEN Y GRFICA DE DATOS

A. 13, 72, 16, 135, 96.5%


B. 23, 62, 16, 137, 96.5%
C. 13, 72, 16, 138, 96%
Anotaciones

D. 23, 62, 16, 135, 96%

4. El siguiente grfico representa las preferencias de bebidas de los estudiantes de la


Universidad Continental. Seale el enunciado incorrecto entre los presentados
luego del grfico.

A. Es un diagrama de barras agrupadas que representa la preferencia de bebidas por


gnero.
B. La mayora de los estudiantes de ambos gneros prefieren gaseosas.
C. De todos los estudiantes encuestados 22 prefieren otras bebidas.
D. Ms del 50% de los estudiantes prefieren Frugos.
E. Slo 33 de los estudiantes encuestados prefieren agua.

5. Se tiene la siguiente tabla de distribucin de frecuencia:

Determine el tamao de la muestra.


A. 120
B. 130
C. 140
D. 150
E. 160

Desarrollo
de contenidos

Diagrama

Objetivos

Desarrollo
de contenidos

Lecturas
seleccionadas
Diagrama

Inicio

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS:


INDICADORES ESTADSTICOS
Actividades

Diagrama
Recordatorio

Glosario

Recordatorio

Anotaciones

DIAGRAMA DE PRESENTACIN DE LA UNIDAD II


Glosario

Bibliografa

Objetivos

Inicio

Anotaciones
Actividades

EJEMPLOS

Glosario

ACTIVIDADES

Autoevaluacin

AUTOEVALUACIN
Lecturas
seleccionadas

Lecturas
seleccionadas

Autoevaluacin

CONTENIDOS
Recordatorio
Desarrollo
de contenidos

BIBLIOGRAFA

Bibliografa

ORGANIZACIN DE LOS APRENDIZAJES


Objetivos

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Inicio

Anotaciones

CONOCIMIENTOS

Tema NActividades
1:Medidas
de
Autoevaluacin
Tendencia Central
1. Media
2. Mediana
3. Moda
Lecturas
Glosario
Bibliografa

Desarrollo
de contenidos

seleccionadas

Tema N 2: Medidas de
Dispersin
1. Rango o recorrido
Recordatorio
Anotaciones
2. Recorrido
semi intercuartil
3. Desviacin media
4. Varianza
5. Desviacin tpica o
estndar
6. Coeficiente de variabilidad
Tema N 3: Medidas de
Posicin, Asimetra y
Curtosis
1. Cuantiles
2. Medidas de Asimetra
3. Medidas de Curtosis
Lectura Seleccionada N 2
Los premios de la Academia discriminan por la
edad?
Autoevaluacin N 2

PROCEDIMIENTOS

ACTITUDES

1. Calcula las medidas de


tendencia central y las
interpreta.
2. Calcula las medidas de
dispersin y las interpreta.

Demuestra proactividad y
tica en el desarrollo de la
asignatura y en el manejo
de la informacin.

Actividad N 1:
Calcula indicadores estadsticos en distintas situaciones.
3. Calcula las medidas de
posicin y utiliza otros
indicadores estadsticos
para analizar conjuntos
de datos.
Actividad N 2:
Resuelve ejercicios y problemas aplicando las medidas de dispersin.
Tarea Acadmica N 1

Bibliografa

35

o
os

as

io

36

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS


Anotaciones

TEMA N 1: MEDIDAS DE TENDENCIA CENTRAL


Estimado alumno es momento de conocer las medidas descriptivas que son conocidas
a menudo como indicadores estadsticos que nos van ayudar a tener una idea del comportamiento general de los datos sin tener la necesidad de analizarlos uno por uno, por
ello es importante que tengamos en cuenta que lo que vamos a calcular son medidas
representativas de los datos sobre los cuales ya podremos tomar algn tipo de decisin.
Las medidas de tendencia central, llamadas as porque tienden a localizarse en el centro
de la informacin.
De tendencia porque no necesariamente son valores que la distribucin presenta, sino
valores hacia los cuales tiende o aproxima.
Centrales porque, normalmente, en el grfico de frecuencias sern siempre valores medios centrales.
Las medidas de tendencia central responden a la necesidad de describir una colectividad en funcin de una sola medida que la caracterice y distinga, ya sea porque son
los ms frecuentes (moda) o porque alrededor de ellos se agrupa la mayor parte de la
poblacin o muestra (media o mediana).
Las medidas de tendencia central, son tambin medidas de posicin ya que, de todas
maneras ocupan un lugar dentro de la informacin, los parmetros posicionales son
muy tiles en la interpretacin porcentual de la informacin.
Este tipo de medidas son de gran importancia en el manejo de las tcnicas estadsticas,
sin embargo, su interpretacin no debe hacerse aisladamente de las medidas de dispersin, ya que la representatividad de ellas est asociada con el grado de concentracin
de la informacin.
Las principales medidas de tendencia central son:
1. Media aritmtica.
2. Mediana
3. Moda.
1 MEDIA ARITMTICA
Definida matemticamente como el cociente entre la suma de todos los valores de
la variable y el nmero de observaciones.
a. Simbologa:
Si la media es calculada de una poblacin se simboliza mediante
Si la media muestral es calculada de una muestra de una poblacin se simboliza
mediante x .

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

b. Clculo de la Media

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

b.1. Para datos no agrupados

Ejemplo 1:
La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas de la ciudad fueron:
10 12 40 10 30 14 16 20 25 28 30 26 30 10 18 17
13 17 21 14 15 19 27 22 14 11 13 15 18 20 30 39
Calcule e interprete la media.
Solucin:
Obtenemos

Interpretacin: En promedio las pequeas empresas invierten 20 125 nuevos


soles al ao
b.2. Para datos agrupados

Ejemplo 2: Variable Discreta


Se selecciona al azar 280 vendedores de una gran compaa constructora de
casas. A continuacin se muestra el nmero de casas vendidas durante el ltimo bimestre. Calcule e interprete la media

Solucin:
Completando la siguiente tabla para el clculo de la media aritmtica

Bibliografa

37

o
os

as

io

38

Actividades

Autoevaluacin

Glosario

Bibliografa

Anotaciones

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

El promedio es:
Ejemplo 3: Variable Continua
La siguiente tabla de distribucin de frecuencias corresponde al rendimiento
de gasolina en kilmetros por litro de una muestra de 50 automviles producidos por Nissan Mxico.

Solucin:
Completando la siguiente tabla para el clculo de la media aritmtica

El promedio es:

Interpretacin: _____________________________________________________
__________________________________________________________________
c. Propiedades de la media aritmtica
1. La suma total de los n valores cuya media es

Datos no agrupados :

es igual a n. x .

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

Lecturas
seleccionadas

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

2. Si cada uno de los n valores xi es transformado en: yi = a . xi + b, siendo a y b


constantes, entonces, la media de los n valores yi es:
Recordatorio

Como casos particulares se tiene:


. Si los n datos son una constante b, entonces la
Si yi = b, entonces
media es igual a esa constante b.
. Si a cada dato se le suma una constante
Si yi = xi + b, entonces
b, la media queda sumada por esa constante b.
. Si a cada dato multiplica por una constan Si yi = a . xi , entonces
te a, la media queda multiplicada por esa constante a.
3.La suma algebraica de las desviaciones de n datos xi con respecto a su media,
es igual a cero.

4.La suma de los cuadrados de las desviaciones de n datos con respecto a su


media es el valor mnimo.

d. Ventajas de la media aritmtica


- Es fcil de entender y usar.
- Hace uso de todos los datos de la distribucin, por lo cual es una medida de
tendencia central eficiente.
- Es el ms conocido y popular de los promedios, el primero en el que piensan
las personas, aunque no sepan estadstica.
- El hecho de que su definicin no sea lgica sino matemtica hace que sea la
medida de tendencia central usada con preferencia en Inferencia Estadstica y
en la mayora de tests estadsticos.
e. Desventajas de la media aritmtica
- Puede ser influenciada por valores extremos, que la hagan perder su valor
como medida de tendencia central
- En ciertos casos puede no representar un valor observable, lo cual en el caso
de variables discretas resulta artificioso.
- No puede calcularse para series cualitativas.
- Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos de dato de nuestro clculo.
- Somos incapaces de calcular la media para un conjunto de datos que tiene
clases de extremo abierto, ya sea en el inferior o en el superior de la escala.
2 MEDIANA
Su definicin no es matemtica sino lgica, entendemos por mediana aquel valor
de la variable que divide en dos partes iguales a un conjunto ordenado de datos.
a. Simbologa
Se simboliza con Me

Anotaciones

Bibliografa

39

o
os

as

io

40

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

b. Clculo de la Mediana
b.1 Para datos no agrupados
Anotaciones

Para el clculo de la mediana los datos deben estar ordenados de menor a


mayor, y deja a su izquierda y derecha el mismo nmero de elementos, es
decir, el valor que ocupa el lugar central es la mediana.
Lo anterior tiene sentido en caso de que la serie tenga un nmero impar
de elementos, si por el contrario tuviera un nmero par habra dos valores
centrales, y en este caso se toma como mediana la media aritmtica de los dos
valores centrales.
Ejemplo 1-a: Si el nmero de datos es par
La inversin anual (en miles de soles) de un grupo de pequeas empresas de
la ciudad fueron:

Calcule e interprete la mediana.


Solucin:
Primero debemos ordenar los datos en forma ascendente (de menor a mayor)

Luego el nmero de datos se divide en dos partes iguales


Se elige los valores centrales de la variable que tiene la posicin i=16 y i=17
que para el ejercicio son 18 y 18

La mediana ser:

Me =18

Interpretacin:
El 50% de las pequeas empresas han invertido como mximo 18 mil nuevos
soles al ao.
Ejemplo 1-b: Si el nmero de datos es impar
La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas de la ciudad fueron:

Calcule e interprete la mediana.


Solucin:
Primero debemos ordenar los datos en forma ascendente (de menor a mayor)

Luego el nmero de datos se divide en dos partes iguales

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

Lecturas

Glosario

Recordatorio

Anotaciones

seleccionadas
Se elige el valor centrales de la variable que tiene la posicin i=17 que para
el ejercicio es 18

La mediana ser:

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Me = 18

Interpretacin:
El 50% de las pequeas empresas han invertido como mximo 18 mil nuevos
soles al ao.
b.2 Para datos agrupados
Se aplica el siguiente estadgrafo:

Ejemplo 2: Variable Discreta


Se selecciona al azar 280 vendedores de una gran compaa constructora
de casas. A continuacin se muestra el nmero de casas vendidas durante el
ltimo bimestre. Calcule e interprete la media

Calcule e interprete la mediana.


Solucin:
Como los datos tabulados ya estn ordenados, debemos encontrar el valor de
la variable que ocupa la posicin central, entonces dividimos al conjunto de
datos n en dos partes:
Entonces ubicamos en la tabla el valor que tenga la posicin ___, para eso
calculamos la frecuencia acumulada

Bibliografa

41

o
os

as

io

42

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

Entonces la mediana es:



Anotaciones

Me =

Ejemplo 3: Variable Continua


La siguiente tabla de distribucin de frecuencias corresponde al rendimiento
de gasolina en kilmetros por litro de una muestra de 50 automviles producidos por Nissan Mxico.

Calcule e interprete la mediana.


Solucin:

Para aplicar los valores en la frmula debemos encontrar la clase j denominada clase mediana.
La clase mediana es aquella que contiene a la mitad de del conjunto de datos, esto es el que contenga la posicin
la frecuencia acumulada:

, para eso calculamos

Entonces aplicando en la frmula:


Me =

Caractersticas de la mediana:
Todo conjunto de datos medidos en escala de ordinal, intervalo o razn
tiene una mediana.
El valor de la mediana depende del nmero de datos observados.
La mediana es un estadstico robusto, es decir, no se ve afectada por el valor
de los extremos (mnimo y mximo). Por eso se le utiliza cuando hay datos
inusuales o el polgono de frecuencias no es simtrico.
La mediana no tiene propiedades matemticas valiosas para poder usarlas
en otros clculos.

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

3 MODA

Lecturas
seleccionadas

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Entendemos por moda el valor de la variable que ms veces se repite, y en una distribucin de frecuencias el valor con mayor frecuencia absoluta simple
Recordatorio
Puede darse el caso de que no haya moda (amodal), slo una (unimodal), dos modas (bimodal) o varias modas (multimodal).

a. Simbologa
Se simboliza con Mo
b. Clculo de la Moda
b.1 Para Datos no agrupados
En este caso la determinacin de la moda es inmediata por simple observacin. Aquel valor de la variable con mayor frecuencia es la moda.
Ejemplo 1:
La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas de la ciudad fueron:

Calcule e interprete la moda.


Solucin:
Buscamos el valor que ms se repita, en este caso es: Mo = 30
Interpretacin: Las pequeas empresas con mayor frecuencia han invertido
30 mil nuevos soles al ao.
b.2 Para Datos Agrupados
Se aplica el siguiente estadgrafo:

Ejemplo 2: Variable Discreta


Se selecciona al azar 280 vendedores de una gran compaa constructora
de casas. A continuacin se muestra el nmero de casas vendidas durante el
ltimo bimestre. Calcule e interprete la media

Anotaciones

Bibliografa

43

o
os

as

io

44

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

Anotaciones

Calcular e interpretar la Moda.


Solucin:
El clculo es bastante sencillo, slo ubicamos el valor que tenga la mayor
frecuencia, que para el ejercicio es:

Mo =
Ejemplo 3: Variable Continua
La siguiente tabla de distribucin de frecuencias corresponde al rendimiento
de gasolina en kilmetros por litro de una muestra de 50 automviles producidos por Nissan Mxico.

Solucin:
Para aplicar los valores en:
debemos encontrar la clase j denominada clase modal
La clase modal es aquella que tenga la mayor frecuencia, entonces para nosotros es la clase que tiene la frecuencia ____

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

Entonces aplicando en la frmula:

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones


Caractersticas de la moda:
La moda se puede calcular para cualquier escala de medicin.
El valor de la moda no se ve afectada por valores extremos.
La moda se puede calcular aun cuando uno o ms intervalos sean de extremo abierto.
La moda no siempre es un valor nico. Una serie de datos puede tener dos
modas (bimodal) o ms modas (multimodal).
Algunas series de datos no tienen moda.
La moda es una medida menos importante que la mediana o la media debido a su ambigedad.
La moda no tiene propiedades matemticas valiosas para poder usarlas en
otros clculos.
IMPORTANTE:
Medidas de tendencia central y el sesgo de la distribucin de frecuencias

Bibliografa

45

o
os

as

io

46

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

TEMA N 2: MEDIDAS DE DISPERSIN


Anotaciones

Estimado alumno, es muy usual que las decisiones que se tomen se basen exclusivamente en los indicadores estadsticos que estamos estudiando, por lo que no solo basta con
obtener las medidas de tendencia central, es necesario saber tambin cul es el nivel de
homogeneidad que tienen las series de datos que estamos analizando, que tan alejados
del promedio estn cada uno de los datos y cual es justamente el promedio de ese alejamiento que le llamaremos desviacin. El tema que a continuacin te presento trata
justamente de lo expuesto.
MEDIDAS DE DISPERSIN
El anlisis estadstico o el estudio de una serie estadstica no puede quedarse slo en el
clculo de las medidas de tendencia central o de posicin tales como la media, mediana,
moda, percentiles, ya que no estaramos siendo absolutamente fieles a la realidad, suele
existir datos extremos inferiores y superiores a la media aritmtica, los cuales no estn
siendo bien representados por este parmetro, hay veces que la media, por s sola, no
es muy significativa. Adems puede ocurrir que series absolutamente distintas pueden
tener medias iguales y este hecho no significa que las distribuciones sean exactamente
iguales. Por lo tanto es necesario profundizar en su estudio, para lo cual se requiere ver
si los valores de la variable estn muy o poco separados de la media aritmtica.
La media aritmtica es ms representativa cuanto ms agrupados estn los valores de la
serie respecto a ella y al revs y a la mayor o menor separacin de los valores respecto a
la media se le llama dispersin o variabilidad.
Para medir el grado de dispersin de una variable, se utilizan principalmente los siguientes indicadores o medidas de dispersin:
7. Rango o recorrido
8. Recorrido semi intercuartil
9. Desviacin media
10. Varianza
11. Desviacin tpica o estndar
12. Coeficiente de variabilidad
1 RANGO O RECORRIDO
Es la medida de dispersin ms sencilla ya que slo considera los dos valores extremos de una coleccin de datos, sin embargo, su mayor utilizacin est en el campo
de la estadstica no paramtrica.
Clculo del Rango
R = Xmax Xmin

2 RECORRIDO SEMI INTERCUANTIL


La desviacin cuartil de un conjunto de datos est definida por:
Q = (Q3 - Q1)/2
Donde Q3 y Q2 son el primer y tercer cuartil de los datos. A veces se usa el Recorrido intercuartil Q3 Q1
El recorrido semi-intercuartil o desviacin cuartil, da una idea de la dispersin del
50% de los datos centrales. Suele utilizarse cuando la mediana es el ndice ms
representativo.

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

Lecturas
seleccionadas

3 DESVIACIN MEDIA

La desviacin media, mide la distancia absoluta promedio entre cada uno de los
Recordatorio
datos, y el parmetro que caracteriza la informacin. Usualmente se considera la
desviacin media con respecto a la media aritmtica:
Cuanto ms alta es la desviacin absoluta media mayor es la dispersin y menos
representativa la media aritmtica.
Clculo de la Desviacin Media
Para datos no agrupados

Para datos agrupados

4 VARIANZA
La varianza es uno de los parmetros ms importantes en estadstica paramtrica,
se puede decir que, teniendo conocimiento de la varianza de una poblacin, se ha
avanzado mucho en el conocimiento de la poblacin misma.
Numricamente definimos la varianza, como desviacin cuadrtica media de los
datos con respecto a la media aritmtica.
La varianza nos mide la mayor o menor representatividad de la media aritmtica:
- Si la varianza es grande nos indica gran dispersin, la media aritmtica no es representativa.
- Si casi todos los valores estn muy cercanos a la media aritmtica entonces la varianza se acercar a cero, con lo que se dice que la serie es concentrada.
- La varianza nunca puede ser negativa.
De su forma de clculo se desprenden dos problemas:
- Se expresa en unidades cuadradas (nuevos soles cuadrados, minutos cuadrados,
etc.)
- Si la media aritmtica no es una buena medida de tendencia central, la varianza
que se basa en ella tampoco ser una buena medida de dispersin.
a. Simbologa
S2 : Varianza de la muestra
2 : Varianza de la Poblacin
b. Clculo de la Varianza
b.1 Para Datos no Agrupados
Varianza de la Muestra

Varianza de la Poblacin

La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas


de la ciudad fueron:

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografa

47

o
os

as

io

48

Actividades

Autoevaluacin

Glosario

Bibliografa

Anotaciones

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

Calcule la varianza
Solucin:

Para aplicar:

debemos calcular

(calculado en la pgina 33 )

Entonces aplicando a la frmula de la varianza:

b.2 Para datos agrupados

Ejemplo 2: Variable Discreta


Se selecciona al azar 280 vendedores de una gran compaa constructora
de casas. A continuacin se muestra el nmero de casas vendidas durante el
ltimo bimestre. Calcule e interprete la media

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

Solucin:

Para aplicar:

debemos calcular

(calculado en pgina 33 )
Completando la siguiente tabla para el clculo de la varianza

La varianza es: =
Otra solucin:

Se puede aplicar:
Completando la siguiente tabla para el clculo de la varianza

Reemplazando en:

Bibliografa

49

o
os

as

io

50

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

Ejemplo 3: Variable Continua


Anotaciones

La siguiente tabla de distribucin de frecuencias corresponde al rendimiento de gasolina en kilmetros por litro de una muestra de 50 automviles
producidos por Nissan Mxico.

Solucin:

Para aplicar:

debemos calcular

(calculado en pg 34)
Completando la siguiente tabla para el clculo de la varianza:

La varianza es:
Otra solucin:

Se puede aplicar: |

Propiedades de la varianza
1. La varianza es un nmero real no negativo y viene expresado en unidades cuadrticas, mientras que la desviacin estndar viene expresada en

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

las mismas unidades en las que vienen expresados los datos.

Lecturas
seleccionadas

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

2. Si cada uno de los n valores xi es transformado en: yi = a . xi + b, siendo


a y b constantes, entonces, la varianza de los n valores yi es:
Recordatorio

Como casos particulares se tiene:


Si yi = b, entonces
. Si los n datos son iguales a una constante
b, entonces la varianza (y la desviacin estndar) es igual a cero.
. Si a cada dato se le suma una constan Si yi = xi + b, entonces
te b, la varianza (y la desviacin estndar) no cambian.
. Si a cada dato se le multiplica por
Si yi = a . xi , entonces
una constante a, la varianza de los nuevos valores es igual a la varianza
de los valores iniciales multiplicada por a2.
3. La varianza depende del valor de todos los datos y es sensible a la variacin de cada uno de ellos.
4. La varianza puede ser calculada tambin con datos agrupados en intervalos, inclusive de amplitud diferente, siempre que se puedan determinar las marcas de clase.
5. Desigualdad de Tchebysheff: Independientemente de la forma de la
,
distribucin de frecuencias de los datos, el intervalo
donde k > 1, contiene por lo menos el:
de los datos.

5 DESVIACIN ESTNDAR O TPICA


Para eliminar el problema de la elevacin al cuadrado de la varianza, se realiza una
transformacin consistente en calcular la raz cuadrada de la varianza con lo que
obtendramos la desviacin estndar o tpica

Con lo que la desviacin estndar o tpica vendr dada en las mismas unidades que
los valores de la variable.
- La desviacin estndar o tpica siempre es positiva porque la varianza tambin lo
es.
- La desviacin estndar o tpica es la medida de dispersin ptima, ms exacta, ms
estable y ms utilizada, sirviendo de base para las medidas de asimetra, estadsticos tpicas y correlacin.
- Cuanto ms se acerca a cero la desviacin ms concentrada es la serie.
- Suele decirse que cuando la desviacin estndar o tpica es menor que la media
aritmtica la serie es concentrada y s la desviacin estndar o tpica es mayor que
la media aritmtica la serie es dispersa.
Ejemplo 1:
La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas
de la ciudad fueron:

Anotaciones

Bibliografa

51

o
os

as

io

52

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

Calcule e interprete la desviacin estndar


Solucin:
Anotaciones

Interpretacin: La inversin promedio anual de las pequeas empresas varan 8


069 nuevos soles.
Ejemplo 2: Variable Discreta
Se selecciona al azar 280 vendedores de una gran compaa constructora de casas.
A continuacin se muestra el nmero de casas vendidas durante el ltimo bimestre.
Calcule e interprete la media

Solucin:
entonces s =
Ejemplo 3: Variable Continua
La siguiente tabla de distribucin de frecuencias corresponde al rendimiento de
gasolina en kilmetros por litro de una muestra de 50 automviles producidos por
Nissan Mxico.

Solucin:

entonces s =

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

6 COEFICIENTE DE VARIABILIDAD

Lecturas
seleccionadas

Con frecuencia nos interesa establecer comparaciones de la dispersin, entre diferentes muestras que posean distintas unidades de medida (por ejemplo, nuevos soRecordatorio
les con dlares), las medidas de dispersin antes mencionadas no permiten realizar
este tipo de comparaciones, pero es el coeficiente de variabilidad quien nos ayuda
a realizar estas comparaciones.
El coeficiente de variabilidad es una medida de dispersin relativa (sin unidades de
medida) tiene en cuenta el valor de la media aritmtica, para establecer un nmero
relativo, que hace comparable el grado de dispersin entre dos o ms variables, y
se define como:

Para determinar la homogeneidad (tiene menor variabilidad) de dos o ms muestras que tienen diferente unidad de medida, se elige aquella que tenga el menor
CV.
Ejemplo 1:
La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas
de la ciudad fueron:

Calcule e interprete el coeficiente de variacin


Solucin:
Para calcular el coeficiente de variacin, debemos calcular la media y la desviacin
y s = 8.069038047
estndar, por los ejercicios anteriores tenemos:
Entonces

Interpretacin: La inversin de las pequeas empresas en altamente dispersas (heterognea)


Ejemplo 2: Variable Discreta
Se selecciona al azar 280 vendedores de una gran compaa constructora de casas.
A continuacin se muestra el nmero de casas vendidas durante el ltimo bimestre.
Calcule e interprete la media

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografa

53

o
os

as

io

54

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

Solucin:
Para calcular el coeficiente de variacin, debemos calcular la media y la desviacin
y s =
estndar, por los ejercicios anteriores tenemos:
Anotaciones

Entonces
CV = __________________*100 CV=
Ejemplo 3: Variable Continua
La siguiente tabla de distribucin de frecuencias corresponde al rendimiento de
gasolina en kilmetros por litro de una muestra de 50 automviles producidos por
Nissan Mxico.

Solucin:
Para calcular el coeficiente de variacin, debemos calcular la media y la desviacin
estndar, por los ejercicios anteriores tenemos:
y s =
Entonces
CV = __________________*100
CV=

TEMA N 3: MEDIDAS DE POSICON, ASIMETRA Y CURTOSIS


1 CUANTILES
Sucede tambin con frecuencia que al investigador o al analista le interesa reducir
la distribucin de frecuencias de una variable a ciertas estructuras porcentuales que
le sirvan como patrn para efectuar comparaciones entre segmentos equivalentes
de otras distribuciones similares.
Los cuantiles son los valores de la variable debajo de los cuales caen determinados
porcentajes de frecuencia.
a. Cuantiles ms frecuentes
Centil:
Tambin conocido como percententil o porcentil. El centil k, Pk. es el valor numrico tal que el k por ciento de los datos ordenados est por debajo de ese valor
y el (100 k) por ciento de los datos est por encima de ese valor.
Decil:
Se denomina as a cada uno de los nueve centiles: P10, P20, P30 P90 y se les denota como D1, D2, D3, , D9 respectivamente.

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

Lecturas
seleccionadas

Cuartil:

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Se denomina as a cada uno de los tres centiles: P25, P50, P75 y se les denota como
Q1, Q2 y Q3 respectivamente.
Adems, se define el rango intercuartil (llamado tambin propagacin media)
Recordatorio
como la diferencia entre el tercer cuartil y el primer cuartil en una serie de datos,
es decir:
Rango intercuartil = Q3 Q1
b. Clculo de los Percentiles
Si para calcular la mediana buscbamos el ordinal correspondiente a n/2, o lo
que es lo mismo 50*n/100, para calcular cualquier percentil haremos lo mismo
pero partiendo de que el ordinal que queremos buscar ser el correspondiente
a i*n/100.
Hecho lo anterior el clculo de cualquier percentil sigue los mismos pasos que
los seguidos en el clculo del percentil 50 (mediana).
Para Datos Agrupados

Ejemplo 2: Variable Discreta


Se selecciona al azar 280 vendedores de una gran compaa constructora de
casas. A continuacin se muestra el nmero de casas vendidas durante el ltimo
bimestre. Calcule e interprete:

1. Cuartil 1

5. Decil 9

2. Cuartil 2

6. Percentil 5

3. Cuartil 3

7. Percentil 78

4. Decil 3

8. Percentil 99

Clculo de Cuartil 1:
Solucin:
Como los datos tabulados ya estn ordenados, debemos encontrar el valor de la
variable que contiene el i=25% de los datos, entonces calculamos el 25% de n:

Anotaciones

Bibliografa

55

o
os

as

io

56

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

Entonces ubicamos en la tabla el valor que tenga la posicin ___, para eso calculamos la frecuencia acumulada
Anotaciones

Entonces el cuartil 1 es: Q1 = P25 =



1. Q1=

5. D9=

2. Q2=

6. P5=

3. Q3=

7. P78=

4. D3=

8. P99=

Ejemplo 3: Variable Continua


La siguiente tabla de distribucin de frecuencias corresponde al rendimiento de
gasolina en kilmetros por litro de una muestra de 50 automviles producidos
por Nissan Mxico. Calcule:

1. Cuartil 1

5. Decil 9

2. Cuartil 2

6. Percentil 5

3. Cuartil 3

7. Percentil 78

4. Decil 3

8. Percentil 99

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

Lecturas
seleccionadas

Clculo de Cuartil 1

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Solucin:
debemos encontrar la clase j

Para aplicar los valores en:

Recordatorio

denominada clase del i-simo percentil.


La clase del i-simo percentil es aquella que contiene el i%=25% del conjunto de
datos, esto es el que contenga la posicin
frecuencia acumulada:

, para eso calculamos la

Entonces aplicando en la frmula:


Q1 = P25 =

1. Q1=

5. D9=

2. Q2=

6. P5=

3. Q3=

7. P78=

4. D3=

8. P99=

2 MEDIDAS DE CURTOSIS
La curtosis es la caracterstica de una distribucin de frecuencias en la cual se compara la dispersin de los datos observados cercanos al valor central con la dispersin de los datos cercanos a ambos extremos de la distribucin, Se aplica cuando la
distribucin es simtrica.
Se calcula mediante:

Interpretacin:
Si K tiende a 0 la distribucin es normal o mesocrtica
Si K tiende a 0.5 es leptocrtica
Si K tiende a -0.5 es platicrtica
Ejemplo 2: Variable Discreta
Se selecciona al azar 280 vendedores de una gran compaa constructora de casas.
A continuacin se muestra el nmero de casas vendidas durante el ltimo bimestre.
Calcule e interprete el coeficiente de curtosis.

Anotaciones

Bibliografa

57

o
os

as

io

58

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

Solucin:
Para calcular el coeficiente de curtosis, debemos calcular:
P10 =

P75=

P25 =

P90 =

Anotaciones

Entonces :

K= ____________ -

K=

Ejemplo 3: Variable Continua


La siguiente tabla de distribucin de frecuencias corresponde al rendimiento de
gasolina en kilmetros por litro de una muestra de 50 automviles producidos por
Nissan Mxico. Calcule el coeficiente de curtosis:

Solucin:
Para calcular el coeficiente de curtosis, debemos calcular:

P10 =

P75=

P25 =

P90 =

Entonces :

K= ____________ -

K=

3 MEDIDAS DE ASIMETRA
En la Parte I de Medidas de descriptivas, se mencion la relacin emprica de las
tres medidas de tendencia central: Media, Mediana y Moda, la cual nos mostraba
el tipo de distribucin de una serie de datos. Ahora determinaremos esta relacin
pero mediante un indicador ms representativo que se le conoce como el ndice de
Asimetra. El ndice de asimetra de Pearson se define como

En distribuciones asimtricas se verifica que :


de asimetra es:

, entonces el ndice

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

Interpretacin:
Si As = 0, La distribucin es simtrica, esto es
Si As > 0, La distribucin es asimtrica positiva, esto es
Si As < 0, La distribucin es asimtrica negativa, esto es
Ejemplo 1: Datos no clasificados
La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas
de la ciudad fueron:

Calcule e interprete el coeficiente de asimetra.


Solucin:
Para calcular el coeficiente de asimetra, debemos calcular la media, la mediana y la
desviacin estndar, por los ejercicios anteriores tenemos:

Entonces:

Interpretacin: La distribucin de la inversin anual de las pequeas empresas


muestra una ligera distribucin asimtrica positiva, esto es que ms del 50% de las
pequeas empresas invierten menos de 20 125 nuevos soles al ao.
Ejemplo 2: Variable Discreta
Se selecciona al azar 280 vendedores de una gran compaa constructora de casas.
A continuacin se muestra el nmero de casas vendidas durante el ltimo bimestre.
Calcule e interprete el coeficiente de asimetra.

Solucin:
Para calcular el coeficiente de asimetra, debemos calcular la media, mediana y la
desviacin estndar, por los resultados de los ejercicios anteriores tenemos:

x=
; Me = y s=
Entonces:

As = _______________

As =

Bibliografa

59

o
os

as

io

60

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

Ejemplo 3: Variable Continua

Anotaciones

La siguiente tabla de distribucin de frecuencias corresponde al rendimiento de


gasolina en kilmetros por litro de una muestra de 50 automviles producidos por
Nissan Mxico. Calcule e interprete el coeficiente de variacin.

Solucin:
Para calcular el coeficiente de asimetra, debemos calcular la media, mediana y la
desviacin estndar, por los resultados de los ejercicios anteriores tenemos:

x=
; Me = y s=
Diagrama

Objetivos

Inicio

Entonces:
Desarrollo
de contenidos

Actividades

As = _______________

Autoevaluacin

As =
LECTURA SELECCIONADA N 2

Lecturas
seleccionadas

Glosario

Bibliografa

Los Premios de la Academia discriminan por la edad?


Estadstica. Mario Triola. Pg. 75
Recordatorio

Anotaciones

Cada ao se otorgan scares a la mejor actriz y al mejor actor. En la tabla se presenta


una lista con las edades de los galardonados en el momento de la ceremonia de entrega
de los premios. Las edades aparecen en orden, empezando con la primera ceremonia
de los Premios de la Academia en 1928. [Notas: En 1968 hubo un empate en la categora de mejor actriz, y se utiliz el promedio (la media) de las dos edades; en 1932 hubo
un empate en la categora de mejor actor, y se utiliz el promedio (la media) de las dos
edades. Tales datos se basan en el artculo "Ages of Oscar-winning Best Actors and Actresses", de Richard Brown y Gretchen Davis, en la revista Mathematics Teacher. En ese
artculo, el ao de nacimiento del ganador del premio se rest del ao de la ceremonia;
no obstante, las edades de la tabla se basan en la fecha de nacimiento del ganador y en
la fecha de la ceremonia de premiacin]. La pregunta bsica que consideraremos es:
Hay diferencias importantes entre las edades de las mejores actrices y las edades de los
mejores actores? Al parecer los actores y las actrices son juzgados estrictamente por sus
habilidades artsticas? O hien, existe discriminacin por la edad y las mejores actrices
suelen ser ms jvenes que los mejores actores? Hay algunas otras diferencias evidentes? Adems de ser interesante, esto es importante porque nos brinda informacin sobre la forma en que nuestra sociedad percibe a los hombres y a las mujeres en general.
Una comparacin visual entre las edades de la tabla sera reveladora para las personas que tienen una habilidad especial para observar un orden en este tipo de listas de
nmeros; sin embargo, para nosotros los simples mortales, es probable que la lista no
revele mucha informacin. Afortunadamente, se dispone de mtodos para investigar
este tipo de conjuntos de datos, y pronto veremos que tales procedimientos revelan
caractersticas importantes que nos permiten entender los datos. Seremos capaces de
hacer comparaciones inteligentes y reveladoras; aprenderemos tcnicas para resumir,
graficar, describir, explorar y comparar conjuntos de datos como los de la tabla.

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

Tabla: Premios de la Academia: Edades de las mejores actrices y los mejores actores

Lecturas
seleccionadas

Las edades (en aos) aparecen en orden, empezando con la primera ceremonia de
premiacin.
Recordatorio

El problema incluye las edades de los ganadores del scar a la mejor actriz y al mejor
actor. Con lo aprendido utilizamos distribuciones de frecuencias y grficas para investigar si las edades de las actrices eran significativamente diferentes de las edades de los
actores. Con base en los resultados obtenidos, parece que las actrices ganadoras del
scar son ms jvenes que los actores ganadores de este premio.
En el presente captulo continuamos investigando si existe una discrepancia en las edades, pero incluirnos nuevas herramientas que servirn para comparar los dos conjuntos
de datos. Las distribuciones de frecuencias y las grficas del captulo anterior no resultan afectadas si los datos corresponden a una muestra o a una poblacin completa. Sin
embargo, esta diferencia s afecta a algunas de las herramientas que se presentan en
este captulo. Se podra decir que los datos constituyen una poblacin, ya que incluyen
la edad de cada ganador del scar como mejor actor y mejor actriz desde la primera
ceremonia de Premios de la Academia, celebrada en 1928, hasta los ltimos resultados
disponibles en el momento en que se escribe este libro. En vez de considerar que las
edades son datos poblacionales, los manejaremos como datos muestrales que se obtuvieron de una poblacin ms grande. Algunos puristas podran manifestarse en contra
de esto, pero es un enfoque comn que nos permite enfrentar preguntas importantes
como sta: Existe una diferencia significativa entre la edad promedio (media) de las
mejores actrices y la edad promedio (media) de los mejores actores? Los mtodos que
se estudiaron en el captulo anterior nos permitieron construir distribuciones de frecuencias y grficas que resumen y presentan visualmente la distribucin de los datos.
Los mtodos que se presentan en este captulo nos permitirn calcular valores numricos de estadsticos importantes. (En el captulo anterior aprendimos que un estadstico
es una medicin numrica que describe alguna caracterstica de una muestra, en tanto
que un parmetro es una medicin numrica que describe alguna caracterstica de una
poblacin). En vez de basarnos nicamente en distribuciones de frecuencias y grficas,
ahora empezaremos a incluir estadsticos importantes al comparar las edades de las
mejores actrices y los mejores actores. Despus de calcular los valores de estadsticos
importantes, estaremos ms preparados para comparar los dos conjuntos de datos y
para responder la siguiente pregunta fundamental: Existen diferencias sustanciales e
importantes entre las edades de las mejores actrices y las edades de los mejores actores?
Diagrama

Objetivos

Desarrollo
de contenidos

Actividades

Inicio

ACTIVIDAD N 2
Autoevaluacin

Esta actividad puede consultarla en su aula virtual.

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

Bibliografa

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografa

61

o
os

as

io

62

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD II:Inicio
ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS

Diagrama

Objetivos

Desarrollo
de contenidos

Actividades

Lecturas
seleccionadas

Glosario

Autoevaluacin

GLOSARIO
Anotaciones

-
Recordatorio

Objetivos

Asimetra: Coeficiente que mide la nivel de dispersin de una serie de datos respecto a la media.

- Anotaciones
Cuartil medio: La mitad de la suma de los cuartiles primero y tercero.
-

Cuartiles: Los tres valores que dividen datos ordenados en cuatro grupos, con aproximadamente el 25% de los valores en cada grupo.

Desviacin Estandar: Medida de variacin igual a la raz cuadrada de la varianza.

Media: La suma de un conjunto de valores, dividida entre el nmero de valores.

Mediana: Valor que est a la mitad de un conjunto de valores acomodados en orden


por magnitud.

Medida correctiva: Accin que se realiza a un punto crtico para que pueda estar
dentro de los lmites de control.

Medida de tendencia central: Valor que pretende indicar el centro de los valores de
una coleccin de datos.

Medida de variacin: Cualquiera de varias medidas diseadas para reflejar la magnitud de la variacin o dispersin de un conjunto de valores.

Moda: Valor que se presenta con mayor frecuencia.

Multimodal: Se dice que un conjunto de datos es multimodal cuando tiene ms de


dos modas.

Punto Crtico: Observacin que est fuera de los lmites de control.

Rango de percentiles 10-90: Diferencia entre los percentiles dcimo y nonagsimo.

-
Diagrama

Bibliografa

Sesgado: No simtrico y que se extiende ms hacia un lado que hacia el otro.


Inicio

Sesgo negativo: Sesgado hacia la izquierda.

Sesgo positivo: Sesgado hacia la derecha.

Varianza: Promedio de las desviaciones cuadrticas de cada dato respecto a la media

Desarrollo
de contenidos

Actividades

Autoevaluacin

Lecturas
seleccionadas

Glosario

Bibliografa

BIBLIOGRAFA DE LA UNIDAD II

1. Triola Mario F. ESTADSTICA. Pearson Educacin. Mxico 2012

Recordatorio

Anotaciones

2. Berenson, Mark y Levine, David. Estadstica Bsica en Administracin, Conceptos y


aplicaciones. Prentice Hall, Mxico 2010

Diagrama

Objetivos

Inicio

Desarrollo
de contenidos

Actividades

Autoevaluacin

AUTOEVALUACIN DE LA UNIDAD II
1. Indique: Estadgrafo que en valor es igual a la mediana
a) Q1
Lecturas
seleccionadas

Recordatorio

Glosario

Anotaciones

b) P3

c) Q2

d) Q3

e) P5

Bibliografa

2. Determine la proposicin correcta respecto a la siguiente distribucin de frecuencias

UNIDAD II: ANLISIS EXPLORATORIO DE DATOS: INDICADORES ESTADSTICOS Desarrollo

de contenidos

a)

No se puede calcular la media aritmtica pero s la mediana.

b)

La media, mediana y moda s se pueden calcular.

c)

La media aritmtica es el estado civil casado.

d)

La mediana es el estado civil casado.

e)

La medida de tendencia central ms confiable en estos datos es la moda

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

3. En el cuadro adjunto, cul es el sueldo del 57% de la poblacin mostrada?.


a) 62,48

b) 61,43

d) 65,97

e) 63,88

c) 67,23

4. Los siguientes datos muestran las calificaciones de una muestra de 10 personas sometidas a una prueba de aptitud: 16; 19; 13; 20; 14; 16; 19; 18; 17; 15. Calcular la
desviacin estndar de dichas calificaciones.
a) 2,31

b) 16,34

d) 18,23

e) 19,1

c) 18,02

5. El histograma de la distribucin correspondiente al peso de 100 alumnos de Bachillerato es el siguiente:

Calcule la desviacin estndar de los pesos de los alumnos.


a) 2,9 Kg

b) 4,3 Kg

d) 4,6 Kg

e) 6,8 Kg

c) 1,8 Kg

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Bibliografa

63

Desarrollo
de contenidos

Diagrama

Objetivos

Desarrollo
de contenidos

Lecturas
seleccionadas
Diagrama

Inicio

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

UNIDAD III: PROBABILIDAD


Actividades

Autoevaluacin

DIAGRAMA DE PRESENTACIN DE LA UNIDAD III


Glosario

Bibliografa

Objetivos

Inicio

CONTENIDOS

Recordatorio
Desarrollo
de contenidos

Anotaciones
Actividades

Lecturas
seleccionadas

Glosario

EJEMPLOS

Autoevaluacin

AUTOEVALUACIN

Recordatorio
Diagrama

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

ACTIVIDADES
BIBLIOGRAFA

Bibliografa

ORGANIZACIN DE LOS APRENDIZAJES


Anotaciones
Objetivos

Inicio

CONOCIMIENTOS
2 Clase Presencial/ Virtual
(Video
conferencia)
Desarrollo
Actividades Autoevaluacin

de contenidos

Tema N 1: Fundamentos de
Probabilidad y Reglas Bsicas.
1. Definiciones bsicas, suceLecturas
Glosario
Bibliografa
sos y probabilidades.
seleccionadas
2. Regla de la suma y multiplicacin
Tema N 2: Probabilidad
Total y Teorema de Bayes
Recordatorio
Anotaciones
1. Teorema
de la probabilidad total.
2. Teorema de Bayes.
Tema N 3: Tcnicas de
Conteo
1. Tcnicas de conteo
2. Combinaciones y permutaciones
Lectura seleccionada 1:
Debe preocuparse de que le
realicen una prueba de deteccin de drogas cuando solicite
un trabajo?.
Autoevaluacin N 03

PROCEDIMIENTOS

ACTITUDES

1. Identifica elementos de
experimentos aleatorios.
2. Calcula la probabilidad de
eventos aleatorios.

Valora de manera reflexiva


la importancia de las Probabilidades en todo campo de
la ciencia.

Actividad N1:
Aplica las propiedades fundamentales de la probabilidad
en distintas situaciones.
3. Calcula la probabilidad de
eventos aleatorios.
4. Calcula la probabilidad
utilizando tcnicas de conteo.
Actividad N2:
Resuelve ejercicios y problemas aplicando tcnicas de
conteo y el teorema de Bayes.
Control de Lectura N 2

Bibliografa

65

o
os

as

io

66

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD III: PROBABILIDAD

UNIDAD III: PROBABILIDAD


TEMA N 1: FUNDAMENTOS DE PROBABILIDAD Y REGLAS BSICAS
Anotaciones

En alguna ocasin te has preguntado cul es la probabilidad de que suceda algn suceso, como por ejemplo, la probabilidad de que maana llueva, la probabilidad de que
algn equipo de ftbol gane un partido, o la probabilidad de ganar un premio y hasta
la probabilidad de acertar una pregunta con alternativas al marcarla al azar. Nos damos
cuenta que vivimos en un mundo que es incapaz de predecir el futuro con total certeza
lo cual genera el estudio y uso de la teora de la probabilidad, la cual nos permitir reconocer y ordenar nuestras suposiciones para poder tomar alguna decisin de manera
ms concreta y con fundamento. Te invito entonces a conocer el mundo de las probabilidades teniendo una probabilidad alta de que te va a gustar.
1 DEFINICIONES BSICAS, SUCESOS Y PROBABILIDADES
1.1 PROBABILIDAD.
La probabilidad es una medida de la posibilidad que tiene un evento de ocurrir.
Los valores de probabilidad siempre se asignan en una escala de cero a uno. Una
probabilidad cercana a cero indica que el evento tiene muy pocas posibilidades
de ocurrir, mientras que una probabilidad cercana a uno indica que es casi seguro que ocurra dicho evento. La probabilidad proporciona la posibilidad de
medir, expresar y analizar la incertidumbre asociada a eventos futuros.
1.2 EXPERIMENTO.
Dentro del punto de vista de la probabilidad se define un experimento como
cualquier proceso que genera un conjunto de resultados bien definidos. En
cualquier ejecucin del experimento ocurrir solamente uno de los posibles resultados experimentales.
A continuacin se presentan algunos ejemplos de experimentos y sus resultados
asociados.

Para analizar un experimento en particular es necesario definir cuidadosamente


los resultados experimentales posibles.
1.3 ESPACIO MUESTRAL.
El espacio muestral es el conjunto de todos los resultados posibles generados
por un experimento. Cada resultado experimental se conoce tambin como
punto muestral y corresponde a un elemento del espacio muestral.
Si suponemos que S denota el espacio muestral entonces:

UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

1.4 DETERMINACIN DE PROBABILIDADES.


A partir de la comprensin de los conceptos de experimento y espacio muestral, veamos cmo pueden determinarse las probabilidades para los resultados
experimentales. Al asignarse estas probabilidades se deben satisfacer dos requerimientos bsicos de probabilidad.
1. Los valores de probabilidad asignados deben estar entre cero y uno. Si denoindica su probabilidad asociada,
ta el -simo resultado experimental y
entonces:
2. La suma de todas las probabilidades asociadas a los resultados experimentales debe ser igual a uno. Si el espacio muestral tiene resultados experimentales, entonces:

Cualquier mtodo para asignar valores de probabilidad a los resultados experimentales que satisfaga estos dos requerimientos y produzca medidas numricas
razonables es aceptable. En la prctica, se emplean con frecuencia el mtodo
clsico, el mtodo de frecuencia relativa y el mtodo subjetivo.
1.4.1 Mtodo clsico
El mtodo clsico de asignacin de probabilidades supone que cada resultado experimental tiene la misma posibilidad de ocurrir. Si un experimento tiene resultados posibles el mtodo clsico asignara una probabilidad
de a cada resultado experimental.
EJEMPLO 1: Si se considera el experimento de lanzar una moneda, en
cualquiera de estos lanzamientos se observar Cara o Sello. Una suposicin razonable, en caso la moneda no est trucada, es que cualquiera
de estos resultados experimentales es igualmente probable, es decir
.
EJEMPLO 2: Considere el experimento de lanzar un dado. Si el dado fue
diseado de modo que los seis resultados experimentales sean igualmente
.
probables entonces se cumple que
Este mtodo fue elaborado originalmente para analizar probabilidades en
los juegos de azar, donde la suposicin de resultados igualmente probables
frecuentemente es razonable. Sin embargo en muchas otras situaciones
esta suposicin no es vlida por lo que se requieren mtodos alternativos
para asignar las probabilidades.

Bibliografa

67

o
os

as

io

68

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD III: PROBABILIDAD

1.4.2 Mtodo de frecuencia relativa

Anotaciones

El mtodo de frecuencia relativa est basado en los datos observados sobre


el proceso o fenmeno bajo estudio. Para su determinacin se necesita
obtener datos mediante pruebas, entrevistas, etc. los cuales se resumen
en una tabla de resultados (la tabla de distribucin de frecuencias). La
frecuencia relativa de un resultado (cantidad de resultados favorables entre total de resultados) se considera como la probabilidad de ocurrencia,
siempre y cuando las condiciones bajo las cuales se obtuvieron los resultados se mantengan a futuro.
1.4.3 Mtodo subjetivo
Este mtodo es apropiado cuando no se puede suponer de manera realista
que todos los resultados experimentales son igualmente probables y cuando se dispone de pocos datos relevantes. Cuando se emplea este mtodo
podemos usar cualquier informacin disponible como nuestra experiencia o intuicin. Despus de considerar toda esa informacin se especifica
un valor de probabilidad que exprese nuestro grado de creencia, en una
escala de cero a uno, sobre las posibilidades de ocurrir que tiene el resultado experimental de inters. Usando el mtodo subjetivo puede esperarse
que diferentes personas asignen probabilidades diferentes al mismo resultado experimental.
EJEMPLO 1: Cul es la probabilidad de que maana por la tarde llueva?
EJEMPLO 2: Cul es la probabilidad de salir al parque y encontrar a tres
personas que hayan probado la gaseosa de marca Inka Kola, la bebida de
sabor nacional?
1.5 PROBABILIDAD DE UN EVENTO
Un evento es una coleccin especfica de puntos muestrales. Considere el experimento de lanzar un dado, cuyo espacio muestral es S = { 1 , 2 , 3 , 4 , 5 , 6 }. Si se
define el evento A como obtener un nmero impar, entonces A = { 1 , 3 , 5 }. Por
tanto, si el resultado experimental fuese 1, 3 o 5 se dira que ha ocurrido el evento A. Si se conocen las probabilidades de los puntos muestrales, la probabilidad
de un evento es igual a la suma de las probabilidades de los puntos muestrales
que la componen. Es decir que

Siempre que podamos identificar todos los puntos muestrales de un experimento y asignarles las correspondientes probabilidades podemos usar el enfoque
anterior para calcular la probabilidad de un evento cualquiera. Sin embargo, en
muchos experimentos la cantidad de puntos muestrales es grande y su identificacin, al igual que la determinacin de sus probabilidades, se vuelve demasiado
compleja o, incluso, imposible. Mas adelante estudiaremos algunas relaciones
bsicas de probabilidad para calcular la probabilidad de un evento sin conocer
todas las probabilidades individuales de los puntos muestrales que la componen.
Complemento de un evento
Para un evento A cualquiera, se define su complemento como el evento consistente en todos los puntos muestrales que no estn en A. El complemento del
evento A se denota con AC. La Figura muestra una representacin conocida
como Diagrama de Venn, que ilustra el concepto del complemento. El rea rectangular representa el espacio muestral para el experimento y como tal contiene
todos los puntos muestrales posibles. El crculo representa el evento A y solo
contiene los puntos muestrales que le pertenecen. El resto del rectngulo sombreado contienen todos los puntos muestrales que no estn en el evento A, el
cual por definicin es el complemento de A.

UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

En cualquier aplicacin de probabilidad, el evento A y su complemento AC deben satisfacer la condicin:


Despejando se tiene

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

2 REGLA DE LA SUMA Y MULTIPLICACIN


2.1 REGLA DE LA SUMA (ADICIN)
La regla de la adicin es una relacin til cuando tenemos dos eventos y estamos
interesados en conocer la probabilidad que ocurra al menos uno de ellos. Es
decir, si tenemos los eventos A y B, estamos interesados en conocer la probabilidad que ocurra el evento A, el evento B o ambos simultneamente. Antes de
presentar la ley de la adicin se necesita exponer dos conceptos relacionados a
la combinacin de eventos: la unin y la interseccin de eventos.
Para dos eventos A y B, la unin del evento A con el evento B es el evento que
contienen todos los puntos muestrales que pertenecen a A o a B o a ambos. La
. El diagrama de Venn que se muestra en la Figura
unin se denota por
describe la unin de los eventos A y B.

Para dos eventos A y B, la interseccin de los eventos A y B es el evento que contienen todos los puntos muestrales que pertenecen tanto a A como a B, es decir,
que son comunes a ambos conjuntos. La interseccin se denota por
. El
diagrama de Venn que se muestra en la Figura describe la interseccin de los
eventos A y B.

Bibliografa

69

o
os

as

io

70

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD III: PROBABILIDAD

La ley de la adicin permite encontrar la probabilidad de la unin de dos eventos usando la siguiente relacin:
Anotaciones

Ejemplo: La probabilidad que un sistema de comunicacin de datos tenga una


selectividad elevada es 0.72, la probabilidad que tenga alta fidelidad es 0.59 y la
probabilidad que tenga ambas caractersticas es 0.37. Cul es la probabilidad
que el sistema de comunicacin de datos tenga al menos una de las caractersticas mencionadas? Si se definen los eventos:
A = Sistema de comunicacin de datos tiene una selectividad elevada
B = Sistema de comunicacin de datos tiene alta fidelidad

Entonces, la probabilidad pedida es:

2.1.1 EVENTOS MUTUAMENTE EXCLUYENTES.


Se dice que dos o ms eventos son mutuamente excluyentes si los eventos
no tienen ningn punto muestral en comn, es decir, no hay puntos muestrales en la interseccin de los eventos. Para que dos eventos A y B sean
mutuamente excluyentes se debe cumplir que . La Figura proporciona
un diagrama de Venn que muestra dos eventos mutuamente excluyentes.

Si los eventos A y B son mutuamente excluyentes, entonces

2.1.2 PROBABILIDAD CONDICIONAL.


En muchas situaciones es importante poder determinar la probabilidad
de un evento cuando se sabe que ha ocurrido otro. Suponga que tenemos
y que obtenemos informacin nueva
un evento A con probabilidad
o nos enteramos que ha ocurrido otro, denotado B. Si el evento A se relaciona con B, desearemos sacar ventaja de esta informacin al calcular una
probabilidad nueva o revisada para el evento A.
Esta nueva probabilidad del evento A se escribe
. El smbolo /
denota el hecho que estamos considerando la probabilidad del evento A
dada la condicin que ha ocurrido el evento B. Por lo tanto, la notacin
se lee la probabilidad de A dado B.
Con dos eventos A y B, la probabilidad condicional para A dado B, y la
probabilidad condicional para B dado A son como siguen:


y en cada caso.
Para obtener una comprensin intuitiva del uso de las relaciones anteriores consideremos el diagrama de Venn de la figura siguiente. La regin

UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

Lecturas

seleccionadas
sombreada (tanto en gris claro como en gris oscuro) denota que el evento
B ocurri; la regin sombreada en gris oscuro denota el evento
.
Sabemos que una vez que ha ocurrido B, la nica forma en que podemos
observar tambin el evento A es que ocurra el evento
. Por lo tanto
Recordatorio
la razn entre
y
proporciona la probabilidad que observemos el evento A cuando ya ocurri el evento B.

Ejemplo: Se estima que la probabilidad que la empresa A tenga xito al


comercializar su nuevo producto en el mercado es 0.75, la probabilidad
que la empresa B tenga xito al comercializar su nuevo producto en el
mercado es 0.62 y la probabilidad que ambas empresas tengan xito con
sus respectivos productos es 0.45. Cul es la probabilidad que la empresa
A tenga xito al comercializar su nuevo producto, si se sabe que la empresa
B tambin lo tuvo?
Si se definen los eventos:
A = La empresa A tiene xito al comercializar su producto
B = La empresa B tiene xito al comercializar su producto

Entonces

2.1.3 EVENTOS INDEPENDIENTES.


Dos eventos A y B son independientes si:
o , de otro modo, los eventos son dependientes.
Por lo tanto, dados dos eventos A y B, la ocurrencia del evento A no influye
en la ocurrencia del evento B.
Ejemplo: Se tienen los eventos
A: Extraer un naipe de la baraja y que este resulte de color rojo.
B: Extraer un naipe de la baraja y que este resulte una espada.
Luego deducimos que los eventos A y B son independientes.
2.2 REGLA DE LA MULTIPLICACIN.
La regla de la multiplicacin se usa para encontrar la probabilidad de la interseccin de dos eventos. Se obtiene a partir de la definicin de probabilidad
condicional.

Ejemplo: El departamento de circulacin de un peridico sabe que el 84% de
sus clientes se suscribe a la edicin diaria (lunes a sbado). Adems la probabilidad que un cliente, que ya tiene suscripcin diaria, se suscriba tambin a la
edicin dominical es 0.75. Cul es la probabilidad que un cliente se suscriba
tanto a la edicin diaria como a la dominical del peridico?

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografa

71

o
os

as

io

72

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD III: PROBABILIDAD

Si se definen los eventos:


A = Un cliente se suscribe la edicin diaria
Anotaciones

B = Un cliente se suscribe la edicin dominical


,

entonces

Luego:

Notar que para el caso especial de eventos independientes, la ley de la multiplicacin


se convierte en:
Por lo tanto, para calcular la probabilidad de la interseccin de dos eventos independientes solo multiplicamos las probabilidades correspondientes.
Ejemplo: El xito de un proyecto de inversin depende del trabajo de un ingeniero, un administrador y un abogado. Se sabe que la probabilidad de que el
ingeniero falle en su labor es de 4%, la probabilidad de que el administrador
falle es de 6% y la probabilidad de que el abogado falle es de 8%. Para que el
proyecto sea exitoso, ninguno de los 3 debe fallar. Asumiendo que las labores de
los tres integrantes son independientes entre s, cul es la probabilidad de que
al final el proyecto falle?
Sean los eventos
A = El ingeniero falle en su labor
B = El administrador falle en su labor
C = El abogado falle en su labor
D = El proyecto falle

Luego

TEMA N 2: PROBABILIDAD TOTAL Y TEOREMA DE BAYES


Como has podido observar, la teora de la probabilidad maneja ciertas leyes o reglas
que debemos respetar, del mismo modo cuando tenemos un evento que pertenece a un
sistema y que se puede realizar de manera conjunta con varios eventos disjuntos entre
s indistintamente dentro del mismo sistema es posible que nosotros calculemos cul es
la probabilidad total de la ocurrencia de dicho evento como lo veremos a continuacin.
Por ejemplo si en un aula hay varones y mujeres, podremos calcular la probabilidad
total de elegir a algn alumno y que este alumno (sin considerar el gnero) no sea de
Huancayo.
1 TEOREMA DE LA PROBABILIDAD TOTAL
Si conocemos la probabilidad de B en cada uno de los componentes de un sistema
exhaustivo y excluyente de sucesos donde participan los sucesos A1, A2, A3 y A4,
entonces podemos calcular la probabilidad de B como la suma:
P(B) = P(B A1) + P(B A2) + P( B A3) + P( B A4)
P(B) = P(B|A1)P(A1) + P(B|A2)P(A2) + P(B|A3)P(A3) + P(B|A4)P(A4)

UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

Lecturas
seleccionadas

Por lo tanto si generalizamos, para la Ley de la Probabilidad Total:

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Supongamos que A1, A2, ... ,An son una particin de E,


es decir que los sucesos son mtuamente excluyentes entre s (AiAj= para todo
par) y su unin es E entonces se cumple
Recordatorio

2 TEOREMA DE BAYES
Una etapa importante del anlisis de las probabilidades condicionales consiste en
revisar dichos valores cuando se obtiene nueva informacin. Con esta nueva informacin actualizamos los valores iniciales de probabilidad encontrando probabilidades revisadas, conocidas como probabilidades posteriores. El teorema de Bayes
proporciona un medio para hacer estos clculos de probabilidad. Los pasos en este
proceso de revisin de probabilidades se muestran en la Figura siguiente.

Ejemplo: Suponga una empresa que compra componentes de dos proveedores.


Sean los eventos:
A1 = Componente comprado al proveedor 1

A2 = Componente comprado al
proveedor 2

Actualmente, el 65% de los componentes comprados provienen del proveedor 1 y


el resto del proveedor 2. Por lo tanto, si se elige al azar un componente, asignaray
.
mos las probabilidades previas
La calidad de los componentes comprados depende del proveedor. Sean los eventos:
B1 = Componente comprado se encuentra en buenas condiciones
B2 = Componente comprado se encuentra en malas condiciones
Las probabilidades condicionales de recibir un componente en buenas o malas
condiciones (con base en datos histricos), segn el proveedor, son:


El diagrama de rbol que se muestra en la Figura siguiente describe el proceso en
que esta empresa recibe un componente de unos de los proveedores mencionados y luego descubre que se encuentra en buenas o malas condiciones como un
experimento de dos etapas. De los cuatro resultados experimentales posibles, dos
corresponden al caso en que el componente se encuentra en buenas condiciones y
dos corresponden al caso contrario.

Anotaciones

Bibliografa

73

o
os

as

io

74

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD III: PROBABILIDAD

Anotaciones

Cada uno de los resultados experimentales es la interseccin de dos eventos, de


modo que podemos usar la regla de la multiplicacin para calcular las probabilidades. Es decir,

El proceso de calcular estas probabilidades conjuntas puede describirse con lo que


en ocasiones se llama rbol de probabilidad. Tambin se le denomina rbol de decisiones, como se muestra en la Figura siguiente. De izquierda a derecha en el rbol,
las probabilidades para cada una de las ramas en la primera etapa corresponden a
las probabilidades iniciales, mientras que las probabilidades para cada rama en la
segunda etapa son probabilidades condicionales. Para encontrar las probabilidades
de cada resultado solo multiplicamos las probabilidades en las ramas que conducen
al resultado. Observe que las probabilidades de los cuatro resultados experimentales suman uno.

UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

El teorema de Bayes es aplicable cuando los eventos para los que deseamos calcular
probabilidades posteriores son mutuamente excluyentes y su unin es el espacio
muestral completo. El teorema de Bayes puede extenderse al caso de n eventos
mutuamente excluyentes A1, A2 , .... , An cuya unin cubre todo el espacio muestral.
En tal caso, el teorema de Bayes para el clculo de cualquier probabilidad posterior
se vuelve
, i = 1,2......,n
donde
con el nombre de probabilidad total.

se le conoce

EJEMPLO: Suponga que los componentes del ejemplo anterior se usan en un proceso de manufactura y que un componente en malas condiciones causa que una
mquina se descomponga, cul es la probabilidad que el componente en malas
condiciones provenga del proveedor 1? y cul es la probabilidad que provenga
del proveedor 2? Con la informacin del rbol de probabilidad podemos usar el
teorema de Bayes para responder a estas preguntas.

Proveedor 1:
Proveedor 2:
donde
Luego:

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Bibliografa

75

o
os

as

io

76

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD III: PROBABILIDAD

TEMA N 3: TCNICAS DE CONTEO


Anotaciones

En el tema anterior nos hemos encontrado con un detalle muy importante que genera
un gran error en las probabilidades si no se calcula bien: el tamao del espacio muestral, el cual debe ser analizado con mucho cuidado sobre todo al determinar la estructura que tiene para luego contabilizar el total de posibilidades que se tiene. Por esa razn
cuando las posibilidades son inmensas y ya no se puede realizar un conteo de manera
individual debemos aplicar alguna tcnica que nos facilite el conteo, esa es la razn por
la cual debemos optimizar las tcnicas presentadas a continuacin y que requiere en
varios casos del manejo del desarrollo de un factorial.
1 TCNICAS DE CONTEO
A menudo el espacio muestral con el que tenemos que calcular las probabilidades
es grande, de tal manera que construyendo un diagrama de rbol o un tablero
de contingencia no va a ser posible, es por esta razn que recurrimos a modelos
matemticos para poder calcular el tamao de nuestro espacio muestra, pero es
necesario antes conocer el principio de la adicin y de la multiplicacin en quienes
se fundamentan los mtodos de conteo.
1.1 REGLA DE LA ADICIN
Si un primer experimento tiene n1 resultados posibles y un segundo experimento tiene n2 resultados posibles. Entonces, la cantidad total de resultados
experimentales luego de realizar el primer o segundo experimento, es decir solo
uno de ellos, es n1 +n2.
Ejemplo: Una persona puede viajar de Lima a Cuzco por va area o terrestre
y tiene a su disposicin 6 lneas areas y 5 lneas terrestres. De cuantas formas
puede realizar el viaje desde Lima hasta Cuzco?
El primer experimento consiste en elegir una lnea area y tiene n1 = 6 formas
posibles de hacerlo, el segundo experimento consiste en elegir una lnea terrestre y tiene n1 = 5 formas posibles de hacerlo. Luego, se tienen n1 +n2 =11 formas
posibles de realizar el viaje.
1.2 REGLA DE LA MULTIPLICACIN
Si un experimento se puede describir como una sucesin de k etapas, en las que
hay n1 resultados posibles en la primera etapa, n2 en la segunda, etc. Entonces,
la cantidad total de resultados experimentales es n1 n2 .... nk .
Ejemplo: Cuntas parejas de bailes de diferente sexo se puede formar con 3
varones y 5 damas?
El experimento consiste en formar parejas de baile. La primera etapa consiste
en elegir al varn y se puede hacer de n1 = 3 formas. La segunda etapa consiste
en escoger a la dama y se puede realizar de n2 = 5 formas. Luego, se pueden
formar n1 n2 = 15 parejas de baile.
2 COMBINACIONES Y PERMUTACIONES

2.1 COMBINACIONES
Las combinaciones permiten contar la cantidad de resultados experimentales
cuando se deben seleccionar objetos entre un total de N , por lo general ms
grande, donde el orden de seleccin no se considera importante. La cantidad de
combinaciones de N objetos tomando n a la vez es

UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

donde
Ejemplo: Se tiene un grupo de 30 estudiantes del curso Estadistica , de cuantas
maneras diferentes se podra elegir a 3 delegados para que representen a la
seccin?
El orden de seleccin de los tres delegados no es importante. Luego, existen
formas diferentes de elegirlos.
Diagrama

Desarrollo
de contenidos

Lecturas
seleccionadas

Objetivos

Diagrama
Actividades

Inicio

ACTIVIDAD
Objetivos
Inicio N 3
Autoevaluacin

Esta actividad puede consultarla en su aula virtual.


Desarrollo
de contenidos
Glosario

Actividades

Autoevaluacin

Bibliografa

LECTURA SELECCIONADA N 2
Lecturas
seleccionadas
Recordatorio

Glosario

Bibliografa

Anotaciones

Debe preocuparse de que le realicen una prueba de deteccin de drogas cuando solicite un
trabajo? Estadstica. Mario Triola. Pg. 137
Recordatorio

Anotaciones

Debe preocuparse de que le realicen una prueba de deteccin de drogas cuando solicite un trabajo?
Segn la American Management Association, alrededor del 70% de las empresas estadounidenses realizan pruebas de deteccin de drogas al menos a algunos empleados y
aspirantes. El U.S. National Institute on Drug Abuse afirma que aproximadamente el
15% de los jvenes entre 18 y 25 aos consumen drogas ilegales. Quest Diagnostic estima que el 3% de la fuerza laboral general de Estados Unidos consume marihuana. Supongamos que usted solicit un empleo, tiene excelentes aptitudes (las cuales incluyen
la aprobacin exitosa de un curso de estadstica), le hicieron una prueba de consumo
de marihuana y no le dieron el empleo. Usted podra sospechar que no pas el examen
de marihuana, aun cuando no consume esta droga.
Anlisis de los resultados
La tabla muestra los resultados de la prueba "1-Panel- THC" para identificar el consumo
de marihuana. Este dispositivo de prueba cuesta $5.95 y la empresa Drug Test Success lo
distribuye. Los resultados de la prueba fueron confirmados con cromatografa de gases
y espectrometra de masas, que la empresa describe como "el mtodo de confirmacin
preferido". (Esos resultados se basan en el uso de 50 ng/mL como nivel de corte para
determinar la presencia de marihuana). Con base en los resultados de la tabla 4-1, qu
probabilidades hay de que la prueba indique que usted consumi marihuana, aunque
no sea as? Cuando una prueba muestra la presencia de alguna condicin, como una
enfermedad o los residuos de alguna droga, se dice que el resultado de la prueba es
positivo. Cuando la prueba indica un resultado positivo, pero la condicin en realidad
no est presente, el resultado es un falso positivo. Es decir, un falso positivo es un error
en el que la prueba indica la presencia de una condicin, cuando en realidad esta ltima no se presenta. En este caso, el aspirante al empleo podra sentirse angustiado por
la probabilidad de un resultado falso positivo, ya que sera un error que provocara de
manera injusta la negacin del empleo. (El contratante podra sentirse preocupado por
otro tipo de error, un falso negativo, que se presenta cuando una prueba indica que el
aspirante no consume marihuana, cuando en realidad s lo hace. Este falso negativo
podra causar la contratacin de un individuo que consume marihuana, y este error
puede ser grave para algunos trabajos, como los que realizan los pilotos, los cirujanos o
los ingenieros de trenes).

Bibliografa

77

o
os

as

io

78

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD III: PROBABILIDAD

En este captulo analizaremos preguntas relevantes como stas: Dados los resultados
muestrales de la tabla, cul es la probabilidad de un resultado falso positivo? Cul es
la probabilidad de un resultado falso negativo? Esas probabilidades son lo suficientemente bajas como para que los aspirantes y los contratantes no se preocupen por tomar
decisiones incorrectas motivadas

Anotaciones

por resultados errneos de las pruebas?


Tabla: Resultados de exmenes sobre el consumo de marihuana

Diagrama

Objetivos

Inicio

Desarrollo
de contenidos

Actividades

Autoevaluacin

Lecturas
seleccionadas

Glosario

GLOSARIO
-
Recordatorio

Bibliografa

Experimento: La aplicacin de un tratamiento y la posterior observacin de sus


efectos sobre los sujetos.

- Anotaciones
Probabilidad Condicionada: Probabilidad de que ocurra un evento despus de que
haya ocurrido otro.
-

Probabilidad Condicional: La probabilidad de un suceso, dado que algn otro suceso ya ocurri.

Probabilidad Conjunta: Probabilidad de que ocurran dos eventos de manera simultanea.

Probabilidad Subjetiva: Conjetura o estimado de una probabilidad con base en un


conocimiento de las circunstancias relevantes.

Probabilidad: Medida de la posibilidad de que ocurra un suceso dado; se expresa


como un nmero entre 0 y 1 .

Regla de Combinacin: Regla para determinar el nmero de combinaciones diferentes de elementos seleccionados.

Regla de la adicin: Regla para determinar la probabilidad de que, en un solo ensayo, ocurra el suceso A o el suceso B, o bien, de que ocurran ambos.

Regla de la multiplicacin: Regla para determinar la probabilidad de que ocurra el


suceso A en un ensayo y de que ocurra el suceso B en un segundo ensayo.

Regla de Permutacin: Regla para determinar el nmero de arreglos diferentes de


elementos seleccionados.

Regla del conteo fundamental: Regla que dice que, para una secuencia de dos sucesos en la que el primer suceso puede ocurrir de m maneras y el segundo de n
maneras, los sucesos juntos pueden ocurrir en un total de m n maneras.

Regla del Factorial: Regla que afirma que n objetos distintos se pueden acomodar de
n! maneras distintas.

Regla del suceso infrecuente: Si, bajo un supuesto dado, la probabilidad de un resultado especfico observado es muy pequea, se concluye que posiblemente el
supuesto no sea correcto.

Suceso Compuesto: Combinacin de sucesos simples.

Suceso Simple: Resultado experimental que no puede descomponerse ms.

Suceso: Resultado de un experimento.

Sucesos Dependientes: Sucesos para los cuales la ocurrencia de cualquier suceso


individual afecta las probabilidades de ocurrencia de los dems sucesos.

Sucesos Disjuntos o mutuamente excluyentes: Sucesos que no pueden ocurrir de


manera simultnea.

os

UNIDAD III: PROBABILIDAD Desarrollo

de contenidos

Objetivos

Inicio

Glosario

Lecturas

Glosario

Recordatorio

Anotaciones

seleccionadas
Sucesos Independientes: Sucesos para los cuales la ocurrencia de cualquiera de ellos
no afecta las probabilidades de ocurrencia de los dems.

-
Actividades

Autoevaluacin

BIBLIOGRAFA DE LA UNIDAD III

Bibliografa

1. Triola Mario F. ESTADSTICA. Pearson Educacin. Mxico 2012

Anotaciones

2. Introduccin a la Probabilidad.Dcimo Segunda Edicin. William Mendenhall, Robert Beaver. Cengage Learning. 2008
3. Estadstica y Muestreo. Ciro Martinez Bencardino. Colombia 2012. ECOE Ediciones.

Objetivos

Inicio

Actividades

Autoevaluacin

AUTOEVALUACIN DE LA UNIDAD III


1.
Glosario

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

La probabilidad de que la prxima semana llueva en Huancayo es un tpico caso de


probabilidad:

Bibliografa

a) Clsica

b) Subjetiva

d) Total

c) Binomial
e) Emprica o de frecuencia relativa

Anotaciones

2.

La siguiente definicin: Conforme un procedimiento se repite una y otra vez, la


probabilidad de frecuencias relativas (o empricas) de un suceso, tiende a aproximarse a la probabilidad real, corresponde a:
a) Teorema de Bayes
b) Probabilidad total
c) Regla del suceso infrecuente
d) Probabilidad condicional
e) Ley de los nmeros grandes

3.

Determine el valor de la probabilidad del complemento de A, si P(A) = 0.274


a) 0.672

4.

b) 0

c) 0.726 d) 1

e) 0.762

Considere el caso de una pequea empresa de ensamble en la que hay 50 empleados. Se espera que todos los trabajadores terminen su trabajo a tiempo y que pase
la inspeccin final. A veces, alguno de los empleados no satisface el estndar de
desempeo, ya sea porque no termina a tiempo su trabajo o porque no ensambla
bien una pieza. Al final del perodo de evaluacin del desempeo, el jefe de produccin encuentra que 5 de los 50 trabajadores no terminaron su trabajo a tiempo,
6 de los 50 trabajadores ensamblaron mal una pieza y 2 de los 50 trabajadores no
terminaron su trabajo a tiempo y armaron mal una pieza. Despus de analizar los
datos del desempeo, el jefe de produccin decide despedir a los trabajadores que
no terminaron a tiempo su trabajo o que armaron mal alguna pieza. Cul es la
probabilidad de que el jefe de produccin despida a un trabajador?
a) 0,14

b) 0,16

c) 0,18

d) 0,2

e) 0,24

Bibliografa

79

o
os

as

io

80

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD III: PROBABILIDAD

5.

De una baraja de 52 cartas extraemos sin reposicin y en forma sucesiva dos cartas.
Si en la primera extraccin se obtuvo espada. Cul es la probabilidad de que en la
segunda extraccin salga espada nuevamente?

Anotaciones

a) 0,059

b) 0,24

c) 0,67

d) 0,0022

e) 0,834

6. Una compaa dedicada al transporte pblico explota tres lneas de una ciudad
de forma que el 50% de los autobuses cubre el servicio de la primera lnea, el 20%
cubre la segunda y el 30% cubre el servicio de la tercera lnea. Se sabe que la probabilidad de que diariamente un autobs se avere es del 3%, 2% y 5%, respectivamente, para cada lnea. Determine la probabilidad de que, en un da, un autobs
sufra una avera.:
a) 0,34

b) 0,00034

c) 3,4

d) 0,034

e) 0,0304

7. Mariela desea adquirir el libro de Estadstica de Mario Triola, el cual es vendido


en 8 libreras diferentes de la calle Calixto, en 7 galeras del Tambo y en 6 libreras
cercanas al campus de la UCCI. De cuntas maneras podr adquirir dicho libro?
a) 15
8.

c) 14

d) 20

e) 21

Viviana tiene 3 blusas de diferente color, 3 pantalones diferentes, 4 minifaldas y 2


pares de zapatos diferentes. De cuntas formas distintas puede vestirse con estas
prendas para ir a sus clases, considerando que el profesor de Estadstica ha prohibido a las mujeres ir a clase con minifalda?:
a) 5/9

9.

b) 13

b)2/18

c)5/18

d) 9/12

e)9/17

Una caja contiene 4 bolas blancas y 5 bolas rojas. Se extraen consecutivamente 2


bolas sin reemplazo. Calcular la probabilidad de que se extraigan una bola blanca
y una roja, en ese orden.

10. Identifica el enunciado falso con respecto a las COMBINACIONES:


a) Se tiene un total de n diferentes elementos disponibles.
b) Los reordenamientos de los mismos elementos son considerados iguales.
c) Se selecciona r de los n elementos, donde r<n.
d) Se expresa como:
e) La agrupacin ABC CBA

Desarrollo
de contenidos

Diagrama

Objetivos

Desarrollo
de contenidos

Lecturas
seleccionadas
Diagrama

Inicio

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD


Actividades

Autoevaluacin

DIAGRAMA DE PRESENTACIN DE LA UNIDAD IV


Glosario

Bibliografa

Objetivos

Inicio

CONTENIDOS

Recordatorio
Desarrollo
de contenidos

Anotaciones
Actividades

Lecturas
seleccionadas

Glosario

EJEMPLOS

ACTIVIDADES

Autoevaluacin

AUTOEVALUACIN

Recordatorio
Diagrama

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

BIBLIOGRAFA

Bibliografa

ORGANIZACIN DE LOS APRENDIZAJES


Anotaciones
Objetivos

Inicio

CONOCIMIENTOS
Tema N 01:Distribuciones
de
Actividades Autoevaluacin
Probabilidad Discreta
1. Variables aleatorias
2. Distribucin de probabilidad binomial.
Lecturas
Glosariode probabiliBibliografa
3. Distribucin
seleccionadas
dad hipergeomtrica.
4. Distribucin de probabilidad de Poisson.

Desarrollo
de contenidos

Anotaciones
Tema N 2:
Distribuciones De
Probabilidad Normal
1. Distribucin normal estndar. Valor crtico z.
2. Aplicaciones de la distribucin normal estndar.

Recordatorio

Lectura Seleccionada N4
Los mtodos estadsticos pueden demostrar que el proceso
de seleccin de un jurado es
discriminatorio?
Autoevaluacin N 04

PROCEDIMIENTOS

ACTITUDES

Procedimientos:
1. Identifica la distribucin de
probabilidad discreta de un
experimento aleatorio
2. Calcula e interpreta la probabilidad del evento de inters.
Actividad N1:
Calculan la probabilidad en
distintas distribuciones

Demuestra proactividad y
tica en el desarrollo de la
asignatura y en el manejo
de la informacin.

Procedimientos:
3. Identifica la distribucin de
probabilidad continua de
un experimento aleatorio
4. calcula e interpreta la probabilidad de distribuciones
normales.
Actividad N2:
Resuelve ejercicios y problemas aplicando la distribucin
normal.
Tarea Acadmica N 2

Bibliografa

81

o
os

as

io

82

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD


Anotaciones

Debes tener en cuenta que las distribuciones de probabilidad estn relacionadas con
la distribucin de frecuencias. De hecho, podemos pensar en la distribucin de probabilidad como una distribucin de frecuencias terica. Una distribucin de frecuencias
terica es una distribucin de probabilidades que describe la forma en que se espera
que varen los resultados. Debido a que estas distribuciones tratan sobre expectativas de
que algo suceda, resultan ser modelos tiles para hacer inferencias y tomar decisiones
de incertidumbre.

TEMA 01: DISTRIBUCIONES DE PROBABILIDAD DISCRETA


1 VARIABLES ALEATORIAS:

1.1 DEFINICION BSICA DE VARIABLES ALEATORIAS


En la Unidad anterior se define un experimento como cualquier proceso que
genera resultados bien definidos. Se considera de inters el proceso de asignar
valores numricos a los resultados experimentales. Para hacerlo, se introduce la
nocin de variable aleatoria.
Para cualquier experimento en particular, una variable aleatoria puede definirse
de modo que cada resultado experimental posible genere exactamente un valor
numrico para la variable aleatoria, es decir que una variable aleatoria es la descripcin numrica del resultado de un experimento.
Ejemplo

Una variable aleatoria puede clasificarse como discreta o continua dependiendo de los valores numricos que pueda asumir. Una variable aleatoria que solo
puede tomar una secuencia finita o infinita numerable de valores es una variable
aleatoria discreta. El nmero de ventas logradas, nmero de artculos defectuosos y nmero de clientes atendidos por da son ejemplos de variables aleatorias
discretas. Una variable aleatoria que toma una secuencia infinita no numerable
de valores es una variable aleatoria continua, por ejemplo: tiempo requerido (en
minutos) para trasladarse de la UCCI al hogar.
1.2 DISTRIBUCIN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA
La funcin de distribucin de probabilidad, denotada por , proporciona la probabilidad que la variable aleatoria discreta tome el valor especifico . En la
construccin de una distribucin de probabilidad discreta siempre deben satisfacerse dos condiciones:

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

Lecturas

seleccionadas
Ejemplo: Una empresa compra juguetes y su proveedor los entrega en cajas
de 50 unidades. Luego de la comercializacin de los juguetes y de acuerdo a
las devoluciones realizadas por sus propios clientes ha determinado el nmero
de juguetes defectuosos en las ltimas 500 cajas compradas. La informacin se
Recordatorio
muestra a continuacin:

Sea la variable aleatoria X = Nmero de juguetes defectuosos por caja de 50 unidades. La funcin de distribucin de probabilidad se puede obtener calculando
la frecuencia relativa para cada valor de X.

1.3 VALOR ESPERADO DE UNA VARIABLE ALEATORIA DISCRETA


El valor esperado de una variable aleatoria discreta es un promedio ponderado
de todos los valores posibles de la misma, donde los pesos son las probabilidades
asociadas con los valores. El valor esperado de una variable aleatoria discreta se
calcula con la siguiente expresin:

El valor esperado de una variable aleatoria es el valor medio, o promedio. Para


experimentos que pueden repetirse muchas veces, el valor esperado puede interpretarse como el valor promedio a largo plazo para la variable aleatoria. Sin
embargo, el valor esperado no necesariamente es el nmero que pensamos asumir la variable aleatoria la prxima vez que se realice el experimento.
Ejemplo: Si se desea calcular el valor esperado de la variable aleatoria definida
en el ejemplo anterior.

Luego, el valor esperado de X es 0.95 juguetes defectuosos.


1.4 VARIANZA DE UNA VARIABLE ALEATORIA DISCRETA
El valor esperado nos da una idea acerca del valor promedio o central para la
variable aleatoria, pero es importante tener adems una medida de la dispersin o variabilidad de los valores posibles de la variable aleatoria. La varianza
es una medida usada para representar la dispersin o variabilidad en los valores de una variable aleatoria. La varianza de una variable aleatoria discreta se
calcula con la siguiente expresin:

Una medida de dispersin relacionada es la desviacin estndar, , la cual se


define como la raz cuadrada positiva de la varianza.

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografa

83

o
os

as

io

84

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Ejemplo: Si se desea calcular la varianza y desviacin estndar de la variable


aleatoria definida en el ejemplo anterior.
Anotaciones

Aplicaciones
La siguiente tabla muestra la distribucin del nmero de errores que un publicista comete al elaborar una pieza publicitaria.

a. Encuentre el valor de a para que dicha distribucin sea de probabilidad.

b. Si se elige una pieza publicitaria. cul es la probabilidad que el publicista


cometa a lo ms 3 errores?

c. Calcule e interprete el valor esperado.

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

2 DISTRIBUCIN DE PROBABILIDAD BINOMIA

Lecturas
seleccionadas

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

La distribucin de probabilidad binomial es una distribucin discreta de probabiRecordatorio


lidad que se relaciona con un experimento binomial, el cual tiene cuatro propiedades:
El experimento consiste de una sucesin de n intentos o ensayos idnticos.
En cada intento o ensayo son posibles dos resultados. A uno lo llamaremos xito
y al otro fracaso.
La probabilidad de obtener un xito, p , no cambia de un intento o ensayo a
otro.
Los intentos o ensayos son independientes.
En un experimento binomial la variable aleatoria de inters se define como X = Nmero de xitos obtenidos en los intentos o ensayos. Esta variable aleatoria puede
tomar los valores 0,1,2,...,n . La funcin de distribucin de probabilidad asociada
con esta variable aleatoria es:

Lo anterior puede escribirse como


. El valor esperado y variancia de una
variable aleatoria con distribucin binomial son
respectivamente.
Ejemplo 1: La probabilidad de que cualquier smbolo particular de cdigo se transmita errneamente a travs de un sistema de comunicaciones es 0.10. En la transmisin de los smbolos los errores ocurren de manera independiente unos de otros.
Suponga que se enva un mensaje formado por 10 smbolos. Cul es la probabilidad que se transmitan errneamente solo 2 smbolos?
Sea X = Nmero de smbolos transmitidos errneamente del total de 10, entonces
. La funcin de distribucin de probabilidad es

Luego,

Ejemplo 2: Con respecto al Ejemplo anterior, cul es la probabilidad de transmitir


como mximo tres smbolos errneamente?

Propiedades de la distribucin binomial


a) la media: = np
b) la varianza: 2 = npq
c) cuando p es menor que 0.5, la distribucin binomial est sesgada hacia la derecha.
d) conforme p aumenta, el sesgo es menos notable.
e) cuando p = 0.5, la distribucin binomial es simtrica.
f) cuando p es mayor que 0.5, la distribucin esta sesgada hacia la izquierda.

Anotaciones

Bibliografa

85

o
os

as

io

86

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

3 DISTRIBUCIN DE PROBABILIDAD HIPERGEOMTRICA

Anotaciones

La distribucin de probabilidad hipergeomtrica est estrechamente relacionada


con la distribucin binomial, pero difieren en dos puntos: en la distribucin hipergeomtrica los ensayos no son independientes y la probabilidad de xito vara de
ensayo a ensayo.
En la notacin usual, r denota el nmero de elementos considerados como xitos
que hay en una poblacin de tamao N, y N r denota el nmero de elementos
considerados como fracasos que hay en dicha poblacin. La funcin de probabilidad hipergeomtrica se usa para calcular la probabilidad de que en una muestra
aleatoria de n elementos, seleccionados sin reemplazo, se tengan x xitos y n x
fracasos. La funcin de distribucin de probabilidad asociada con esta variable aleatoria es:

Lo anterior puede escribirse como

. El valor esperado y variancia

de una variable aleatoria con distribucin hipergeomtrica son

respectivamente.
Ejemplo: Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada
una. Suponga que un inspector selecciona al azar tres de los 12 fusibles de una caja
para inspeccionarlos. Si la caja contiene 5 fusibles defectuosos, cul es la probabilidad que el inspector encuentre ms de un fusible defectuoso?
Sea X = Nmero de fusibles defectuosos encontrados por el inspector en la muestra
. La funcin de distribucin de
de tamao 3, entonces
probabilidad es

4 DISTRIBUCIN DE PROBABILIDAD DE POISSON


En esta seccin se describe una variable aleatoria discreta que se usa con frecuencia para estimar la cantidad de sucesos u ocurrencias en determinado intervalo
de tiempo o espacio. Por ejemplo, la variable aleatoria de inters podra ser X =
Nmero de clientes de los clientes al banco por hora, X = Nmero de reparaciones
necesarias por cada 10 kilmetros e carretera o X = Nmero de fugas en 100 millas
de un oleoducto. Si se satisfacen las dos propiedades siguientes, la variable aleatoria
X = Nmero de ocurrencias en determinado intervalo de tiempo o espacio es una
variable aleatoria discreta que se describe con la distribucin de probabilidad de
Poisson:
La probabilidad de una ocurrencia es igual en dos intervalos cualesquiera de
igual longitud.
La ocurrencia o no ocurrencia en cualquier intervalo es independiente de la
ocurrencia o no ocurrencia en cualquier otro intervalo.
La funcin de probabilidad de Poisson es:

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

Lecturas
seleccionadas

Lo anterior puede escribirse como


, donde es la tasa o nmero promedio de ocurrencias en determinado intervalo de tiempo o espacio y
. El
valor esperado y variancia de una variable aleatoria con distribucin de Poisson son
numricamente iguales al parmetro de la distribucin, es decir
.
Recordatorio
Ejemplo 1: La divisin de mantenimiento de telefona est tratando de decidir
cuntos reparadores necesita para proporcionar un nivel aceptable de servicio a sus
clientes. El nmero de quejas que llegan al centro de servicio sigue una distribucin de Poisson, con una tasa promedio de 30 llamadas al da. Cual es la probabilidad de recibir en el centro de servicio ms de 20 quejas en medio da?
Sea X = Nmero de quejas que llegan al centro de servicio en medio da, entonces
. La funcin de distribucin de probabilidad es:

Ejemplo 2: Con respecto al Ejemplo anterior, cul es la probabilidad que llegue al


centro de servicio menos de 25 quejas al da?
Sea X = Nmero de quejas que llegan al centro de servicio por da, entonces
. La funcin de distribucin de probabilidad es:

Luego,

TEMA N 2: DISTRIBUCION DE PROBABILIDAD NORMAL


1 DISTRIBUCIN NORMAL ESTNDAR. VALOR CRTICO Z.
1.1 DISTRIBUCIN NORMAL ESTNDAR
La distribucin normal es una de las distribuciones ms usadas e importantes.
Se ha desenvuelto como una herramienta indispensable en cualquier rama de
la ciencia , la industria y el comercio. Muchos eventos reales y naturales tienen
una distribucin de frecuencias cuya forma es muy parecida a la distribucin
normal.
La distribucin normal es llamada tambin campana de Gauss por su forma
acampanada

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Anotaciones

Bibliografa

87

o
os

as

io

88

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Propiedades de la distribucin normal


La distribucin normal tiene forma de campana.
Anotaciones

La distribucin normal es una distribucin de probabilidad que tiene media


= 0 y desviacin estndar = 1.
El rea bajo la curva o la probabilidad desde menos infinito a ms infinito vale
1.
La distribucin normal es simtrica, es decir cada mitad de curva tiene un
rea de 0.5.
La escala horizontal de la curva se mide en desviaciones estndar.
La forma y la posicin de una distribucin normal dependen de los parmetros y , en consecuencia hay un nmero infinito de distribuciones normales.

Existe una relacin del porcentaje de poblacin a la desviacin estndar. En la


figura observamos por ejemplo que el rea bajo la curva para tiene un porcentaje de 68.26%, 2 = 95.46% y 3 = 99.73%

La poblacin incluye todos los datos, la muestra es una porcin de la poblacin.

Tomando como referencia una distribucin normal estndar con parmetros:


= 0 y 2 = 1. Se trabaja con la distancia entre x y en funcin de la desviacin
estndar. Tal como se muestra a continuacin:

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

Notacin:

Lecturas
seleccionadas

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Z ~ Normal (0,1) y se lee: Z tiene distribucin normal estndar con medio 0 y


varianza igual a 1
Recordatorio

1.2 VALOR CRTICO Z


Determina el nmero de desviaciones estndar entre algn valor X y la media
de la poblacin . Para calcular el valor de Z usamos la siguiente frmula.

La distribucin de probabilidad f (Z) es una distribucin normal con media 0


y desviacin estndar 1; esto es Z se distribuye normalmente con media cero
y desviacin estndar = 1 Z~N(0,1): La grfica de densidad de probabilidad se
muestra en la figura.

La distribucin f (Z) se encuentra tabulada en la tabla de distribucin normal


estndar. En esta tabla podemos determinar los valores de Z o la probabilidad
de determinado valor Z.

Anotaciones

Bibliografa

89

o
os

as

io

90

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Anotaciones

Ejemplo 1: El gerente de personal de una gran compaa requiere que los solicitantes a un puesto efecten cierta prueba y alcancen una calificacin de 500.
Si las calificaciones de la prueba se distribuyen normalmente con media 485
y desviacin estndar 30 Qu porcentaje de los solicitantes pasar la prueba?
Calculando el valor de Z obtenemos:

Buscamos el valor correspondiente Z en las tabla de distribucin normal.


Z0.5 = .69146 = 69.146%. siendo esta la probabilidad de que la calificacin sea
menor a 500 P (X<500). Dado que el porcentaje pedido es la solucin es
1-.69146 =.3085 , 30.85% de los participantes pasarn la prueba.

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

Ejemplo 2:

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

Encuentre la probabilidad siguiente usando la tabla Z.


P(-1.23 < Z < 0)

Solucin: Buscamos el valor Z1..23 en las tablas siendo este = .89065. restando
.89065-.05 = .3905, este valor es la probabilidad de 0 a 1.23 que es exactamente
la misma de 1.23 a 0 por simetra. Por lo tanto la probabilidad es .3905

2 APLICACIONES DE LA DISTRIBUCIN NORMAL ESTNDAR.


APROXIMACIN NORMAL A LA BINOMIAL
Cuando las muestras son pequeas, en una distribucin binomial se obtienen fcilmente probabilidades asociadas a un evento mediante la frmula de la binomial.
Cuando las muestras son grandes, el clculo nos llevara bastante tiempo. La distribucin normal es a menudo una buena aproximacin a una distribucin binomial
cuando np y nq son mas grandes que 5.

con n = 20 y p = .5

con n = 60 y p = .5

Para utilizar la distribucin normal como una aproximacin de la binomial debemos estar seguros de que la distribucin de inters es en efecto una distribucin
biniomial, para lo cual debe reunir los siguientes criterios:
1. Hay solo dos posibles resultados xito o fracaso
2. Resulta de un conteo
3. Cada prueba es independiente
4. La probabilidad del xito es constante en cada prueba
5. Hay un nmero fijo de pruebas.

Bibliografa

91

o
os

as

io

92

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Ejemplo 1
La probabilidad de que un paciente se recupere de una rara enfermedad de la sangre es 0.4. Si se sabe que 100 personas contrajeron esa enfermedad,
Anotaciones

a) Cul es la probabilidad de que menos de 30 sobrevivan?


b) Cul es la probabilidad de que exactamente 5 sobrevivan?
c) Cul es la probabilidad de que a lo ms 30 sobrevivan?
El primer paso es verificar si el experimento cumple con los requisitos de una distribucin binomial, y si es el caso calcular la media y la desviacin estndar de la
distribucin.


a) P(x < 30 )
Para resolver el problema con la frmula de la distribucin binomial se tendra que
calcular 30 binomiales, desde la binomial de cero hasta la binomial de 29. Mediante
el uso de la aproximacin normal a la binomial el procedimiento es mucho ms
corto.
El primer paso es aplicar al valor de x el factor de correccin de continuidad, que
es simplemente sumar o restar 0.5 al valor de x, dependiendo del problema. En
este caso queremos la probabilidad de que x valga menos de 30, no incluye al 30,
entonces se le resta 0.5. En seguida se aplica la frmula de Z, utilizando el valor de
x = 29.5, y en seguida buscar el rea en la tabla:

b) P(x = 35 )
En una distribucin continua la probabilidad de que la variable aleatoria sea exactamente determinado valor no se puede calcular y se estima que es cero, mientras que
en una distribucin discreta la probabilidad se calcula sumando y restando el factor
de correccin de continuidad para estimar el rea entre ambos puntos.
Sin embargo, cuando tenemos un caso como este, lo correcto y lo ms fcil es calcular la probabilidad con la frmula de la binomial, y obtenemos el resultado exacto.

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

Lecturas
seleccionadas

c) P( x 30 )

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Glosario

Aqu se pide la probabilidad de que x tome valores desde 0 hasta 30 inclusive, como
el 30 est incluido el factor de correccin de continuidad se suma.
Recordatorio

Ejemplo 2
Calcular la probabilidad de que al lanzar una moneda 100 veces, el nmero de
caras obtenido est comprendido entre 45 y 55.

Se tiene:


Y la probabilidad pedida es, con la aproximacin realizada:

Ejemplo 3: La presin sangunea de ciertos enfermos sigue una ley normal de media 90 mm. Hg y de desviacin tpica 12 mm. Hg. Hallar la probabilidad de que
elegido un paciente al azar:
a) Su presin sea mayor de 115 mm. Hg.
b) Su presin est comprendida entre 80 y 100 mm. Hg.

Anotaciones

Bibliografa

93

o
os

as

io

94

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Tipificando los valores 90, 80 y 100 tenemos:

Anotaciones

La probabilidad de que la presin sea mayor de 115 mm. Hg. es:

Y la probabilidad de que la presin est comprendida entre 80 y 100 mm. Hg:

Ejemplo 4: Diferencias y relaciones entre la distribucin binomial y la normal.


El porcentaje de espaoles con estudios medios es del 35 %. Elegidos ocho al azar,
calcular la probabilidad de que entre 3 y 5 (ambos incluidos) tengan estudios medios, aplicando:
a) La distribucin binomial.
b) La aproximacin normal de la binomial.
Aplicando la distribucin binomial con n=8, p=0,35 y q=0,65, se tiene:

Aplicando la aproximacin normal a la binomial con:

Y, tipificando para aplicar la aproximacin normal a la binomial:

Con lo cual la probabilidad ser:


Y se ve que la aproximacin no es aqu buena porque n es muy inferior a 30 y p es
muy distinto de 0,5.
TABLAS DE DISTRIBUCIN NORMAL

rea bajo la curva normal

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

de contenidos

TABLAS DE DISTRIBUCIN NORMAL

rea bajo la curva normal

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

Bibliografa

95

o
os

as

io

96

Actividades

Autoevaluacin

Glosario

Bibliografa

Anotaciones

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

Diagrama

Desarrollo
de contenidos

Lecturas
seleccionadas

Objetivos

Diagrama
Actividades

Inicio

ACTIVIDAD
Objetivos
Inicio N 4
Autoevaluacin

Esta actividad puede consultarla en su aula virtual.


Desarrollo
de contenidos
Glosario

Actividades

Autoevaluacin

Bibliografa

LECTURA SELECCIONADA N 4
Lecturas
seleccionadas
Recordatorio

Glosario

Bibliografa

Anotaciones

Los mtodos estadsticos pueden demostrar que el proceso de seleccin de un jurado es


discriminatorio?

Recordatorio

Anotaciones

Estadstica. Mario Triola. Pg.199

Despus de que un acusado ha sido condenado por algn crimen, en ocasiones se interpone una apelacin con el argumento de que el acusado fue condenado por un
jurado de personas diferentes a l. Uno de los criterios es que el proceso de seleccin
del jurado debe garantizar que los miembros representen a la poblacin de la regin.
En un caso clebre, el doctor Benjamin Spock, escritor del libro Baby and Child Cure,
fue condenado por conspiracin al fomentar la resistencia al reclutamiento durante la
guerra de Vietnam. Su defensor argument que el doctor Spock estaba en desventaja,
pues los 12 miembros del jurado eran hombres. Las mujeres se habran mostrado ms
comprensivas, ya que, en general, se oponan ms a la guerra; adems, el doctor Spock
era muy reconocido entre el pblico femenino como mdico infantil. Un especialista
en estadstica testific que el jurado tena una proporcin consistentemente menor de
mujeres que los otros seis jurados del mismo distrito. La condena del doctor Spock fue
anulada por otras razones. En la actualidad los integrantes de los jurados de las cortes
federales se deben elegir de manera aleatoria.
En 1972, Rodrigo Partida, mxico-estadounidense, fue condenado por robo con i ntento de violacin. Su condena fue dictada en el condado de Hidalgo, que se localiza en
Texas, en la frontera con Mxico. En el condado de Hidalgo haba 181,535 personas
que podan formar parte del jurado, y el 80% de ellas eran mxico-estadounidenses.
De las 870 personas llamadas a servir como jueces, el 39% (339) eran mxico-estadounidenses. Tiempo despus, se apel la condena de Partida (Castaneda contra Partida)
con base en la gran discrepancia entre el 80% de mxico-estadounidenses disponibles
para fungir como jueces y el hecho de que slo fuera seleccionado el 39% de este grupo.
En este captulo estudiaremos el problema de Castaneda contra Partida en especial a
partir de las siguientes preguntas fundamentales:
1. Puesto que los mxico-estadounidenses constituyen el 80% de la poblacin y dado
que Partida fue sentenciado por un jurado de 12 personas de las que slo el 58% de
los jueces (7) eran mxico-estadounidenses, podemos concluir que este jurado fue
elegido en un proceso que discrimina a los mxico-estadounidenses?
2. Dado que los mxico-estadounidenses constituyen el 80% de la poblacin total de
181535 habitantes y que durante un perodo de ms de 11 aos slo el 39% de los
individuos llamados a servir como jueces eran mxico-estadounidenses, podemos
concluir que el proceso de seleccin del jurado discrimin a este grupo? (Sabemos
que, debido al azar, las muestras varan naturalmente hasta cierto punto de lo que se
esperara a nivel terico. Sin embargo la discrepancia entre la tasa del 80% de mxico-estadounidenses de la poblacin y el 39% de los mxico-estadounidenses llamados a servir como jueces es lo suficientemente grande para explicarse por el azar?)
Este ejemplo explica la importancia de una comprensin bsica de los mtodos estadsticos en el terreno legal. Es probable que los abogados que carecen de conocimientos
estadsticos no puedan ofrecer un buen servicio a sus clientes. En una ocasin el autor
testific en la suprema Corte del estado de Nueva York y al analizar la situacin, se dio
cuenta de que la falta de comprensin de conceptos estadsticos bsicos podra ser muy
perjudicial para el cliente de un abogado.

os

Diagrama

Objetivos

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD Desarrollo

Inicio

de contenidos

Desarrollo
de contenidos

Actividades

Lecturas
seleccionadas

Glosario

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Autoevaluacin
Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

GLOSARIO
Distribucin binomial: Distribucin donde los sucesos tienen la misma probabilidad, con la presencia de xito y fracaso y en un nmero fijo de ensayos.

-
Recordatorio

Objetivos

Bibliografa

- Anotaciones
Distribucin de Poisson: Distribucin de probabilidad discreta que se aplica a ocurrencias de algn suceso durante un intervalo de tiempo, distancia, rea, volumen u
otra unidad similar que se especifique.
-

Distribucin de probabilidad: Conjunto de valores de una variable aleatoria junto


con sus probabilidades correspondientes.

Distribucin hipergeomtrica: Se diferencia de la binomial en que la probabilidad


de los sucesos no se mantiene constante.

Distribucin muestral de proporciones: Distribucin de probabilidad de las proporciones muestrales, donde todas las muestras tienen el mismo tamao muestral n.

Distribucin normal: Distribucin de probabilidad con forma de campana, simtrica y asinttica por ambos extremos.

Distribucin normal estndar: Distribucin normal con una media igual a cero y
una desviacin estndar igual a 1

Valor crtico z: Nmero de veces que la diferencia entre la observacin dada y la


media contiene a la desviacin estndar.

-
-

Valor esperado: Promedio ponderado de los resultados de un experimento.

Inicio

Variable Aleatoria: Variable que toma diferentes valores como resultado de un experimento aleatorio.

Actividades

Autoevaluacin

Glosario

Bibliografa

BIBLIOGRAFA DE LA UNIDAD IV

1.

Triola Mario F. ESTADSTICA. Pearson Educacin. Mxico 2012

2.

Toma Inafuko-Rubio Donet. Estadstica Aplicada. Centro de Investigacin Universidad del Pacfico. 2012

Anotaciones

Objetivos

Inicio

Actividades

Autoevaluacin

AUTOEVALUACIN DE LA UNIDAD IV
1.
Glosario

La encargada de los prstamos en un banco estima, con base en sus aos de experiencia, que la probabilidad de que un solicitante no sea capaz de pagar su prstamo es 0.025. El mes pasado realiz 40 prstamos. Cul es la probabilidad de que 3
Bibliografa
prstamos no sean pagados oportunamente?
A) 0,6

B) 61%

C) 6%

D)
0,625 E) 0,94

Anotaciones

2.

El arribo de buses de pasajeros al terminal de la Empresa de Transportes Cruz del


Sur es un proceso de Poisson, con un promedio de 2 arribos por hora. Calcular la
probabilidad de que ningn bus arribe en una hora.
A) 0,1527

B) 0,0165

C) 0,1353

D)
0,1254 E) 0,1758

Bibliografa

97

o
os

as

io

98

Actividades

Autoevaluacin

Glosario

Bibliografa

UNIDAD IV: DISTRIBUCIONES DE PROBABILIDAD

3.

Sea Z ~ N(0,1). Halle P[-2 Z -1.57]


A) 0.0678

Anotaciones

B) 0.0542

C) 0.0354

D)
0.0478 E) 0.5147
4.

Una poblacin normal tiene una media de 20,00 y una desviacin estndar de 4,00.
Halle el valor z correspondiente a 25,00
A) 1,25

B) 1,26

C) 1,27

D)
1,28 E) 1,29
5.

Un estudio reciente de los sueldos por hora del personal de una empresa mostr
que el salario medio por hora es de 16,50 Nuevos Soles, con una desviacin estndar de 3,50 nuevos soles. Si se selecciona al azar a un trabajador de la empresa cul
es la probabilidad de que gane ms de 20 nuevos soles la hora?
A) 0,1680

B) 0,1580

C) 0,1587

D)
0,1682 E)0,8415

ANEXO Desarrollo

de contenidos

ESTADSTICA I
Actividades Autoevaluacin
MANUAL AUTOFORMATIVO

Lecturas
seleccionadas

Glosario

Recordatorio

Anotaciones

CLAVE DE RESPUESTAS AUTOEVALUACIONES.

Bibliografa

99

Potrebbero piacerti anche