Sei sulla pagina 1di 312

GUA DIDCTICA Y MDULO

GABRIEL JAIME POSADA HERNNDEZ


MARA VICTORIA BUITRAGO CARDONA

FUNDACIN UNIVERSITARIA LUIS AMIG


FACULTAD DE CIENCIAS ADMINISTRATIVAS,
ECONMICAS Y CONTABLES
Colombia, 2008

COMIT DIRECTIVO
Fray Marino Martnez Prez
Rector
Hernn Ospina Atehorta
Vicerrector Administrativo y Financiero
Director de Planeacin
Jos Jaime Daz Osorio
Vicerrector Acadmico
Francisco Javier Acosta Gmez
Secretario General

ESTADSTICA
Gabriel Jaime Posada Hernndez
Mara Victoria Buitrago Cardona
Decana Facultad de Ciencias Administrativas,
Econmicas y Contables:
Mara Victoria Agudelo Vargas
Correccin de estilo:
Lorenza Correa Restrepo
Diseo:
Colectivo Docente Facultad de Ciencias
Administrativas, Econmicas y Contables
Impresin:
Departamento de Publicaciones FUNLAM
www.funlam.edu.co
TODOS LOS DERECHOS RESERVADOS
Medelln Colombia
2008

Estadstica

CONTENIDO
Pg
GUA DIDCTICA

PRESENTACIN

13

1. FICHA TCNICA

15

2. INTENCIONALIDADES FORMATIVAS

16

3. OBJETIVOS

17

3.1. OBJETIVOS ESENCIALES

17

3.2. OBJETIVOS COMPLEMENTARIOS

17

4. UNIDADES TEMTICAS

19

5. METODOLOGA GENERAL

20

6. EVALUACIN INTEGRAL

21

II

ESTADSTICA DESCRIPTIVA

INTRODUCCIN

23

JUSTIFICACIN

25

UNIDAD 1. INTRODUCCIN Y OBTENCIN DE DATOS


ESTADSTICOS
1.1. ESTADSTICA

27
27

1.1.1. Historia

27

1.1.2. Definicin

31

1.1.3. Divisin

32

Estadstica

1.2.

CONCEPTOS GENERALES

32

1.2.1. Unidad de investigacin

32

1.2.2. Poblacin

33

1.2.3. Muestra

34

1.2.4. Parmetros y estadgrafos

34

1.2.5. Variables

35

1.2.6. Escalas de medicin

38

1.3.

MUESTREO

42

1.3.1. Mtodos de muestreo probabilstico

43

1.3.2. Mtodos de muestreo no probabilstico

47

1.3.3. Evaluacin del valor de una encuesta

49

1.3.4. Errores en las encuestas

50

1.3.5. Aspectos ticos del muestreo

52

UNIDAD 2. ORDENACIN DE DATOS ESTADSTICOS


2.1.

2.2.

TABULACIN DE DATOS

55

2.1.1. Rango o recorrido

55

2.1.2. Amplitud del rango

59

2.1.3. Nmero de clases

59

2.1.4. Amplitud del intervalo de clase

60

2.1.5. Lmites de las clases

61

2.1.6. Tabulacin

62

2.1.7. Marca de clase o punto medio

62

FRECUENCIAS

63

2.2.1. Frecuencia absoluta

63

2.2.2. Frecuencia relativa

64

Estadstica

2.3.

2.4.

2.2.3. Frecuencia absoluta acumulada

66

2.2.4. Frecuencia relativa acumulada

67

2.2.5. Nmeros ndices

69

GRFICAS O DIAGRAMAS

70

2.3.1. Histogramas

70

2.3.2. Polgono de frecuencias

72

2.3.3. Ojivas o polgonos de frecuencias acumuladas

74

2.3.4. Diagramas de barras

75

2.3.5. Diagramas circulares

76

2.3.6. Diagrama de tallo y hojas

77

2.3.7. Diagrama de Pareto

80

TABULACIN DE DATOS BINARIOS O CRUZADOS

82

UNIDAD 3. MTODOS NUMRICOS


3.1.

3.2.

MEDIDAS DE TENDENCIA CENTRAL O DE PRECISIN

88

3.1.1. Media aritmtica

88

3.1.2. Mediana

91

3.1.3. Moda

96

3.1.4. Cuantiles

100

MEDIDAS DE VARIABILIDAD

107

3.2.1. Rango

108

3.2.2. Rango intercuartil

109

3.2.3. Varianza

109

3.2.4. Desviacin estndar

114

3.2.5. Coeficiente de variacin

115

Estadstica

3.3.

MEDIDAS DE LOCALIZACIN

117

3.3.1. Valor z

118

3.3.2. Teorema de Chebyshev

119

3.3.3. Sesgo o forma

122

3.3.4. Diagrama de caja o bigotes

124

3.3.5. Curtosis

128

UNIDAD 4. REGRESIN LINEAL Y CORRELACIN


4.1.

4.2.

III

REGRESIN LINEAL SIMPLE

132

4.1.1. Diagrama de dispersin

132

4.1.2. Ajuste de una recta por el mtodo de mnimos cuadrados

135

CORRELACIN

141

4.2.1. Coeficiente de correlacin

141

4.2.2. Coeficiente de determinacin

144

TEORA DE PROBABILIDADES

UNIDAD 1. DEFINICIONES
1.1 INTRODUCCIN

148

1.2 QU ES LA PROBABILIDAD

149

1.3 CONCEPTOS BSICOS DE PROBABILIDAD

150

1.3.1

Fenmeno experimento aleatorio

150

1.3.2

Fenmeno o experimento determinstico

1.3.3

Prueba

150

1.3.4

Espacio muestral

150

1.3.5

Elemento o punto muestral

1.3.6

Evento

152

1.3.7

Interseccin de dos eventos a y b

152
6

Estadstica

150

152

1.3.8

Unin de dos eventos a y b

1.3.9.

153

Complemento de un evento a

154

UNIDAD 2. TCNICAS DE CONTEO


2.1

2.2

TCNICAS DE CONTEO

157

Regla 2.1.1. Principio de la multiplicacin

157

Regla 2.1.2. Principio de permutacin

161

Regla 2.1.3 Variaciones o permutaciones

162

Regla 2.1.4 Combinaciones

164

Regla 2.1.5 Particiones

166

EJERCICIOS RESUELTOS

167

UNIDAD 3. SUCESOS PROBABILSTICOS Y REGLAS DE


PROBABILIDAD
3.1 SUCESOS PROBABILSTICOS
3.1.1 Sucesos independientes

3.2

3.3.

172
172

3.1.2 Sucesos dependientes

172

3.1.3 Sucesos compatibles o mutuamente no excluyentes

172

3.1.4 Sucesos incompatibles o mutuamente excluyentes

172

DEFINICIN DE PROBABILIDAD

173

3.2.1. Modelo de probabilidad emprico o frecuencialista.

173

3.2.2. Modelo subjetivo

174

3.2.3 Modelo clsico

174

REGLAS PRINCIPALES DE LA PROBABILIDAD

Estadstica

175
7

3.4.

AXIOMAS DE PROBABILIDAD

180

3.4.1 Teorema 1: regla de la unin o suma

180

3.4.2 Teorema 2: regla del complemento

180

3.4.3 Teorema 3: probabilidad condicional

181

3.4.4 Teorema 4: regla de la multiplicacin o interseccin 182

UNIDAD 4. VARIABLES ALEATORIAS Y DISTRIBUCIONES


DE PROBABILIDAD
4.1 INTRODUCCIN

191

4.2 DISTRIBUCIN O FUNCIN DE PROBABILIDAD

191

4.3 ALGUNAS DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 194


4.3.1 Distribucin binomial
4.3.1.1

4.3.2

Caractersticas

194
195

4.3.1.2

Funcin de probabilidad de la v.a. binomial

196

4.3.1.3

Tablas de probabilidad acumulada de la binomial

200

4.3.1.4

Parmetros de la distribucin binomial

205

Distribucin hipergeomtrica

206

4.3.2.1

Funcin de probabilidad de la v.a. hipergeomtrica

207

4.3.2.2

Parmetros de la distribucin hipergeomtrica

212

4.3.3 Distribucin de Poisson


4.3.3.1
4.3.3.2
4.3.3.3

Estadstica

Funcin de probabilidad de la v.a. Poisson


Tablas de probabilidad acumulada de la Poisson
Parmetros de la distribucin Poisson

212
213
213
220

4.4

DISTRIBUCIN CONTINUA DE PROBABILIDAD:


DISTRIBUCIN NORMAL
4.4.1

IV

La funcin de densidad de la distribucin normal

220
221

4.4.2 Representacin grfica de esta funcin de densidad

221

4.4.3 Distribucin normal estndar

222

4.4.4 Pasos para buscar en la tabla

222

ESTADSTICA INFERENCIAL

UNIDAD 1. ESTIMACIN
1.1 INTRODUCCIN

233

1.2 NIVEL DE CONFIABILIDAD DE LOS RESULTADOS

236

1.3 PRINCIPALES PARMETROS, ESTADSTICOS


Y SUS SMBOLOS
1.4 ESTIMACIN PUNTUAL

1.5

236
237

1.4.1

Estimacin puntual para variable cuantitativa

237

1.4.2

Estimacin puntual para variable cualitativa

238

TAMAO DE LA MUESTRA PARA ESTIMAR MEDIAS Y


PROPORCIONES.

238

1.5.1 Determinacin estadstica del tamao de la muestra

240

1.5.1.1

Poblaciones infinitas

240

1.5.1.1.1

Proporcin conocida

240

1.5.1.1.2
Estadstica

Proporcin desconocida

240
9

1.5.1.2

Poblaciones finitas
242

UNIDAD 2. INTERVALOS DE CONFIANZA


2.1 INTRODUCCIN

244

2.1.1 Intervalos de confianza para el promedio poblacional

244

2.1.1.1 Parmetros y/o estadsticos para utilizar las frmulas


de intervalos de confianza
2.1.2 Intervalo de confianzas para la proporcin poblacional p

245
253

2.1.2.1 Parmetros para utilizar las frmulas de intervalos de confianza 253

UNIDAD 3. PRUEBA DE HIPTESIS


3.1

INTRODUCCIN

257

3.2 DEFINICIN DE PRUEBA DE HIPTESIS

257

3.3 PASOS PARA LA PRUEBA DE HIPTESIS PARA


EL PROMEDIO

Y LA PROPORCIN P.

258

4.

ESTUDIO DE CASO

272

5.

ACTIVIDADES DE RECONOCIMIENTO

276

6.

RESPUESTA A PREGUNTAS FRECUENTES

277

7.

ACTIVIDADES DE PROFUNDIZACIN

281

ANEXOS TABLAS DE PROBABILIDAD ACUMULADA


Anexo A

Tabla acumulada de la distribucin binomial

297

Anexo B

Tabla acumulada de la distribucin Poisson

302

Anexo C

Tabla acumulada de la distribucin normal

305

Estadstica

10

Anexo D

Tabla de la distribucin t-student

307

GLOSARIO

308

BIBLIOGRAFA

317

Estadstica

11

Estadstica

12

PRESENTACIN
Apreciado estudiante, bienvenido a la Asignatura Estadstica Descriptiva e
Inferencial.
Este mdulo ha sido escrito teniendo presente al estudiante que ingresa en
la metodologa a distancia, la cual se constituye en uno de los nuevos retos y
alternativas para la formacin de profesionales capaces de intervenir
problemticas sociales contemporneas, desde la aplicacin de la ciencia y
la tecnologa con criterios ticos y de calidad.
La educacin a distancia responde a la necesidad de ofrecer un proceso de
formacin que supere obstculos representados en grandes distancias
geogrficas y escasez de tiempo de personas deseosas de tener las
oportunidades de desarrollo humano que brinda la educacin superior.
Dicha metodologa exige a cada estudiante un esfuerzo investigativo,
creativo e innovador soportado por la voluntad del compromiso que demanda
nuestra sociedad.
Por esto, para el alcance de los objetivos en este proceso formativo, ms que
construir un texto, se ha tratado de presentar un instrumento de
comunicacin acadmica y dinmica entre la institucin y el estudiante, en el
que se diferencian dos partes fundamentales: la gua de estudio y trabajo, y
el mdulo de aprendizaje.

Estadstica

13

La gua considera las orientaciones sobre el desarrollo del curso en cuanto


define los elementos necesarios para la interlocucin entre estudiantes y
docente, describiendo en la metodologa las actividades a realizar para cada
encuentro,

bibliografa

complementaria,

proceso

de

evaluacin

compromisos adquiridos por el estudiante. El mdulo desarrolla el contenido


conceptual bsico que permite al estudiante la comprensin de los
problemas potenciales en el campo administrativo.
Seguros de que en dicho material se encuentran los referentes necesarios
para el desarrollo de un proceso acadmico con calidad, le deseamos xitos
en este nuevo ciclo de su formacin profesional.

Estadstica

14

1. FICHA TCNICA

CURSO

ESTADSTICA DESCRIPTIVA

AUTORES

GABRIEL JAIME POSADA HERNNDEZ


MARA VICTORIA BUITRAGO CARDONA

INSTITUCIN

FUNDACIN UNIVERSITARIA LUIS AMIG

UNIDAD ACADMICA

FACULTAD DE CIENCIAS ADMINISTRATIVAS,


ECONMICAS Y CONTABLES

PROGRAMAS

ADMINISTRACIN DE EMPRESAS
CONTADURA PBLICA
NEGOCIOS INTERNACIONALES

PALABRAS CLAVE

ESTADSTICA, CONTEO, DATOS, MUESTRA,


POBLACIN, PROBABILIDAD

REA DE CONOCIMIENTO

BSICA

CRDITOS

3 (TRES)

CIUDAD

MEDELLN

FECHA

JULIO DE 2007

ACTUALIZACIN
ADICIN DE TEMAS
APROBADA POR

2. INTENCIONALIDADES FORMATIVAS

Estadstica

15

El mundo global y nuestra sociedad exigen al profesional moderno el


desarrollo de competencias y habilidades que permitan la solucin oportuna
y adecuada a los diferentes problemas que se presentan en las
organizaciones.
La Fundacin Universitaria Luis Amig, consciente de ello, ha generado
constantemente espacios que propician la formacin integral de sus
estudiantes, partiendo del reconocimiento del ser humano como persona y,
sobre l, la tcnica y el saber especfico que exige la academia.
Por tal razn, el egresado de la Fundacin Universitaria Luis Amig es un
profesional ntegro, tico y comprometido con la sociedad en la bsqueda de
alternativas viables para el mejoramiento funcional de las organizaciones y la
calidad de vida de sus integrantes.

3. OBJETIVOS

Estadstica

16

3.1. OBJETIVOS ESENCIALES


Manejar adecuadamente los conceptos relacionados con estadstica.
Aplicar los conceptos y procedimientos matemticos para describir el
comportamiento de una variable en un conjunto de datos.
Analizar los mtodos numricos de un conjunto de datos.
Generar modelos de regresin lineal simple, y realizar anlisis pertinentes
para la toma de decisiones.
Aplicar el concepto de teora de probabilidad para tomar decisiones bajo
incertidumbre.
Manejar las distribuciones discretas y continuas de probabilidad para
resolver

problemas

reales,

teniendo

en

cuenta

los

parmetros

poblacionales y el tipo de situacin a resolver.


Realizar inferencias partiendo de parmetros muestrales, por medio de
los intervalos de confianza y prueba de hiptesis.

3.2. OBJETIVOS COMPLEMENTARIOS


Diferenciar conceptualmente la poblacin y la muestra.
Reconocer los tipos de variables y escalas de medicin aplicados a un
conjunto de datos.
Estadstica

17

Calcular e interpretar las medidas de tendencia central, variabilidad y


localizacin de un conjunto de datos.
Calcular los parmetros de la ecuacin de regresin lineal simple.
Calificar el modelo de regresin lineal simple por medio de los
coeficientes de correlacin y determinacin.
Reconocer un espacio muestral y su tcnica de conteo acorde al
problema.
Reconocer las diferentes reglas de probabilidad y su aplicabilidad.
Aplicar y calcular por frmula o tabla de probabilidad, las distribuciones
binomial, Poisson, hipergeomtrica y normal.
Reconocer la informacin que se tiene para poder sacar una muestra
aleatoria, con un alto grado de confiabilidad
Diferenciar una variable aleatoria discreta y una variable aleatoria
continua.
Diferenciar un parmetro poblacional y un parmetro muestral.
Aplicar de acuerdo con los estadsticos, un parmetro muestral por medio
del intervalo de confianza o prueba de hiptesis a un nivel de
confiabilidad.

Estadstica

18

4.
II

UNIDADES TEMTICAS
ESTADSTICA DESCRIPTIVA

UNIDAD 1. INTRODUCCIN Y OBTENCIN DE DATOS


ESTADSTICOS
UNIDAD 2. ORDENACIN DE DATOS ESTADSTICOS
UNIDAD 3. MTODOS NUMRICOS
UNIDAD 4. REGRESIN LINEAL Y CORRELACIN

III

TEORA DE PROBABILIDADES

UNIDAD 1

DEFINICIONES

UNIDAD 2

TCNICAS DE CONTEO

UNIDAD 3

SUCESOS PROBABILSTICOS Y REGLAS DE


PROBABILIDAD

UNIDAD 4

VARIABLES ALEATORIAS Y DISTRIBUCIONES DE


PROBABILIDAD

IV

ESTADSTICA INFERENCIAL

UNIDAD 1

ESTIMACIN

UNIDAD 2

INTERVALOS DE CONFIANZA

UNIDAD 3

PRUEBA DE HIPTESIS

Estadstica

19

5.

METODOLOGA GENERAL

El curso Estadstica, bajo la modalidad a distancia, es realizado por medio


de encuentros presenciales, utilizando como mediaciones la plataforma
Dicom y el mdulo.
En los encuentros presenciales se compartirn los temas propuestos, se
realizarn ejemplos aplicados a la administracin y se asignarn actividades
para las siguientes asesoras.
Al iniciar el curso, cada estudiante selecciona una organizacin (puede ser
pblica, privada o del sector de la economa solidaria) o un grupo poblacional
de inters (estudiantes, familias, habitantes de un barrio, etc.). Seleccionar
una muestra de elementos (de un tamao acordado) y generar una base de
datos que contemple las variables cualitativas, cuantitativas discretas y
cuantitativas continuas.
En los elementos de la muestra seleccionada, se aplicarn paulatinamente
los conceptos vistos en el desarrollo del curso.

En cada encuentro

presencial se compartirn los avances sobre la secuencia del anlisis


estadstico de los elementos de la organizacin.
A travs de la plataforma virtual Dicom, cada estudiante compartir sus
inquietudes y apreciaciones en el portafolio personal de desempeo. Estas
inquietudes sern resueltas por este medio o socializadas en la siguiente
asesora.

Estadstica

20

6. EVALUACIN INTEGRAL
La evaluacin del curso Estadstica se realizar de forma cualitativa, por
medio del portafolio personal de desempeo (acorde con el artculo 80 del
Reglamento Estudiantil). Se establecer un proceso dinmico y continuo que
contenga seguimiento, trabajo aplicado y evaluacin final.
El seguimiento se realizar a travs de evaluaciones cortas sobre temticas
ya compartidas, designando un espacio para hacerlas, previo acuerdo con
los estudiantes.
El trabajo de aplicacin a la organizacin o poblacin de inters tendr un
seguimiento durante todo el curso, el cual ser tenido en cuenta para la
evaluacin final del mismo; adems de la presentacin, anlisis de variables
y conclusiones.
Al finalizar el curso, se realizar la evaluacin final o Prueba Acumulativa de
Conocimiento Integral (PACI), la cual pretende evaluar, de forma global,
todos los temas tratados en el curso.

Estadstica

21

Estadstica

22

INTRODUCCIN
La estadstica o los mtodos estadsticos, como se denomina a veces, est
jugando un papel de gran importancia en casi todas las facetas del
comportamiento humano. Ocupada inicialmente en asuntos del Estado, y de
ah su nombre, la influencia de la Estadstica se ha extendido ahora a la
administracin, la economa, los negocios, la comunicacin, la agricultura, la
medicina, la fsica, las ciencias polticas, la psicologa, la sociologa y muchos
otros campos de la ciencia y la ingeniera.
El propsito de este mdulo es presentar desde el manejo de la informacin,
su representacin tabular y medidas, hasta el manejo de las probabilidades,
y llegar a conclusiones poblacionales por medio de la inferencia estadstica
en la cual son de gran utilidad, para la manipulacin de la informacin,
respuestas bajo incertidumbre y respuestas poblacionales. Se ha diseado
para ser usado como complemento del proceso formativo, acompaado de la
plataforma Dicom y los encuentros presenciales.

Adems, puede ser

considerado como texto de consulta para aquellas personas que estn


interesadas en aplicar la Estadstica en el anlisis de problemas
investigativos.
Los temas han sido compilados de diferentes autores: Anderson, Sweeney y
Williams; Berenson, Levine y Krehbiel; Walpole y Myers; Spiegel, entre otros.
Cada unidad comienza con enunciados claros de las definiciones pertinentes
y ejemplos aplicados a la vida real. La nica base matemtica requerida
Estadstica

23

para la comprensin de los temas es la aritmtica. En la primera unidad se


presenta la conceptualizacin de la estadstica y la forma como se obtiene
una base de datos. La segunda unidad se refiere a la ordenacin de datos
estadsticos, segn el tipo de variable en la cual se ubican, para luego
representar en la tercera unidad las medidas de tendencia central, de
dispersin y de localizacin del conjunto de datos.

La cuarta unidad

establece la relacin entre variables por medio de la regresin lineal y la


correlacin. La quinta unidad se refiere a un espacio muestral, las tcnicas
de conteo y las reglas de probabilidad.

La sexta unidad se refiere a la

diferencia entre variables aleatorias discretas y continuas y sus distribuciones


de probabilidad. La sptima unidad se refiere a resultados poblacionales, por
medio de los intervalos de confianza y prueba de hiptesis, basndose en
resultados muestrales.
Al final, se presenta un estudio de caso, el cual pretende mayor cercana de
la Estadstica a la administracin; adems de algunas preguntas frecuentes,
con su respectiva respuesta, que se presentan al estudiar la Estadstica.

Estadstica

24

JUSTIFICACIN
El desarrollo cientfico del siglo XXI exige una formacin profesional ntegra,
que rena conocimientos, experiencia y expectativas, que permita la
utilizacin adecuada de los recursos y herramientas del mundo actual.
En la actualidad, las reas administrativas, contables y econmicas requieren
de un profesional con conocimientos bsicos de clculo, de tal forma que lo
lleven a incursionar en el campo investigativo y en la toma de decisiones,
para generar nuevos conocimientos a partir de la integracin de los
conceptos propios y de las diferentes reas de estudio, que lo hagan ms
competente en los retos del mundo moderno.

Estadstica

25

Estadstica

26

1. INTRODUCCIN Y OBTENCIN DE DATOS


ESTADSTICOS
1.1. ESTADSTICA
1.1.1. Historia
Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto,
cuyos faraones lograron recopilar, hacia el ao 3050 antes de Cristo, prolijos
datos relativos a la poblacin y la riqueza del pas. De acuerdo con el
historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto,
Ramss II hizo un censo de las tierras con el objeto de verificar un nuevo
reparto.
En el antiguo Israel, la Biblia da referencias, en el libro de los Nmeros, de
los datos estadsticos obtenidos en dos recuentos de la poblacin hebrea. El
rey David, por otra parte, orden a Joab, general del ejrcito, hacer un censo
de Israel con la finalidad de conocer el nmero de la poblacin.
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los
griegos efectuaron censos peridicamente con fines tributarios, sociales
(divisin de tierras) y militares (clculo de recursos y hombres disponibles).
La investigacin histrica revela que se realizaron 69 censos para calcular
los impuestos, determinar los derechos de voto y ponderar la potencia
guerrera.
Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor
supieron emplear los recursos de la estadstica. Cada cinco aos realizaban
un censo de la poblacin, y sus funcionarios pblicos tenan la obligacin de
Estadstica
27

anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos


peridicos del ganado y de las riquezas contenidas en las tierras
conquistadas. Para el nacimiento de Cristo, suceda uno de estos
empadronamientos de la poblacin bajo la autoridad del imperio.
Durante los mil aos siguientes a la cada del imperio romano se realizaron
muy pocas operaciones estadsticas, con la notable excepcin de las
relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el
Breve en el 758, y por Carlomagno en el 762 DC. Durante el siglo IX se
realizaron en Francia algunos censos parciales de siervos. En Inglaterra,
Guillermo el Conquistador recopil el Domesday Book o Libro del gran
catastro para el ao 1086, un documento de la propiedad, extensin y valor
de las tierras de Inglaterra. Esa obra fue el primer compendio estadstico de
Inglaterra.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols
Coprnico, Galileo, Neper, William Harvey, Sir Francis Bacon y Ren
Descartes, hicieron grandes operaciones al mtodo cientfico, de tal forma
que cuando se crearon los Estados nacionales y surgi como fuerza el
comercio internacional exista ya un mtodo capaz de aplicarse a los datos
econmicos.
Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones
debido al temor que Enrique VII tena por la peste. Ms o menos por la
misma poca, en Francia la ley exigi a los clrigos registrar los bautismos,
fallecimientos y matrimonios. Durante un brote de peste que apareci a fines
de la dcada de 1500, el gobierno ingls comenz a publicar estadsticas
semanales de los decesos. Esa costumbre continu muchos aos, y en 1632
estos Bills of Mortality (Cuentas de mortalidad) contenan los nacimientos y
fallecimientos por sexo.
Estadstica

28

En 1662, el capitn John Graunt us documentos que abarcaban treinta aos


y efectu predicciones sobre el nmero de personas que moriran de varias
enfermedades y sobre las proporciones de nacimientos de varones y mujeres
que cabra esperar. El trabajo de Graunt, condensado en su obra Natural and
political observations... Made upon the bills of mortality (Observaciones
polticas y naturales... hechas a partir de las cuentas de mortalidad), fue un
esfuerzo innovador en el anlisis estadstico. Por el ao 1540, el alemn
Sebastin Muster realiz una compilacin estadstica de los recursos
nacionales, comprensiva de datos sobre organizacin poltica, instrucciones
sociales, comercio y podero militar.
Durante el siglo XVII aport indicaciones ms concretas de mtodos de
observacin y anlisis cuantitativo y ampli los campos de la inferencia y la
teora estadstica. Los eruditos del siglo XVII demostraron especial inters
por la estadstica demogrfica como resultado de la especulacin sobre si la
poblacin aumentaba, decreca o permaneca esttica.
En los tiempos modernos, tales mtodos fueron resucitados por algunos
reyes que necesitaban conocer las riquezas monetarias y el potencial
humano de sus respectivos pases. El primer empleo de los datos
estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a
cargo de Gaspar Neumann, un profesor alemn que viva en Breslau. Este
investigador se propuso destruir la antigua creencia popular de que en los
aos terminados en siete mora ms gente que en los restantes, y para
lograrlo hurg pacientemente en los archivos parroquiales de la ciudad.
Despus de revisar miles de partidas de defuncin pudo demostrar que en
tales aos no fallecan ms personas que en los dems. Los procedimientos
29

Estadstica

de Neumann fueron conocidos por el astrnomo ingls Halley, descubridor


del cometa que lleva su nombre, quien los aplic al estudio de la vida
humana. Sus clculos sirvieron de base para las tablas de mortalidad que
hoy utilizan todas las compaas de seguros.
Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli,
Francis

Maseres,

Lagrange

Laplace

desarrollaron

la

teora

de

probabilidades. No obstante, durante cierto tiempo, la teora de las


probabilidades limit su aplicacin a los juegos de azar y hasta el siglo XVIII
no comenz a aplicarse a los grandes problemas cientficos. Godofredo
Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la palabra
estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con
sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz
del gobernante consciente. La raz remota de la palabra se halla, por otra
parte, en el trmino latino status, que significa estado o situacin. Esta
etimologa aumenta el valor intrnseco de la palabra, por cuanto la estadstica
revela el sentido cuantitativo de las ms variadas situaciones.
Jacques Qutelect es quien aplica las estadsticas a las ciencias sociales.
Este interpret la teora de la probabilidad para su uso en las ciencias
sociales y resolver la aplicacin del principio de promedios y de la
variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la
aplicacin prctica de todo el mtodo estadstico, entonces conocido, a las
diversas ramas de la ciencia. Entre tanto, en el perodo del 1800 al 1820 se
desarrollaron dos conceptos matemticos fundamentales para la teora
estadstica: la teora de los errores de observacin, aportada por Laplace y
Gauss; y la teora de los mnimos cuadrados desarrollada por Laplace,
Gauss y Legendre.
Estadstica

30

A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido por
Correlacin, que tena por objeto medir la influencia relativa de los factores
sobre las variables. De aqu parti el desarrollo del coeficiente de correlacin
creado por Karl Pearson y otros cultivadores de la ciencia biomtrica como J.
Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios
sobre la medida de las relaciones.
Los progresos ms recientes en el campo de la Estadstica se refieren al
ulterior desarrollo del clculo de probabilidades; particularmente en la rama
denominada indeterminismo o relatividad, se ha demostrado que el
determinismo fue reconocido en la Fsica como resultado de las
investigaciones atmicas y que este principio se juzga aplicable tanto a las
ciencias sociales como a las fsicas.
1.1.2. Definicin
La Estadstica es la ciencia cuyo objetivo es reunir una informacin
cuantitativa concerniente a individuos, grupos, series de hechos, etc., y
deducir de ello, gracias al anlisis de estos datos, significados precisos o
previsiones para el futuro.
La estadstica, en general, es la ciencia que trata de la recopilacin,
organizacin presentacin, anlisis e interpretacin de datos numricos con
el fin de realizar una toma de decisin ms efectiva.
Los estudiantes confunden comnmente los dems trminos asociados con
las estadsticas, una confusin que es conveniente aclarar debido a que esta
palabra tiene tres significados: la palabra estadstica, en primer trmino, se
usa para referirse a la informacin estadstica; tambin se utiliza para
Estadstica

31

referirse al conjunto de tcnicas y mtodos que se utilizan para analizar la


informacin estadstica; y el trmino estadstico, en singular y en masculino,
se refiere a una medida derivada de una muestra.
1.1.3. Divisin
La Estadstica, para su mejor estudio, se ha dividido en dos grandes ramas:
la Estadstica Descriptiva y la Inferencial.
Estadstica Descriptiva: consiste sobre todo en la presentacin de datos en
forma de tablas y grficas. Esta comprende cualquier actividad relacionada
con los datos y est diseada para resumir o describir los mismos sin
factores pertinentes adicionales, esto es, sin intentar inferir nada que vaya
ms all de los datos como tales.
Estadstica Inferencial: se deriva de muestras, de observaciones hechas
slo acerca de una parte de un conjunto numeroso de elementos y esto
implica que su anlisis requiere de generalizaciones que van ms all de los
datos. Como consecuencia, la caracterstica ms importante del reciente
crecimiento de la estadstica ha sido un cambio en el nfasis de los mtodos,
los cuales son utilizados para hacer generalizaciones. La Estadstica
Inferencial investiga o analiza una poblacin partiendo de una muestra
tomada.

1.2. CONCEPTOS GENERALES


1.2.1. Unidad de investigacin

Estadstica

32

La unidad de investigacin es el elemento a quien va dirigida la investigacin,


el cual puede ser una persona, una familia, una vivienda, un estudiante, una
universidad, un empleado, una organizacin, etc.

La unidad debe ser

adecuada al tipo de investigacin y debe poseer caractersticas claras y


entendibles que permitan mediciones y comparaciones.
1.2.2. Poblacin
Se entiende por poblacin o universo un conjunto grande de elementos o
unidades de investigacin, de los cuales se estudia una o varias
caractersticas comunes. Por ejemplo, los estudiantes de una universidad,
las universidades de una ciudad, los artculos producidos en una fbrica, las
empresas de un pas, los lanzamientos de una moneda, etc.
Segn el tamao, la poblacin puede clasificarse en finita e infinita.
Se considera una poblacin finita cuando tiene un nmero determinado de
elementos, es decir, se conoce el tamao de la poblacin. Por ejemplo, los
habitantes de un pas, los estudiantes de una universidad, los empleados de
una empresa, los asociados a una cooperativa, etc.,

mientras que la

poblacin infinita tiene un nmero indeterminado de elementos, por ejemplo,


los cuerpos que caen, los lanzamientos de un dado, etc.
Esta clasificacin slo existe en la teora, porque en la prctica existen
poblaciones con un nmero enormemente grande de elementos, las cuales
son clasificadas como poblaciones infinitas.
Cuando la poblacin est compuesta por un nmero relativamente alto de
elementos, por razones de costo, tiempo y recursos tcnicos que acarreara
33

Estadstica

la observacin exhaustiva de cada uno de los elementos de la poblacin, es


necesario recurrir a la seleccin de una muestra representativa de la
poblacin.
1.2.3. Muestra
La muestra es un conjunto de unidades pertenecientes a la poblacin,
seleccionadas adecuadamente; es decir, es una parte de la poblacin o
universo.

Por ejemplo, de los 150 empleados de una empresa que

constituyen el universo o poblacin en estudio, al azar se pueden seleccionar


30 empleados, que constituyen la muestra.
Al emplear una muestra se busca lograr que al observar una porcin
reducida de unidades, se puedan sacar conclusiones semejantes a las que
se obtendran si se estudiara el total de la poblacin o universo.
Lo ideal es que el nmero de elementos o unidades de observacin que
constituyen la muestra sea igual al de la poblacin, para evitar los errores al
utilizar muestras no representativas.

Sin embargo, por la limitacin de

recursos, es preciso acudir al muestreo y asumir los posibles errores que


puedan generarse.

Cuando el tamao de la muestra es igual al de la

poblacin, el trabajo realizado se denomina censo.


1.2.4. Parmetros y estadgrafos
Los

parmetros

son

medidas

que

describen

numricamente

una

caracterstica de la poblacin, tales como: la media aritmtica, la varianza, el


coeficiente de variacin, etc.

Una poblacin puede tener varias

caractersticas y, por lo tanto, varios parmetros.


Estadstica

34

Los estadgrafos o estadsticas son medidas que describen numricamente


una caracterstica de la muestra; as como los parmetros lo hacen en una
poblacin, igual los estadgrafos lo hacen para la muestra, tales como: la
media aritmtica, la varianza, el coeficiente de variacin, etc.
1.2.5. Variables
Una variable es cualquier caracterstica o propiedad de una poblacin o de
una muestra, susceptible de asumir distintos valores o modalidades. Por
ejemplo: la altura de cada uno de los estudiantes de un curso puede tomar
distintos valores: sta puede ser 1.65 m o 1.72 m, o cualquier otro valor, as
la altura es una variable. Esto no significa que la altura de un estudiante
puede variar, sino que la altura puede variar de un estudiante a otro.
El color tambin es una variable. Si se toma, por ejemplo, el color de las
camisetas de los estudiantes, esta cualidad puede variar de una camiseta a
otra, ya que puede haber camisetas blancas, negras, rojas, azules, etc.
Estos colores son, en este caso, los distintos atributos o modalidades que
puede asumir la variable en mencin.
Las caractersticas de los objetos pueden ser o no ser susceptibles de
medida; en el primer caso (la altura de los estudiantes) se tiene una
caracterstica cuantitativa, y en el segundo (el color de la camiseta) una
caracterstica cualitativa.

Por esta razn, las variables se clasifican en

cualitativas y cuantitativas.

Estadstica

35

Variables cualitativas
Las variables cualitativas son las que no permiten construir una serie
numrica definida; los atributos o caractersticas que toman son distintas
modalidades observadas cualitativamente.

Son variables cualitativas el

color, la profesin, el estado civil, etc.


Para designar variables cualitativas, generalmente se utilizan las primeras
letras del alfabeto en maysculas (A, B, C,...) y para designar el atributo se
toman las letras minsculas acompaadas por subndices. Por ejemplo, la
variable profesin en una empresa puede ser representada por la letra A y
sus posibles caractersticas: administrador, economista, contador, ingeniero,
por a1, a2 , a3 ,a4, respectivamente, en este caso,
a1 = administrador
a2 = economista
a3 = contador
a4 = ingeniero
Variables cuantitativas
Las variables cuantitativas son aquellas que permiten una escala numrica
de medicin, toman distintos valores observados cuantitativamente mediante
una medida y una escala de medidas. Son variables cuantitativas la altura,
el peso, el nmero de hijos de una familia, el salario, el nmero de artculos
producidos en una semana.
Para designar las variables cuantitativas se utilizan las ltimas letras del
alfabeto en maysculas (... X, Y, Z). Por ejemplo, la variable altura de cinco
36

Estadstica

estudiantes se representa por X y las alturas 1.65 m, 1.67 m, 1.68 m, 1.70 m


y 1.72 m, se representan por x1, x2 , x3 , x4 y x5 , respectivamente. En este
caso,
x1 = 1.65 m
x2 = 1.67 m
x3 = 1.68 m
x4 = 1.70 m
x5 = 1.72 m
Las variables cuantitativas pueden clasificarse en cuantitativas continuas y
cuantitativas discretas.
Una variable es cuantitativa continua si entre dos valores consecutivos
puede tomar infinito nmero de valores; es decir, entre uno y otro valor de la
variable existen infinitas posibilidades intermedias; son variables continuas el
peso, la temperatura, el tiempo, el salario, etc.
Por ejemplo, el peso es una variable cuantitativa continua porque entre los
valores de 65 Kg y 66 Kg existen infinitos valores, stos pueden ser 65.9 Kg,
65.99 Kg, 65.999 Kg, etc.
Una variable es cuantitativa discreta si entre dos valores consecutivos no
puede asumir otro valor; en este caso la variable no toma valores decimales.
Por ejemplo, el nmero de empleados de una empresa, el nmero de
artculos producidos, el nmero de empresas de la competencia, etc. En
estos casos se habla de un cierto valor como 10, 11, 12 o cualquier otro
nmero entero, porque es absurdo decir, por ejemplo, que una empresa tiene
11.8 empleados.
Estadstica

37

1.2.6. Escalas de medicin


Una escala es un sistema para asignar valores numricos a ciertas
caractersticas o rasgos mensurables. Existen varios mtodos para ordenar
datos; en la mayora de los casos, las tcnicas de medicin se pueden
reducir a cuatro tipos de escalas: nominal, ordinal, de intervalos y de razn.
Escala nominal
La escala nominal se aplica a la variable cualitativa, la cual presenta
diferentes categoras o modalidades, cada una de las cuales recibe un
nombre; de ah la denominacin de esta escala. A las variables con tales
caractersticas tambin se les denomina atributos. Las categoras pueden
estar preconstruidas y ser de aceptacin general, o puede definirlas el
investigador de acuerdo con sus intereses, pero en cualquier caso deben ser
exhaustivas y mutuamente excluyentes, esto es, que exista una y slo una
categora para cada uno de los elementos de la poblacin.
Ejemplos:
Color = {blanco, rojo, azul, verde, violeta, otro}
Tipo de artculo = {normal, imperfecto}
Cargo = {gerente, coordinador, auxiliar}
Las nicas estadsticas bsicas que se pueden obtener a partir de estas
variables son la frecuencia y la moda y, por tanto, los mtodos estadsticos
disponibles son aquellos que se basan en las mismas. En el caso de una
sola variable, se pueden obtener tablas de frecuencias y diagramas de
38

Estadstica

barras o de sectores; si se tienen dos variables se puede realizar un anlisis


de correspondencia o construir tablas de contingencia.
Escala ordinal
Cada uno de los niveles de esta escala tiene un rango, lo que permite
establecer comparaciones de orden entre los mismos (mayor que, menor
que). No obstante, no es adecuado, en general, suponer que la distancia
entre un nivel y sus niveles adyacentes superior e inferior es la misma.
Ejemplos:
Estado sanitario = {sano, ligeramente afectado, enfermo, muy enfermo,
muerto}
Estrato socioeconmico = {1, 2, 3, 4, 5, 6}
Produccin = {alta, media, baja}
Las variables medidas en esta escala contienen ms informacin que
aquellas medidas en escala nominal; por tanto, se podran aplicar los mismos
mtodos

anlisis,

prescindiendo

de

la

informacin

de

orden.

Adicionalmente, se pueden calcular la mediana y la desviacin media.


Aunque es posible reemplazar cada una de los niveles por un nmero
(etiqueta), ste no aporta informacin adicional y las relaciones que se
pueden establecer siguen siendo las mismas.

As, se podra hacer

corresponder los nmeros del 1 al 5 con cada uno de los niveles de estado
fitosanitario, pero lo nico que se podra decir en cuanto a la sanidad es que
1 > 2 > 3 > 4 > 5.
Estadstica

En general, ser inadecuada la utilizacin de estos


39

nmeros para efectuar operaciones o deducciones matemticas de otro tipo,


como la obtencin del estado fitosanitario promedio, por ejemplo.
Escala de intervalo
Es una escala que contiene ms informacin que las anteriores, pues
adems de que existe un orden entre los diferentes niveles, la distancia entre
cualquier par de niveles adyacentes es la misma, lo que implica el uso de
una distancia unitaria de referencia. Esta caracterstica permite establecer
relaciones entre cualquier par de intervalos en la escala; as, es posible
afirmar que la distancia que hay entre 5 y 6 es la misma que hay entre 10 y
11.
Esta escala hace uso de un punto cero que se asigna arbitrariamente en
cada sistema y que no implica ausencia de la caracterstica medida. Este
hecho hace imposible establecer comparaciones de razn. As, para una
caracterstica medida en esta escala, sera incorrecto afirmar que 5 es la
mitad de 10.
Un ejemplo tpico es la escala en que se mide la temperatura; para su
medicin se pueden utilizar diferentes sistemas: el Celsius, el Fahrenheit1 u
otro.

Dentro de cualquiera de estos sistemas es posible afirmar que la

distancia entre dos divisiones cualesquiera es la misma, sin importar el lugar


de la escala.

No obstante, en la siguiente tabla se observa cmo una

relacin entre dos temperaturas cambia dependiendo del sistema, la cual


explica por qu no puede afirmarse que 5 sea la mitad de 10.
Celsius
1

Fahrenheit

(temperatura) F = (9/5) * (temperatura) C + 32

Estadstica

40

5 C
10 C

41 F
50 F

Ntese que cualquier escala ordinal que se construya cuidando que la


distancia entre niveles sea la misma constituir, en realidad, una escala de
intervalos.
Cuando las variables estn medidas en esta escala, se pueden calcular
todos los estadsticos, y es posible usar cualesquiera de los mtodos
estadsticos clsicos, siempre que se cumplan los supuestos especficos de
los mismos.
Escala de razones
Es la escala de medicin que tiene ms informacin. Posee un punto cero
verdadero que indica ausencia de la caracterstica, lo que permite realizar
comparaciones no slo de intervalo, sino tambin de razones, sin importar el
sistema utilizado.
As, por ejemplo, un objeto que mida 5,08 cm tendr el doble de longitud con
relacin a un objeto que mida 2,54 cm, cualquiera que sea el sistema en que
se registre la longitud, tal como se muestra en la siguiente tabla2.
Centmetros

Pulgadas

2,54
5,08

1
2

Como ejemplo de variables medidas en escala de razones, estn los conteos


de cualquier caracterstica, pesos y longitudes, ente otras.
2

1 pulgada = 2,54 centmetros

Estadstica

41

Cuando se tiene una variable medida en escala de razones, se pueden


calcular todos los estadsticos y es posible utilizar cualesquiera de los
mtodos estadsticos clsicos, siempre que se cumplan los supuestos
especficos de los mismos.
Las escalas de medicin que contienen poca informacin se denominan
dbiles, y los mtodos estadsticos que se pueden aplicar sobre las mismas
son, por lo general, ms restringidos. Las escalas de medicin con mayor
informacin se denominan escalas fuertes y pueden analizarse mediante los
mtodos

diseados

especficamente

para

su

anlisis

mediante

cualesquiera de los mtodos diseados para trabajar sobre variables


medidas en una escala ms dbil, simplemente prescindiendo de la
informacin adicional.

Una clasificacin ms amplia llama variables cualitativas a aquellas medidas


en escala nominal, y cuantitativas a las medidas en escala de razones o de
intervalo. Las variables medidas en escala ordinal forman un puente entre
ambas.

1.3. MUESTREO
Los mtodos estadsticos proponen diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos: mtodos de muestreo
probabilsticos y mtodos de muestreo no probabilsticos.
1.3.1. Mtodos de muestreo probabilsticos

Estadstica

42

Los mtodos de muestreo probabilstico son aquellos que se basan en el


principio de equiprobabilidad. Es decir, aquellos en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte de
una muestra y, consiguientemente, todas las posibles muestras de tamao n
tienen la misma probabilidad de ser elegidas. Slo estos mtodos de
muestreo probabilstico aseguran la representatividad de la muestra extrada
y son, por tanto, los ms recomendables. Dentro de los mtodos de
muestreo probabilstico se encuentran los siguientes tipos:
Muestreo aleatorio simple
El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada
individuo de la poblacin, y 2) a travs de algn medio mecnico (bolas
dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios
generados con una calculadora u ordenador, etc.) se eligen tantos sujetos
como sea necesario para completar el tamao de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad
prctica cuando la poblacin que se est manejando es muy grande.
Muestreo aleatorio sistemtico
Este procedimiento exige, como el anterior, numerar todos los elementos de
la poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae
uno. Se parte de ese nmero aleatorio i, que es un nmero elegido al azar, y
los elementos que integran la muestra son los que ocupan los lugares i, i+k,
i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el
resultado de dividir el tamao de la poblacin entre el tamao de la muestra:
Estadstica

43

k=N/n. El nmero i que se emplea como punto de partida ser un nmero al


azar entre 1 y k.
El riesgo se este tipo de muestreo est en los casos en que se dan
periodicidades en la poblacin ya que al elegir a los miembros de la muestra
con una periodicidad constante (k) se puede introducir una homogeneidad
que no se da en la poblacin. Supngase que se est seleccionando una
muestra sobre listas de 10 individuos en los que los 5 primeros son varones y
los 5 ltimos mujeres; si se emplea un muestreo aleatorio sistemtico con
k=10 siempre sern seleccionados o slo hombres o slo mujeres; no podra
haber una representacin de los dos sexos.
Muestreo aleatorio estratificado
Trata de obviar las dificultades que presentan los anteriores, ya que
simplifica los procesos y suele reducir el error muestral para un tamao dado
de la muestra. Consiste en considerar categoras tpicas diferentes entre s
(estratos) que poseen gran homogeneidad respecto a alguna caracterstica
(se puede estratificar, por ejemplo, segn la profesin, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de
muestreo es asegurarse de que todos los estratos de inters estarn
representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo
aleatorio simple o el estratificado para elegir los elementos concretos que
formarn parte de la muestra. En ocasiones, las dificultades que plantea son
demasiado grandes, pues exige un conocimiento detallado de la poblacin
(tamao geogrfico, sexos, edades...).

Estadstica

44

La distribucin de la muestra en funcin de los diferentes estratos se


denomina afijacin, y puede ser de diferentes tipos:
Afijacin simple: a cada estrato le corresponde igual nmero de elementos
muestrales.
Afijacin proporcional: la distribucin se hace de acuerdo con el peso
(tamao) de la poblacin en cada estrato.
Afijacin ptima: se tiene en cuenta la previsible dispersin de los
resultados, de modo que se consideran la proporcin y la desviacin tpica.
Tiene poca aplicacin ya que no se suele conocer la desviacin.
Por ejemplo, se est interesado en estudiar el grado de aceptacin que la
implantacin de la reforma educativa ha tenido entre los padres de un
municipio. A tal efecto se seleccion una muestra de 600 padres de familia.
Se conoce por los datos del Ministerio de Educacin que de los 10.000 nios
escolarizados en la bsica, 7.000 acuden a colegios pblicos y 3.000 a
colegios privados. Como el inters es que en la muestra estn representados
todos los tipos de colegio, se realiza un muestreo estratificado empleando
como variable de estratificacin el tipo de colegio.
Si se emplea una afijacin simple seran 300 nios de cada tipo de centro,
pero en este caso parece ms razonable utilizar una afijacin proporcional
pues hay bastante diferencia en el tamao de los estratos. Por consiguiente,
se calcula la

proporcin para cada uno de los estratos respecto de la

poblacin, para poder reflejarlo en la muestra.

Estadstica

45

Colegios

pblicos:

7.000/10.000

0.70

Colegios

privados:

3.000/10.000

0.30

Para conocer el tamao de cada estrato en la muestra se multiplica la


proporcin por el tamao muestral.
Colegios

pblicos:

0.70x600

420

padres

de

familia

Colegios privados: 0.30x600 = 180 padres de familia


Muestreo aleatorio por conglomerados
Los mtodos presentados hasta ahora estn pensados para seleccionar
directamente los elementos de la poblacin, es decir, que las unidades
muestrales son los elementos de la poblacin. En el muestreo por
conglomerados la unidad muestral es un grupo de elementos de la poblacin
que forman una unidad, a la que se denomina conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado
producto, etc. son conglomerados naturales. En otras ocasiones, se pueden
utilizar conglomerados no naturales como, por ejemplo, las urnas electorales.
Cuando los conglomerados son reas geogrficas suele hablarse de
"muestreo por reas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un
cierto nmero de conglomerados (el necesario para alcanzar el tamao
muestral establecido) y en investigar despus todos los elementos
pertenecientes a los conglomerados elegidos.
Por ejemplo, en una investigacin se trata de conocer el grado de
satisfaccin laboral de los empleados de una cadena de almacenes; se toma
46

Estadstica

una muestra de 700 empleados. Ante la dificultad de acceder individualmente


a estos empleados, se decide hacer una muestra por conglomerados.
Sabiendo que el nmero de empleados por almacn es aproximadamente de
35, los pasos a seguir seran:

Recoger un listado de todos los almacenes.

Asignar un nmero a cada uno de ellos.

Elegir por muestreo aleatorio simple o sistemtico los 20 almacenes


(700/35 = 20) que proporcionarn los 700 empleados que se
necesitan.

Finalmente, ante lo compleja que puede llegar a ser la situacin real de


muestreo es muy comn emplear lo que se denomina muestreo polietpico.
Este tipo de muestreo se caracteriza por operar en sucesivas etapas,
empleando en cada una de ellas el mtodo de muestreo probabilstico ms
adecuado.
1.3.2. Mtodos de muestreo no probabilsticos
A veces, para estudios exploratorios, el muestreo probabilstico resulta
excesivamente costoso y se acude a mtodos no probabilsticos, aun siendo
conscientes de que no sirven para realizar generalizaciones, pues no se
tiene certeza de que la muestra extrada sea representativa, ya que no todos
los sujetos de la poblacin tienen la misma probabilidad de ser elegidos. En
general, se selecciona a los sujetos siguiendo determinados criterios
procurando que la muestra sea representativa.

Estadstica

47

Muestreo por cuotas


Tambin denominado en ocasiones "accidental". Se asienta generalmente
sobre la base de un buen conocimiento de los estratos de la poblacin y/o de
los individuos ms "representativos" o "adecuados" para los fines de la
investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carcter de aleatoriedad de aqul.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero
de individuos que renen determinadas condiciones, por ejemplo: 20
individuos de 25 a 40 aos, de sexo femenino y residentes en una misma
ciudad. Una vez determinada la cuota, se eligen los primeros que se
encuentre que cumplan esas caractersticas. Este mtodo se utiliza mucho
en las encuestas de opinin.
Por ejemplo, una universidad desea estudiar la incidencia de las drogas en la
adolescencia. Lo que debera hacer sera: conocer por los informes del
Estado cules son los centros educativos ms afectados por el problema,
fijar un nmero de sujetos a entrevistar, proporcional a cada uno de los
estratos (cuotas) y, finalmente, dejar en manos de los responsables del
trabajo de campo a qu sujetos concretos se deber entrevistar.
Muestreo opintico o intencional
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras "representativas" mediante la inclusin en la muestra de grupos
supuestamente tpicos. Es muy frecuente su utilizacin en sondeos
preelectorales de zonas que en anteriores votaciones han marcado
tendencias de voto.
Estadstica

48

Muestreo casual o incidental


Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacin. El caso ms frecuente de
este procedimiento es el utilizar como muestra los individuos a los que se
tiene fcil acceso (los profesores de universidad emplean con mucha
frecuencia a sus propios alumnos). Un caso particular es el de los
voluntarios.
Bola de nieve
Se localiza a algunos individuos, los cuales conducen a otros, y stos a
otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales",
delincuentes, sectas, determinados tipos de enfermos, egresados de una
institucin, etc.
1.3.3. Evaluacin del valor de una encuesta
Cotidianamente se oye o se lee sobre resultados de encuestas en los
diferentes medios de comunicacin.

Es evidente que los avances

tecnolgicos en las comunicaciones han provocado la proliferacin de


investigaciones por medio de encuestas; sin embargo, no todas son
aceptables, significativas o importantes.
Para evitar encuestas carentes de objetividad o credibilidad, debe evaluarse
con sentido crtico todo lo que se lee y escucha, adems de examinarse el
valor de la encuesta, evaluando los siguientes aspectos:
Estadstica

49

Propsito de la encuesta: por qu y para quin se realiza. Un resultado


de opinin o una encuesta realizada para satisfacer la curiosidad
pertenece a la esfera de la diversin. Su resultado es un fin en s mismo,
no un medio para lograr un fin.

Debe existir escepticismo ante tales

encuestas porque el resultado no tiene una aplicacin posterior.


Determinar si la encuesta est basada en una muestra probabilstica o no
probabilstica:

el

nico

medio

disponible

para

hacer

inferencias

estadsticas correctas a partir de una muestra es el uso de un muestreo


probabilstico.

Las encuestas que emplean mtodos de muestreo no

probabilstico

estn

sujetas

errores

significativos,

quiz

no

intencionales, que pueden generar resultados sin sentido.


1.3.4. Errores en las encuestas
Aun cuando en las encuestas se utilizan mtodos de muestreo probabilstico,
estn sujetas a errores potenciales, los cuales se describen a continuacin:
Error de cobertura o sesgo en la seleccin
La clave para una seleccin apropiada en la muestra es un marco de
poblacin adecuado o una lista actualizada de todos los elementos que
participarn en el muestreo. El error de cobertura ocurre si se excluyen
ciertos elementos de la lista de poblacin, de manera que no tienen
oportunidad de ser seleccionados en la muestra.

El error de cobertura

conduce a un sesgo de seleccin. Si el listado es inadecuado porque no se


incluyeron

Estadstica

algunos

elementos

de

la

poblacin,

cualquier

muestra

50

probabilstica aleatoria proporcionar una estimacin de las caractersticas


del marco, no de la poblacin real.
Error o sesgo de no respuesta
No todas las personas estn dispuestas a contestar una encuesta. El error
de no respuesta surge del fracaso al recopilar datos de todos los sujetos de
la muestra y el resultado es un sesgo de no respuesta. Como en general no
se puede suponer que las personas que no responden son semejantes a
aquellas que s responden, es importante realizar un seguimiento a las no
respuestas despus de un periodo determinado. Deben hacerse varios
intentos, ya sea por correo o por telfono, para convencerlos de que
diligencien la encuesta.

Con base en estos resultados, las estimaciones

obtenidas con las respuestas iniciales se combinan con las estimaciones


obtenidas con el seguimiento, de manera que las inferencias hechas a partir
de la encuesta sean vlidas.
Error de muestreo
El error de muestreo se presenta cuando se encuesta una muestra y no la
poblacin, es decir, cuando no se aplica un censo. Aun cuando no se puede
evitar este error, s se puede controlar; una forma importante de controlarlo
es seleccionar un mtodo o un diseo adecuado de muestreo. El error de
muestreo muestra la heterogeneidad o las diferencias aleatorias de una
muestra a otra, segn la probabilidad de que elementos especficos sean
seleccionados en unas muestras determinadas.
Error de medicin
Estadstica

51

Se refiere a la falta de precisin en las respuestas registradas, debido a fallas


en la redaccin del enunciado de las preguntas, la influencia del
entrevistador en la persona que responde, o por el esfuerzo que realiza la
persona que responde.
1.3.5. Aspectos ticos del muestreo
En la actualidad se existe una tendencia a la proliferacin de investigaciones
que se apoyan en encuestas; no todas son buenas, significativas o
importantes, y no todas son ticas.

Debe intentarse distinguir entre un

diseo de encuesta deficiente y un diseo carente de tica.


Las consideraciones ticas surgen con relacin a cuatro tipos de errores
potenciales que pueden ocurrir cuando se disean encuestas que utilizan
muestras probabilsticas aleatorias: error de cobertura o sesgo de seleccin,
error o sesgo de no respuesta, error de muestreo y error de medicin. El
error de cobertura o sesgo de seleccin se convierte en un problema tico,
slo si se excluyen a propsito grupos especficos de individuos del marco de
poblacin, para obtener resultados sesgados, que indican una posicin ms
favorable para los intereses del investigador.
De igual manera, el error o sesgo de no respuesta se convierte en un
problema tico, slo si es menos probable que grupos o individuos
especficos respondan a una encuesta, y si el investigador la disea a
propsito con el fin de excluir grupos o elementos.
El error de muestreo se convierte en un problema tico, slo cuando los
resultados se presentan, a propsito, sin referencia al tamao de muestra o
Estadstica

52

al margen de error, de modo que el investigador puede promover un punto


de vista que de otra manera sera insignificante.
El error de medicin se convierte en un problema tico en cualquiera de las
siguientes situaciones:
Un investigador puede elegir preguntas orientadas que guan las
respuestas hacia una direccin especfica.
Un investigador, mediante actitudes y tono de voz, puede crear un efecto
deliberado de halo o puede guiar las respuestas en cierta direccin.
Alguien que responde, pero no est de acuerdo con la encuesta, puede
proporcionar informacin falsa a propsito.

Estadstica

53

2. ORDENACIN DE DATOS ESTADSTICOS


Estadstica

54

En los datos obtenidos en encuestas, experimentos o mediante cualquier


instrumento de medida, por ser numerosos, se dificulta su interpretacin, a
menos que se ordenen y clasifiquen en forma conveniente. Por lo tanto, se
deben agrupar los datos y presentarlos en forma de tablas.

2.1. TABULACIN DE DATOS


La tabulacin de datos consiste en tomar los distintos valores o atributos que
toma la variable y colocarlos en columna, de acuerdo con algn criterio de
ordenacin, y al frente se coloca el nmero de veces que aparece el valor o
atributo, o sea, la frecuencia.
Para la tabulacin de datos correspondientes a variables cualitativas se
puede hacer de acuerdo con el orden cronolgico, con el orden alfabtico o
en forma convencional.
Por ejemplo, una Cooperativa de Trabajo Asociado Epsilon desea conocer el
nivel de escolaridad de sus asociados y encuentra la siguiente informacin: 5
profesionales, 15 tcnicos, 20 bachilleres y 10 con bsica primaria.
Ordenando los niveles de escolaridad en forma convencional se obtiene la
tabla 1.

Estadstica

55

Tabla 1. Nivel de escolaridad de los asociados de la Cooperativa de


Trabajo Asociado Epsilon
NIVEL DE ESCOLARIDAD TABULACIN

FRECUENCIA

Profesional
Tcnico
Bachiller

5
15
20

Bsica primaria

10

Fuente: Datos hipotticos

Para la clasificacin de datos correspondientes a variables cuantitativas se


utilizan escalas numricas y se pueden colocar de forma creciente o
decreciente.
Por ejemplo, se seleccionan diez asociados de la Cooperativa de Trabajo
Asociado Epsilon y se les consulta por el nmero de hijos que poseen en el
momento, obteniendo los siguientes datos: 2, 3, 1, 1, 0, 2, 4, 3, 2, 2.
Ordenando en forma creciente se obtiene la tabla 2.
Tabla 2. Nmero de hijos de los asociados de la Cooperativa de Trabajo
Asociado Epsilon
NMERO DE HIJOS TABULACIN

0
1
2
3
4

FRECUENCIA

1
2
4
2
1

Fuente: Datos hipotticos

En la tabla 2 se ha ordenado en forma creciente el nmero de hijos de los


asociados, pero cuando los datos son numerosos o el recorrido de la variable
es largo, este procedimiento no es prctico y, por lo tanto, se deben formar
Estadstica

56

grupos o intervalos de clase, mediante el siguiente procedimiento: rango o


recorrido, amplitud del rango, nmero de clases, amplitud del intervalo de
clase, lmites de cada clase y tabulacin.
2.1.1. Rango o recorrido (R)
El rango o recorrido (R) de una variable es el campo de variacin numrica
de dicha variable, es decir, el intervalo entre el menor valor y el mayor valor
que toma la variable. Se representa como:

R = [ Li , Ls ]
Donde, R: rango o recorrido.
Li: lmite inferior (menor valor de la variable).
Ls: lmite superior (mayor valor de la variable).
Por ejemplo, un grupo de expertos en auditaje analiza el tiempo que tarda
(en minutos) en realizar la auditora de un proceso similar en diferentes
empresas. Los datos se presentan en la siguiente tabla:

Tabla 3. Tiempo que tarda (en minutos) un grupo de expertos en auditar


un proceso
Estadstica

57

Auditor

Tiempo

Auditor Tiempo

(min)

Aud. 1
Aud. 2
Aud. 3
Aud. 4
Aud. 5
Aud. 6
Aud. 7
Aud. 8
Aud. 9
Aud. 10

70
71
62
63
67
65
74
62
65
56

Auditor

(min)

Aud. 11
Aud. 12
Aud. 13
Aud. 14
Aud. 15
Aud. 16
Aud. 17
Aud. 18
Aud. 19
Aud. 20

47
68
60
54
63
60
69
54
73
55

Aud. 21
Aud. 22
Aud. 23
Aud. 24
Aud. 25
Aud. 26
Aud. 27
Aud. 28
Aud. 29
Aud. 30

Tiempo Auditor

Tiempo

(min)

(min)

57
55
55
57
59
74
56
59
71
50

Aud. 31
Aud. 32
Aud. 33
Aud. 34
Aud. 35
Aud. 36
Aud. 37
Aud. 38
Aud. 39
Aud. 40

52
63
65
50
53
59
45
72
64
69

Auditor Tiempo
(min)

Aud.41
Aud.42
Aud.43
Aud.44
Aud.45
Aud.46
Aud.47
Aud.48
Aud.49
Aud.50

51
50
60
56
67
59
68
61
51
64

Fuente: Datos hipotticos

En la tabla 3 el valor mayor es 74 minutos y, el menor, 45 minutos, por lo


tanto:
Li = 45 minutos, Ls = 74 minutos y R = [45, 74]
Lmites reales: como los tiempos se registran con aproximacin a 1 minuto,
el lmite inferior, 45 minutos, incluye el valor 44.6 minutos; por lo tanto, el
valor real del lmite inferior es 44.5 minutos; y el lmite superior, 74 minutos,
incluye el valor 74.5 minutos; luego, el lmite real superior es 74.5 minutos, y
el recorrido real en este caso es:
R = [44.5, 74.5]
2.1.2. Amplitud del rango (AR)
La amplitud del rango de una variable se determina hallando la diferencia
entre el lmite superior real y el lmite inferior real.

AR = Ls - Li
Estadstica

58

Para el ejemplo de la tabla 3 la amplitud del rango es:


AR = 74.5 minutos 44.5 minutos = 30 minutos
2.1.3. Nmero de clases (m)
El nmero de clases puede obtenerse de forma convencional, teniendo en
cuenta que no debe ser menor a 5 ni mayor de 20 clases. Sin embargo,
puede obtenerse por medio de la frmula de Sturges, la cual es:

m = 1 + 3.3 x log

Donde n es el nmero total de datos.


Para el ejemplo de la tabla 3 el nmero de intervalos es:
m = 1 + 3.3 x log (50)
m = 1 + 3.3 x 1.69
m = 1 + 5.6
m = 6.6
En este caso se pueden tomar 6 7 intervalos.
2.1.4. Amplitud del intervalo de clase (C)
El valor del intervalo de clase no es necesario que sea igual para todos los
intervalos; sin embargo, para fines de simplificacin y funcionalidad es
59

Estadstica

conveniente que todas las clases tengan la misma amplitud. Para obtenerla,
se divide la amplitud del rango entre el nmero m de clases que se considere
ms adecuado, teniendo en cuenta que C debe ser un nmero exacto. En
consecuencia,
C = AR / m
Para el ejemplo de la tabla 3 la amplitud del intervalo podra ser:
Si m = 6, entonces C = 30/6, C = 5 minutos
Si m = 7, entonces C = 30/7, C = 4.285714286... minutos
Entre estos dos valores, el ms recomendable es C = 5, ya que es exacto.
Por lo tanto, se deben construir 6 intervalos con una amplitud de 5 minutos.
Esto es m = 6 y C = 5.
Cuando la amplitud del intervalo (AR) no es divisible por un nmero entero,
sta se puede incrementar hasta hacerla divisible; este incremento debe ser
distribuido proporcionalmente, sumando la mitad al lmite superior y restando
la otra mitad al lmite inferior.
2.1.5. Lmites de las clases
Cada clase tiene un lmite inferior l i y un lmite superior ls ; el lmite inferior
de la clase ms baja o clase uno es igual al lmite inferior del rango L i, y el
lmite superior de esta clase es igual al lmite inferior, ms la amplitud del
intervalo (C). El lmite inferior de la clase dos es igual al lmite superior de la
Estadstica

60

clase uno, y el lmite superior de esta clase es igual al lmite inferior, ms la


amplitud del intervalo (C). Y as sucesivamente, hasta cubrir el nmero de
clases definidas.
Para el ejemplo de la tabla 3, los lmites de clases seran:
Tabla 4. Lmites de clases para el tiempo que tarda (en minutos) un
grupo de expertos en auditar un proceso
N DE CLASE

LMITES DE CLASE
li

1
2
3
4
5
6

44.5
49.5
54.5
59.5
64.5
69.5

INTERVALOS DE CLASE

ls

44.5 + 5 = 49.5
49.5 + 5 = 54.5
54.5 + 5 = 59.5
59.5 + 5 = 64.5
64.5 + 5 = 69.5
69.5 + 5 = 74.5

li

44.5
49.5
54.5
59.5
64.5
69.5

ls

49.5
54.5
59.5
64.5
69.5
74.5

Fuente: Datos hipotticos

2.1.6. Tabulacin
Una vez establecidos los intervalos de clase, se procede al conteo como en
el caso para datos no agrupados, como se ilustra en la tabla 5.
Tabla 5. Tabulacin para el tiempo que tarda (en minutos) un grupo de
expertos en auditar un proceso
N DE CLASE TIEMPO (minutos) TABULACIN
Estadstica

FRECUENCIAS

61

1
2
3

44.5 - 49.5
49.5 - 54.5
54.5 - 59.5

2
9
12

59.5 - 64.5

11

5
6

64.5 - 69.5
69.5 - 74.5

9
7

Fuente: Datos hipotticos

2.1.7. Marca de clase o punto medio


.

Cada clase tiene un punto medio o marca de clase xi que representa a cada
intervalo. La marca de clase se calcula como la semisuma entre los lmites
inferior y superior de cada intervalo, as:

xi =

l s + li
2

Tabla 6. Marca de clase para el tiempo que tarda (en minutos) un grupo
de expertos en auditar un proceso
N DE

INTERVALO

MARCA DE

CLASE

(Tiempo en minutos)

CLASE

1
2
3
4
5
6
Estadstica

44.5
49.5
54.5
59.5
64.5
69.5

49.5
54.5
59.5
64.5
69.5
74.5

47
52
57
62
67
72
62

Fuente: Datos hipotticos

Obsrvese que al pasar de una marca de clase a la siguiente, sta se


incrementa en las mismas unidades de la amplitud del intervalo C; por esta
razn es que C siempre debe ser un nmero exacto.

2.2. FRECUENCIAS
2.1.1. Frecuencia absoluta (fi)
Se llama frecuencia absoluta (fi) al nmero de veces que aparece el valor xi
de una variable X en un colectivo. As, si en un grupo de 30 empleados hay 6
que tienen una edad de 25 aos, se dice que la edad 25 aos tiene una
frecuencia de 6.
Las frecuencias absolutas para el grupo de expertos de la auditora de un
proceso se presentan en la tabla 7.
Tabla 7. Frecuencias absolutas para el tiempo que tarda (en minutos) un
grupo de expertos en auditar un proceso
N DE CLASE

1
2
3
4
5
6
TOTAL

INTERVALO

FRECUENCIA

(Tiempo en minutos)

ABSOLUTA (fI)

44.5
49.5
54.5
59.5
64.5
69.5

49.5
54.5
59.5
64.5
69.5
74.5

2
9
12
11
9
7
50

Fuente: Datos hipotticos


Estadstica

63

Obsrvese que la suma de las frecuencias absolutas debe ser igual al


nmero total de datos.
2.2.2. Frecuencia relativa (hi)
Se llama frecuencia relativa (hi) al cociente de dividir la frecuencia absoluta
entre el nmero total de elementos del colectivo. Tambin se puede
representar en porcentaje.

hi =

fi
* 100
n

Donde n es el total de elementos.


As, si en un grupo de 30 empleados hay 6 que tienen una edad de 25 aos,
entonces la frecuencia relativa ser:
hi =

6
* 100 = 20%
30

Aqu la edad 25 aos tiene una frecuencia relativa de 20%; es decir, el 20%
de los empleados tiene edad de 25 aos.
Las frecuencias relativas para el grupo de expertos de la auditora de un
proceso se presenta en la 8.
Tabla 8. Frecuencias relativas para el tiempo que tarda (en minutos) un
grupo de expertos en auditar un proceso
Estadstica

64

N DE CLASE

INTERVALO

FRECUENCIA

(Tiempo en minutos)

RELATIVA (hI)

1
2
3
4
5
6
TOTAL

44.5
49.5
54.5
59.5
64.5
69.5

49.5
54.5
59.5
64.5
69.5
74.5

(2/50)*100 = 4%
(9/50)*100 = 18%
(12/50)*100 = 24%
(11/50)*100 = 22%
(9/50)*100 = 18%
(7/50)*100 = 14%
100%

Fuente: Datos hipotticos

Obsrvese que la suma de las frecuencias relativas es igual al 100%.


La frecuencia relativa se aplica a las variables cualitativa, cuantitativa
discreta y continua.
2.2.3. Frecuencia absoluta acumulada (FI)
Se llama frecuencia absoluta acumulada (FI) de un valor xi de una variable X
a la suma de las frecuencias absolutas hasta la correspondiente frecuencia fI
del valor xi .
i

Fi = f k
k =1

Tabla 9. Frecuencias absolutas acumuladas para el tiempo que tarda


(en minutos) un grupo de expertos en auditar un proceso
INTERVALO

FRECUENCIA

FRECUENCIA ABSOLUTA

(Tiempo en

ABSOLUTA (fi)

ACUMULADA (Fi)

minutos)
Estadstica

65

44.5
49.5
54.5
59.5
64.5
69.5

49.5
54.5
59.5
64.5
69.5
74.5

2
9
12
11
9
7

2
2 + 9 = 11
2 + 9 + 12 = 23
2 + 9 + 12 + 11 = 34
2 + 9 + 12 + 11 + 9 = 43
2 + 9 + 12 + 11 + 9 + 7 = 50

Fuente: Datos hipotticos

2.2.4. Frecuencia relativa acumulada (Hi)


Se llama frecuencia relativa acumulada (HI) de un valor xi de una variable X a
la suma de las frecuencias relativas hasta la correspondiente frecuencia hI
del valor xi .

H i = hk
k =1

Tabla 10. Frecuencias relativas acumuladas para el tiempo que tarda (en
minutos) un grupo de expertos en auditar un proceso
INTERVALO

FRECUENCIA

FRECUENCIA RELATIVA

(Tiempo en

RELATIVA (hi)

ACUMULADA (Hi)

minutos)
44.5 - 49.5
49.5 - 54.5
54.5 - 59.5

4%
18%
24%

Estadstica

4%
4% + 18% = 22%
4% + 18% + 24% = 46%

66

59.5 - 64.5
64.5 - 69.5
69.5 - 74.5

22%
18%
14%

4% + 18% + 24% + 22% = 68%


4% + 18% + 24% + 22% + 18% = 86%
4% + 18% + 24% + 22% + 18% + 14% = 100%

Fuente: Datos hipotticos

Una vez construidos los intervalos y las frecuencias, se ilustra en una tabla el
consolidado para facilitar la interpretacin y el anlisis de la variable (ver
tabla 11).
Tabla 11. Intervalos y frecuencias para el tiempo que tarda (en minutos)
un grupo de expertos en auditar un proceso
N DE

TIEMPO EN

CLASE
1
2
3
4
5
6

MINUTOS
44.5 - 49.5
49.5 - 54.5
54.5 - 59.5
59.5 - 64.5
64.5 - 69.5
69.5 - 74.5

xi

fi

hi

Fi

Hi

47
52
57
62
67
72

2
9
12
11
9
7

4%
18%
24%
22%
18%
14%

2
11
23
34
43
50

4%
22%
46%
68%
86%
100%

Fuente: Datos hipotticos

Para analizar los resultados obtenidos en la tabla anterior, se deben tener en


cuenta los siguientes aspectos:
Las frecuencias absolutas y relativas se interpretan a partir de los
intervalos.
Por ejemplo: 2 expertos tardan entre 44.5 y 49.5 minutos en realizar la
auditora del proceso o el 4% de los expertos tardan entre 44.5 y 49.5
minutos en realizar la auditora del proceso; 9 expertos tardan entre 49.5
y 54.5 minutos en realizar la auditora del proceso o el 18% de los
Estadstica

67

expertos tardan entre 49.5 y 54.5 minutos en realizar la auditora del


proceso, as sucesivamente.
Las frecuencias absolutas acumuladas y relativas acumuladas se
interpretan con la marca de clase del intervalo.
Por ejemplo: 2 expertos tardan menos de 47 minutos en realizar la
auditora del proceso o 4% de los expertos tardan menos de 47 minutos
en realizar la auditora del proceso, 11 expertos tardan menos de 52
minutos en realizar la auditora del proceso o 22% de los expertos tardan
menos de 52 minutos en realizar la auditora del proceso, as
sucesivamente.
NOTA: las frecuencias acumuladas no se aplican a la variable cualitativa.
2.2.5. Nmeros ndice
Un nmero ndice es una medida estadstica diseada para resaltar cambios
en una variable o un grupo de variables relacionadas con respecto al tiempo,
situacin geogrfica, ingresos, o cualquier otra caracterstica.
El nmero ndice es el cociente que resulta al dividir una determinada
frecuencia de una serie por otra frecuencia de la misma serie, la cual se toma
como base o punto de referencia; puede expresarse en porcentaje o en
miles.
Ejemplo: los precios de un artculo A durante los aos 2001 a 2005 fueron
$40.000, $48.000, $56.000, $70.000, $84.000, respectivamente. Al tomar
Estadstica

68

como base el ao 2001, que corresponde al 100%, se obtienen los ndices


para cada ao.

Tabla 12. ndices de precios del artculo a, de los aos 2001 a 2005
AO
2001
2002
2003
2004
2005

PRECIO ($)
40.000
48.000
56.000
70.000
84.000

NDICE
(40.000/40.000)*100 = 100%
(48.000/40.000)*100 = 120%
(56.000/40.000)*100 = 140%
(70.000/40.000)*100 = 175%
(84.000/40.000)*100 = 210%

Fuente: Datos hipotticos

Esto indica que el precio del artculo A se increment 20% en el ao 2002


con respecto al ao 2001; 40% en el ao 2003 con respecto al ao 2001;
75% en el ao 2004 con respecto al ao 2001; y 110% en el ao 2005 con
respecto al ao 2001.

2.3. GRFICAS O DIAGRAMAS


Las grficas permiten describir brevemente las caractersticas de un
colectivo.

Existen varios tipos de grficas que pueden utilizarse para

representar el comportamiento de una variable, tales como histogramas,


polgonos de frecuencia, ojivas, diagramas circulares y barras.
2.3.1. Histogramas
Estadstica

69

Un histograma de frecuencias consiste en una serie de rectngulos que se


construyen sobre un plano cartesiano. Este tipo de grfica se aplica a la
variable cuantitativa continua.
Sobre el plano cartesiano, en el eje horizontalm, se ubican los intervalos de
cada clase, y en el eje vertical las frecuencias. Luego, para cada intervalo se
dibuja un rectngulo cuya base es la amplitud del intervalo de cada clase, y
la altura es la frecuencia de cada clase.
Si sobre el eje vertical se ubican las frecuencias absolutas, se obtiene el
histograma de frecuencias absolutas, y si se ubican las frecuencias relativas,
se obtiene el histograma de frecuencias relativas, como se ilustra en las
grficas 1 y 2 para un grupo de expertos que auditan un proceso.

Grfica 1. Histograma de frecuencias absolutas para un grupo de


expertos que auditan un proceso

Estadstica

70

Grfica 2. Histograma de frecuencias relativas para un grupo de


expertos que auditan un proceso

2.3.2. Polgono de frecuencias


El polgono de frecuencias se construye de forma similar al histograma; la
diferencia radica en la forma y estructura de la grfica, la cual se obtiene
ubicando las marcas de clase sobre el eje horizontal; y sobre el eje vertical,
las frecuencias, segn el tipo de polgono; si se ubican las frecuencias
absolutas, se denomina polgono de frecuencias absolutas; y si se ubican las
frecuencias relativas, se denomina polgono de frecuencias relativas, como
se ilustra en las grficas 3 y 4 para un grupo de expertos que auditan un
proceso.
Estadstica

71

Grfica 3. Polgono de frecuencias absolutas para un grupo de


expertos que auditan un proceso

Grfica 4. Polgono de frecuencias relativas para un grupo de expertos


que auditan un proceso

Estadstica

72

Se acostumbra prolongar el polgono hasta las marcas de clase inferior y


superior inmediatas, que corresponderan a las clases de frecuencia cero.
Los polgonos de frecuencia pueden tomar muchas formas, sin embargo, en
la mayora de los casos toman una forma acampanada que se identifica con
la curva normal.
2.3.3. Ojivas o polgonos de frecuencias acumuladas
La construccin de estos polgonos es similar a los polgonos de frecuencias
absolutas y relativas; la diferencia radica en que aqu se toman las
frecuencias acumuladas, como se puede observar en las grficas 5 y 6,
donde se presentan los polgonos de frecuencias absolutas y relativas
acumuladas para el grupo de expertos que auditan un proceso.

Grfica 5. Polgono de frecuencias absolutas acumuladas para un grupo


de expertos que auditan un proceso

Estadstica

73

Grfica 6. Polgono de frecuencias relativas acumuladas para un grupo


de expertos que auditan un proceso

2.3.4. Diagramas de barras


Los diagramas de barras son muy utilizados por la facilidad y sencillez que
ofrecen para presentar caractersticas de una poblacin, especialmente de
variables cualitativas o cuantitativas discretas.
Los diagramas de barras consisten en rectngulos de anchura arbitraria en la
cual se ubican los valores de la variable, y de longitud proporcional al nmero
de observaciones o frecuencias. Las barras se pueden construir de forma
horizontal o vertical, como se muestra en la grfica 7, correspondiente a los
datos del cuadro 2.

Estadstica

74

Grfica 7. Nmero de hijos de los asociados de la Cooperativa de


Trabajo Asociado Epsilon

2.3.5. Diagramas circulares


Estas grficas consisten en un crculo dividido en partes proporcionales a los
porcentajes de cada una de las caractersticas o valores de la variable. Se
utilizan principalmente en la representacin de variables cualitativas.
Para

su

construccin,

se

dividen

los

360

de

la

circunferencia

proporcionalmente a los porcentajes o a las frecuencias absolutas de cada


caracterstica.
En la grfica 8 se ilustra el nivel de escolaridad de los asociados de la
Cooperativa de Trabajo Asociado Epsiln.

Estadstica

En ella, 360 corresponde al

75

100% de los asociados; con nivel profesional corresponde 36; nivel tcnico
corresponde 108; nivel de bachillerato, 144; y con bsica primaria, 72.
Grfica 8. Nivel de escolaridad de los asociados de la Cooperativa de
Trabajo Asociado Epsilon

2.3.6. Diagrama de tallo y hojas


El diagrama de tallo y hoja es una herramienta valiosa y verstil para
organizar un conjunto de datos y entender la distribucin y agrupacin de los
valores dentro del intervalo de observaciones en el conjunto. Un diagrama
de tallo y hoja separa los datos en dgitos gua, o tallos, y dgitos que le
siguen, u hojas. Para construir el diagrama, primero se ordenan los dgitos
principales de cada dato a la izquierda de una lnea vertical. A la derecha de
sta se registra el ltimo dgito para cada dato conforme al orden de
aparicin de las observaciones. El ltimo dgito de cada dato se coloca en la
fila que corresponde a su primer dgito.
Para ilustrar el uso del diagrama de tallo y hojas se consideran los siguientes
datos de la tabla 13. La informacin es resultado de un examen de aptitudes
Estadstica
76

de 150 preguntas, aplicado a 50 personas durante un proceso de seleccin


de personal en Manufacturas Alfa.
Tabla 13. Nmero de preguntas contestadas en forma correcta en una
prueba de aptitud
112
73
126
82
92

84
68
100
72
92

108
76
141
119
98

76
118
132
96
91

115
94
97
86
127

102
80
98
106
106

124
83
92
81
106

119
95
104
69
113

7
95
134
128
81

115
85
107
100
75

Fuente: Datos hipotticos

Inicialmente, se deben ubicar los datos en tallo y hojas, as:


6

9 8

2 3 6 3 6 5

6 2 3 1 1 0 4 5

7 2 2 6 2 1 5 8 8 5 4

10

7 4 8 0 2 6 6 0 6

11

2 8 5 9 3 5 9

12

6 8 7 4

13

2 4

14

Posteriormente, se ordena cada lnea en forma ascendente, y una vez


ordenado, queda el diagrama de tallo y hojas como sigue:

Estadstica

77

8 9

2 3 3 5 6 6

0 1 1 2 3 4 5 6

1 2 2 2 4 5 5 6 7 8 8

10

0 0 2 4 6 6 6 7 8

11

2 3 5 5 8 9 9

12

4 6 7 8

13

2 4

14

Los nmeros de la izquierda de la lnea (6, 7, 8, 9, 10, 11, 12, 13, 14) forman
el tallo, y cada dgito de la derecha de la fila es una hoja.

Por ejemplo, se

considera la primera fila con un valor de tallo igual a 6, y hojas de 8 y 9, lo


cual significa que hay dos valores que tienen un primer dgito de 6; las hojas
muestran que los valores son 68 y 69. De manera similar, la segunda fila
indica que hay seis valores cuyo primer dgito es siete: 72, 73, 73, 75, 76 y
76.
Si se gira el diagrama de tallo y hojas 90 en sentido contrario a las
manecillas del reloj, se obtiene una imagen similar al histograma de
frecuencias. Aunque el diagrama de tallo y hojas parece ofrecer la misma
informacin que un histograma, tiene dos ventajas principales:
1. Es ms fcil de construir.
2. Dentro de un intervalo de clase, el diagrama de tallo y hojas da ms
informacin que un histograma, porque muestra los valores reales.

2.3.7. Diagrama de Pareto


Estadstica

78

El diagrama de Pareto es un recurso grfico que permite representar datos


categricos (variables cualitativas) y que a menudo proporciona ms
informacin visual que los diagramas de barras o circulares.
El diagrama de Pareto es un tipo especial de diagrama de barras verticales,
donde las respuestas categorizadas se grafican en orden descendente de
frecuencias y se combinan con un polgono acumulado en la misma escala.
El principio fundamental de la grfica es separar los pocos vitales de los
muchos triviales, lo que permite dirigir la atencin a las respuestas
importantes. As, el diagrama alcanza su utilidad mxima cuando la variable
categrica de inters contiene muchas categoras. Este diagrama se utiliza
ampliamente en el control estadstico de procesos y el control estadstico de
calidad del producto.
En la construccin de un diagrama de Pareto, el eje vertical de la izquierda
contiene las frecuencias o porcentajes, el eje vertical de la derecha contiene
los porcentajes acumulados, y el eje horizontal contiene las categoras de
inters. Las barras con separacin uniforme tienen el mismo ancho. El
punto en el polgono de porcentajes acumulados para cada categora se
centra en el punto medio de cada barra. Entonces, al estudiar el diagrama
de Pareto se buscan dos cosas: las magnitudes de las diferencias en las
longitudes de las barras que corresponden a las categoras adyacentes
decrecientes, y los porcentajes acumulados de estas categoras adyacentes.
Para ilustrar el diagrama de Pareto, se utiliza el ejemplo tomado del texto
Estadstica para administracin, de Berenson y otros, pgina 60.

Estadstica

79

El gerente de operaciones de una planta empacadora de cereales indic que,


segn su experiencia, casi siempre hay nueve razones que dan como
resultado la produccin de cajas de cartn no conformes al final del proceso
de empaque: cartn roto, cartn abultado, cartn agrietado, cartn sucio,
agujeros en el cartn, peso de empaque inadecuado, error de impresin,
etiqueta ilegible y tapa superior sin sello.
Se tom una muestra de 50 cajas de cartn no conformes de la produccin
de una semana, con los siguientes datos:
Tabla 14. Porcentajes razones de no conformidad de la produccin de
cajas de cartn
RAZN DE NO CONFORMIDAD
Tapa superior sin sello
Etiqueta ilegible
Cartn sucio
Cartn abultado
Cartn roto
Cartn agrietado
Peso de empaque inadecuado
Agujeros en el cartn
Error de impresin
Total

NM
16
12
9
4
3
2
2
1
1
50

%
32.0
24.0
18.0
8.0
6.0
4.0
4.0
2.0
2.0
100.00

% ACUMULADO
32.0
56.0
74.0
82.0
88.0
92.0
96.0
98.0
100.0

Fuente: Berenson y otros. Estadstica para administracin, Pg. 60.

Grfica 9. Diagrama de Pareto para las razones de no conformidad de la


produccin de cajas de cartn

Estadstica

80

A pesar de los pocos vitales de los muchos triviales, se determina que las
tapas sin sello (32.0%), las etiquetas ilegibles (24.0%) y los cartones sucios
(18.0%) representan el 74% de las razones de no conformidad. Las otras
dos razones representan el 26%.

2.4. TABULACIN DE DATOS BINARIOS O CRUZADOS


Con frecuencia se requiere analizar al mismo tiempo las respuestas de dos
variables, por lo cual es necesario cruzar variables para describir
exitosamente el comportamiento de las mismas. En este caso, se utiliza la
tabulacin cruzada o tablas de contingencia.
La tabulacin cruzada o tablas de contingencia se emplea para resumir
de manera simultnea los datos para dos variables.

Se describir el

procedimiento mediante la adaptacin del ejemplo planteado por Anderson y


otros en el texto Estadstica para administracin y economa, Pg. 44.
Un informe mundial sobre restaurantes muestra muchas variables, entre
ellas, la evaluacin de la calidad del restaurante y los precios caractersticos.
La calificacin de la calidad es una variable cualitativa, con categoras de
bueno, muy bueno y excelente.

El precio de la comida es una variable

cuantitativa continua que, por lo general, vara de 10 a 49 dlares. Se tom


una muestra de 300 restaurantes para un Estado determinado. En la tabla
15 se muestran slo los datos para los primeros 10 restaurantes.
Tabla 15. Evaluacin de calidad y precio de la comida para restaurantes
de un Estado
Estadstica

81

RESTAURANTE

EVALUACIN DE LA

1
2
3
4
5
6
7
8
9
10
.
.

CALIDAD
Bueno
Muy bueno
Bueno
Excelente
Muy bueno
Bueno
Muy bueno
Muy bueno
Muy bueno
Bueno
.
.

PRECIO DE LA
COMIDA (dlares)
18
22
28
38
33
28
19
11
23
13
.
.

Fuente: Anderson y otros. Estadstica para administracin y economa, Pg. 44.

El formato general de la tabulacin cruzada para este ejemplo se muestra en


la tabla 16, la cual ha recogido toda la informacin para el Estado objeto de
anlisis. Los encabezados de las mrgenes izquierda y superior definen las
clases de las dos variables.

En la margen izquierda se encuentran las

categoras de la variable Evaluacin de la calidad, y en la parte superior los


valores correspondientes a la variable Precio de la comida.

Cada

restaurante tiene una evaluacin de la calidad y un precio de la comida.


As, cada restaurante de la muestra se asocia con una celda que aparece en
uno de los renglones y en una de las columnas de la tabulacin cruzada. Por
ejemplo, el restaurante 5 se identifica por tener una evaluacin de la calidad
muy buena y un precio de la comida de 33 dlares.

Este restaurante

pertenece a la celda de la fila 2 y la columna 3 de la tabla 15. Para elaborar


una tabulacin cruzada simplemente se cuenta la cantidad de restaurantes
que pertenecen a cada una de las celdas de la tabla.

Estadstica

82

En la tabla 16 se observa que la mayor cantidad de restaurantes (64) en la


muestra tienen calificacin de muy bueno, y que el precio de la comida est
entre los lmites de 20 a 29 dlares.

Slo hay dos restaurantes con

calificacin de excelente y precio de la comida de 10 a 19 dlares. De las


dems frecuencias se puede llegar a interpretaciones anlogas. Adems, las
mrgenes derecha e inferior de la tabla cruzada indican por separado las
distribuciones de frecuencias de evaluacin de la calidad y del precio de la
comida. En la margen derecha se ve que los datos sobre evaluacin de la
calidad indican que hay 84 restaurantes buenos, 150 muy buenos y 66
excelentes.

De igual forma, la margen inferior indica la distribucin de

frecuencias de la variable costo de la comida.


Tabla 16. Tabulacin cruzada o tabla de contingencia de calificaciones y
precio de la comida para restaurantes de un Estado
EVALUACION DE
LA CALIDAD
Bueno
Muy bueno
Excelente
TOTAL

PRECIO DE LA COMIDA (dlares)


10 - 19 20 - 29 30 - 39 40 - 49
42
34
2
78

40
64
14
118

2
46
28
76

0
6
22
28

TOTAL
84
150
66
300

Fuente: Anderson y otros. Estadstica para administracin y economa, Pg. 44.

El valor de una tabulacin cruzada consiste en que proporciona una idea de


la relacin entre las variables. A partir de los resultados de la tabla 16 los
precios ms altos por comida parecen estar asociados con una calidad
mayor del restaurante y el precio ms bajo por comida a una calidad menor.
Si se convierten los elementos de la tabla 16 a porcentajes de fila o
porcentajes de columna, se puede tener una mejor idea acerca de la relacin
entre las variables.
Estadstica

Para los porcentajes de fila, los resultados de dividir


83

cada frecuencia de la tabla 16 entre su total de fila correspondiente se


muestran en la tabla 17. Por ejemplo, el porcentaje en la primera fila y la
primera columna (50%) se calcula al dividir 42 entre 84 y multiplicar por 100.
Para los porcentajes de columna, los resultados de dividir cada frecuencia de
la tabla 16 entre su total de columna correspondiente se muestran en la
tabla 18. Por ejemplo, el porcentaje en la primera fila y la primera columna
(53.8%) se calcula al dividir 42 entre 78 y multiplicar por 100.

Tabla 17. Tabulacin cruzada o tabla de contingencia de porcentaje de


fila para las calificaciones de calidad y los precios de la comida
EVALUACIN DE
LA CALIDAD
Bueno
Muy bueno
Excelente

PRECIO DE LA COMIDA (dlares)


10 - 19 20 - 29 30 - 39 40 - 49
50.0
22.7
3.0

47.6
42.7
21.2

2.4
30.6
42.4

0.0
4.0
33.4

TOTAL
100
100
100

Fuente: Anderson y otros. Estadstica para administracin y economa, Pg. 44.

Tabla 18. Tabulacin cruzada o tabla de contingencia de porcentaje de


columna para las calificaciones de calidad y los precios de la comida
EVALUACIN DE
LA CALIDAD
Bueno
Muy bueno
Excelente
TOTAL

PRECIO DE LA COMIDA (dlares)


10 - 19 20 - 29 30 - 39 40 - 49
53.8
43.5
2.7
100

33.9
54.2
11.9
100

2.6
60.6
36.8
100

0.0
21.4
78.6
100

Fuente: Anderson y otros. Estadstica para administracin y economa, Pg. 44.

Estadstica

84

Estadstica

85

3. MTODOS NUMRICOS
En la unidad anterior se ordenaron los datos correspondientes a las variables
cualitativa y cuantitativa y se representaron los resultados por medio de
grficas; sin embargo, el anlisis de datos tambin abarca los clculos y el
resumen de las caractersticas importantes y el anlisis de lo que contienen.
En esta unidad se examinarn las medidas de tendencia central, de
variabilidad y de localizacin para un conjunto de datos. Si se calculan estas
medidas descriptivas globales a partir de una muestra, se denominan
estadsticos; en cambio, si se calculan para toda la poblacin se denominan
parmetros. Esta unidad estar centrada en los estadsticos.

3.1. MEDIDAS DE TENDENCIA CENTRAL O DE PRECISIN


La mayor parte de los conjuntos de datos muestra una tendencia a agruparse
o aglomerarse alrededor de un punto central. As, para cualquier conjunto
especfico de datos, casi siempre se puede seleccionar algn valor tpico, o
Estadstica

86

promedio, para describir todo el conjunto; este valor tpico descriptivo es una
medida de tendencia central, entre las cuales estn: la media aritmtica, la
mediana, la moda y los cuantiles.
3.1.1. Media aritmtica
La media aritmtica, tambin llamada media, es el promedio o medida de
tendencia central que se utiliza con mayor frecuencia, adems de que es la
medida de tendencia central representativa por excelencia. Se calcula con la
suma de todas las observaciones en un conjunto de datos, dividida entre el
nmero de elementos que lo componen. Se representa por X .
Cuando se tienen pocos datos y no se han agrupado, la media aritmtica
sera:

X =
Donde

x
i =1

: media aritmtica de la muestra

n : tamao de la muestra
xi : observacin de la variable
n

x
i =1

: suma de todos los valores de la muestra

Por ejemplo, las notas de un estudiante son 2, 4, 3 y 4.

La media aritmtica es X =

Estadstica

2 + 4 + 3 + 5 14
=
= 3.5
4
4

87

Cuando los datos se han agrupado con frecuencias, pero no se han


construido intervalos, la media aritmtica se calcula como:
n

X =

x .f
i

i =1

Donde f i es el nmero de observaciones de cada valor de la variable; es


decir, la respectiva frecuencia absoluta.
Por ejemplo, tomando el nmero de hijos de la tabla 2 se tendra:
Tabla 19. Media aritmtica para el nmero de hijos de los asociados de
la Cooperativa de Trabajo Asociado Epsilon
NMERO DE HIJOS

FRECUENCIA

xi

fi

0
1
2
3
4

1
2
4
2
1

n = f i = 10

xi . f i

0
2
8
6
4

x . f
i

= 20

Fuente: Datos hipotticos

X =

x .f
i

i =1

, lo que significa que el promedio es 2 hijos.


20
=2
10

Cuando los datos se han agrupado con intervalos, la media aritmtica se


calcula como:
n

x .f
i

Estadstica

X =

i =1

88

Donde xi es la marca de clase de cada intervalo.


Para el ejemplo de la tabla 3, la media aritmtica sera:

Tabla 20. Media aritmtica para el tiempo que tarda (en minutos) un
grupo de expertos en auditar un proceso
N DE

TIEMPO EN

CLASE
1
2
3
4
5
6

MINUTOS
44.5 - 49.5
49.5 - 54.5
54.5 - 59.5
59.5 - 64.5
64.5 - 69.5
69.5 - 74.5

xi

fi

xi . f i

47
52
57
62
67
72

2
9
12
11
9
7
n = f i = 50

94
468
684
682
603
504
.

xi . fi = 3035

Fuente: Datos hipotticos

X =

xi . fi
i =1

. lo que significa que el promedio es 60.7 minutos.


3035
= 60.7
50

3.1.2. Mediana
La mediana, representada por Me, de un conjunto de valores x1, x2, x3, xn,
es el valor que ocupa el lugar central ordenando los datos en forma
ascendente o descendente, de tal forma que la mitad de las observaciones
Estadstica

89

son menores o iguales a la mediana y la otra mitad son mayores o iguales a


dicho valor.
Podra interpretarse la mediana como aquel valor que deja el 50% de las
observaciones por debajo de l y el otro 50% por encima de l.
Cuando los datos estn sin agrupar, la posicin de la mediana se calcula
mediante las siguientes ecuaciones:

Me = X n +1

Si el total de datos (n) es impar

Xn + Xn
Me =

+1

Si el total de datos (n) es par


Una vez ubicada la posicin, el valor correspondiente a dicha posicin en la
mediana.
Por ejemplo, sean los valores 3, 6, 4, 5, 8.
Ordenando se tendra: 3, 4, 5, 6, 8.
El total de datos es n = 5. Por lo tanto, la posicin de la mediana ser
Me = X n +1 = X 5 +1 = X 3
2

El valor correspondiente a la posicin x3 en los datos ordenados es 5.


Estadstica

90

En consecuencia, la mediana Me = 5. Es decir, el 50% de los valores estn


por encima de 5 y el otro 50% estn por debajo de 5.
Si se tienen los valores 5, 15, 5, 13, 9, 13, 11, 7.
Ordenando se tendra: 5, 5, 7, 9, 11, 13, 13, 15
El total de datos es n = 8. Por lo tanto, la posicin de la mediana ser

Xn + Xn
Me =

+1

X8 + X8
=

+1

X4 + X5
2

Los valores correspondientes a las posiciones x4 y x5 en los datos ordenados


son 9 y 11, respectivamente.
En consecuencia, el valor de la mediana ser:

Me =

9 + 11 20
=
= 10
2
2

Es decir, el 50% de los valores est por encima de 10, y el otro 50% est por
debajo de 10.
Cuando los datos estn agrupados en clases o intervalos, la mediana se
calcula mediante los siguientes pasos:
Primer paso: se halla n/2.

Estadstica

91

Segundo paso: se ubica el intervalo cuya frecuencia absoluta acumulada Fi


contiene a n/2.
Tercer paso: se calcula la mediana por medio de la siguiente ecuacin:

n
Fi 1
2
Me = li +
*c
fi

Donde:
li : lmite inferior del intervalo que contiene a n/2

n : nmero total de datos


Fi 1 : Frecuencia absoluta acumulada anterior al intervalo que contiene a n/2
f i : frecuencia absoluta del intervalo que contiene a n/2

c : amplitud del intervalo que contiene a n/2


Por ejemplo, para calcular la mediana para el grupo de expertos de la tabla
3, se realizarn los pasos requeridos a partir de los datos de la tabla 21.
Tabla 21. Mediana para el tiempo que tarda (en minutos) un grupo de
expertos en auditar un proceso
N DE

TIEMPO EN

CLASE
1
2
3
4
5
6

MINUTOS
44.5 - 49.5
49.5 - 54.5
54.5 - 59.5
59.5 - 64.5
64.5 - 69.5
69.5 - 74.5

Estadstica

xi

fi

hi

Fi

Hi

47
52
57
62
67
72

2
9
12
11
9
7

4%
18%
24%
22%
18%
14%

2
11
23
34
43
50

4%
22%
46%
68%
86%
100%

92

Fuente: Datos hipotticos

Primer paso: el total de datos es 50, por lo tanto n/2 es = 25.


Segundo paso: en la frecuencia absoluta acumulada se ubica el valor de 25,
el cual corresponde al cuarto intervalo, con una frecuencia absoluta
acumulada de 34 expertos. Ntese que en el tercer intervalo no es posible
ubicar la mediana, dado que la frecuencia absoluta acumulada hasta este
intervalo es de 23 expertos, y lo querido es de 25 expertos.
Tercer paso: se calcula la mediana por medio de la ecuacin, donde:
li = 59.5

n /2 = 25
Fi 1 = 23
f i = 11

c = 64.5 59.5 = 5
Luego,
n
Fi 1
25 23
2
Me = li + 2
* c = 59.5 +
* 5 = 59.5 + * 5 = 59.5 + 0.9 = 60.4
fi
11
11

Es decir, el 50% de los expertos tarda menos de 60.4 minutos en realizar la


auditora del proceso y el otro 50% tarda ms de 60.4 minutos.
A pesar de que la media aritmtica es la medida de tendencia central por
excelencia, en algunos casos la mediana es preferida a la media aritmtica,
dado que no es sensible a valores extremos.
Suponiendo que se tienen los siguientes datos sobre el salario de
empleados: $490.000, $550.000, $550.000, $580.000 y $990.000.
Estadstica

93

La media aritmtica X sera $632.000 y la mediana Me = $550.000.


Obsrvese que, en este caso, es ms representativa para el conjunto de
datos la mediana que la media aritmtica, dado que el salario extremo de
$990.000 influye directamente en el promedio, mostrndolo con un valor
elevado, cuando la mayora de datos est por debajo de $632.000.
3.1.3. Moda
La moda es til en estudios de mercadeo como calzado, vestido, etc.
Algunos la consideran como el promedio industrial ya que la fabricacin o
venta de artculos est determinada por la moda.
La moda, representada por Mo, de un conjunto de valores x1, x2, x3, xn, es
el valor que se presenta con mayor frecuencia.

Puede ser aplicada a

cualquier tipo de variable.


Cuando los datos estn sin agrupar, la moda se obtiene directamente
ordenndolos ascendentemente.
Por ejemplo, sean los valores 4, 3, 2, 5, 4, 4.
Ordenndolos: 2, 3, 4, 4, 4, 5.
Como el valor 4 se presenta 3 veces y los otros valores una vez, la moda es
4.
La moda no necesariamente debe ser nica, y hasta puede no existir.
Cuando existen varios valores con la misma frecuencia mxima se denomina
Estadstica

94

distribucin multimodal, como el ejemplo de la tabla 22.

Si existen dos

valores con la misma frecuencia mxima se llama distribucin bimodal (ver


tabla 23) y si slo existe una frecuencia mxima se denomina distribucin
unimodal (ver tabla 24).
Tabla 22. Ejemplo de distribucin multimodal
xi

fi

2
3
4
5
6

5
3
5
3
5

Fuente: Datos hipotticos

Los valores que tienen mayor frecuencia son 2,4 y 6, por tanto la distribucin
es multimodal.
Tabla 23. Ejemplo de distribucin bimodal
xi

fi

2
3
4
5
6

5
8
3
8
5

Fuente: Datos hipotticos

Los valores que tienen mayor frecuencia son 3 y 5, por tanto la distribucin
es bimodal.
Tabla 24. Ejemplo de distribucin unimodal

Estadstica

95

xi

fi

2
3
4
5
6

3
7
5
3
2

Fuente: Datos hipotticos

El valor que tiene mayor frecuencia es 3, por tanto, la distribucin es


unimodal.
Cuando los datos estn agrupados en clases o intervalos, se calcula la
moda mediante los siguientes pasos:
Primer paso: se ubica el intervalo (o los intervalos) de mayor frecuencia
absoluta f i .
Segundo paso: se calcula la moda (o las modas) mediante la siguiente
frmula:

Mo = li +

1
*c
1 + 2

Donde:
li : lmite inferior del intervalo de mayor frecuencia absoluta

1 : diferencia entre la frecuencia absoluta mayor y la frecuencia absoluta

anterior.
2 : diferencia entre la frecuencia absoluta mayor y la frecuencia absoluta

siguiente.
Estadstica

96

c : amplitud del intervalo de mayor frecuencia absoluta.


Por ejemplo, para calcular la moda para el grupo de expertos de la tabla 3,
se realizarn los pasos requeridos a partir de los datos de la tabla 25.
Tabla 25. Moda para el tiempo que tarda (en minutos) un grupo de
expertos en auditar un proceso
N DE

TIEMPO EN

CLASE
1
2
3
4
5
6

MINUTOS
44.5 - 49.5
49.5 - 54.5
54.5 - 59.5
59.5 - 64.5
64.5 - 69.5
69.5 - 74.5

xi

fi

hi

Fi

Hi

47
52
57
62
67
72

2
9
12
11
9
7

4%
18%
24%
22%
18%
14%

2
11
23
34
43
50

4%
22%
46%
68%
86%
100%

Fuente: Datos hipotticos

Primer paso: ubicacin del intervalo de mayor frecuencia absoluta f i . El


tercer intervalo es el que posee la frecuencia absoluta mayor (12 expertos).
Segundo paso: obtencin de valores para el clculo de la moda.
li = 54.5

1 = 12 9 = 3
2 = 12 11 = 1

c = 59.5 54.5 = 5

Mo = li +

Estadstica

1
3
15
* c = 54.5 +
* 5 = 54.5 +
= 58.2
1 + 2
3 +1
4

97

Es decir, el tiempo que ms se presenta en realizar la auditora del proceso


es de 58.2 minutos.
3.1.4. Cuantiles
Los cuantiles son valores que dividen el conjunto de datos en porcentajes
iguales. Pueden ser cuartiles, deciles o percentiles.
Cuartiles (Q): valores que dividen los datos en cuatro partes iguales.
Existen tres cuartiles y se calculan de forma similar a la mediana; de hecho,
el cuartil dos es igual a la mediana.
El primer cuartil Q1 deja acumulado el 25% de los datos de la variable. Se
calcula con los siguientes pasos:
- Primer paso: se halla n/4.
- Segundo paso: se ubica el intervalo cuya frecuencia absoluta acumulada
Fi contiene a n/4.
-

Tercer paso: se calcula el primer cuartil por medio de la siguiente

ecuacin:

n
Fi 1
4
Q1 = li +
*c
fi

Estadstica

98

Nota: los componentes de la frmula tienen la misma descripcin que los


componentes de la frmula para el clculo de la mediana.
El clculo del primer cuartil para el ejemplo del tiempo que tardan los
expertos en realizar la auditora de un proceso se detalla a continuacin:
Tabla 26. Primer cuartil para el tiempo que tarda (en minutos) un grupo
de expertos en auditar un proceso
N DE

TIEMPO EN

CLASE
1
2
3
4
5
6

MINUTOS
44.5 - 49.5
49.5 - 54.5
54.5 - 59.5
59.5 - 64.5
64.5 - 69.5
69.5 - 74.5

xi

fi

hi

Fi

Hi

47
52
57
62
67
72

2
9
12
11
9
7

4%
18%
24%
22%
18%
14%

2
11
23
34
43
50

4%
22%
46%
68%
86%
100%

Fuente: Datos hipotticos

Primer paso: el total de datos es 50, por lo tanto n/4 es = 12.5


Segundo paso: en la frecuencia absoluta acumulada se ubica el valor de
12.5, el cual corresponde al tercer intervalo, con una frecuencia absoluta
acumulada de 23 expertos.
Tercer paso: se calcula el primer cuartil por medio de la ecuacin, donde:
li = 54.5

n /4 = 12.5
Fi 1 = 11
f i = 12
Estadstica

99

c = 59.5 54.5 = 5
Luego,
n
Fi 1
12.5 11
1 .5
Q1 = li + 4
* c = 54.5 +
* 5 = 54.5 +
* 5 = 54.5 + 0.62 = 55.12
fi
12
12

Lo que significa que el 25% de los expertos tarda menos de 55.12 minutos
en realizar la auditora del proceso.
El segundo cuartil Q2 deja acumulado el 50% de los datos de la variable. Se
calcula con los siguientes pasos:
- Primer paso: se halla 2n/4 = n/2.
- Segundo paso: se ubica el intervalo cuya frecuencia absoluta acumulada
Fi contiene a n/2.
-

Tercer paso: se calcula el segundo cuartil por medio de la siguiente

ecuacin:

n
Fi 1
2
Q2 = li +
*c
fi

Ntese que los pasos y la frmula para calcular el segundo cuartil son los
mismos que los de la mediana.

En consecuencia, siempre el segundo

cuartil ser igual a la mediana.


Estadstica

100

Luego, para el ejemplo del tiempo que tardan los expertos en realizar la
auditora de un proceso, Q2 = Me = 60.4 minutos.
El tercer cuartil Q3 deja acumulado el 75% de los datos de la variable. Se
calcula con los siguientes pasos:
- Primer paso: se halla 3n/4.
- Segundo paso: se ubica el intervalo cuya frecuencia absoluta acumulada
Fi contiene a 3n/4.
- Tercer paso: se calcula el tercer cuartil por medio de la siguiente ecuacin:

3n
Fi 1
4
Q3 = li +
*c
fi

Luego,
3n
Fi 1
37.5 34
3 .5
Q3 = li + 4
* c = 64.5 +
* 5 = 64.5 +
* 5 = 64.5 + 0.22 = 64.72
fi
9
9

Lo que significa que el 75% de los expertos tarda menos de 64.72 minutos
en realizar la auditora del proceso.
Deciles (D): valores que dividen los datos en diez partes iguales. Existen
nueve deciles y se calculan de forma similar a los cuartiles.
Estadstica

101

El primer decil D1 deja acumulado el 10% de los datos de la variable. Se


calcula con los siguientes pasos:
- Primer paso: se halla n/10.
- Segundo paso: se ubica el intervalo cuya frecuencia absoluta acumulada
Fi contiene a n/10.
- Tercer paso: se calcula el primer decil por medio de la siguiente ecuacin:

n
Fi 1
D1 = li + 10
*c
fi

Los dems deciles se calculan con el procedimiento similar al primer decil,


teniendo en cuenta que, en el primer paso, para el segundo decil
corresponde 2n/10; para el tercer decil, 3n/10; para el cuarto decil, 4n/10;
para el quinto decil, 4n/10 = n/2; as sucesivamente hasta el decil nueve, con
9n/10.
Ntese que, al calcular el decil cinco, en el primer paso se presenta el mismo
planteamiento que para el segundo cuartil y para la mediana (n/2). Por tanto,
el decil cinco es igual al cuartil dos y a la mediana.
El clculo del primer y noveno decil a partir del ejemplo de la tabla 23 para el
tiempo que tardan los expertos en realizar la auditora de un proceso se
detallan a continuacin.
Estadstica

102

n
Fi 1
0 .5 0
0 .5
D1 = li + 10
* c = 44.5 +
* 5 = 44.5 +
* 5 = 44.5 + 1.25 = 44.75
fi
2
2

9n
Fi 1
45 43
2
D9 = li + 10
* c = 69.5 +
* 5 = 69.5 + * 5 = 69.5 + 1.43 = 70.93
fi
7
7

Percentiles (P): valores que dividen los datos en cien partes iguales.
Existen 99 percentiles y se calculan de forma similar a los cuartiles y deciles.
El primer percentil P1 deja acumulado el 1% de los datos de la variable. Se
calcula con los siguientes pasos:
- Primer paso: se halla n/100.
- Segundo paso: se ubica el intervalo cuya frecuencia absoluta acumulada
Fi contiene a n/100.
-

Tercer paso: se calcula el primer percentil por medio de la siguiente

ecuacin:

n
Fi 1
100
P1 = li +
*c
fi

Estadstica

103

Los dems percentiles se calculan con el procedimiento similar al primer


percentil, teniendo en cuenta que, en el primer paso, para el segundo
percentil corresponde 2n/100; para el tercer percentil 3n/100; para el
percentil 10, 10n/100; para el percentil 50, 50n/100 = n/2; as sucesivamente
hasta el percentil 99, con 99n/100.
Ntese que, al calcular el percentil 50, en el primer paso se presenta el
mismo planteamiento que para el segundo cuartil, para el decil cinco y para
la mediana (n/2).

Por tanto, el percentil 50 es igual al decil cinco, al

cuartil dos y a la mediana.

Grfica 10. Relacin entre cuartiles, deciles y percentiles


Q1
1%

10%

2 0%

D1

Estadstica

D2

Q2

25% 30%

D3

40%

D4

50%

D5

Q3
60%

70% 75% 80%

D6

D7

90%

D8

99%

D9

104

P1 ..P10 .. P20 P25 P30 ....P40 ..... P50 .. P60 ....P70 P75 P80 ...... P90 . P99

Me
En la grfica 10 se representa la distribucin de cuartiles, deciles y
percentiles, de la cual se deducen las siguientes relaciones:
Q2 = D5 = P50 = Me, Q1 = P25 , Q3 = P75
D1 = P10 , D2 = P20 , D3 = P30 , D4 = P40 , D6 = P60 , D7 = P70 , D8 = P80 ,
D9 = P90

3.2. MEDIDAS DE VARIABILIDAD


Adems de las medidas de localizacin o de tendencia central, es necesario
considerar medidas de dispersin o variabilidad, dado que dos conjuntos de
datos pueden tener promedios similares, pero diferir en la dispersin de
stos.
Las medidas de variabilidad de mayor uso en estadstica son rango, rango
intercuartil, varianza, desviacin estndar y coeficiente de variacin.
3.2.1. Rango
El rango es la medida de dispersin ms sencilla en un conjunto de datos.
Se calcula por medio de la siguiente ecuacin:

Rango = valor mximo valor mnimo


Estadstica

105

Aunque el rango es la medida de dispersin ms fcil de calcular, casi nunca


se usa como la nica medida de dispersin, debido a que se basa slo en los
valores extremos del conjunto de datos.
Por ejemplo, para el tiempo que tardan los expertos en auditar un proceso, el
rango sera:
Rango = 74 45 = 29 minutos
El rango debe interpretarse a partir de los valores extremos; es decir,
mencionar entre qu valores est el rango. Para el ejemplo, se dice que la
variacin del tiempo de los expertos es de 29 minutos, el cual oscila entre 45
y 74 minutos.

3.2.2. Rango intercuartil


El rango intercuartil (RIC) es una medida de dispersin que elimina la
influencia de los valores extremos de un conjunto de datos. Se define como
la diferencia entre el tercer cuartil Q3 y el primero Q1. En otras palabras, el
rango intercuartil corresponde al rango del 50% intermedio de los datos.

Rango intercuartil (RIC) = Q3 - Q1

Para los datos del tiempo que tardan los expertos en realizar la auditora de
un proceso, los cuartiles son Q1 = 55.12 minutos y Q3 = 64.72 minutos. As el
rango intecuartil es
Estadstica

106

RIC = 64.72 55.12 = 9.6 minutos.


El intervalo 55.12 a 64.72 suele denominarse mitad central y 9.6 minutos la
dispersin media o rango intercuartil del tiempo que tardan los expertos en
realizar la auditora de un proceso.
3.2.3. Varianza
La varianza es una medida de dispersin que emplea todos los datos. Se
basa en la diferencia de cada observacin (xi) y la media. La diferencia entre
cada xi y el promedio ( x para una muestra y para una poblacin) se
llama desviacin respecto al promedio.

Para una muestra, la desviacin

respecto a la media se expresa como

( xi x ) ;

para una poblacin es

( xi ) . Para calcular la varianza, las desviaciones respecto al promedio se

elevan al cuadrado.
Si el conjunto de datos es una poblacin, el promedio de las desviaciones al
cuadrado se llama varianza de la poblacin y se representa con el smbolo
griego 2 . Para una poblacin con N observaciones o datos, cuando
representa el promedio de esa poblacin, la definicin de la varianza de la
poblacin es:

(x
=

)2

En la mayora de los anlisis estadsticos los datos analizados son una


muestra. Cuando se calcula la varianza para la muestra, lo ms importante

Estadstica

107

es emplearla para estimar la varianza de todo el conjunto de datos, es decir,


para la poblacin.
La varianza de la muestra (s2) es la suma de los cuadrados de las
desviaciones con relacin a la media aritmtica, dividida entre el tamao de
la muestra menos 1.

s2 =

( x

x) 2

n 1

Donde:

: media aritmtica de la muestra

n : tamao de la muestra
xi : cada dato u observacin de la variable X.

Si el denominador fuera n en lugar de n 1, se obtendra el promedio de los


cuadrados de las diferencias con respecto a la media.

Sin embargo, se

utiliza n 1 debido a ciertas propiedades matemticas deseadas que tiene el


estadstico s2, las cuales lo hacen apropiado para hacer inferencias
estadsticas. Al aumentar el tamao de la muestra, la diferencia entre n y n
1disminuye cada vez ms.
Cuando se calcula la varianza, las unidades en las cuales fueron medidos los
datos causan confusiones. Como los valores que se suman al calcular la
varianza, que son ( xi x) 2 , se elevan al cuadrado, las unidades asociadas
con la varianza de la muestra tambin se elevan al cuadrado. Por ejemplo, si

Estadstica

108

se est calculando la edad en aos para un grupo de empleados, la varianza


tendr (aos)2.
Las unidades al cuadrado asociadas con la varianza hacen difcil la
interpretacin. Por tanto, se recomienda que se tome la varianza como una
medida til para comparar el grado de dispersin de dos o ms variables y, al
compararlas, la que tienen mayor varianza tiene mayor dispersin o
variabilidad.
Por ejemplo, en la tabla 27 se presenta el salario, en millones de pesos, de
los gerentes de una cadena de almacenes; calcular la varianza.

Tabla 27. Salario en millones de pesos de gerentes


SALARIO

MEDIA DE LA

(millones)

MUESTRA

xi
3,5
4,5
6,0
8,0
10,0
15,0
20,0

9.57
9.57
9.57
9.57
9.57
9.57
9.57

DESVIACIN
( xi x )

( xi x) 2

-6.07
-5.07
-3.57
-1.57
0.43
5.43
10.42

36.84
25.70
12.74
2.46
0.18
29.48
108.78

( x

x) = 0

( x

x ) 2 = 216.18

Fuente: Datos hipotticos

Estadstica

109

Luego, la varianza ser:

( x
=

x) 2

n 1

216.18
= 36.03
6

Cuando los datos estn agrupados en frecuencias o por intervalos, la frmula


para la varianza puede ser transformada en la siguiente ecuacin:

s2 =

2
i

* fi

Donde:

: media aritmtica de la muestra

n : tamao de la muestra
xi : cada dato u observacin de la variable X o marca de clase si es

intervalo
f i : frecuencia absoluta del valor de la variable X

Para los datos de tiempo que tardan los expertos en realizar la auditora de
un proceso, presentados en la tabla 10, la varianza sera:
Tabla 28. Varianza para el tiempo que tardan los expertos en realizar la
auditora de un proceso

Estadstica

110

N DE

TIEMPO EN

CLASE
1
2
3
4
5
6

MINUTOS
44.5 - 49.5
49.5 - 54.5
54.5 - 59.5
59.5 - 64.5
64.5 - 69.5
69.5 - 74.5

xi

fi

xi2

xi2 * f i

47
52
57
62
67
72

2
9
12
11
9
7
n = 50

2209
2704
3249
3844
4489
5184
2
i

4418
24336
38988
42284
40401
36288

Fuente: Datos hipotticos

De la tabla 17 se tienen que el promedio es

s2 =

2
i

* fi

x =

x * f = 186.715
i

x = 60.7 ; luego

186.715
(60.7) 2 = 3734.3 3684.49 = 49.81
50

3.2.4. Desviacin estndar


La desviacin estndar se define como la raz cuadrada positiva de la
varianza. Se denota por s la desviacin estndar de la muestra y por

la

desviacin estndar de la poblacin.

s=

s2

= 2

La desviacin estndar indica cmo se agrupa o distribuye un conjunto de


datos alrededor de la media. Para la mayor parte de los conjuntos de datos,
la mayora de los valores observados cae dentro de un intervalo que
corresponde a la media aritmtica ms o menos una desviacin estndar.
Esto implica que el intervalo comprendido entre

X 1S

X +1S

, por lo

general, incluye la mayora de los valores de los datos. Por consiguiente, el


Estadstica

111

conocimiento de la media aritmtica y la desviacin estndar ayudan a definir


en dnde se agrupa la mayor parte de los datos.
Para los datos de tiempo que tardan los expertos en realizar la auditora de
un proceso, presentados en la tabla 26, la desviacin estndar sera:

s=

s2 =

49.81 = 7.06

minutos

La desviacin estndar del tiempo de los expertos es 7.06 minutos. Esto


indica que los tiempos que tardan en realizar la auditora del proceso para la
mayor parte de los expertos se agrupan dentro de 7.06 minutos alrededor de
la media 60.7 minutos; es decir, se agrupan entre
X +1S = 67.76

X 1S = 53.64

minutos.

Finalmente, para comprender la variacin de los datos se deben tener en


cuenta los siguientes aspectos:
Cuanto ms dispersos estn los datos, mayores sern el rango, el rango

intercuartil, la varianza y la desviacin estndar.


Cuanto ms concentrados u homogneos sean los datos, menores sern

el rango, el rango intercuartil, la varianza y la desviacin estndar.


Si los datos son todos iguales (de manera que no hay variacin de los

datos), el rango, el rango intercuartil, la varianza y la desviacin estndar


sern iguales a cero.

Estadstica

112

Las medidas de variacin (rango, rango intercuartil, varianza y desviacin

estndar) nunca son negativas.


3.2.5. Coeficiente de variacin
El coeficiente de variacin, denotado por CV, es una medida descriptiva que
indica lo grande que es la desviacin estndar en comparacin con la media
aritmtica; se expresa en porcentaje y se calcula por medio de la siguiente
ecuacin:

CV =

S
* 100
X

Para los datos del tiempo que tardan los expertos en realizar la auditora de
un proceso, el promedio es 60.7 minutos y la desviacin estndar es 7.06
minutos. El coeficiente de variacin sera:

CV =

S
7.06
* 100 =
* 100 = 11.6%
60.7
X

Interpretando estos datos, el coeficiente de variacin indica que la desviacin


estndar de la muestra es el 11.6% del valor de la media de la muestra.
Como medida relativa, el coeficiente de variacin resulta especialmente til
cuando se compara la variabilidad de dos o ms conjuntos de datos, que se
expresan en diferentes unidades de medida. Esto se muestra en el siguiente
ejemplo, adaptado del texto Estadstica para administracin, de Mark L.
Berenson y otros, pgina 120.

Estadstica

113

Suponga que un inversionista desea adquirir acciones en una de dos


compaa A o B, listadas en la Bolsa de Valores.

Si ninguna de las

compaas ofrece dividendos a sus clientes y ambas tienen igual


clasificacin (segn los servicios de inversin) en trminos del crecimiento
potencial, el inversionista quiz considere la volatilidad o variabilidad de
ambas acciones para ayudar en la decisin de inversin.
Supngase que cada accin de la compaa A ha promediado $150.000 en
los ltimos meses, con desviacin estndar de $30.000. Adems, durante el
mismo perodo el precio promedio de las acciones en la compaa B fue de
$36.000 con una desviacin estndar de $12.000. Cmo puede determinar
el inversionista cules acciones son ms variables?
Solucin
En trminos de las desviaciones estndar, el precio de las acciones de A
parece ms voltil o variable que el de las acciones de B. Sin embargo,
como los precios promedio por acciones de las dos compaas son tan
diferentes, es ms conveniente que el inversionista considere la variabilidad
del precio respecto al promedio con el fin de analizar la estabilidad de ambas
acciones.
Los coeficientes de variacin para las compaas A y B seran:

CV A =

S
$30.000
S
$12.000
* 100 =
* 100 = 20.0% y CVB =
* 100 =
* 100 = 33.3%
$
150
.
000
$36.000
X
X

En consecuencia, en relacin con la media, el precio de las acciones B es


ms variable que el de las acciones A.
Estadstica

114

3.3. MEDIDAS DE LOCALIZACIN


Hasta el momento se han descrito algunas medidas de tendencia central y
de dispersin. La media es la que ms se usa como medida de tendencia
central, mientras que la desviacin estndar y la varianza son las ms
empleadas para la dispersin.

Las medidas de localizacin relativa se

apoyan en la media y la desviacin estndar para ubicar valores particulares


de un conjunto de datos.

3.3.1. Valores z
Al usar la media y la desviacin estndar se puede determinar la localizacin
relativa de cualquier observacin. Supngase que hay una muestra de n
datos, con sus valores representados por x1 , x2 , x1 x3 ,. . . .,xn . Adems, se
han calculado la media

y la desviacin estndar s de la muestra. Existe

otro valor asociado con cada valor xi de los datos que se denomina valor z, el
cual se calcula con la siguiente ecuacin:

zi =

xi x
s

Donde,
zi : valor de z del elemento xi
x

: media de la muestra

s : desviacin estndar de la muestra.

Estadstica

115

Con frecuencia se le da el nombre de valor estandarizado al valor de z. El


valor zi se interpreta como el nmero de desviaciones estndar que dista xi
de promedio

. Por ejemplo, si zi = 1.2 indica que x1 es 1.2 desviaciones

estndar por encima de la media de la muestra.

Igualmente, z2 = 0.5

indica que x2 est a 0.5, o desviacin estndar por debajo de la media de


la muestra.

Obsrvese que los valores de z positivos corresponden a

observaciones o datos con valores mayores que la media, y que los valores
de z negativos corresponden a observaciones con valores menores que la
media. Un valor z igual a cero indica que el valor de una observacin es
igual a la media.
Los valores de z para el ejemplo de la tabla 25, donde se presenta el salario,
en millones de pesos, de los gerentes de una cadena de almacenes, con
media $9.57 millones y desviacin estndar $6 millones, sern:
Tabla 29. Valores z para el salario en millones de pesos de gerentes
SALARIO
(millones)
xi
3,5
4,5
6,0
8,0
10,0
15,0
20,0

DESVIACIN
( xi x )

-6.07
-5.07
-3.57
-1.57
0.43
5.43
10.42

VALOR Z
xi x
s
-1.01
-0.84
-0.60
-0.26
0.07
0.90
1.74

Fuente: Datos hipotticos

Estadstica

116

Obsrvese que el valor z de 1.74 para el sptimo dato indica que es el ms


alejado del promedio; est a 1.74 desviaciones estndar por encima del
promedio.
3.3.2. Teorema de Chebyshev
El teorema de Chebyshev permite inferir la proporcin de valores que deben
quedar dentro de una cantidad especfica de desviaciones estndar respecto
a la media.

Teorema de Chebyshev
1

Cuando menos 1 2 de los datos debe estar a menos de z desviaciones


z

estndar de separacin respecto a la media, siendo z cualquier valor mayor


que 1.

Por ejemplo, cuando z es igual a 2, 3 y 4 desviaciones estndar, se tienen


las siguientes implicaciones a partir del teorema de Chebyshev:

Cuando menos, el 0.75 o 75% de los datos debe estar a menos de 2


desviaciones de la media (z = 2).

Cuando menos, el 0.89 u 89% de los datos debe estar a menos de 3


desviaciones de la media (z = 3).

Cuando menos, el 0.94 o 94% de los datos debe estar a menos de 4


desviaciones de la media (z = 4).

Estadstica

117

Como ejemplo de la aplicacin del teorema de Chebyshev, supngase que


las puntuaciones de un examen de ingreso de 100 aspirantes al programa de
Administracin de una universidad tuvieron un promedio de 70 puntos y una
desviacin

estndar

de

puntos.

Cuntos

aspirantes

tuvieron

puntuaciones entre 60 y 80? Cuntos entre 58 y 82?


Para las puntuaciones de 60 a 80 se observa que el valor 60 est a dos
desviaciones estndar por debajo del promedio: (60-70)/5 = -2, y que el valor
80, a dos desviaciones estndar por encima del promedio: (80-70)/5 = +2. Al
aplicar el teorema de Chebyshev, cuando menos el 0.75 o 75% de los datos
debe tener valores menores de dos desviaciones estndar del promedio.
As, cuando menos o mnimo 75 de los 100 aspirantes deben haber obtenido
puntuaciones entre 60 y 80.
Para las puntuaciones entre 58 y 82, (58-70)/5 = -2.4 indica que 58 estn a
2.4 desviaciones estndar por debajo del promedio, y que (82-70)/5 = +2.4
indica que 82 estn a 2.4 desviaciones estndar por encima del promedio.
Aplicando el teorema de Chebyshev con z = 2.4 se obtiene:
1
1

1 2 = 1
= 0.826
z ( 2. 4 ) 2

Lo que significa que, mnimo 82.6% de los aspirantes deben tener


puntuaciones entre 58 y 82.
La regla emprica

Estadstica

118

Una de las ventajas del teorema de Chebyshev es que se aplica a cualquier


conjunto de datos, independientemente de la forma de la distribucin de los
mismos. Sin embargo, en las aplicaciones prcticas se ha encontrado que
muchos conjuntos de datos tienen una distribucin en forma de colina o de
campana.

Cuando se cree que los datos tienen aproximadamente esa

distribucin, se puede aplicar la regla emprica para determinar el porcentaje


de elementos que debe estar dentro de determinada cantidad de
desviaciones estndar respecto al promedio.

Regla emprica para datos con distribucin en forma de


campana

Aproximadamente 68% de los elementos estn a menos de una desviacin


estndar de la media.

Aproximadamente 95% de los elementos estn a menos de dos


desviaciones estndar de la media.

Casi todos los elementos estn a menos de tres desviaciones estndar de


la media.

Por ejemplo, en una lnea de produccin se llenan, automticamente,


envases de plstico con detergente lquido. Con frecuencia, el volumen de
llenado tiene una distribucin en forma de campana. Si el volumen promedio
de llenado es de 16 cm3 y la desviacin estndar 0.25 cm3, se puede aplicar
la regla emprica para concluir:

Estadstica

119

Aproximadamente 68% de los envases llenos tienen entre 15.75 y 16.25


cm3 (esto es, menos de una desviacin estndar de la media).

Aproximadamente 95% de los envases llenos tienen entre 15.50 y 16.50


cm3 (esto es, menos de dos desviaciones estndar de la media).

Casi todos los envases llenos tienen entre 15.25 y 16.75 cm 3 (esto es,
menos de tres desviaciones estndar de la media).

3.3.3. Sesgo o forma


El sesgo o forma es la manera como se distribuyen los datos. La distribucin
de los datos es simtrica (en forma de campana) o no lo es.

Si no es

simtrica, recibe el nombre de distribucin asimtrica o sesgada.


Para describir el sesgo o la forma, se deben comparar la media y la mediana.
Si ambas medidas son iguales, por lo general se considera que los datos son
simtricos (o con sesgo cero). Por el contrario, si la media es mayor que la
mediana, los datos se describen como sesgados a la derecha, o con sesgo
positivo. Si la media es menor que la mediana, los datos suelen llamarse
sesgados a la izquierda, o con sesgo negativo. Es decir,

Media > Mediana: sesgo positivo o a la derecha


Media = Mediana: simetra o sesgo cero
Media < Mediana: sesgo negativo o a la izquierda

El sesgo positivo surge cuando la media aumenta debido a algunos valores


grandes y poco usuales; el sesgo negativo ocurre cuando la media se reduce
debido a algunos valores muy pequeos. Los datos son simtricos cuando
Estadstica

120

en realidad no hay valores extremos en ninguna direccin, de tal manera que


los valores grandes y pequeos se equilibran.
Grfica 11. Forma o sesgo de un conjunto de datos

La grafica 11 muestra la forma o sesgo de tres conjuntos de datos. Los


datos del primer cuadro son simtricos; cada mitad de la curva es la imagen
del espejo de la otra mitad. Los valores grandes y pequeos se compensan,
y la media es igual a la mediana.
Los datos del cuadro del centro tienen sesgo negativo o a la izquierda. Se
observan una cola larga y una distorsin hacia la izquierda, causadas por
valores en extremo pequeos. Estos valores tan pequeos jalan la media
hacia abajo y resulta menor que la mediana. Los datos del tercer cuadro
tienen un sesgo positivo o a la derecha. Se observan una cola larga hacia la
derecha de la distribucin y una distorsin hacia la derecha, causadas por
valores muy grandes. Estos valores en extremo grandes jalan la media hacia
arriba y resulta mayor que la mediana.
El sesgo para el ejemplo de la tabla 25, donde se presenta el salario, en
millones de pesos, de los gerentes de una cadena de almacenes, con media
$9.57 millones y mediana $8 millones, ser positivo o a la derecha, dado que
la media es mayor que la mediana. Adems, el conjunto de datos presenta
Estadstica

121

un valor extremo muy alto, el cual atrae la media hacia el extremo derecho
de la distribucin.
3.3.4. Diagrama de caja o bigotes
El diagrama de caja o bigotes es un resumen grfico de los datos basado en
el resumen de cinco nmeros.
En un resumen de cinco nmeros se emplean cinco cantidades para resumir
los datos:
Valor mnimo
Primer cuartil (Q1)
Mediana (Me = Q2)
Tercer cuartil (Q3)
Valor mximo
La forma ms gil de elaborar un resumen de 5 nmeros es poner los datos
en orden ascendente. As facilita la identificacin del valor mnimo, los tres
cuartiles y el valor mximo.
Por ejemplo, los salarios mensuales, en miles de pesos, de 12 egresados de
un programa de Administracin son 2.940, 2.920, 2.950, 2.710, 2.850, 2.755,
2.890, 2.880, 2.880, 3.130, 3.325 y 3.050.
Organizando los datos y calculando los cuartiles, se tiene la siguiente
distribucin:
2710

2755

Estadstica

2850

2880

2880

2890

2920

2940

2950

3050

3130

3325

122

Q1 = 2865

Q2 = 2905

Q3 = 3000

(Mediana)

Al analizar los datos anteriores se ve un valor mnimo de 2.710 y un valor


mximo de 3.325 miles de pesos. As, el resumen de los cinco nmeros de
los datos de salarios es 2.710, 2.865, 2.905, 3.000 y 3.325 miles de pesos.
Aproximadamente una cuarta parte, 25% de los valores de los datos, estn
entre dos nmeros adyacentes del resumen de cinco nmeros.
El diagrama de caja y bigotes resume grficamente los cinco nmeros.
Los pasos para trazar un diagrama de caja y bigotes son los siguientes:

Se traza un rectngulo con los extremos en el primer y tercer cuartiles.


Este rectngulo contiene el 50% intermedio de los datos. Para los
datos de salarios Q1 = 2.865 y Q3 = 3.000.

En la caja se traza una recta vertical en el lugar de la mediana (2.950


para los datos de salarios). As, la lnea de la mediana divide los
datos en dos partes iguales.

Se ubican los lmites mediante el rango intercuartil, RIC = Q 3 - Q1. Los


lmites en el diagrama de caja estn a 1.5(RIC) por debajo de Q1 y
1.5(RIC) por encima de Q3 . Para los datos de salarios RIC = Q3 - Q1 =
3.000 2.865 = 135. As, los lmites son 2.865 1.5(135) = 2.662,5 y
3.000 + 1.5(135) = 3.202,5. Se considera que los datos fuera de estos
lmites son valores atpicos.

Los bigotes de la caja se trazan con lneas punteadas, desde los


extremos de la caja hasta los valores mnimo y mximo dentro de los
lmites. As, los bigotes terminan en los valores de salarios de 2.710 y
3.130.

Estadstica

123

Por ltimo, se marcan con un asterisco (*) las localizaciones de los


valores atpicos. Para el ejemplo se localiza un valor atpico de 3.325.

Grfica 12. Diagrama de caja y bigotes con lneas que muestran los
lmites

En la grfica 12 se trazaron las lneas que indican el lugar de los lmites con
el fin de mostrar cmo se calculan stos y dnde se ubican en el caso de los
salarios. Aunque siempre se calculan, por lo general no se trazan en los
diagramas de caja. En la grfica 13 se muestra el aspecto habitual de un
diagrama de caja y bigotes para los datos de los salarios.
Estadstica

124

Grafica 13. Diagrama de caja y bigotes de los sueldos mensuales de un


grupo de egresados de un programa de Administracin

Observacin
Al utilizar el diagrama de caja y bigotes se tiene la opcin de identificar los
mismos valores atpicos que los encontrados con el mtodo de valores z:
menores que 3 y mayores que +3. Sin embargo, el objetivo de ambos
mtodos es identificar elementos que se deben revisar para asegurar la
validez de los datos. Se deben revisar los valores atpicos identificados por
cualquiera de los mtodos.
Estadstica

125

3.3.5. Curtosis
La curtosis mide si los valores de la distribucin estn ms o menos
concentrados alrededor de los valores medios de la muestra. El coeficiente
percentil de Curtosis (k) analiza el grado de concentracin que presentan los
valores alrededor de la zona central de la distribucin; se calcula con la
siguiente ecuacin:

k=

1
2

(Q3 Q1 )
P90 P10

Donde,
Q3: tercer cuartil.
Q1: primer cuartil.
P90: percentil 90.
P10: percentil 10.
Nota: es importante recordar que el P10 es igual al D1 y el P90 es igual al D9.
Segn el coeficiente de Curtosis, se definen 3 tipos de distribuciones, los
cuales se ilustran en la grfica 14:
Grfica 14. Tipos de distribucin segn el coeficiente de Curtosis

Estadstica

126

Distribucin mesocrtica: presenta un grado de concentracin medio


alrededor de los valores centrales de la variable (el mismo que presenta una
distribucin simtrica o normal). El valor de k = 0.263.
Distribucin leptocrtica: presenta un elevado grado de concentracin
alrededor de los valores centrales de la variable. El valor de k > 0.263.
Distribucin platicrtica: presenta un reducido grado de concentracin
alrededor de los valores centrales de la variable. El valor de k < 0.263.
Para el ejemplo de la tabla 23 del tiempo que tarda un grupo de expertos en
realizar la auditora de un proceso, Q1 = 55.12, Q3 = 64.72, P10 = D1 = 44.7 y
P90 = D9 = 70.9.
El coeficiente percentil de Curtosis (k) ser:

(Q3 Q1 ) 12 (64.72 55.12) 0.5(9.6) 4.8


k=
=
=
=
= 0.183
P90 P10
70.9 44.7
26.2
26.2
1
2

Por lo tanto, el coeficiente percentil de Curtosis es 0.183, lo que quiere decir


que se trata de una distribucin platicrtica, es decir, con una reducida
concentracin alrededor de los valores centrales de la distribucin.

Estadstica

127

Estadstica

128

4. REGRESIN LINEAL Y CORRELACIN


En las unidades anteriores se ha centrado la atencin en el tratamiento de
los valores que puede tomar una variable definida en una investigacin, tanto
en el nivel de muestra como en el de poblacin.

Sin embargo,

frecuentemente las investigaciones implican considerar dos o ms variables.


Los procedimientos para el anlisis de la relacin de dos variables sern
contemplados en esta unidad.

4.1. REGRESIN LINEAL SIMPLE


La regresin es un mtodo para determinar la relacin existente entre una
variable independiente y otra dependiente, con fines de prediccin de esta
ltima variable ante los cambios de la primera.
La variable independiente o predictora suele representarse por X y la variable
dependiente por Y. En algunos casos, la variable independiente se asocia
con medidas de causa y la dependiente con medidas de efecto.
En la produccin industrial pueden ser variables independientes: el nmero
de trabajadores, el tiempo de labor semanal, la cantidad de materia prima,
entre otras. Y variables dependientes: el nmero de artculos producidos, los
ingresos semanales, el posicionamiento en el mercado, etc. Obsrvese que

Estadstica

129

las variables dependientes se muestran como efecto de las variables


independientes o causa del proceso de produccin.
Por ejemplo, una compaa de bienes races residenciales en una ciudad
desea predecir los costos mensuales del alquiler de apartamentos, basado
en el rea en metros cuadrados. Se seleccion una muestra aleatoria con
los siguientes datos:
Tabla 30. rea y costo de alquiler de apartamentos
APARTAMENTO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

REA (m2)
79
135
101
114
67
138
106
67
65
89
102
119
184
127
109
114
116
117
107
83
126
97
70
93
111

COSTO MENSUAL (miles de pesos)


475
800
600
750
475
850
825
467
437
575
700
825
1150
900
700
725
550
850
600
575
800
825
600
400
875

Fuente: Adaptacin del texto Estadstica para administracin. Berenson y otros, pg. 466.

Estadstica

130

En este caso, se busca relacionar las variables rea y costo mensual; donde
la variable independiente (X) es el rea, y la dependiente (Y), el costo
mensual.
4.1.1. Diagrama de dispersin
Cuando se toma una muestra de dos variables o bivariada, se obtiene una
serie de pares de datos. Estas parejas son de la forma (x,y) y se pueden
representar como puntos en un plano bidimensional o plano cartesiano; la
representacin grfica de las parejas se conoce como diagrama de
dispersin.
La regresin lineal pretende encontrar una recta que represente todos los
puntos que se encuentran en el plano cartesiano.
En la grfica 15 se ilustran algunos diagramas de dispersin.
Grfica 15. Representacin de algunos diagramas de dispersin

Para el ejemplo de la tabla 30, el diagrama de dispersin se presenta en la


grfica 16.
Estadstica

131

Grfica 16. Diagrama de dispersin para el rea y costo de alquiler de


apartamentos

El diagrama de dispersin muestra una relacin lineal positiva; es decir, a


medida que crece el rea aumenta el valor del alquiler del apartamento.
Adicionalmente, no se observa ningn valor atpico.
4.1.2. Ajuste de una recta por el mtodo de mnimos cuadrados
Sobre el diagrama de dispersin se puede trazar un sinnmero de lneas
rectas que represente el conjunto de datos y facilite la prediccin para la
variable dependiente.

Sin embargo, este mtodo intuitivo es demasiado

subjetivo.
El objeto de la regresin lineal consiste en determinar una recta de la forma
yi = b0 + b xi ,

Estadstica

que sea representativa del conjunto de datos muestrales; este

132

proceso se conoce como ajuste de una recta y se utiliza como procedimiento


el mtodo de mnimos cuadrados.
En este sentido, el mtodo de mnimos cuadrados es objetivo y no depende
de la apreciacin personal del investigador, sino de relaciones matemticas
preestablecidas.
La tarea est en determinar los parmetros b0 y

en la ecuacin de

regresin lineal simple yi = b0 + b xi , donde


x i : es el i-simo valor de la variable X.
yi : es el i-simo valor de la variable y
b0 : es el valor que toma la variable dependiente "y", cuando la variable

independiente "x" vale 0, y es el punto donde la recta cruza el eje vertical.


b

: determina la pendiente de la recta, su grado de inclinacin.

Una vez hallados los parmetros b0 y

, los valores calculados a partir de

la ecuacin de regresin se denominan valores estimados, y se representan


por y i .
En el mtodo de mnimos cuadrados se emplean los datos de la muestra
para determinar los parmetros b0 y

que minimizan la suma de los

cuadrados de las desviaciones entre los valores observados de la variable


dependiente yi y los valores estimados de la variable dependiente y i .
La desviacin se obtiene entre la diferencia de los valores reales yi y los
valores estimados

i ; por tanto, la suma de los cuadrados de las


y

desviaciones debe ser mnima. Esto es,


Estadstica

133

min

( y

y i )

Con el clculo diferencial se puede demostrar que los parmetros b0 y

que minimizan el cuadrado de las desviaciones son:

b =

n xi yi xi yi
n x ( xi )
2
i

b0 =

b
n

Los parmetros para el ejemplo de la tabla 30, se calculan a partir de los


datos presentados en la tabla 31.
Tabla 31. Valores para el clculo de parmetros de la compaa de
bienes raz
APARTAMENTO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Estadstica

X
79
135
101
114
67
138
106
67
65
89
102
119
184
127
109
114
116
117
107
83
126
97
70
93
111

Y
475
800
600
750
475
850
825
467
437
575
700
825
1150
900
700
725
550
850
600
575
800
825
600
400
875

XY
37525
108000
60600
85500
31825
117300
87450
31289
28405
51175
71400
98175
211600
114300
76300
82650
63800
99450
64200
47725
100800
80025
42000
37200
97125

X2
6241
18225
10201
12996
4489
19044
11236
4489
4225
7921
10404
14161
33856
16129
11881
12996
13456
13689
11449
6889
15876
9409
4900
8649
12321

Y2
225625
640000
360000
562500
225625
722500
680625
218089
190969
330625
490000
680625
1322500
810000
490000
525625
302500
722500
360000
330625
640000
680625
360000
160000
765625

134

TOTAL

2.636

17.329

1.925.819

295.132

12.797.183

Fuente: Adaptacin del texto Estadstica para administracin. Berenson y otros, pg. 466.

De la tabla 29 se tiene que:

= 2.636 ,

= 17.329 ,

x y
i

= 1.925.819 ,

2
i

= 295.132 y n =

25
por tanto,

b =

n xi yi xi yi

b0 =

n x ( xi )
2
i

b
n

25(1.925.819) (2.636)(17.329) 2.466.231


=
= 5,73804
25( 295.132) (2.636) 2
429.804

17.329 (5,73804)(2.636) 2.203,53


=
= 88,14120
25
25

en consecuencia, el modelo de regresin para estimar el costo de alquiler


mensual de un apartamento a partir del rea ser:
y = 88,14120 +5,73804 x

Este modelo representa la integracin de todos los puntos ubicados en el


diagrama de dispersin, y garantiza que la suma del cuadrado de las
desviaciones es mnima, como se ilustra en la grfica 17.

Grfica 17. Modelo de regresin lineal para el rea y costo de alquiler de


apartamentos
Estadstica

135

Interpretacin de bo y b
bo = 88,1412 indica que cuando el cambio en el rea es cero, el cambio
esperado en el costo de alquiler mensual es de 88,1412 miles de pesos; es
decir, que el costo de alquiler mensual aumenta 88,1412 miles de pesos. La
pendiente b = 5,73804 seala que por cada incremento de 1 m2 en el rea,
se pronostica que el cambio esperado en el costo mensual de alquiler es de
5,73804 miles de pesos, cuyo significado es que se pronostica que el costo
de alquiler aumenta 5,73804 miles de pesos por cada 1 m2 de incremento en
el rea.
Predicciones
Estadstica

136

Con la ecuacin de regresin encontrada, es posible predecir algunos


valores para la variable dependiente a partir de la variable independiente
Observacin
Cuando se utiliza un modelo de regresin con propsitos de pronstico, es
importante que se tenga en cuenta slo el intervalo de valores que toma la
variable independiente y que fueron usados para construir el modelo.
Entonces, si se predice un valor de Y para un valor dado de X, es posible
interpolar dentro de este intervalo de valores de X, pero no se debe
extrapolar hacia fuera de este intervalo. Por ejemplo, cuando se usa el rea
en m2 para predecir el alquiler mensual, se observa en la tabla 29 que los
metros cuadrados varan de 65 a 184. Por tanto, las predicciones de costos
de alquiler mensual deben hacerse slo para apartamentos con un rea
entre estas medidas. Cualquier pronstico de costos de alquiler mensual con
reas fuera de este intervalo es poco confiable.

4.2. CORRELACIN
Hasta el momento se ha considerado el problema de la regresin lineal
simple o estimacin de una variable dependiente a partir de una variable
independiente. Sin embargo, surge el interrogante: Qu tanto se relacionan
las variables dependiente e independiente? La correlacin pretende dar
respuesta a esta pregunta e intenta medir el grado de asociacin entre dos
variables por medio de los coeficientes de correlacin y determinacin.
4.2.1. Coeficiente de correlacin

Estadstica

137

El coeficiente de correlacin (r) es la medida de la intensidad de la relacin


entre dos variables. Se calcula con la ecuacin

r=

n xy ( x )( y )

n x 2 ( x ) * n y 2 ( y )
2

Donde,

nxy ( x )( y ) : desviacin conjunta de los datos X y Y


n x 2 ( x ) : desviacin de los datos X
2

n y 2 ( y ) : desviacin de los datos Y


2

El coeficiente de correlacin toma valores comprendidos entre 1 y +1, de tal


forma que cuando r = -1 r = +1 existe una correlacin perfecta entre las
variables. Esto es, todos los puntos del plano cartesiano estn alineados (o
se ajustan perfectamente) a la lnea recta de la ecuacin de regresin.
Cuando r = 0, no existe correlacin entre las variables.

La correlacin

aumenta cuando r se acerca de 0 a +1 de 0 a 1.


En la medida en que los puntos se acerquen a la recta, el coeficiente de
correlacin ser ms prximo a 1, y si los puntos se alejan de la recta, el
coeficiente de correlacin ser ms prximo a cero.
Aunque la correlacin o la medida de la intensidad de la relacin puede
oscilar entre 1 y +1, no existe una regla precisa para afirmar si la correlacin
es buena o mala entre las variables, ya que la calificacin depende del rigor
138

Estadstica

del estudio y la experiencia del investigador para juzgar los resultados de


acuerdo con las expectativas planteadas. Sin embargo, en la tabla 32 se
presenta un esquema que puede ayudar a la calificacin de un modelo de
regresin.
Tabla 32. Calificacin del modelo de regresin

r
-0.1
-0.2
-0.3
-0.4
-0.5
-0.6
-0.7
-0.8
-0.9
-1.0

CALIFICACIN
Correlacin nula
Correlacin baja
Correlacin alta
Mxima correlacin

r
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0

Grfica 18. Correlacin entre dos variables

En la grfica 18 se presenta la correlacin entre dos variables. Obsrvese


que en la correlacin lineal positiva, la pendiente de la recta es positiva, y en
la correlacin lineal negativa, la pendiente es negativa.

Al calcular el

coeficiente de correlacin, el signo debe ser el mismo del parmetro b 1, dado


Estadstica
139

que este parmetro corresponde a la pendiente de la recta.

En

consecuencia, existe una igualdad de signos entre la pendiente de la recta y


el coeficiente de correlacin.
El coeficiente de correlacin para el ejemplo de la tabla 29, en el cual se
relaciona el rea con el precio de alquiler de apartamentos sera:

r=

r=

n xy ( x )( y )

n x 2 ( x ) * n y 2 ( y )
2

25(1.925.819) (2.636)(17.329)
25(295.132) (2.636) 2 * 25(12.797.183) (17.329) 2

2.466.321
2.466.321
=
= 0.8489
655,59 * 4.431,18 2.905.037,296

Como r = 0,8489 y la pendiente b1 es positiva, indica que hay alta correlacin


entre el rea y el precio de alquiler de los apartamentos.
4.2.2. Coeficiente de determinacin
Para predecir una variable en funcin de otra predomina la incertidumbre, y
la pregunta forzada es qu tan bien se ajusta a los datos la ecuacin de
regresin? En este aparte se muestra que el coeficiente de determinacin
(r2) es una medida de la bondad de ajuste para una ecuacin de regresin.
El coeficiente de determinacin (r2) expresa el porcentaje de variacin de la
variable dependiente causado o atribuido por la variacin de la variable
independiente.

Estadstica

Coeficiente de determinacin = (Coeficiente de correlacin)2 * 100


r2 = (r)2 * 100
140

El coeficiente de determinacin para el ejemplo de la tabla 29, en el cual se


relaciona el rea con el precio de alquiler de apartamentos, sera:
r2 = ( 0,8489 )2 * 100 = 72%
Este valor permite concluir que el 72% del aumento en el costo de alquiler
del apartamento se debe al incremento en el rea, el otro 28% se debe al
cambio producido por otras variables que no fueron analizadas en el modelo
(por ser regresin lineal simple).
Adems de los coeficientes de correlacin y determinacin, la correlacin
puede ser analizada con mayor profundidad por medio de la inferencia del
coeficiente de correlacin poblacional (p) (se lee rho), la cual incluye pruebas
de hiptesis e intervalos de confianza para p.

Estadstica

141

Estadstica

142

Estadstica

143

1.1 INTRODUCCIN

En nuestra vida aparecen a diario, no importa en el mbito que nos estemos


desenvolviendo, muchas situaciones bajo incertidumbre como, por ejemplo:
qu posibilidad tengo de conseguir el empleo, qu posibilidad tengo de ganar
la evaluacin, qu posibilidad hay de que compren el producto, qu
probabilidad hay de que una persona se recupere de la enfermedad, qu
posibilidad hay de que todos los productos salgan bajo las especificaciones
exigidas, qu posibilidad tengo de encontrar la informacin que necesito,
etc. La respuesta a todas las preguntas anteriores tiene un grado de
Incertidumbre, aunque tengamos alguna base para obtener las primeras
respuestas. Pero existen otros casos en que las respuestas no dependen de
conocimientos anteriores sino del azar. Como, por ejemplo, qu posibilidad
tengo al lanzar un par de dados de obtener un 7 o un doble uno.
En nuestro lenguaje cotidiano, palabras como probablemente, es poco
probable que, hay muchas posibilidades de que hacen referencia a
esta incertidumbre.
La teora de la probabilidad pretende ser una herramienta para modelizar y
tratar de obtener respuesta a estas incertidumbres. Cuando se aplican las
tcnicas estadsticas a la recogida, anlisis e interpretacin de los datos, la
teora de la probabilidad proporciona una base para evaluar la fiabilidad de
las conclusiones alcanzadas y las inferencias realizadas. Debido al
importante papel desempeado por la probabilidad dentro de la estadstica,
es necesario familiarizarse con sus elementos bsicos, lo que constituye el
objetivo del presente tema.

Estadstica

144

Al estudiar las probabilidades existen los siguientes objetivos:

Familiarizar al estudiante con experiencias de la vida diaria en las que


interviene el azar.

Entender los enfoques de la probabilidad ms usuales as como sus


peculiaridades, ventajas e inconvenientes.

Manejar el lenguaje de la probabilidad, sus propiedades y aplicarlo a


problemas concretos.

1.2

Entender los teoremas de la probabilidad y su aplicabilidad.

QU ES LA PROBABILIDAD?

La teora de probabilidad es la teora matemtica que modela los fenmenos


aleatorios. Estos deben contraponerse a los fenmenos determinsticos, en
los cuales el resultado de un experimento, realizado bajo condiciones
determinadas, produce un resultado nico o previsible: por ejemplo, el agua
calentada a 100 grados centgrados, a presin normal, se transforma en
vapor. Un fenmeno aleatorio es aquel que, a pesar de realizarse el
experimento bajo las mismas condiciones determinadas, tiene como
resultados posibles un conjunto de alternativas, ejemplos: lanzar un dado o
una moneda. O sea que la probabilidad es darle una medida o un valor a la
incertidumbre.

Estadstica

145

1.3

CONCEPTOS BSICOS DE PROBABILIDAD

1.3.1 Fenmeno experimento aleatorio.

Es el proceso mediante el cual

se obtiene una observacin o una medida de un fenmeno o es aquel


que en las mismas condiciones iniciales produce distintos resultados
finales, que son conocidos por anticipado pero no se puede predecir
con certeza el resultado en cada experiencia en particular. Ejemplo:
lanzar una moneda, un dado, etc.
1.3.2 Fenmeno o experimento determinstico. Es aquel en el que las
mismas condiciones provocan los mismos efectos, como por ejemplo:
un capital bajo el mismo intervalo de tiempo, produce el mismo
resultado.
1.3.3 Prueba. Es una observacin particular.
1.3.4 Espacio muestral

(S).

Es el conjunto de todos los resultados

posibles de un experimento estadstico.


Ejemplos:
a. Considrese el experimento de lanzar un dado. Sus resultados posibles
son:

S = (1,2,3,4,5,6).

b. Considrese el experimento de lanzar una moneda una sola vez. Sus


resultados posibles son:

S= (cara, sello).

c. Considrese el experimento de lanzar una moneda dos veces.

Sus

resultados posibles son:


S = [(Cara, cara), (cara, sello), (sello, cara), (sello, sello)].
Estadstica

146

d. Un experimento consiste en lanzar una moneda al aire. Si sale cara, se


lanza otra vez la moneda. Si sale sello, se lanza un dado una vez. Sus
resultados posibles son:
Sea C =Cara y S = Sello

e. Un experimento consiste en lanzar primero un dado y despus lanzar una


moneda, siempre y cuando el nmero en el dado sea par. Si el resultado
del dado es impar, la moneda se lanza 2 veces. Encuentre el espacio
muestral.

f. Si queremos lanzar una moneda 5 veces, al especificar todos los


resultados posibles, es necesario saber cuntos resultados tendra, dado
que es muy fcil perderse en el desarrollo.
Habra

resultados posibles. Si queremos lanzar una moneda

10 veces habra

resultados posibles.

En muchos casos no es necesario desagregar los resultados posibles sino


que es importante y necesario saber el total de resultados posibles en un
experimento.

Dada la complejidad de los experimentos, en muchas

ocasiones es difcil saber el total de resultados posibles del experimento y es


necesario utilizar frmulas que son proporcionadas por una de las
Estadstica

147

herramientas de las matemticas llamada tcnicas de conteo. Tema que


veremos ms adelante.

1.3.5 Elemento o punto muestral. Es cada uno de los elementos o


resultados del espacio muestral.
1.3.6 Evento. Un evento es un subconjunto de un espacio muestral. En
muchos experimentos solo nos interesa averiguar ciertos elementos
de un espacio muestral.

Ejemplo:

al lanzar un dado, solo nos

interesa encontrar los nmeros primos.


S = (1, 2, 3, 4, 5,6)

A = (1, 2,3, 5).

A B.

1.3.7 Interseccin de dos eventos A y B.

Es el evento que contiene a los elementos comunes a A y a B, o sea:

Grficamente,

Ejemplo
Sea el espacio muestral S = (0,1,2,3,4,5,6,7,8,9)

y los Eventos:

A = ( 1,2,3,4,5)
Estadstica

148

B = ( 0,1,3,6,8 )
C= (3,4,6,9)
GRAFICANDO,

8
0
3 6

4
9

C
7

1.
2.
3.
4.

1.3.8 Unin de dos eventos a y b:

A B.

Es el evento que contiene a todos los elementos que pertenecen a A o a B o


a ambos. O sea:

Grficamente,
Estadstica

149

Ejemplo
Con el espacio muestral del ejercicio anterior, hallar los siguientes eventos:

1.3.9 Complemento de un evento a: A.

Es el conjunto de todos los elementos de S (del espacio muestral) que no


estn en A, o sea:

Grficamente,

S
Estadstica

150

Ejemplo
Con el espacio muestral del ejercicio anterior, hallar los siguientes eventos:

Estadstica

151

Estadstica

152

2.1

TCNICAS DE CONTEO

Es una herramienta matemtica que sirve para conocer el total de resultados


posibles en un experimento estadstico. Las principales son:

Regla 2.1.1:

Principio de la multiplicacin

Si un acontecimiento A puede ocurrir de m maneras diferentes, y si para


cada una de esas m maneras posibles de ocurrencia de A, un segundo
acontecimiento B puede ocurrir de n maneras diferentes, entonces, el
nmero de manetas diferentes en que puede ocurrir el acontecimiento A
seguido del acontecimiento B es m x n

Ejemplo 1: Sarita es una nia que vive en un distrito, tiene de vestuario 3


sombreros, 2 faldas y 2 blusas. Sarita desea vestir cada da de una manera
diferente.

Su problema es saber en cuntos das puede salir a la calle

vestida de manera diferente.


SOLUCIN
Sea

= sombrero 1

=sombrero 2

= falda 1

= falda 2

=blusa 1

=blusa 2

= sombrero 3

El nmero de resultados finales:


3 sombreros

2 faldas

2 blusas

Nmero de resultados posibles o nmero de vestidos diferentes:


Estadstica

153

3x2x2=12

Segn el diagrama de rbol, los resultados son:

Estadstica

154

(S 1
(S 1
(S 1
(S 1

,
,
,
,

f
f
f
f

b
b
b
b

1)

(S 2
(S 2
(S 2
(S 2

2)
1)
2)

,
,
,
,

f
f
f
f

1 ,
1 ,
2 ,
2 ,

b
b
b
b

1)
2)
1)
2)

(S 3
(S 3
(S 3
(S 3

,
,
,
,

f
f
f
f

1 ,
1 ,
2 ,
2 ,

b
b
b
b

1)
2)
1)
2)

Ejemplo 2: Cules son los resultados posibles al lanzar una moneda 3


veces?
Solucin

sea

c = cara

s = sello

El nmero de resultados finales:


Primera moneda 2 resultados= c, s
Segunda moneda 2 resultados=c, s
Tercera moneda 2 resultado= c, s
Total de resultados posibles= 2x2x2=8 resultados.
C

C
S

C
S
S
C
C
S

C
S
S
Estadstica

155

Segn el diagrama de rbol, los resultados son:


(C,C,C),(C,C,S),(C,S,C)(C,S,S,),(S,C,C),(S,C,S),(S,S,C)(S,S,S).
Ejemplo 3: Suponga que se seleccionan en forma aleatoria 3 artculos de
un proceso de manufactura. Se examina cada uno de ellos y se les clasifica
como D-Defectuosa y B-Bueno. Cules son los resultados posibles?

Solucin
El nmero de resultados posibles:

Primer artculo, dos resultados posibles = B,D

Segundo artculo, dos resultados posibles B,D

Tercer artculo, dos resultados posibles B,D

Total de resultados posibles= 2x2x2=8 resultados.


B
D
D

B
B
D
B
D
D

B
B
D

(B,D,B),(B,D,D),(B,B,B),(B,B,D),(D,D,B),(D,D,D,)(D,B,B,)(D,B,D).
Estadstica

156

Regla 2.1.2. Principio de permutacin

Se define el nmero de permutaciones de n objetos como el total de


maneras como se pueden ordenar o agrupar los n objetos el cual equivale
a
1x2x3x ... x n = n ! , definido como factorial de n.

n! (factorial) es el producto de los enteros


Desde 1 hasta n.
0!
=1
Ejemplo 3! = 1.2.3 =6

5!=1.2.3.4.5=120

Ejemplo 4: De cuntas maneras podemos organizar cuatro personas en


una fila?
Solucin
Sea

A la persona 1
B la persona 2
C la persona 3
D la persona 4.

Para saber el total de resultados posibles = 4! = 1.2.3.4= 24 resultados


posibles:

Estadstica

157

(A B C D)
(A B D C)
(A C B D)
(A C D B)
(A D B C)
(A D C B)

(B A
(B A
(B C
(B C
(B D
(B D

C D)
DC)
A D)
DA)
A C)
C A)

(C A
(C A
(C B
(C B
(C D
(C D

B D)
DB)
A D)
DA)
A B)
B A)

(D A B
(D A C
(D B A
(D B C
(D C A
(D C B

C)
B)
C)
A)
B)
A)

Ejemplo 5. Se tiene un equipaje conformado de pantalones: P; camisas: C;


y zapatos: Z. De cuntas maneras se puede colocar en un armario de 3
compartimentos?
Para saber el total de resultados posibles = 3! = 1.2.3.= 6 resultados
posibles:
(P C
(P Z
(Z P
(Z C
(C Z
(C P

Z)
C)
C)
P)
P)
Z)

Regla 2.1.3: Variaciones o permutaciones

Cuando se permutan u organizan de los n elementos, solo r ( r n),


teniendo en cuenta o siendo importante el orden ya que tiene sentido,
decimosqueesunavariacinopermutacin.Sufrmula:

Estadstica

158

Ejemplo 6: Se tiene a cuatro concursantes para un primer y segundo


puesto. Cules son los resultados posibles para los cuatro concursantes?

Solucin

Sea A el concursante 1

Sea B el concursante 2

Sea C el concursante 3

Sea D el concursante 4

El total de resultados posibles:

(A B)
(A C)
(A D)
(B C)
(B D)
(C D)

(B A)
(C A)
(D A)
(C B)
(D B)
(D C)

(A,B) significa que el concursante A ocup el primer puesto y B ocup el


segundo puesto. En cambio (B,A) significa que el concursante B ocup el
primer puesto y el concursante A ocup el segundo puesto; estos dos
resultados son diferentes.

Estadstica

159

Ejemplo 7. Si en el ejercicio de las prendas (ejemplo 5), se tuvieran


pantalones: P; interiores I; camisas: C; y zapatos: Z, de cuntas maneras se
pueden colocar en un armario de 3 compartimentos, teniendo en cuenta que
la prenda sobrante se coloca en otro armario?
Solucin

El total de resultados posibles:

(P
(P
(P
(I

I
I
C
C

C)
Z)
Z)
Z)

(P
(P
(P
(I

C
Z
Z
Z

I)
I)
C)
C)

(I C
(I P
(C I
(C I

P)
Z)
P)
Z)

(I P
(I Z
(C P
(C Z

C)
P)
I)
I)

(
(
(
(

C
Z
I
Z

I
I
C
I

P)
P)
P)
C

(C
(Z
(I
(Z

P
P
P
C

I)
I)
C)
I)

Regla 2.1.4: Combinaciones

Cuando se organizan de los n elementos, solo r ( r n), sin tener en


cuentaelordenoalcambiardeordennosepierdeelsentido,decimosque
esunacombinacin.Sufrmula:

Ejemplo 8: Se tienen cuatro reglas de salud:

Regla A: no fumar

Estadstica

160

Regla B: hacer ejercicios

Regla C: tomar 7 u 8 vasos diarios de agua

Regla D: comer verduras.

Si actualmente todas no se cumplen y se quieren cumplir 2 de ellas, cules


seran las opciones?

Solucin
El total de resultados posibles:

Si se tiene las soluciones (A,B) y (B, A) se est diciendo no fumar y hacer


ejercicios, y para el segundo se est diciendo, hacer ejercicios y no fumar;
este resultado es igual.
Teniendo en cuenta lo anterior, los resultados quedaran:

(A B)
(A C)
(A D)
(B C)
(B D)
(C D)

Estadstica

161

Regla 2.1.5: Particiones


El nmero de particiones distintas de n objetos en los cuales n1 son de
una
clase, n2 de una segunda clase, ..., nk de una k - sima clase, coincide con
el nmero de formas de hacer una particin de un conjunto de n objetos en
k
celdas con n1 objetos en la primera celda, n2 elementos en la segunda
celda y as sucesivamente donde

Ejemplo 9: Un colegio participa en 4 partidos de ftbol en una temporada.


De cuntas maneras puede el equipo terminar la temporada con 2 victorias,
1 derrotas y 1 empate?

Sea V victoria (2)

Sea D derrota (1)

Sea E empate (1)

Solucin
Para saber el nmero de resultados posibles.

Estadstica

162

V
V
V
V

V
V
D
E

D
E
V
V

E
D
E
D

V
V
D
D

D
E
V
V

E
D
V
E

V
V
E
V

D
E
E
E

E
D
V
V

V
V
D
V

V
V
V
D

2.2

EJERCICIOS RESUELTOS

1.

Un vendedor de autos quiere presentar a sus clientes todas las

diferentes opciones con que cuenta: auto convertible, auto de 2 puertas y


auto de 4 puertas, cualquiera de ellos con rines deportivos o estndar.
Cuntos y cules diferentes arreglos de autos y rines puede ofrecer el
vendedor?
Solucin
Para solucionar el problema se emplea la tcnica de la multiplicacin, (donde
m es nmero de modelos y n es el nmero de tipos de rin).

Nmero total de arreglos = 3 x 2 = 6


arreglos diferentes

Sea m = 3
n=2

Estadstica

A auto convertible

B 2 puertas

D rin deportivo

E rin estndar

C 4 puertas

163

D
A

E
D

B
E

D
E

Deacuerdoconeldiagramaderbol,losresultadosposiblesson:
(A,D),(A,E),(B,D),(B,E),(C,D),(C,E).

Suponga que hay ocho tipos de computadora pero solo tres espacios

disponibles para exhibirlas en la tienda de computadoras. De cuntas


maneras diferentes pueden ser arregladas las 8 mquinas en los tres
espacios disponibles?
Solucin
Para solucionar el problema se emplea la tcnica de Permutacin, (donde n
es el nmero de mquinas y r es el nmero de espacios disponibles).

Estadstica

164

Nmero total de arreglos

3. Una tarjeta de circuito impresa se puede comprar con cinco proveedores.


De cuntas maneras de pueden escoger tres proveedores de los cinco?
Solucin
Para solucionar el problema se emplea la tcnica de las combinaciones,
(donde n son los 5 proveedores y r son los 3 proveedores a escoger).

Nmero total de arreglos

4. Un estudiante desea acomodar ocho libros en un anaquel. Calcule el


nmero de maneras en que puede hacerlo si la condicin es que:
a. Tres libros especficos siempre deben quedar juntos.
b. Tres libros especficos nunca deben quedar todos juntos.

Solucin del numeral a

Estadstica

165

Enrealidadlos8puestosseconviertenen6;yaque3librosdebenquedar
juntos.Peroesos3,asuvez,sepuedenorganizardediferentesmaneras.
Supongamosqueloslibros1,2,3debenquedarjuntos..

LIBROS
PUESTOS

2
1

4
2

5
3

6
4

7
5

8
6

Solucin del numeral b


3separadoseslocontrarioalos3juntos.Estoquieredecirquealorganizar
8libros(8!=40320)yalrestarlelosresultadosdelos3juntos(4320),nos
quedanlosresultadosdelos3separados.

5. Un comit de 5 personas se va a elegir entre 10 principales y 7 suplentes,


de cuntas maneras es posible si ha de haber ms principales que
suplentes?
Solucin
Paraquelosprincipalesseanmsquelossuplentesdebenquedar:
3principalesy2suplenteso4principalesyunsuplenteo5principalesy0
suplentes..

Estadstica

166

Recordemos que en matemticas el conector


y significa producto y el conector o significa
suma

Estadstica

167

3.1

SUCESOS PROBABILSTICOS

De acuerdo con la forma como ocurren dos o ms sucesos probabilsticos


estos pueden ser:
3.1.1 Sucesos independientes: son aquellos sucesos en donde la
ocurrencia de uno de ellos no depende de la ocurrencia de otro u
otros sucesos. Ejemplo: sacar de una urna una pelota blanca, si
antes se sac una pelota negra y se devolvi a la urna.
3.1.2 Sucesos dependientes: son aquellos sucesos en donde la ocurrencia
de uno de ellos s depende de la ocurrencia de otro u otros sucesos.
Ejemplo: sacar de una urna una pelota blanca, si antes se sac una
pelota negra y no se devolvi a la urna.
3.1.3 Sucesos compatibles o mutuamente no excluyentes: son aquellos
sucesos que pueden ocurrir al mismo tiempo o simultneamente, es
decir, la ocurrencia de uno de ellos no excluye la ocurrencia de otro u
otros sucesos. Ejemplo: se lanzan dos dados al mismo tiempo,
puede salir el 1 o el 5?
3.1.4 Sucesos incompatibles o mutuamente excluyentes: son aquellos
sucesos que no pueden ocurrir al mismo tiempo en forma simultnea,
es decir, que la ocurrencia de uno de ellos excluye la ocurrencia de
otro. O sea A B =

Ejemplo:

En el lanzamiento de dos

dados simultneamente, sacar al mismo tiempo dos nmeros pares y


que su suma sea impar.
Estadstica

168

3.2

DEFINICIN DE PROBABILIDAD

La posibilidad de que se presente un evento resultante de un experimento


estadstico se evala por medio de un conjunto de nmeros reales llamados
Probabilidades que caen en el rango (0,1). A cada punto en el espacio
muestral se le asigna una probabilidad tal que la suma de todas las
probabilidades tiene que ser igual a 1.

3.2.1. Modelo de probabilidad emprico o frecuencialista

El modelo de frecuencia relativa llamado tambin modelo a posteriori utiliza


datos que se han observado empricamente, registra la frecuencia con que
ha ocurrido algn evento en el pasado y estima la probabilidad de que el
evento ocurra nuevamente con base en estos datos histricos.
La probabilidad de un evento con base en el modelo de frecuencia relativa se
determina mediante:

Ejemplo
Un resultado de Gregor J. Mendel (1822-1884)) en uno de sus experimentos
con cruzamiento de plantas fue de 355 guisantes amarillos (A) y 123 verdes
(V) o sea que la frecuencia relativa para los guisantes amarillos fue de
Estadstica

169

. En otro experimento obtuvo 315 guisantes amarillos y


108 verdes o sea que la frecuencia relativa para los guisantes amarillos fue
de

La estabilidad de las frecuencias relativas

alrededor de 0.74 para la ocurrencia de guisantes amarillos y 0.26 para los


guisantes verdes lo condujeron a formular la ley. Por lo tanto, se le llam a
la frecuencia constante la probabilidad del evento A.
3.2.2. Modelo subjetivo
Es el grado de creencia personal de la posibilidad de que ocurra un suceso.
Ejemplo: Posibilidad de que gane mi equipo favorito es de un 70%.
3.2.3. Modelo clsico
En este enfoque se asume que todos los resultados de un experimento
tienen la misma posibilidad de ocurrir. La probabilidad clsica de un evento
A se determina

Ejemplo
Se tiene una muestra de 20 artculos y 5 de ellos son defectuosos; al
seleccionar uno en forma aleatoria, la probabilidad de que sea defectuoso es
de 5/20 =0.25 y la probabilidad de que sea un artculo bueno es de
15/20=0.75.
Estadstica

170

3.2

REGLAS PRINCIPALES DE LA PROBABILIDAD

Para asignar probabilidades a los puntos muestrales se ha convenido:

REGLAS DE PROBABILIDAD

La probabilidad de cada punto

La suma de las probabilidades de todos

muestral debe estar entre 0 y 1, o

los puntos muestrales debe ser igual a

sea

uno

Antes de entrar a ver los axiomas de probabilidad es importante que se


experimenten varios puntos:
1. Es necesario el conocimiento de la teora de conjuntos para poder
interpretar muchos problemas de probabilidades.
2. En muchos casos, no se necesitan las reglas de probabilidades para
poder obtener la respuesta de probabilidad; es suficiente tener buena
interpretacin de lo que se pregunta y tener clara la frmula bsica de
probabilidad.

Estadstica

171

Los casos favorables son aquellos que cumplen con la condicin, y los casos
posibles son todos los resultados posibles en un experimento estadstico
(espacio muestral).
Para comprobar lo anterior, se har un ejemplo donde la respuesta es
obtenida solamente utilizando la lgica y la frmula anterior, y despus se
comprobar la respuesta utilizando las reglas de probabilidad.
Ejemplo 1 de probabilidad
En un curso, 10 alumnos aprobaron Historia, 15 aprobaron Matemticas y 14
aprobaron Espaol; 3 alumnos aprobaron Espaol e Historia, 5 Matemticas
y Espaol, 3 aprobaron Matemticas e Historia y 1 solo aprob las 3
materias. Si seleccionamos un estudiante en forma aleatoria, hallar:
a.

Probabilidad de que haya aprobado Matemticas

b.

Probabilidad de que haya aprobado solamente Matemticas

c.

Probabilidad de que no haya aprobado Matemticas

d.

Probabilidad de que haya aprobado Matemticas o Historia

e.

Probabilidad de que haya aprobado Historia y Espaol

f.

Si aprob Espaol, cul es la probabilidad de que haya aprobado


Historia?

Solucin
Para mayor comprensin es necesario realizar un Diagrama de Venn con
toda la informacin que se tiene de los 10 estudiantes:

Estadstica

172

29

E
4

8
2

a. Para hallar la probabilidad de que haya aprobado Matemtica, se tienen


como casos favorables los que aprobaron Matemticas, que en este caso
son 15, y como casos posibles, los estudiantes que se estn analizando,
que en este caso son 29. O sea la frmula queda:

La probabilidad de que haya aprobado


Matemtica es de 51.72% o sea que el 51.72% de los estudiantes
aprobaron Matemticas.
b. Para hallar la probabilidad de que haya aprobado solamente Matemtica,
se tienen como casos favorables, los estudiantes que aprobaron
Matemticas, y no Espaol ni Historia.

En este caso, son 8 los

estudiantes que solo aprobaron Matemticas;

los casos posibles son

todos los estudiantes que se estn analizando, que en este caso son 29.
O sea la frmula queda:

Estadstica

173

. La probabilidad de que haya


aprobado Matemtica solamente es 27.59%, o sea, que el 27.59% de
los estudiantes aprob solamente Matemtica.
c. Para hallar la probabilidad de que no haya aprobado Matemtica, se
tienen como casos favorables 14 estudiantes que no aprobaron
Matemtica; como casos posibles, los estudiantes que se estn
analizando, que en este caso son 29.

. La probabilidad de que no haya aprobado


Matemtica es 48.28%, o sea, que el 48.28% de los estudiantes no
aprob Matemtica.

d. Para hallar probabilidad de que haya aprobado Matemtica o Historia, se


utiliza la definicin de unin en teora de conjuntos, o sea, los que
aprobaron Matemtica o Historia o ambos, como casos favorables; en
este caso son 22 los estudiantes y todos los casos posibles son todos los
estudiantes que se estn analizando que, en este caso, son 29.

.
Matemtica o Historia es

La probabilidad de que haya aprobado


75.86%,

o sea, que el 75.86% de los

estudiantes aprobaron Matemtica o Historia.


e. Para hallar la probabilidad de que haya aprobado Historia y Espaol se
utiliza la definicin de interseccin en teora de conjuntos, o sea, los que
aprobaron tanto Espaol como Historia, como casos favorables; en este
Estadstica

174

caso son 3 los estudiantes y todos los casos posibles son todos los
estudiantes que se estn analizando, que en este caso son 29.

La probabilidad de que haya aprobado


Historia y Espaol es 10.34%, o sea, que el 10.34% de los estudiantes
aprobaron Historia y Espaol.

f. Para hallar la probabilidad de que haya aprobado Historia dado que


aprob Espaol, quiere decir que se conoce que aprob Espaol y de
ellos, cuntos aprobaron Historia. Por lo tanto, el total de casos posibles
cambia; no son 29, sino que son el total que aprob Espaol (14) y de
ellos los casos favorables (los que aprobaron Historia) son 3.

La probabilidad de que haya aprobado

Historia dado que aprob Espaol es 21.43%, o sea, que el 21.43% de


los estudiantes que aprobaron Espaol, tambin aprobaron Historia.

observa que hasta ahora no se han necesitado los axiomas de probabilidad, para
responder las preguntas. Solo se ha necesitado de tu buena interpretacin y anlisis!
Para comprobar las preguntas anteriores, se utilizan los axiomas.

Estadstica

175

3.3

AXIOMAS DE PROBABILIDAD

3.4.1 Teorema 1: Regla de la unin o suma


Si A y B son dos eventos cualquiera, entonces la probabilidad de A o B

EVENTOS MUTUAMENTE

NO EXCLUYENTES

EXCLUYENTES

Ejemplo:
Probabilidad de que haya aprobado Matemticas o Historia (numeral d. del
ejercicio anterior).

3.4.2 Teorema 2: Regla del complemento

Estadstica

176

Si A es el complemento de A, entonces:

Ejemplo:
Probabilidad de que no haya aprobado Matemtica. (Numeral c. del ejercicio
anterior).

3.4.3 Teorema 3: Probabilidad condicional


A la probabilidad de que un evento A ocurra dado que un evento B ya
ocurri, se llama probabilidad condicional y se escribe

Donde A es la pregunta, y B es lo conocido, y su frmula es:

Ejemplo:
Si aprob Espaol, cul es la probabilidad de que haya aprobado Historia?
Estadstica

177

(Numeral f. del ejercicio anterior). Otra forma de plantear la pregunta es:


cul es la probabilidad de que haya aprobado Historia dado que aprob
Espaol?

3.4.4 Teorema 4: Regla de la multiplicacin o interseccin


A la probabilidad de que ocurra un Evento A y B
EVENTOS

DEPENDIENTES

INDEPENDIENTES

Ejemplo:
Probabilidad de que haya aprobado Historia y Espaol. (Numeral e. del
ejercicio anterior).
Como son eventos dependientes,

Estadstica

178

EJEMPLO 2 DE PROBABILIDAD
La asociacin de estudiantes de Estadstica en una universidad muy grande
quera determinar si hay una relacin entre el inters de un estudiante por la
Estadstica y su capacidad para las Matemticas.

Se selecciona una

muestra aleatoria de 200 estudiantes y se obtienen los siguientes resultados:


80 tienen capacidad baja para las Matemticas, de los cuales 15 tienen
inters medio en la Estadstica.
90 tienen inters bajo por la Estadstica, de los cuales 15 tienen capacidad
media para las Matemticas.
40 tienen inters alto por la Estadstica de los cuales 10 tienen capacidad
media para las Matemticas.
50 tienen capacidad alta para las Matemticas, de los cuales 25 tienen
inters alto por la Estadstica.
Si se selecciona un estudiante en forma aleatoria,
a. Cul es la probabilidad de que tenga capacidad alta para las

Matemtica?
b. Cul es la probabilidad de que tenga inters bajo o medio por la

estadstica?
c. Cul es la probabilidad de que tenga capacidad media para las

Matemticas o un inters alto por la Estadstica?


d. Cul es la probabilidad de que no tenga capacidad alta para las
Estadstica

179

Matemticas?
e. Cul es la probabilidad de que tenga capacidad alta para las

Matemticas, dado que su inters por la Estadstica es bajo?


f.

Cul es la probabilidad de que tanto la capacidad para las Matemticas


como el inters por la Estadstica sean medios?

Solucin
Para mayor comprensin del ejercicio, es adecuado llevar los datos a un
Cuadro de contingencia o doble entrada.

1.

El 25% de los estudiantes tienen capacidad alta


para las Matemticas.

2. Como

los

eventos

son

mutuamente

excluyentes,

El80%delosestudiantestienen
inters bajo o medio por la Estadstica.

Estadstica

180

CAPACIDAD
MATEMTICAS

INTERS-ESTADSTICA
OPCIN

ALTO

MEDIO

BAJO

TOTAL

ALTO

25

10

15

50

MEDIO

10

45

15

70

BAJO

15

60

80

TOTAL

40

70

90

200

3. Comoloseventossonmutuamentenoexcluyentes,

EL

50%

de

los

estudiantes tienen capacidad media para las Matemticas o un inters


alto por la Estadstica.

CAPACIDAD
MATEMTICAS

INTERS-ESTADSTICA
OPCIN

ALTO

MEDIO

BAJO

TOTAL

ALTO

25

10

15

50

MEDIO

10

45

15

70

BAJO

15

60

80

TOTAL

40

70

90

200

4.

El 75% de los estudiantes


no tienen capacidad alta para las Matemticas

5. Se sabe que el inters por Estadstica es bajo; o sea que es una


probabilidad condicional y su frmula es:

Estadstica

181

El 16.67% de los estudiantes que tienen inters bajo por la Estadstica tienen
una capacidad media para la Matemtica.

CAPACIDAD
MATEMTICAS

INTERS-ESTADSTICA
OPCIN

ALTO

MEDIO

BAJO

TOTAL

ALTO

25

10

15

50

MEDIO

10

45

15

70

BAJO

15

60

80

TOTAL

40

70

90

200

6. Como los eventos son dependientes, la frmula es:

El 7.5% de los estudiantes, tienen una capacidad media para las


Matemticas y un inters medio por la Estadstica.

EJEMPLO 3 DE PROBABILIDAD
La probabilidad de que un hombre casado vea un cierto programa de
Estadstica

182

televisin es de 0.4, y la de que una mujer del mismo estado civil lo haga,
0.5; la probabilidad de que un hombre vea el programa, dado de que su
esposa lo hace, es de 0.7. Encuentre la probabilidad de que:
1.

Una pareja de casados vea el programa.

2.

Una esposa no vea el programa, dado que su esposo lo hace.

3.

Al menos una persona de un matrimonio vea el programa

4.

Ninguno de los dos vea el programa

Solucin
Parmetros: sea H: hombre casado

M: mujer casada.

1.

La probabilidad de que una pareja de casados vea el programa es de un


35%.

2.

Es ms fcil si se obtiene el denominador de un


Diagrama de Venn.

Estadstica

183

PROBABILIDAD TOTAL

H
0.35

0.45

0.15

0.05

La probabilidad de que una esposa no vea el programa, dado que su esposo


lo hace, es de 12.5%.
3.

La probabilidad de que al menos una persona de un matrimonio vea el


programa es de 55%

4.

La probabilidad de que ninguno de los dos vea el programa es de 45%.

EJEMPLO 4 DE PROBABILIDAD
Estadstica

184

Suponga que en un estante de una biblioteca hay ocho libros de Fsica


iguales (mismo autor, edicin y ttulo), excepto que cuatro son ediciones
rsticas y los otros cuatro estn empastados (o encuadernados). Suponga,
adems, que en forma sucesiva vienen tres lectores y cada uno de ellos pide
a la bibliotecaria un ejemplar de ese libro para llevar a casa.

Si la

bibliotecaria los elige al azar, cul es la probabilidad de que al primero le


toque empastado, al segundo rstico y al tercero tambin rstico?
Solucin
El espacio muestral sera: (r, r, r, r, e, e, e, e).
Sea A, el evento de sacar un libro empastado
Sea B, el evento de sacar un libro rstico
Sea C, el evento de sacar un libro rstico

La probabilidad de que al primero le toque empastado, al segundo rstico y


al tercero tambin rstico es 14.29%.

Estadstica

185

Estadstica

186

4.1

INTRODUCCIN

De lo visto anteriormente en probabilidades y espacio muestral, se concluye


que muchos experimentos son muy complejos dados los mltiples
resultados.
Una forma de suavizar o canalizar el tema de las probabilidades es por
medio de frmulas que asocien el experimento con una funcin o distribucin
de probabilidad de acuerdo con

sus caractersticas. Por ejemplo, son

muchos los experimentos que tienen que ver con solo dos posibles
resultados (defectuoso-no defectuoso, ganar-perder, vivir-morir, vender-no
vender, etc.); otros experimentos, tienen que ver con el nmero de resultados
en un intervalo de tiempo o regin especfica (nmero de llamadas por
minuto a un conmutador, nmero de artculos defectuoso por lote, nmero de
clientes en un banco por mes, etc.); otros experimentes tienen que ver con la
toma de una medida y bajo una situacin normal (peso, tiempo, estatura,
dimensiones, temperatura, rea, etc.).
Las frmulas o distribuciones de probabilidad son una herramienta muy
importante para solucionar problemas bajo incertidumbre sin necesidad de
desarrollar todos los posibles resultados del experimento y de acuerdo con
las caractersticas de la situacin.

4.2

DISTRIBUCIN O FUNCIN DE PROBABILIDAD

Como ya se vio al principio del mdulo, las variables aleatorias son aquellas
que se asocian a la ocurrencia de un fenmeno aleatorio. Cuando una de
Estadstica

187

estas variables aleatorias toma diversos valores, la probabilidad asociada a


cada uno de tales valores puede ser organizada como una distribucin de
probabilidad, la cual es la distribucin de las probabilidades asociadas a cada
uno de los valores de la variable aleatoria.
Las distribuciones de probabilidad pueden representarse a travs de una
tabla, una grfica o una frmula, en cuyo caso a

tal regla de

correspondencia se le denomina funcin de probabilidad.

Existen dos tipos de distribuciones; distribuciones de probabilidad para


variables discretas y para variables continuas.

Para una variable discreta, la distribucin de probabilidades es, por lo


general, una tabla que asocia una probabilidad a cada valor que puede tomar
la variable aleatoria. La probabilidad de que la variable est dentro de un
rango de valores se halla por medio de la suma de todos los enteros que
estn dentro del rango, incluyendo los extremos. Por ejemplo:

Al considerar las variables continuas se encuentra uno el problema de que,


lo ms probable, los datos que se puedan recabar no sean completamente
exactos, o dos o ms de ellos no coincidan, por lo que se tienen que trabajar
en intervalos y, en ese momento, modelar una funcin se convierte en un
problema serio.
Sin embargo, se pueden realizar aproximaciones y describir la probabilidad a
travs de modelos tericos de probabilidad cuya grfica es una lnea
continua, a diferencia de las variables discretas que les corresponde un
Estadstica

188

histograma. La probabilidad de que la variable est dentro de un rango de


valores no se puede hallar por medio de la suma, dado que sera una suma
infinita; en estos casos la probabilidad se halla por medio de la integral
definida o sea:

En distribuciones continuas de probabilidad, la probabilidad de que X tome


un valor exacto es igual a cero; esto quiere decir que no existe la igualdad.

NO OLVIDAR!

Estadstica

189

4.2.1 Paralelo entre la distribucin discreta y la continua de

probabilidad

Condiciones para que

DISCRETA
1.

CONTINUA

sea distribucin de
probabilidad
2.

Esperanza
matemtica

Varianza matemtica

4.3

ALGUNAS DISTRIBUCIONES DISCRETAS DE


PROBABILIDAD

4.3.1 Distribucin binomial


4.3.1.1 Caractersticas
Estadstica

190

En cada prueba del experimento slo son posibles dos resultados: el


suceso A y su contrario A, como por ejemplo, defectuoso-no
defectuoso, gan-perdi, sobrevivi-no sobrevivi, cara-sello, etc.

El suceso A se conoce como xito (se representa por p) y el suceso


contrario A se conoce como fracaso (se representa por q y es igual a
1-p.

El resultado obtenido en cada prueba es independiente de los


resultados obtenidos anteriormente.

El xito y, por ende, el fracaso se dan en trminos de probabilidad y


son parmetros poblacionales obtenidos de conocimientos

y/o

experiencias de estudios anteriores.

El experimento consta de un nmero n de pruebas o muestras.

El objetivo de la distribucin binomial es buscar la probabilidad de


xito en la muestra

Todo experimento que tenga estas caractersticas se dice que sigue el


modelo de la distribucin binomial.
A la variable x, que expresa el nmero de xitos obtenidos en cada prueba
del experimento, se le llama variable aleatoria binomial.
La variable binomial es una variable aleatoria discreta y slo puede tomar
los valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas.
4.3.1.2
Estadstica

Funcin de probabilidad de la v.a. binomial


191

Funcin de probabilidad de la distribucin binomial, para hallar la


probabilidad de obtener x-xitos en la muestra.

Ejemplo 1
La probabilidad de que una determinada vacuna surta efecto es de 0.8.
Calcule la probabilidad de

que una vez administrada a 15 pacientes:

a)

A ninguno le surta efecto

b)

A 12 les surta efecto.

c)

A mximo 3 no les surta efecto.

d)

A mnimo 13 les surta efecto

e).

De 10 a 12 no les surta efecto

Solucin:
Se trata de una distribucin binomial con los siguientes parmetros:

a).

Probabilidad de que la vacuna surta efecto:

0.8

Probabilidad de que la vacuna no surta efecto

0.2

Tamao de muestra:

15

Para la primera pregunta: la probabilidad de que a ninguno le surta

efecto, el :
Estadstica

192

xito poblacional p=0.8

Fracaso poblacional q=0.2

xito de la muestra= a ninguno de la muestra, les surta efecto o sea


P(x=0)

No hay posibilidad de que de los 15, a ninguno le surta efecto


b).

Para la probabilidad de que a 12 les surta efecto,

el

xito poblacional p=0.8

Fracaso poblacional q=0.2

xito de la muestra= a 12 de la muestra, les surta efecto o sea


P(x=12)

La posibilidad de que de los 15 a 12 les surta efecto es de un 25.01%


c)

Para la probabilidad de que a mximo 3 no les surta efecto, el:

xito poblacional p=0.2

Fracaso poblacional q=0.8

xito de la muestra= a 0, 1 ,2 o 3 de los de la muestra, no les surta


efecto o sea

Estadstica

193

La posibilidad de que de los 15, a mximo 3 no les surta efecto, es de 64.89%.


d)

Para la probabilidad de que mnimo a 13 les surta efecto, el:

xito poblacional p=0.8

Fracaso poblacional q=0.2

xito de la muestra= a 13,14 o 15 de los de la muestra, les surta


efecto, o sea,

La posibilidad de que de los 15, a mnimo 13 les surta efecto es de 39.8%.


e).

Para la probabilidad de que, de 10 a 12 no les surta efecto, el:

Estadstica

194

xito poblacional p=0.2

Fracaso poblacional q=0.8

xito de la muestra= a 10,11 o 12 de los de la muestra, no les surta


efecto, o sea,

No hay posibilidad de que de los 15, a 10,11 12 no les surta efecto la


vacuna.

Ejemplo 2
Una empresa productora sabe por experiencia que el 10% de sus artculos
salen defectuosos. Un cliente interesado en los artculos decide hacer un
pedido significativo, siempre y cuando al seleccionar una muestra aleatoria
de tamao 5, no ms de un artculo salga defectuoso.

Cul es la

probabilidad de que haga el pedido?

Solucin:
Estadstica

195

Se trata de una distribucin binomial con los siguientes parmetros:


Probabilidad de xito:

p= 0.1

Probabilidad de fracaso:

q=0.9

Tamao de muestra:

n=5

Criterio de aceptacin o compra: encontrar en la muestra mximo 10


artculos defectuosos o sea,

La posibilidad de que el cliente compre es de un 91.86%

4.3.1.3

Tablas de probabilidad acumulada de la distribucin binomial

En muchos casos, hallar la probabilidad resulta largo y se tiene mayor riesgo


de una equivocacin en su clculo.

Para solucionar esto, se crearon unas

tablas de probabilidad acumulada que facilitan la solucin de problemas


binomiales.
La tabla acumulada de probabilidad binomial tiene los siguientes parmetros:

(ver anexo A)
Estadstica

196

Nmero de xitos en la muestra


(CONTINUACIN)

TABLA ACUMULADA DE LA DISTRIBUCIN BINOMIAL

Probabilidad de xito p

p
n

0,10

0
1
2
3
4
5
6
7
8
9
Tamao de

0,20

0,25

0,30

0,40

0,50

0,60

0,70

0,80

0,90

0,3874
0,1342
0,7748
0,4362
0,9470
0,7382
0,9917
0,9144
0,9991
0,9804
0,9999
0,9969
1,0000
0,9997
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
muestra
n

0,0751
0,3003
0,6007
0,8343
0,9511
0,9900
0,9987
0,9999
1,0000
1,0000

0,0404
0,1960
0,4628
0,7297
0,9012
0,9747
0,9957
0,9996
1,0000
1,0000

0,0101
0,0705
0,2318
0,4826
0,7334
0,9006
0,9750
0,9962
0,9997
1,0000

0,0020
0,0195
0,0898
0,2539
0,5000
0,7461
0,9102
0,9805
0,9980
1,0000

0,0003
0,0038
0,0250
0,0994
0,2666
0,5174
0,7682
0,9295
0,9899
1,0000

0,0000
0,0004
0,0043
0,0253
0,0988
0,2703
0,5372
0,8040
0,9596
1,0000

0,0000
0,0000
0,0003
0,0031
0,0196
0,0856
0,2618
0,5638
0,8658
1,0000

0,0000
0,0000
0,0000
0,0001
0,0009
0,0083
0,0530
0,2252
0,6126
1,0000

Para trabajar con la tabla binomial se deben seguir los siguientes pasos: (ver
tabla anterior)
1. Matematizar la pregunta.
2. Como la tabla es acumulada, se debe llevar la pregunta a menor e igual
, con la siguientes reglas:
a.
b.
c.
d.
e.
f.
g.
Estadstica

197

3. Se busca en la primera columna el tamao de la muestra n


4. Se busca en la primera fila la probabilidad de xito p
5. Se busca en la segunda columna el valor de X.
6. La interseccin entre la segunda columna
probabilidad acumulada. O sea la

(x) y el valor de p, es la

Ejemplo 3
Volviendo al ejemplo 6.1, y resolvindolo por medio de la tabla acumulada
binomial, se tiene:
a)

A ninguno le surta efecto

xito poblacional p=0.8

Fracaso poblacional q=0.2

xito de la muestra= a ninguno de la muestra, les surta efecto o sea


P(x=0)
p

b).

0,10

0,20

0,25

0,30

0,40

0,50

0,60

0,70

0,80

0,90

15

0,2059

0,0352

0,0134

0,0047

0,0005

0,0000

0,0000

0,0000

0,0000

0,0000

0,5490

0,1671

0,0802

0,0353

0,0052

0,0005

0,0000

0,0000

0,0000

0,0000

0,8159

0,3980

0,2361

0,1268

0,0271

0,0037

0,0003

0,0000

0,0000

0,0000

0,9444

0,6482

0,4613

0,2969

0,0905

0,0176

0,0019

0,0001

0,0000

0,0000

0,9873

0,8358

0,6865

0,5155

0,2173

0,0592

0,0093

0,0007

0,0000

0,0000

0,9978

0,9389

0,8516

0,7216

0,4032

0,1509

0,0338

0,0037

0,0001

0,0000

0,9997

0,9819

0,9434

0,8689

0,6098

0,3036

0,0950

0,0152

0,0008

0,0000

1,0000

0,9958

0,9827

0,9500

0,7869

0,5000

0,2131

0,0500

0,0042

0,0000

1,0000

0,9992

0,9958

0,9848

0,9050

0,6964

0,3902

0,1311

0,0181

0,0003

1,0000

0,9999

0,9992

0,9963

0,9662

0,8491

0,5968

0,2784

0,0611

0,0022

10

1,0000

1,0000

0,9999

0,9993

0,9907

0,9408

0,7827

0,4845

0,1642

0,0127

11

1,0000

1,0000

1,0000

0,9999

0,9981

0,9824

0,9095

0,7031

0,3518

0,0556

12

1,0000

1,0000

1,0000

1,0000

0,9997

0,9963

0,9729

0,8732

0,6020

0,1841

13

1,0000

1,0000

1,0000

1,0000

1,0000

0,9995

0,9948

0,9647

0,8329

0,4510

14

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9995

0,9953

0,9648

0,7941

15

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

Para la probabilidad de que a 12 les surta efecto,

Estadstica

198

xito poblacional p=0.8

Fracaso poblacional q=0.2

Tamao de muestra n=15

p
n

0,10

0,20

0,25

0,30

0,40

0,50

0,60

0,70

0,80

0,90

15

0,2059

0,0352

0,0134

0,0047

0,0005

0,0000

0,0000

0,0000

0,0000

0,0000

0,5490

0,1671

0,0802

0,0353

0,0052

0,0005

0,0000

0,0000

0,0000

0,0000

0,8159

0,3980

0,2361

0,1268

0,0271

0,0037

0,0003

0,0000

0,0000

0,0000

0,9444

0,6482

0,4613

0,2969

0,0905

0,0176

0,0019

0,0001

0,0000

0,0000

0,9873

0,8358

0,6865

0,5155

0,2173

0,0592

0,0093

0,0007

0,0000

0,0000

0,9978

0,9389

0,8516

0,7216

0,4032

0,1509

0,0338

0,0037

0,0001

0,0000

0,9997

0,9819

0,9434

0,8689

0,6098

0,3036

0,0950

0,0152

0,0008

0,0000

1,0000

0,9958

0,9827

0,9500

0,7869

0,5000

0,2131

0,0500

0,0042

0,0000

1,0000

0,9992

0,9958

0,9848

0,9050

0,6964

0,3902

0,1311

0,0181

0,0003

1,0000

0,9999

0,9992

0,9963

0,9662

0,8491

0,5968

0,2784

0,0611

0,0022

10

1,0000

1,0000

0,9999

0,9993

0,9907

0,9408

0,7827

0,4845

0,1642

0,0127

11

1,0000

1,0000

1,0000

0,9999

0,9981

0,9824

0,9095

0,7031

0,3518

0,0556

12

1,0000

1,0000

1,0000

1,0000

0,9997

0,9963

0,9729

0,8732

0,6020

0,1841

13

1,0000

1,0000

1,0000

1,0000

1,0000

0,9995

0,9948

0,9647

0,8329

0,4510

14

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9995

0,9953

0,9648

0,7941

15

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

c)

Para la probabilidad de que a mximo 3 no les surta efecto, el:

xito poblacional p=0.2

Fracaso poblacional q=0.8

Tamao de muestra n=15

Estadstica

199

p
n

0,10

0,20

0,25

0,30

0,40

0,50

0,60

0,70

0,80

0,90

15

0,2059

0,0352

0,0134

0,0047

0,0005

0,0000

0,0000

0,0000

0,0000

0,0000

0,5490

0,1671

0,0802

0,0353

0,0052

0,0005

0,0000

0,0000

0,0000

0,0000

0,8159

0,3980

0,2361

0,1268

0,0271

0,0037

0,0003

0,0000

0,0000

0,0000

0,9444

0,6482

0,4613

0,2969

0,0905

0,0176

0,0019

0,0001

0,0000

0,0000

0,9873

0,8358

0,6865

0,5155

0,2173

0,0592

0,0093

0,0007

0,0000

0,0000

0,9978

0,9389

0,8516

0,7216

0,4032

0,1509

0,0338

0,0037

0,0001

0,0000

0,9997

0,9819

0,9434

0,8689

0,6098

0,3036

0,0950

0,0152

0,0008

0,0000

1,0000

0,9958

0,9827

0,9500

0,7869

0,5000

0,2131

0,0500

0,0042

0,0000

1,0000

0,9992

0,9958

0,9848

0,9050

0,6964

0,3902

0,1311

0,0181

0,0003

1,0000

0,9999

0,9992

0,9963

0,9662

0,8491

0,5968

0,2784

0,0611

0,0022

10

1,0000

1,0000

0,9999

0,9993

0,9907

0,9408

0,7827

0,4845

0,1642

0,0127

11

1,0000

1,0000

1,0000

0,9999

0,9981

0,9824

0,9095

0,7031

0,3518

0,0556

12

1,0000

1,0000

1,0000

1,0000

0,9997

0,9963

0,9729

0,8732

0,6020

0,1841

13

1,0000

1,0000

1,0000

1,0000

1,0000

0,9995

0,9948

0,9647

0,8329

0,4510

14

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9995

0,9953

0,9648

0,7941

15

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

d)

Para la probabilidad de que mnimo a 13 les surta efecto, el:

xito poblacional p=0.8

Fracaso poblacional q=0.2

Tamao de muestra n=15

p
n

0,10

0,20

0,25

0,30

0,40

0,50

0,60

0,70

0,80

0,90

15

0,2059

0,0352

0,0134

0,0047

0,0005

0,0000

0,0000

0,0000

0,0000

0,0000

0,5490

0,1671

0,0802

0,0353

0,0052

0,0005

0,0000

0,0000

0,0000

0,0000

0,8159

0,3980

0,2361

0,1268

0,0271

0,0037

0,0003

0,0000

0,0000

0,0000

0,9444

0,6482

0,4613

0,2969

0,0905

0,0176

0,0019

0,0001

0,0000

0,0000

0,9873

0,8358

0,6865

0,5155

0,2173

0,0592

0,0093

0,0007

0,0000

0,0000

0,9978

0,9389

0,8516

0,7216

0,4032

0,1509

0,0338

0,0037

0,0001

0,0000

0,9997

0,9819

0,9434

0,8689

0,6098

0,3036

0,0950

0,0152

0,0008

0,0000

1,0000

0,9958

0,9827

0,9500

0,7869

0,5000

0,2131

0,0500

0,0042

0,0000

1,0000

0,9992

0,9958

0,9848

0,9050

0,6964

0,3902

0,1311

0,0181

0,0003

1,0000

0,9999

0,9992

0,9963

0,9662

0,8491

0,5968

0,2784

0,0611

0,0022

10

1,0000

1,0000

0,9999

0,9993

0,9907

0,9408

0,7827

0,4845

0,1642

0,0127

11

1,0000

1,0000

1,0000

0,9999

0,9981

0,9824

0,9095

0,7031

0,3518

0,0556

12

1,0000

1,0000

1,0000

1,0000

0,9997

0,9963

0,9729

0,8732

0,6020

0,1841

13

1,0000

1,0000

1,0000

1,0000

1,0000

0,9995

0,9948

0,9647

0,8329

0,4510

14

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9995

0,9953

0,9648

0,7941

15

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

Estadstica

200

e) Para la probabilidad de que, de 10 a 12 no les surta efecto, el:

xito poblacional p=0.2

Fracaso poblacional q=0.8

Tamao de muestra n=15

(Ver anexo tablas de probabilidad)

4.3.1.4

Parmetros de la distribucin binomial

Media

=np

Varianza

2 = npq

Desviacin tpica

= npq

Ejemplo 4
La probabilidad de que el carburador de un coche salga de fbrica
defectuoso es del 8 por 100. Hallar:
a) El nmero de carburadores defectuosos Esperados en un lote de 548
b) La varianza y la desviacin tpica.
Solucin:
Estadstica

201

Parmetros:
Probabilidad de xito:
Probabilidad de fracasos:
Tamao de muestra= 548
a)
b)

Interpretacin
En promedio se espera que salgan aproximadamente 44 carburadores
defectuosos, con una variacin de aproximadamente 6 carburadores.

4.3.2 DISTRIBUCIN HIPERGEOMTRICA


Los experimentos que tienen este tipo de distribucin tienen las siguientes
caractersticas:
a) Igual que en la distribucin binomial, trabaja con los experimentos que
tienen solo dos resultados posibles.
b) Se conoce el tamao de la poblacin. La poblacin se obtiene por lo
general por medio de un lote, produccin, caja, o sea, un total, del cual se
extrae una muestra aleatoria para ser analizada.
c) De la poblacin se tienen dos caractersticas:
Estadstica

Una llamada xito (se denota por K)


202

Otra llamada fracaso (se denota por N-K)

d) El xito y el fracaso poblacional de la distribucin se dan en trminos de


cantidad y son obtenidos por experiencia y/o estudios anteriores.
e)

Cada ensayo o repeticin del experimento no es independiente de los


dems.

d)

Se selecciona una muestra aleatoria de tamao n y se busca la


probabilidad de exitos (x) en la muestra.

4.3.2.1

Funcin de probabilidad de la v.a. hipergeomtrica

En estadstica, la distribucin hipergeomtrica es una distribucin de


probabilidad discreta con tres parmetros discretos N, k y n cuya funcin de
probabilidad es:

Ejemplos 5:
Si de un lote de 25 artculos se sabe que 5 estn defectuosos, hallar las
siguientes probabilidades en una muestra de 8 artculos seleccionados del
lote aleatoriamente.
a) Probabilidad de que de los 8, salgan 3 defectuosos.
b) Probabilidad de que de los 8, salgan 6 buenos.
c) Probabilidad de que de los 8, salgan mnimo 4 defectuosos.
d) Probabilidad de que de los 8, salgan entre 3 y 4 buenos.

Estadstica

203

e) Se considera aceptable el lote, si en la muestra todos estn

buenos.

Cul es la probabilidad de que se acepte el lote?


Solucin:
Parmetros

Tamao de poblacin N=25

Caractersticas de la poblacin:

Cantidad de artculos defectuosos= 5

Cantidad de artculos buenos= 20

Tamao de la muestra

n=8

a) Para la probabilidad de que de los 8, salgan 3 defectuosos, se tiene:


N= 25
K= 5 (recordar que la muestra y la poblacin deben contener el mismo
sentido de xito)
N-K=20
n=8

La probabilidad de que salgan 3 defectuosos es de un 14.33%

b) Para la probabilidad de que de los 8, salgan 6 buenos.


Estadstica

204

N= 25
K= 20 (recordar que la muestra y la poblacin deben contener el mismo
sentido de xito)
N-K=5
n=8

La probabilidad de que de los 8, salgan 6 buenos es de 35.84%


c) Para la probabilidad de que de los 8, salgan mnimo 4 defectuosos.
N= 25
K= 5 (recordar que la muestra y la poblacin deben contener el mismo
sentido de xito)
N-K=20
n=8

Tener en cuenta que aunque el tamao de la


muestra es 8 no se pueden encontrar ni 6, 7 u 8
defectuosos, ya que en la poblacin hay mximo
5 defectuosos

Esto quiere decir que la

Estadstica

205

La probabilidad de que de los 8 salgan mnimo 4 defectuosos es 2.35%


d) Para la probabilidad de que de los 8, salgan entre 3 y 4 buenos.
N= 25
K= 20
N-K=5
n=8

La probabilidad de que de los 8 salgan entre 3 y 4 buenos es de 2.35%.


e) Para aceptar el lote, deben existir todos buenos o cero malos. O sea, que
se soluciona de cualquiera de las dos maneras, sin cambiar el resultado:
Todos buenos

Cero defectuosos

N= 25

N=25

K= 20

K=5

N-K=5

N-K=20

n=8

n=8

Estadstica

206

La probabilidad de que se acepte el lote es de 11.65%


Ejemplos 6:
Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas
de narctico en una botella que contiene 9 pldoras de vitamina que son
similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas
aleatoriamente para analizarlas, cul es la probabilidad de que el viajero
sea arrestado por posesin de narcticos?
Solucin:
N = 9+6 =15 total de tabletas
K= 6 tabletas de narctico
N-K= 9
n = 3 tabletas seleccionadas
x = 0, 1, 2, o 3 tabletas de narctico = variable que indica el nmero de
tabletas de narctico que se pueden encontrar al seleccionar las 3 tabletas
P(viajero sea arrestado por posesin de narcticos) = p(de que entre las 3
tabletas seleccionadas haya 1 o ms tabletas de narctico)

Estadstica

207

Existe un 81.54% de posibilidad de que el viajero sea arrestado por


posesin ilegal de narcticos.

4.3.2.2 Parmetros de la distribucin hipergeomtrica


Media
Varianza

4.3.3 DISTRIBUCIN DE POISSON

La distribucin de Poisson es una distribucin de probabilidad discreta.


Trabaja con la probabilidad de ocurrencia en un tiempo determinado o regin
especfica, teniendo como parmetro de la distribucin el promedio de
ocurrencias en el mismo intervalo de tiempo o regin especfica.

Por

ejemplo, el nmero de llamadas telefnicas que entran a un conmutador por


hora; nmero de personas que se inscriben a la universidad por semestre,
nmero de artculos defectuosos que salen por hora, etc.

Condicin: Los eventos deben ser independientes.

4.3.3.1

Estadstica

Funcin de probabilidad de la v.a. Poisson

208

Su distribucin de probabilidad est dada por

Donde:
es la base del logaritmo natural= (e = 2.71828...),

x!

es el factorial de x,

es un nmero real positivo, equivalente al nmero esperado de


ocurrencias durante un intervalo dado.

4.3.3.2 Tablas de probabilidad acumulada de la distribucin Poisson


Como en la distribucin binomial, existen tablas que facilitan el clculo de las
probabilidades. La tabla de distribucin Poisson tambin es acumulada y
necesita llevar las preguntas a menor e igual ( ).
La tabla acumulada de probabilidad Poisson tiene los siguientes parmetros:
(Ver anexo B)

Estadstica

209

0,1

0,2

0,30

0,4

0,5

0,6

0,7

0,8

0,9

0,9048

0,8187

0,7408

0,6703

0,6065

0,5488

0,4966

0,4493

0,4066

0,9953

0,9825

0,9631

0,9384

0,9098

0,8781

0,8442

0,8088

0,7725

0,9998

0,9989

0,9964

0,9921

0,9856

0,9769

0,9659

0,9526

0,9371

1,0000

0,9999

0,9997

0,9992

0,9982

0,9966

0,9942

0,9909

0,9865

1,0000

1,0000

1,0000

0,9999

0,9998

0,9996

0,9992

0,9986

0,9977

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9998

0,9997

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

Para trabajar con la tabla Poisson se siguen los siguientes pasos: (ver tabla
anterior)
1. Matematizar la pregunta.
2. Como la tabla es acumulada, se lleva la pregunta a menor e igual

con la siguientes reglas:


a.
b.
c.
d.
e.
f.
g.
3. Se busca en la primera fila el valor del promedio
4. Se busca en la primera columna el valor de la variable x
5. La interseccin entre la fila y la columna es la probabilidad acumulada.
O sea la
Estadstica

.
210

EJEMPLO 7
Si en promedio ocurren 5 accidentes por da, hallar las siguientes
probabilidades:
a).

Probabilidad de que en un da ocurran 3 accidentes.

b).

Probabilidad de que en un da ocurran ms de 2 accidentes.

c).

Probabilidad de que en un da ocurran menos de 4 accidentes.

d).

Probabilidad de que en un da ocurran entre 4 y 6 accidentes.

e).

Probabilidad de que en un MEDIO da ocurra 1 accidente.

Solucin
Parmetro:
Promedio de accidentes por da.
Observacin: cada pregunta se resuelve tanto por frmula como por tabla
para comprobar el resultado.
a).

Para la probabilidad de que en un da ocurran 3 accidentes.

Por frmula:

Por tabla: ver reglas para manejo de tablas Poisson

La probabilidad de que en un da ocurran 3 accidentes es de 14.03%.


Estadstica

211


x
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

b).

1,5

2,5

3,5

4,5

0,3679
0,7358
0,9197
0,9810
0,9963
0,9994
0,9999
1,0000

0,2231
0,5578
0,8088
0,9344
0,9814
0,9955
0,9991
0,9998
1,0000

0,1353
0,4060
0,6767
0,8571
0,9473
0,9834
0,9955
0,9989
0,9998
1,0000

0,0821
0,2873
0,5438
0,7576
0,8912
0,9580
0,9858
0,9958
0,9989
0,9997
0,9999
1,0000

0,0498
0,1991
0,4232
0,6472
0,8153
0,9161
0,9665
0,9881
0,9962
0,9989
0,9997
0,9999
1,0000

0,0302
0,1359
0,3208
0,5366
0,7254
0,8576
0,9347
0,9733
0,9901
0,9967
0,9990
0,9997
0,9999
1,0000

0,0183
0,0916
0,2381
0,4335
0,6288
0,7851
0,8893
0,9489
0,9786
0,9919
0,9972
0,9991
0,9997
0,9999
1,0000

0,0111
0,0611
0,1736
0,3423
0,5321
0,7029
0,8311
0,9134
0,9597
0,9829
0,9933
0,9976
0,9992
0,9997
0,9999
1,0000

0,0067
0,0404
0,1247
0,2650
0,4405
0,6160
0,7622
0,8666
0,9319
0,9682
0,9863
0,9945
0,9980
0,9993
0,9998
0,9999
1,0000

Para la probabilidad de que en un da ocurran ms de 2 accidentes.

Por frmula:

Como no se conoce el tamao de la


muestra, no se sabe hasta dnde va la
suma.
Pero
por
definicin
de
probabilidad se sabe que

Estadstica

212

Por tabla: ver reglas para manejo de tablas Poisson

La probabilidad de que en un da ocurran ms de 2 accidentes es de 87.54%.

x
0
1
2
3
4

c).

1,5

2,5

3,5

4,5

0,3679
0,7358
0,9197
0,9810
0,9963

0,2231
0,5578
0,8088
0,9344
0,9814

0,1353
0,4060
0,6767
0,8571
0,9473

0,0821
0,2873
0,5438
0,7576
0,8912

0,0498
0,1991
0,4232
0,6472
0,8153

0,0302
0,1359
0,3208
0,5366
0,7254

0,0183
0,0916
0,2381
0,4335
0,6288

0,0111
0,0611
0,1736
0,3423
0,5321

0,0067
0,0404
0,1247
0,2650
0,4405

Para la probabilidad de que en un da ocurran menos de 4 accidentes.

Por frmula:

Estadstica

213

Por tabla:

La probabilidad de que en un da ocurran menos de 4 accidentes es de


26.50%

x
0
1
2
3
4
5
6
7
8

d).

1,5

2,5

3,5

4,5

0,3679
0,7358
0,9197
0,9810
0,9963
0,9994
0,9999
1,0000

0,2231
0,5578
0,8088
0,9344
0,9814
0,9955
0,9991
0,9998
1,0000

0,1353
0,4060
0,6767
0,8571
0,9473
0,9834
0,9955
0,9989
0,9998

0,0821
0,2873
0,5438
0,7576
0,8912
0,9580
0,9858
0,9958
0,9989

0,0498
0,1991
0,4232
0,6472
0,8153
0,9161
0,9665
0,9881
0,9962

0,0302
0,1359
0,3208
0,5366
0,7254
0,8576
0,9347
0,9733
0,9901

0,0183
0,0916
0,2381
0,4335
0,6288
0,7851
0,8893
0,9489
0,9786

0,0111
0,0611
0,1736
0,3423
0,5321
0,7029
0,8311
0,9134
0,9597

0,0067
0,0404
0,1247
0,2650
0,4405
0,6160
0,7622
0,8666
0,9319

Para la probabilidad de que en un da ocurran entre 4 y 6 accidentes.

Por frmula:

Estadstica

214

Por tabla: ver reglas para manejo de tablas Poisson

La probabilidad de que en un da ocurran entre 4 y 6 accidentes es de


49.72%.
e).

Probabilidad de que en un MEDIO da ocurra 1 accidente.

Como la variable de inters x, tiene que tener la misma


unidad de medida del promedio, entonces
u

Por frmula:

Por tabla: ver reglas para manejo de tablas Poisson

Estadstica

215


x
x
0
1
2
3
4
5
6
7

1
1,0000
0,3679
0,7358
0,9197
0,9810
0,9963
0,9994
0,9999
1,0000

1,5
1,5000
0,2231
0,5578
0,8088
0,9344
0,9814
0,9955
0,9991
0,9998

2
2,0000
0,1353
0,4060
0,6767
0,8571
0,9473
0,9834
0,9955
0,9989

2,5
2,5000
0,0821
0,2873
0,5438
0,7576
0,8912
0,9580
0,9858
0,9958

3
3,0000
0,0498
0,1991
0,4232
0,6472
0,8153
0,9161
0,9665
0,9881

3,5
3,5000
0,0302
0,1359
0,3208
0,5366
0,7254
0,8576
0,9347
0,9733

La probabilidad de que en un MEDIO da ocurra 1 accidente es de 20.52%.

4.3.3.3

Parmetros de la distribucin Poisson


Media
Varianza

4.4

DISTRIBUCIN CONTINUA DE PROBABILIDAD:


DISTRIBUCIN NORMAL

La distribucin normal, tambin llamada distribucin de Gauss o distribucin


gaussiana, es la distribucin continua de probabilidad ms importante de
toda la Estadstica, debido a que su funcin de densidad es simtrica y con
forma de campana, lo que favorece su aplicacin como modelo a gran
nmero de variables estadsticas.

Estadstica

216

4.4.1 Funcin de densidad de la distribucin normal

Donde:

Media
Varianza

Desviacin estndar

4.4.2 Representacin grfica de esta funcin de densidad

Estadstica

217

4.4.3 Distribucin normal estndar


La probabilidad de que la

variable aleatoria (que sigue una distribucin

normal) se encuentre entre dos valores determinados ser en general difcil


de calcular (hay que usar la integral de la funcin de probabilidad). Para ello,
existen tablas que dan estos valores directamente.

Dado que la variable de inters X, puede tomar valores < X < , se


tipifica la variable de inters para as poder trabajar con la tabla, quedando la
distribucin normal, como una distribucin normal tipificada con

= 0 y = 1.
Para tipificar la variable de inters X, se lleva a la frmula:

4.4.4 Pasos para buscar en la tabla (ver anexo C)


1.
2.

Plantear la pregunta matemticamente.


Dado que las tablas son acumulativas, se lleva la pregunta a
menor. Utilizando las siguientes reglas:

1.

Se tipifica cada valor de X utilizando la frmula:

Estadstica

218

Z=

2.

x
.

El valor de Z debe quedar con dos decimales.

Para buscar en la tabla, tanto el signo como el entero y el primer


decimal, se encuentra en la primera columna. El segundo decimal se
encuentra en la primera fila. La interseccin entre la fila y la columna es
la respectiva probabilidad.

Ejemplo. Suponga que Z=0.43, luego p ( z < 0.43) = 0.6664


Z

0,00

0,01

0,02

0,03

0,04

0,05

0,0

0,5000

0,5040

0,5080

0,5120

0,5160

0,5199

0,1

0,5398

0,5438

0,5478

0,5517

0,5557

0,5596

0,2

0,5793

0,5832

0,5871

0,5910

0,5948

0,5987

0,3

0,6179

0,6217

0,6255

0,6293

0,6331

0,6368

0,4

0,6554

0,6591

0,6628

0,6664

0,6700

0,6736

0,5

0,6915

0,6950

0,6985

0,7019

0,7054

0,7088

0,6

0,7257

0,7291

0,7324

0,7357

0,7389

0,7422

0,7

0,7580

0,7611

0,7642

0,7673

0,7704

0,7734

0,8

0,7881

0,7910

0,7939

0,7967

0,7995

0,8023

0,9

0,8159

0,8186

0,8212

0,8238

0,8264

0,8289

1,0

0,8413

0,8438

0,8461

0,8485

0,8508

0,8531

Ejemplo 8
El

peso

promedio

de

aproximadamente normal

las

bolsas

de

caf

tiene

una

distribucin

con un peso promedio de 501 gramos y una

desviacin estndar de 15 gramos.


a.

Cul es la probabilidad de que una bolsa de caf tenga un peso menor


a 532.05 gms?

b.

Cul es la probabilidad de que una bolsa de caf tenga un peso mayor


a 448.5 gms?

Estadstica

219

c.

Cul es la probabilidad de que una bolsa de caf tenga un peso entre


456 y 513.75 gms?

d.

Cual es el peso mximo para que cubra el 59.10% de las bolsas de


caf?

Solucin:
Sea X la variable de inters que significa el peso de las bolsas de caf.
Parmetros:
Peso promedio de las bolsas de caf
Desviacin estndar

a. Para la probabilidad de que una bolsa de caf tenga un peso menor a


532.05 gms:

Estadstica

220

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,0

0,5000

0,5040

0,5080

0,5120

0,5160

0,5199

0,5239

0,5279

0,5319

0,5359

0,1

0,5398

0,5438

0,5478

0,5517

0,5557

0,5596

0,5636

0,5675

0,5714

0,5753

0,2

0,5793

0,5832

0,5871

0,5910

0,5948

0,5987

0,6026

0,6064

0,6103

0,6141

0,3

0,6179

0,6217

0,6255

0,6293

0,6331

0,6368

0,6406

0,6443

0,6480

0,6517

0,4

0,6554

0,6591

0,6628

0,6664

0,6700

0,6736

0,6772

0,6808

0,6844

0,6879

0,5

0,6915

0,6950

0,6985

0,7019

0,7054

0,7088

0,7123

0,7157

0,7190

0,7224

0,6

0,7257

0,7291

0,7324

0,7357

0,7389

0,7422

0,7454

0,7486

0,7517

0,7549

0,7

0,7580

0,7611

0,7642

0,7673

0,7704

0,7734

0,7764

0,7794

0,7823

0,7852

0,8

0,7881

0,7910

0,7939

0,7967

0,7995

0,8023

0,8051

0,8078

0,8106

0,8133

0,9

0,8159

0,8186

0,8212

0,8238

0,8264

0,8289

0,8315

0,8340

0,8365

0,8389

1,0

0,8413

0,8438

0,8461

0,8485

0,8508

0,8531

0,8554

0,8577

0,8599

0,8621

1,1

0,8643

0,8665

0,8686

0,8708

0,8729

0,8749

0,8770

0,8790

0,8810

0,8830

1,2

0,8849

0,8869

0,8888

0,8907

0,8925

0,8944

0,8962

0,8980

0,8997

0,9015

1,3

0,9032

0,9049

0,9066

0,9082

0,9099

0,9115

0,9131

0,9147

0,9162

0,9177

1,4

0,9192

0,9207

0,9222

0,9236

0,9251

0,9265

0,9279

0,9292

0,9306

0,9319

1,5

0,9332

0,9345

0,9357

0,9370

0,9382

0,9394

0,9406

0,9418

0,9429

0,9441

1,6

0,9452

0,9463

0,9474

0,9484

0,9495

0,9505

0,9515

0,9525

0,9535

0,9545

1,7

0,9554

0,9564

0,9573

0,9582

0,9591

0,9599

0,9608

0,9616

0,9625

0,9633

1,8

0,9641

0,9649

0,9656

0,9664

0,9671

0,9678

0,9686

0,9693

0,9699

0,9706

1,9

0,9713

0,9719

0,9726

0,9732

0,9738

0,9744

0,9750

0,9756

0,9761

0,9767

2,0

0,9772

0,9778

0,9783

0,9788

0,9793

0,9798

0,9803

0,9808

0,9812

0,9817

2,1

0,9821

0,9826

0,9830

0,9834

0,9838

0,9842

0,9846

0,9850

0,9854

0,9857

2,2

0,9861

0,9864

0,9868

0,9871

0,9875

0,9878

0,9881

0,9884

0,9887

0,9890

2,3

0,9893

0,9896

0,9898

0,9901

0,9904

0,9906

0,9909

0,9911

0,9913

0,9916

2,4

0,9918

0,9920

0,9922

0,9925

0,9927

0,9929

0,9931

0,9932

0,9934

0,9936

2,5

0,9938

0,9940

0,9941

0,9943

0,9945

0,9946

0,9948

0,9949

0,9951

0,9952

2,6

0,9953

0,9955

0,9956

0,9957

0,9959

0,9960

0,9961

0,9962

0,9963

0,9964

La probabilidad de que una bolsa de caf tenga un peso menor a 532.05 gms
es de 98.08%.
b. Para la probabilidad de que una bolsa de caf tenga un peso mayor a
448.5 gms:

Estadstica

221

0,00

0,01

0,02

0,03

0,04

-3,9

0,0000

0,0000

0,0000

0,0000

0,0000

-3,8

0,0001

0,0001

0,0001

0,0001

0,0001

-3,7

0,0001

0,0001

0,0001

0,0001

0,0001

-3,6

0,0002

0,0002

0,0001

0,0001

0,0001

-3,5

0,0002

0,0002

0,0002

0,0002

0,0002

-3,4

0,0003

0,0003

0,0003

0,0003

0,0003

La probabilidad de que una bolsa de caf tenga un peso mayor a 448.5 gms
es de 99.98%

c. Para la probabilidad de que una bolsa de caf tenga un peso entre 456 y
513.75 gms:

Estadstica

222

0,00

0,01

0,02

0,03

0,04

0,05

0,0

0,5000

0,5040

0,5080

0,5120

0,5160

0,5199

0,1

0,5398

0,5438

0,5478

0,5517

0,5557

0,5596

0,2

0,5793

0,5832

0,5871

0,5910

0,5948

0,5987

0,3

0,6179

0,6217

0,6255

0,6293

0,6331

0,6368

0,4

0,6554

0,6591

0,6628

0,6664

0,6700

0,6736

0,5

0,6915

0,6950

0,6985

0,7019

0,7054

0,7088

0,6

0,7257

0,7291

0,7324

0,7357

0,7389

0,7422

0,7

0,7580

0,7611

0,7642

0,7673

0,7704

0,7734

0,8

0,7881

0,7910

0,7939

0,7967

0,7995

0,8023

0,9

0,8159

0,8186

0,8212

0,8238

0,8264

0,8289

0,00

0,01

0,02

0,03

-3,9

0,0000

0,0000

0,0000

0,0000

-3,8

0,0001

0,0001

0,0001

0,0001

-3,7

0,0001

0,0001

0,0001

0,0001

-3,6

0,0002

0,0002

0,0001

0,0001

-3,5

0,0002

0,0002

0,0002

0,0002

-3,4

0,0003

0,0003

0,0003

0,0003

-3,3

0,0005

0,0005

0,0005

0,0004

-3,2

0,0007

0,0007

0,0006

0,0006

-3,1

0,0010

0,0009

0,0009

0,0009

-3,0

0,0013

0,0013

0,0013

0,0012

-2,9

0,0019

0,0018

0,0018

0,0017

d. 59.10% significa la probabilidad. Lo que interesa es conocer el peso


mximo (x) de las bolsas de caf que cubre dicho porcentaje o
probabilidad.
Se halla el valor de 0.5910 en la tabla normal, encontrando as el valor
de Z que le corresponde; luego se despeja el valor de X o variable de
inters.

Estadstica

223

0,00

0,01

0,02

0,03

0,0

0,5000

0,5040

0,5080

0,5120

0,1

0,5398

0,5438

0,5478

0,5517

0,2

0,5793

0,5832

0,5871

0,5910

0,3

0,6179

0,6217

0,6255

0,6293

0,4

0,6554

0,6591

0,6628

0,6664

0,5

0,6915

0,6950

0,6985

0,7019

El peso mximo para que cubre el 59.10% de las bolsas de caf es


504.45gms.

Ejemplo 9
La resistencia a la traccin de cierto componente de metal se distribuye
normalmente con una media de 10.000 kilogramos por centmetro cuadrado
y una desviacin estndar de 100 kilogramos por centmetro cuadrado.
a.

Qu proporcin de estos componentes excede 10.150 kilogramos por


centmetro cuadrado de resistencia a la traccin?

b.

Si las especificaciones requieren que todos los componentes tengan


resistencia a la traccin entre 9.800 y 10.200 kilogramos por centmetro

Estadstica

224

cuadrado inclusive, qu proporcin de piezas esperara que se


descartaran?
Solucin:
Sea X la variable de inters que significa la resistencia

a la traccin

(kilogramos/centmetros cuadrados).
Parmetros:
Resistencia promedio
Desviacin estndar
a.

El

6.68%

de

los

componentes

de

metal

excede

en

10.150

kilogramos/centmetros cuadrados a la resistencia a la traccin

b. Se

descartan

todas

las

piezas

que

estn

por

fuera

de

las

especificaciones.

Estadstica

225

O sea

El 4.56% de las piezas se descartarn, ya que no cumplen con las


especificaciones.

Estadstica

226

Estadstica

227

Estadstica

228

1.1

INTRODUCCIN

A manera de ejemplo, el rector de una universidad desea conocer la nota


promedio

de

Todos

los

estudiantes

que

cursaron

el

semestre

inmediatamente anterior y la proporcin de estudiantes que obtuvieron una


nota superior a 4.0.

Para solucionar el ejemplo anterior, se retoma todo lo visto anteriormente; se


saca una muestra aleatoria de

n estudiantes (ya sea por encuesta

directamente a los n-estudiantes o por datos histricos obtenidos de


Admisiones).

Con las n-notas se saca una nota promedio y se cuenta el nmero de


estudiantes que obtuvieron un promedio superior a 4.0. Para efecto del
ejemplo, se seleccion una muestra de 25 estudiantes con los siguientes
resultados:

ESTUDIANTE NOTA
NRO
PROMEDIO

1
2
3
4
5

Estadstica

3,8
4,3
4,5
4
3,3

ESTUDIANTE NOTA
NRO
PROMEDIO

6
7
8
9
10

3,5
4
4,1
3,6
3,2

ESTUDIANTE NOTA
NRO
PROMEDIO

11
12
13
14
15

3,5
3,8
4,2
4,8
4

ESTUDIANTE NOTA
NRO
PROMEDIO

16
17
18
19
20

4,3
3,2
3,5
3,8
3,6

ESTUDIANTE NOTA
NRO
PROMEDIO

21
22
23
24
25

3,8
3,6
3,5
4,2
3,5

229

Para hallar el promedio de la muestra, se trabaja con la media aritmtica. Y


para obtener la proporcin de estudiantes con una nota superior a 4.0, se
trabaja con la proporcin muestral. Al recordar sus frmulas, tenemos:
Para la nota promedio de todos los estudiantes:
X: Variable de inters que significa la nota promedio
: La nota promedio del estudiante i
n Tamao de la muestra que en este caso es igual a 25

Para la proporcin de estudiantes con una nota superior a 4.0:


x Total de estudiantes de la muestra que obtuvieron una nota superior a 4.0.
n Tamao de la muestra que en este caso es igual a 25
Para datos sin agrupar

De acuerdo con los datos, se tiene:

Estadstica

230

Interpretacin de resultados:
Los 25 estudiantes en el semestre anterior obtuvieron en promedio una nota
promedio de 3.8.
De los 25 estudiantes, el 28% obtuvo el semestre anterior una nota superior
a 4.0.

Ojo con la
interpretacin!

La interpretacin se puede dar solamente de los estudiantes que


pertenecieron a la muestra. Pero el inters en la investigacin es obtener
respuesta de todos los estudiantes, o sea, de la poblacin.

Todo el proceso anterior es muy vlido y necesario pero no suficiente. Lo


anterior es lo que se conoce como Estadstica Descriptiva, y se necesita
de otras herramientas de la Estadstica, para poder hablar de toda la
poblacin. Esto es lo que se conoce como Estadstica Inferencial, que es
el tema de esta parte del mdulo.

Estadstica

231

1.2 NIVEL DE CONFIABILIDAD DE LOS RESULTADOS

Cuando se selecciona una muestra aleatoria, el nivel de confiabilidad o


seguridad de los resultados ya no es del 100%, porque no se estn tomando
todos los datos; por lo tanto, la confiabilidad de un estudio o investigacin
depender del nivel de seguridad (porcentaje) con el cual se desea que los
parmetros estn contenidos en la muestra seleccionada. Los niveles de
confiabilidad deben ser mnimo del 95%; o sea, entre 95% y 99%; este valor
es escogido por el investigador o por el presupuesto de la investigacin,
aclarando que entre mayor sea el nivel de confianza mayor ser el costo del
estudio, dado que aumentar el tamao de la muestra.

1.3 PRINCIPALES PARMETROS, ESTADSTICAS Y SUS SMBOLOS

NOMBREPOBLACIN (PARMETRO)MUESTRA
(ESTADSTICO)TAMAO NnMEDIADESVIACIN
ESTNDARSVARIANZAPROPORCIN

Estadstica

232

1.4 ESTIMACIN PUNTUAL

Si a partir de las observaciones de una muestra se calcula un solo valor


como estimacin de un parmetro de la poblacin desconocido, el
procedimiento se denomina estimacin puntual. Existen bsicamente tres
parmetros muestrales:

1.4.1 Estimacin puntual para variable cuantitativa

Esencialmente son dos los parmetros de inters:

Media: se toma como aproximacin la media de la muestra. Al recordar


la frmula (Unidad 3 de Estadstica Descriptiva):

DATOS SIN AGRUPAR

Estadstica

DATOS AGRUPADOS

233

Varianza de la poblacin: se toma como aproximacin la cuasivarianza


de la muestra. Al recordar la frmula se tiene:

DATOS SIN AGRUPAR

DATOS AGRUPADOS

1.4.2 Estimacin puntual para variable cualitativa

Proporcin: se toma como aproximacin la proporcin muestral,

Estadstica

234

Casos favorables es el total de resultados de la muestra que cumple con la


condicin.

1.5 TAMAO DE LA MUESTRA PARA ESTIMAR MEDIAS Y


PROPORCIONES

El tamao de la muestra, un tema que siempre preocupa, no tiene fcil


solucin y va estrechamente unido a la representatividad.
No existe un tamao ideal de la muestra. A efectos descriptivos, se considera
una muestra grande cuando n > 30. Una muestra debe ser lo suficientemente
grande como para ser representativa, pero el nmero de elementos
necesarios para lograr la representatividad vara de una investigacin a otra.
Cuanto ms homognea es una poblacin en la/s caracterstica/s objeto de
estudio, ms fcil resulta obtener muestras representativas sin necesidad de
que sean grandes. Es decir, el tamao de la muestra est en relacin directa
con la desviacin tpica de las puntuaciones en la/s caractersticas de la
variable a investigar.
El tamao de la muestra puede dilucidarse en parte preguntndose por

La cuanta del error que es probable cometer al calcular diversos


estadsticos partiendo de muestras de diferente tamao.

Nivel de confianza: Es el porcentaje de confiabilidad con el cual se estima


la verdadera proporcin de xito. El nivel de confianza tiene relacin
directa con el tamao de la muestra, por lo tanto, se dir que a mayor

Estadstica

235

nivel de confianza ms grande debe ser el tamao de la muestra. El nivel


es fijado por el investigador, de acuerdo con su experiencia.

Por ejemplo: con un nivel de confianza del 95% se determinara que de 100
muestras aleatorias diferentes se podra esperar que la proporcin de xito
se encuentre en 95 de ellas.
Nivel de confianza 1- = 0.95.

1.5.1 Determinacin estadstica del tamao de la muestra


Conociendo el nivel de confianza que se quiere alcancen los datos, se puede
aplicar una ecuacin matemtica para estimar el tamao de la muestra.
Segn se trate de poblaciones infinitas o finitas, la determinacin variar,
segn las siguientes ecuaciones:

1.5.1.1

Poblaciones infinitas

En este caso pueden presentarse dos situaciones:


1.5.1.1.1 Proporcin conocida
Conociendo la proporcin de elementos que posee la caracterstica
a travs de estudios previos.
En este caso se aplica la frmula:

Estadstica

236

Z Valor de la distribucin normal que genera un nivel de confiabilidad 1 - .


P Proporcin de xito
Q Proporcin de fracaso = 1-P
E Error muestral admisible: El error muestral admisible es el error que se
est dispuesto a cometer en la precisin de la estimacin de la proporcin. O
sea, es el margen de error que el investigador fija de acuerdo con el
conocimiento que tenga acerca del parmetro que piensa estimar. No es
recomendable un margen de error superior al 5%.
Pasos para hallar el valor de Z:

Tomar el nivel de confiabilidad 1- =

Despejar el nivel de no confiabilidad

Hallar el valor de /2

Dicho resultado es restado de 1. = 1- /2

Buscar 1- /2 en la tabla normal (de adentro hacia afuera) y hallar el


valor de Z.

1.5.1.1.2 Proporcin desconocida


Si se desconoce la proporcin de individuos que poseen la caracterstica, se
toma p = 50% y q = 50%.
2
Estadstica

237

Ejemplo:
El nmero de elementos ptimo de una muestra, estimando qu proporcin
de sujetos poseen una caracterstica al nivel de confianza del 99.7% y un
error de estimacin admitido del 2%, ser:
p=q= 0.5 ya que no se conoce la proporcin
E = 0.02
Para hallar Z
Nivel de confiabilidad 1- = 0.997
Nivel de no confiabilidad = 0.003
Valor de /2 = 0.0015
1- /2= 1-0.0015=0.9985
Z=3.0
32*0.5.0.5
n = ------------------- = 5625 elementos.
0.022
1.5.1.2

Poblaciones infinitas

En este caso se emplea la siguiente frmula:

Estadstica

238

Ejemplo:
Revisar
El nmero ptimo para un estudio de 60.000 personas inscritas en cursos de
formacin, estableciendo un nivel de confianza de 95.5%, el margen de error
en el 3% y si suponemos que la opcin por inscribirse en cursos de
formacin, o no, es del 50%., sera:

Estadstica

239

2.1

INTRODUCCIN

Los resultados obtenidos sobre la nota promedio y la proporcin de alumnos


con una nota superior a 4.0, del ejemplo que se encuentra en la Introduccin
de la Unidad1, no son suficientes para poder hablar del promedio y la
proporcin poblacional; es necesario incluir otros mtodos y entre ellos est
el de los intervalos de confianza.
Una estimacin de intervalo es un intervalo de valores reales que se utiliza
para estimar un parmetro de poblacin. Aunque existen muchos parmetros
poblacionales desarrollados a partir de los resultados de una muestra, en
este mdulo solo se vern dos.
2.1.1 Intervalo de confianza para el promedio poblacional
A un nivel de confiabilidad del

, el intervalo de confianza para el

promedio poblacional se obtiene por medio de una de las siguientes


frmulas:

Condicin

Frmula
1

Estadstica

240

Si por estudios anteriores se tiene el parmetro

, se utiliza la

frmula 1.

Si no se tiene el parmetro

y el tamao de la muestra es mayor o

igual que 30, se utiliza la frmula 2.

Si no se tiene el parmetro

y el tamao de la muestra es menor

que 30, se utiliza la frmula 3

2.1.1.1

Parmetros y/o estadsticos para utilizar las frmulas de


Intervalo de confianza

Tamao de muestra n

Media aritmtica de la muestra .

Desviacin estndar poblacional

en caso de no conocerla, se halla la

desviacin estndar muestral (s).

Para hallar el valor de

se utiliza la tabla normal.

Para hallar el valor de

se utiliza la tabla t-student.

Para hallar

seguimos los siguientes pasos (ver anexo C)

Se tiene nivel de confianza

Se halla el nivel de error

Se halla

Se calcula

Se busca en la tabla normal de adentro hacia fuera, el valor de


y se halla el valor de

Estadstica

.
241

Ejemplo.
Con un nivel de confianza del 95% y tamao de muestra n=40, buscamos en
la tabla normal ya que el tamao de la muestra es mayor de 30.

Nivel de confianza

Nivel de error

Se busca en la tabla normal de dentro hacia fuera, el valor de 0.975 y el


valor de

Estadstica

=1.96

242

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,0

0,5000

0,5040

0,5080

0,5120

0,5160

0,5199

0,5239

0,5279

0,1

0,5398

0,5438

0,5478

0,5517

0,5557

0,5596

0,5636

0,5675

0,2

0,5793

0,5832

0,5871

0,5910

0,5948

0,5987

0,6026

0,6064

0,3

0,6179

0,6217

0,6255

0,6293

0,6331

0,6368

0,6406

0,6443

0,4

0,6554

0,6591

0,6628

0,6664

0,6700

0,6736

0,6772

0,6808

0,5

0,6915

0,6950

0,6985

0,7019

0,7054

0,7088

0,7123

0,7157

0,6

0,7257

0,7291

0,7324

0,7357

0,7389

0,7422

0,7454

0,7486

0,7

0,7580

0,7611

0,7642

0,7673

0,7704

0,7734

0,7764

0,7794

0,8

0,7881

0,7910

0,7939

0,7967

0,7995

0,8023

0,8051

0,8078

0,9

0,8159

0,8186

0,8212

0,8238

0,8264

0,8289

0,8315

0,8340

1,0

0,8413

0,8438

0,8461

0,8485

0,8508

0,8531

0,8554

0,8577

1,1

0,8643

0,8665

0,8686

0,8708

0,8729

0,8749

0,8770

0,8790

1,2

0,8849

0,8869

0,8888

0,8907

0,8925

0,8944

0,8962

0,8980

1,3

0,9032

0,9049

0,9066

0,9082

0,9099

0,9115

0,9131

0,9147

1,4

0,9192

0,9207

0,9222

0,9236

0,9251

0,9265

0,9279

0,9292

1,5

0,9332

0,9345

0,9357

0,9370

0,9382

0,9394

0,9406

0,9418

1,6

0,9452

0,9463

0,9474

0,9484

0,9495

0,9505

0,9515

0,9525

1,7

0,9554

0,9564

0,9573

0,9582

0,9591

0,9599

0,9608

0,9616

1,8

0,9641

0,9649

0,9656

0,9664

0,9671

0,9678

0,9686

0,9693

1,9

0,9713

0,9719

0,9726

0,9732

0,9738

0,9744

0,9750

0,9756

2,0

0,9772

0,9778

0,9783

0,9788

0,9793

0,9798

0,9803

0,9808

Mtodo para hallar

Nivel de confianza

Nivel de error

(ver anexo D)

Se halla el valor de

Se busca en la primera columna el valor de

Se busca en la primera columna el valor de v

La interseccin entre la fila y la columna es el valor de t

Estadstica

243

Ejemplo.
Con un nivel de confianza del 95%, tamao de muestra n=10, y
.
Se busca en la tabla t-student ya que el tamao de la muestra es menor de
30. y

Nivel de confianza

Nivel de error

La interseccin entre la fila y la columna es el valor de t =2.262

TABLA T-STUDENT

n
1
2
3
4
5

0.75
1.000
0,816
0,765
0,741
0,727

0.80
1.376
1.061
0.978
0.941
0.920

0.85
1.963
1.386
1.250
1.190
1.156

1
0,9
0.95 0.975 0,99
0.9 95
3.078 6.314 12.7 06 31.821 63.657
1.886 2.920 4.303 6.965 9.9 25
1.638 2.353 3.182 4.541 5.8 41
1.533 2.132 2.776 3.747 4.6 04
1.476 2.015 2.571 3.365 4.0 32

6
7
8
9
10

0,718
0,711
0,706
0,703
0,7

0.906
0.896
0.889
0.883
0.879

1.134
1.119
1.108
1.100
1.093

1.440
1.415
1.397
1.383
1.372

Estadstica

1.943
1.895
1.860
1.833
1.812

2.447
2.365
2.306
2.262
2.228

3.143
2.998
2.896
2.821
2.764

3.7 07
3.4 99
3.3 55
3.2 50
3.1 69

244

Ejemplo

Retomando el ejemplo que se tiene en la introduccin del captulo, hallar la


nota promedio a un nivel de confianza del 99% de todos los estudiantes que
cursaron el semestre inmediatamente anterior.

SOLUCIN
Como la desviacin estndar poblacional

desconocida y el tamao de la

muestra es menor de 30, utilizamos la frmula:

Tamao de la muestra

Media muestral

Como no se conoce la desviacin estndar poblacional

.
, se halla

la desviacin estndar muestral s.


.

Para hallar el valor de

Con un nivel de confianza del 99%, tamao de muestra n=25.

Estadstica

245

Nivel de confianza

Nivel de error

t =2.797

Reemplazando en la frmula,

Interpretacin

Hay un 99% de confiabilidad al afirmar


que la nota promedio de los estudiantes
de la universidad est entre 3.6 y 4.0

Estadstica

246

Ejemplo
Un fabricante de pintura necesita por efecto de calidad del producto, el
tiempo promedio de secado de una pintura nueva para exteriores. Si en 42
reas de prueba de igual tamao, se obtuvo un tiempo promedio de secado
de 30.2 minutos y una desviacin estndar de 1.1 minutos, cul ser el
tiempo promedio real de secado, con un 95% de confiabilidad?
Solucin

Necesitamos un intervalo de confianza para

Desviacin estndar poblacional

Tamao de muestra mayor de 30.

Su frmula es:

desconocida;

Parmetros muestrales:

Tamao de la muestra

Media muestral

Desviacin estndar muestral s.

Estadstica

247

Para hallar el valor de

: (aunque la desviacin estndar

poblacional es desconocida, el tamao de la muestra es mayor de


30)

Con un nivel de confianza del 95%, tamao de muestra n=42.

Tenemos nivel de confianza

Despejamos el nivel de error

Hallamos a

Calculamos

Buscamos en tabla normal el valor de

Con todos los datos, procedemos a reemplazar en la frmula:

Interpretacin

Hay un 95% de confiabilidad al afirmar


que el tiempo de secado de la nueva
pintura est entre 29.9 y 30.5 minutos

Estadstica

248

2.1.2 Intervalo de confianza para la proporcin poblacional p


A un nivel de confiabilidad del

, el intervalo de confianza para la

proporcin poblacional se obtiene por medio de la siguiente frmula:

Frmula

2.1.2.1

Estadsticos para utilizar la frmula de Intervalo de confianza

Tamao de muestra n

Proporcin muestral

Proporcin muestral

Para hallar el valor de

Estadstica

se utiliza la tabla normal.

249

Ejemplo
Continuando con el ejemplo que se tiene en la introduccin del captulo, falta
hallar la proporcin de estudiantes que obtuvieron una nota promedio mayor
de 4.0, a un nivel de confianza del 99%.

SOLUCIN
Su frmula es:

Tamao de la muestra

Proporcin muestral

son 7 los estudiantes de la muestra

que sacaron una nota superior a 4.0 (resaltados en la tabla de resultados


del ejercicio, con amarillo)

Por la Ley del Complemento ( teora de conjuntos)

Para hallar el valor de

Con un nivel de confianza del 99%, tamao de muestra n=25.

Tenemos nivel de confianza

Despejamos el nivel de error

Estadstica

250

Hallamos a

Calculamos

Buscamos en tabla normal el valor de

Con todos los datos, procedemos a reemplazar en la frmula:

Interpretacin

Hay un 99% de confiabilidad al afirmar que la


proporcin de estudiantes que sacaron una
nota superior a 4.0 est en el 5 y el 50%

Preguntas:

Por qu razn el intervalo dio tan amplio?

Si le disminuimos el nivel de confianza, qu pasara con la amplitud del


intervalo?

Estadstica

251

Conclusiones.

Estadstica

252

3.1

INTRODUCCIN

Retomando el ejemplo propuesto en la introduccin de esta unidad, el rector


de la universidad, en vez de preguntar (como lo hizo en el ejemplo), Afirma
que el promedio de los alumnos de dicha universidad fue de 4.2, y ms del
60% de ellos obtuvo una nota superior a 4.0, esto con un margen de error del
5%.
Fuera de los intervalos de confianza, existe otra forma de plantear el deseo
de conocer un parmetro poblacional, y es por medio de una hiptesis
lanzada.

3.2 DEFINICIN DE PRUEBA DE HIPTESIS


Una prueba de hiptesis es una afirmacin o conjetura que se lanza sobre un
parmetro poblacional; su objetivo en un nivel de significancia o error es
demostrar por medio de resultados muestrales, si existe suficiente evidencia
o no que apoye la hiptesis.
En este mdulo, se conocer la forma de comprobar las hiptesis
relacionadas

con

los

parmetros

poblacionales

(Promedio)

(Proporcin).

Estadstica

253

3.3 . Pasos para la prueba de hiptesis para el promedio

y la

proporcin p.

PASO 1

Plantear o matematizar la hiptesis lanzada y


matematizar la hiptesis que la contradice

El
(asterisco *) en los ejemplos,
significa que son las hiptesis que se
lanzaron

Ejemplo 1:
1.1

El peso promedio de los artculos exportados es de 20 kilos.


.

1.2

El tiempo promedio para atender a una persona en una


cafetera es mnimo de 8 minutos.

1.3

Ms del 35% de las solicitudes de prstamo en el banco x son


para vivienda.

1.4

Un fabricante de cierta marca de cereal de arroz afirma que el


contenido de grasa saturada no excede 1.5 gramos.
.
.

Estadstica

254

1.5

El gerente de una sucursal bancaria en una ciudad pequea


afirma que la proporcin de ahorradores a quienes se les paga
su sueldo semanalmente es menos del 20%

PASO 2

Definir las hiptesis

En la solucin de la prueba de hiptesis, existen dos clases de


hiptesis; la hiptesis que se plantea y la hiptesis que la contradice.
Las hiptesis son:

Hiptesis nula: Se representa por

. Una hiptesis nula con

respecto a un parmetro poblacional siempre se establecer de


modo que especifique un valor exacto del parmetro; esto quiere
decir que la hiptesis nula contiene la matematizacin de la
hiptesis que contiene los signos:

Hiptesis alternativa:

Se representa por

Una hiptesis

alternativa contiene la contradiccin de la hiptesis nula o sea que


la hiptesis alternativa contiene la representacin matemtica que
contiene los siguientes signos:

Estadstica

255

<
>

Ejemplo 2:
Teniendo en cuenta el ejercicio 1 de este tema, se clasificar cada hiptesis
dentro de la nula y de la alternativa
Ejemplo

Hiptesis

Hiptesis

nro.
1.1

nula

alternativa
.
Observemos que la
hiptesis que lanzamos no
siempre queda planteada en
la hiptesis nula

1.2
1.3
1.4

1.5

Observemos que la hiptesis


nula siempre contiene el signo
=

PASO 3
Estadstica

Seleccionar el nivel de significancia


256

El nivel de significancia es la probabilidad de rechazar la hiptesis nula


cuando es verdadera. Se le denota mediante la letra griega , tambin es
denominada como nivel de riesgo; este trmino es ms adecuado, ya que se
corre el riesgo de rechazar la hiptesis nula, cuando en realidad

es

verdadera. Este nivel est bajo el control de la persona que realiza la prueba.
Si suponemos que la hiptesis planteada es verdadera, entonces, el nivel de
significacin indicar la probabilidad de no aceptarla, es decir, que est fuera
de rea de aceptacin. El nivel de confianza (1-) indica la probabilidad de
aceptar la hiptesis planteada, cuando es verdadera en la poblacin.
PASO 4

Definir la regin crtica

Como se sabe por el tema de intervalo de confianza, los parmetros


poblacionales dependen por lo general de los resultados muestrales; pero es
necesario definir a partir de qu valores muestrales se puede aceptar como
parmetro poblacional, ya que es muy importante no caer en el error de la
subjetividad. Suponiendo que la afirmacin dada por el rector (ejercicio de la
introduccin) es suficiente para un estadstico una nota promedio muestral
de 3.8 y en cambio para otro no.
Por esto, es necesario definir estadsticamente, y sujetos al nivel de
significancia, el rea a partir de qu valores vamos a aceptar la hiptesis
nula y rechazar la hiptesis alternativa. Esto es lo que se conoce como
regin crtica. La regin crtica depende de la hiptesis alternativa, tamao de
muestra y conocimiento o no de la desviacin estndar poblacional (si el
parmetro poblacional se refiere al promedio ).
Los pasos a seguir estn resumidos en el siguiente cuadro:

Estadstica

257

Cuadro 1.

Definicin de la regin crtica

Hiptesis /
condicin

y/o

Buscar el valor
de
en la
tabla normal
de adentro
hacia afuera y
encontrar el
valor de
Buscar el valor
de
en la
tabla
t-student. con
v=n-1.
y encontrar el
valor de

graficar al
lado
izquierdo
con signo
negativo y al
lado derecho
con signo
positivo

Buscar el
valor de
en la tabla
normal y
encontrar
Buscar el
valor de
en la tabla
t-student.
encontrar

graficar al
lado
izquierdo
con signo
negativo

Buscar el
valor de
en la tabla
normal y
hallar
Buscar el
valor de
en la tabla
t-student.
encontrar

graficar al
lado
derecho
con signo
positivo

Hiptesis
Buscar el valor
de
en la
tabla normal
de adentro
hacia afuera y
encontrar el
valor de

PASO 4.1

graficar al
lado
izquierdo
con signo
negativo y al
lado derecho
con signo
positivo

Buscar el
valor de
en la tabla
normal y
encontrar

graficar al
lado
izquierdo
con signo
negativo

Buscar el
valor de
en la tabla
normal y
hallar

graficar al
lado
derecho
con signo
positivo

Graficas de la regiones crticas

De acuerdo con lo visto en el cuadro anterior, se tienen las siguientes


grficas:
HIPTESIS

Estadstica

Rechazo
Rechazo

258

1.

No rechazo

2.

3.

Rechazo

PASO 5

Estadstica

Calcular el estadstico de prueba

259

Valor determinado a partir de la informacin muestral, que se utiliza para


determinar si se rechaza la hiptesis nula. La eleccin del estadstico de
prueba depende (igual que en los intervalos de confianza) del tamao de
muestra y conocimiento o no de la desviacin estndar poblacional (si el
parmetro poblacional se refiere al promedio ).
CUADRO 2.

Estadsticos de prueba

Prueba de hiptesis para

condicin

Estadstico de
prueba

Prueba de hiptesis para

Estadstico de prueba

PASO 6

Estadstica

Tomar una decisin

260

En este ltimo paso de la prueba de hiptesis, se calcula el estadstico de


prueba, su resultado se coloca en la grfica y se toma la decisin de
rechazar o no la hiptesis nula as:

Si el estadstico de prueba cae en la regin de aceptacin, aceptar la


hiptesis nula.

Si el estadstico de prueba cae en la regin de rechazo, rechazar la


hiptesis nula.

Tener presente que en una prueba de hiptesis solo se puede tomar una de
dos decisiones: aceptar o rechazar la hiptesis nula. Debe subrayarse que
siempre existe la posibilidad de rechazar la hiptesis nula cuando no debera
haberse rechazado (error tipo I). Tambin existe la posibilidad de que la
hiptesis nula se acepte cuando debera haberse rechazado (error de tipo II).
Ejemplo :
Continuando con el ejemplo del rector, a un nivel de significancia del 5%,
comprobar la hiptesis lanzada por l.
Paso 1

Plantear o matematizar la hiptesis lanzada y matematizar la


hiptesis que la contradice
.

Paso 2

Definir las hiptesis.


.

Paso 3

Estadstica

Seleccionar el nivel de significancia

261

Paso 4

Definir la regin crtica

Teniendo en cuenta el ejercicio, se tienen los siguientes datos (los datos se


encuentran en el ejemplo 1 del tema intervalos de confianza):

Segn lo anterior,

. Por lo tanto, se utiliza de la

tabla 1
Hiptesis /
condicin

Estadstica

Buscar el valor
de
en la
tabla
t-student. con
v=n-1.
y encontrar el
valor de

graficar al
lado
izquierdo
con signo
negativo y al
lado derecho
con signo
positivo

262

2.064

Paso 5

Estadstico de prueba.

condicin

Estadstico de prueba

Paso 6

Decisin

-4.76

-2.064

2.064

Como el estadstico de prueba cae en la regin de


rechazo, se rechaza la hiptesis nula.
La nota promedio de los estudiantes no es de 4.2. El
rector no tiene la razn.

Estadstica

263

Con respecto a la afirmacin del rector: ms del 60% de ellos obtuvo una
nota superior a 4.0, se siguen los pasos para verificar la hiptesis lanzada
por l:
Paso 1
Paso 2

Definir las hiptesis.


.

Paso 3
Paso 4

Definir la regin crtica.

Hiptesis
Buscamos
el valor de
en la
tabla
normal y
hallamos

Paso 5

Estadstica

graficamos
al lado
derecho
con signo
positivo

Estadstico de prueba.

264

Estadstico de prueba

Paso 6

Decisin.
Como el estadstico de prueba cae en la regin de
aceptacin, aceptamos la hiptesis nula,
el 60% o menos de los estudiantes obtuvo una nota
promedio superior a 4.0. El rector no tiene la razon.

-3.26

1.65

Ejemplo:
Histricamente el promedio de clientes que compran con tarjeta de crdito en
una determinada tienda es como mnimo 35; sin embargo, la duea de la
tienda piensa que esta cifra ha disminuido significativamente. De una
muestra aleatoria de 50 clientes, 20 compraron con tarjeta de crdito con una
desviacin estndar de 2 clientes. A un nivel de significancia del 96%, se
est cumpliendo lo que piensa la duea?
Solucin
Paso 1

Paso 2
Estadstica

Definir las hiptesis


265

Paso 3
Paso 4

Definir la regin crtica


.

Segn lo anterior,

. Por lo tanto,

Hiptesis /
condicin
Buscamos el
valor de
en la tabla
normal y
encontramos

y/o

Paso 5

graficamos
al lado
izquierdo
con signo
negativo

Estadstico de prueba

condicin

Estadstico de prueba

y
0

Paso 6

Estadstica

Decisin

266

-53

-1.75

Como el estadstico de prueba cae en la regin de


rechazo, rechazamos la hiptesis nula,
la cantidad de clientes que pagan con tarjeta de crdito
ha disminuido. La seora tiene la razn.

Estadstica

267

4. ESTUDIO DE CASO
La revista Propiedades de julio de 2006, con respaldo de La Lonja, Camacol
y El Colombiano, promociona la venta de apartamentos nuevos en diferentes
zonas de la ciudad de Medelln y el rea Metropolitana. Se ha dividido el
territorio en cuatro zonas, las cuales se describen a continuacin:
Zona 1: Centro, Manrique, Aranjuez, Prado, Buenos Aires, Loreto,
Milagrosa y Villa Hermosa.
Zona 2: Poblado, Envigado, Sabaneta, San Diego, Las Palmas.
Zona

3:

Laureles,

Amrica,

Estadio,

Castilla,

Pedregal,

Bello,

Tricentenario y Conquistadores.
Zona 4: Rosales, Beln, La Mota, Guayabal, Itag y la Estrella.
En la siguiente tabla, se especifica la localizacin del apartamento, el
nmero de alcobas y el precio.
ZONA
1
1
1
1
1
1
1
1
1
1
Estadstica

N DE ALCOBAS
2
2
3
3
3
2
3
2
2
3

PRECIO ($ en miles)
27.900
29.200
31.470
32.400
34.800
35.500
37.944
38.500
39.880
44.415
268

ZONA N DE ALCOBAS PRECIO ($ en miles)


1
2
55.900
1
3
58.736
2
2
38.900
2
2
48.900
2
2
51.000
2
2
55.100
2
3
304.000
2
3
61.500
2
3
374.000
2
2
72.600
2
2
116.000
2
3
113.200
2
3
135.200
2
3
217.930
3
3
35.000
3
3
41.900
3
3
45.900
3
3
50.750
3
2
54.980
3
3
64.100
3
3
158.100
3
2
71.900
3
3
84.500
3
2
96.785
3
3
104.341
3
3
120.000
4
1
28.560
4
2
38.150
4
3
37.400
4
3
44.300
4
2
42.800
4
3
45.000
4
2
48.900
4
3
58.000
4
3
90.000
4
3
104.900
4
3
229.360
4
2
110.000
Fuente: Revista Propiedades, julio de 2006.

Estadstica

269

Un inversionista desea adquirir una propiedad nueva, y para tomar la


decisin se hace los siguientes interrogantes:

Cul ser la zona de mayor valor promedio?

Cmo es la variacin del costo en cada una de las zonas?

Cul es la zona con precio ms estable?

Se podra pronosticar el precio a partir del nmero de alcobas en cada


zona y en todo el territorio?

Sera confiable este pronstico?

A partir de estos interrogantes, qu zona le sugiere usted al


inversionista?

A un nivel de confianza del 95%, cul es el precio promedio de las casas


en Medelln?

A un nivel de confiabilidad del 96%, cul es la proporcin de casas con


un precio superior a 90.000?

Si el inversionista, afirma a un nivel de significancia del 5% que el precio


promedio de las casas es superior a 50.000, qu le dira usted al
inversionista?

Si el inversionista afirma a un nivel de significancia del 4% que el 60% de


las casas con un costo superior a 90.000 tiene 3 habitaciones, que le
dira usted?

Estadstica

270

5. ACTIVIDADES DE RECONOCIMIENTO
Para lograr el alcance de los objetivos planteados en el curso, es necesario
que los estudiantes tengan claridad en los siguientes conceptos y
operaciones:
Operaciones aritmticas: suma, resta, multiplicacin y divisin.
Porcentaje.
Sumatoria de nmeros enteros.
Coordenadas en el plano cartesiano
Funcin lineal: ecuacin de lnea recta, pendiente, grfica en el plano
cartesiano.
Teora de conjuntos
Tcnicas de conteo
Desigualdades

Estadstica

271

6. RESPUESTA A PREGUNTAS FRECUENTES


Desde el punto de vista estadstico, cul es la importancia de la variable
en una investigacin?
R/

La variable es la que determina la caracterstica que se va a

investigar. Es la que se cuantifica con el fin de obtener la muestra. Es, a


la vez, la que determina la poblacin para la investigacin.
Qu indica el signo negativo de la pendiente de una recta?
R/ Indica que la curva desciende a medida que aumenta el valor de la
variable independiente X.
Si un investigador encuentra que, en un conjunto de datos, la media, la
mediana y la moda son iguales, qu se puede deducir de la distribucin
de los datos?
R/ La distribucin de los datos se ajusta a una curva normal, ya que los
tres estadgrafos de tendencia central son iguales y se localizan en el
punto central de la curva.
Qu sentido tiene hablar de intervalos de clase cuando se tienen datos
sin agrupar?
R/ No tiene ningn sentido, ya que el concepto de intervalo de clase se
origina por la necesidad de agrupar los datos dentro de ciertos lmites,
con el fin de facilitar la comprensin y el manejo de una muestra.
Estadstica

272

Qu se entiende por marca de clase?


R/ La marca de clase es el punto central de un intervalo. Es aquel valor
que representa el intervalo de clase.
Qu significa el sesgo?
R/ El sesgo significa la tendencia de los datos a agruparse a la derecha o
izquierda de la media.
Que se entiende por probabilidad?
R/ La probabilidad es la posibilidad relativa de que ocurra un suceso o
evento.
Qu una tcnica de conteo?
R/ Una tcnica de conteo es una herramienta matemtica que sirve para
hallar el total de resultados en un experimento estadstico.
Qu es Estadstica Inferencial?
R/ La Estadstica Inferencial es la rama de la Estadstica que sirve para
hallar parmetros poblacionales, partiendo de resultados muestrales.
Qu significa nivel de confiabilidad?

Estadstica

273

R/

Confiabilidad indica cun seguros podemos estar de que el proceso

seguido resulte en valores que representen verdaderamente la poblacin. Se


usa ms comnmente con intervalos de confianza. En sentido probabilstico,
si tuviramos una confiabilidad del 95%, decimos que si repitiramos el
proceso muchas veces, en cerca del 95% de las veces obtendramos
resultados que reflejan verdaderamente la realidad. Cerca del 95% de los
intervalos as construidos contendran el valor desconocido del parmetro.

Qu significa nivel de significancia?

R/ Nivel de significancia corresponde a la probabilidad de error tipo I que


estamos dispuestos a permitir cuando hacemos una prueba de hiptesis.
Usualmente se expresa como un porcentaje. Los valores ms comunes son
1%, 5%, 10%. Una significancia del 5% quiere decir que de cada cien
pruebas donde rechacemos la hiptesis nula, nos permitimos la posibilidad
de haberla rechazado en 5 ocasiones a pesar de ser cierta. El nivel de
significancia se selecciona de acuerdo con una amplia gama de criterios que
incluyen el costo de cometer error tipo I y la tradicin en el rea de contenido
sobre el cual se est haciendo la prueba.

Qu se entiende por intervalo de confianza?


R/

Intervalo de confianza es el rango de valores dentro del cual se

encuentra un parmetro con una determinada probabilidad (esta


probabilidad es el denominado nivel de confianza).

Estadstica

274

Qu se entiende por prueba de hiptesis?

R/ Una prueba de hiptesis es un procedimiento por el cual establecemos


hiptesis nula y alterna con el fin de resolver un problema. El procedimiento
incluye el diseo y seleccin de la muestra. Luego de tomados los datos de
la muestra, se calcula el valor de una prueba estadstica. A un nivel de
significancia previamente seleccionado, la estadstica prueba se compara
con el valor obtenido de la tabla de la distribucin estadstica apropiada. Esa
comparacin nos lleva a tomar la decisin de rechazar o no la hiptesis nula.

Qu se entiende por proporcin?

R/ Proporcin es la fraccin cuyo numerador est formado por un subgrupo


de individuos incluido en el denominador.

Estadstica

275

7. ACTIVIDADES DE PROFUNDIZACIN
1. Una emisora realiz una encuesta musical a los nuevos oyentes, la cual
contena, entre otras, las siguientes preguntas:
a) Cuntos CD y casetes compr usted en los ltimos 12 meses?
b) Es actualmente miembro de un club radial? (S o No).
c) Qu edad tiene usted?
d) Incluyndose usted, cuntas personas (adultos y nios) viven en su
casa?
e) Qu tipo de msica le interesa comprar?
Diga si en cada pregunta se piden datos cualitativos o cuantitativos
(discretos o continuos).
2. La dependencia de recursos humanos de una empresa clasifica las
ocupaciones de los trabajadores como profesional, de oficina y obrero.
Los datos se registran con 1, que indica profesional; 2, oficina; y 3,
obrero.
a) Cul es la variable?
b) Qu tipo de variable es?
c) Qu tipo de escala de medicin se est usando?
3. Diga si cada una de las siguientes variables es cualitativa o cuantitativa
(discreta o continua) e indique la escala de medicin que sea apropiada
para cada una.
Estadstica

276

a) Edad en aos
b) Sexo
c) Posicin en la lista de clase
d) Marca de automvil
e) Nmero de personas que estn a favor del aborto.
f) Ventas anuales
g) Tamao de la gaseosa (pequea, mediana o grande)
h) Cdigo o clasificacin del cargo del empleado
i) Ganancias anuales
j) Forma de pago (efectivo, cheque, tarjeta de crdito)
4. Las calificaciones de un estudiante en seis pruebas fueron: 5, 2, 1, 3, 4 y
1.
Calcular las siguientes medidas e interpretar los resultados.
a) Media aritmtica
b) Mediana
c) Moda
d) Desviacin estndar
e) Coeficiente de variacin

5. Supongamos que las estaturas, en metros, de los empleados de una


empresa son:
1,65

1,53

1,71

1,69

1,80

1,67

1,60

1,62 1,86

1,64

1,85

1,73

1,77

1,60

1,62

1,59

1,98 1,81

1,78

1,56

1,59

1,57

1,60

1,86

1,71

1,81 1,52

1,92

1,98

1,58

Estadstica

277

a. Construir intervalos de clase.


b. Distribucin de frecuencias: absoluta, relativa y acumuladas.
c. Grficas: barras, circular, histogramas, polgonos y ojivas.
d. Diagrama de tallo y hojas.
e. Medidas de tendencia central.
f. Medidas de variabilidad.
g. Medidas de localizacin.

6. Los siguientes datos representan la altura en centmetros y peso en

kilogramos de los alumnos de una clase. Considere que la altura


es la variable independiente "x" y que el peso es la variable
dependiente "y".

Alumno Estatura Peso Alumno Estatura Peso Alumno Estatura Peso


1
1,25
32
11
1,25
33
21
1,25
33
2
1,28
33
12
1,28
35
22
1,28
34
3
1,27
34
13
1,27
34
23
1,27
34
4
1,21
30
14
1,21
30
24
1,21
31
5
1,22
32
15
1,22
33
25
1,22
32
6
1,29
35
16
1,29
34
26
1,29
34
7
1,30
34
17
1,30
35
27
1,30
34
8
1,24
32
18
1,24
32
28
1,24
31
9
1,27
32
19
1,27
33
29
1,27
35
10
1,29
35
20
1,29
33
30
1,29
34
Fuente: datos hipotticos

a) Construir el diagrama de dispersin.


b) Hallar los parmetros bo y b1 del modelo de regresin lineal simple.
c)

Graficar el modelo de regresin encontrado.

d) Calificar el modelo mediante los coeficientes de correlacin y


determinacin.
Estadstica

278

e) Realice proyecciones para el peso y analcelas.


7. A los participantes de una convencin se les ofrecen 6 recorridos por da
para visitar lugares de inters durante 3 das de duracin del evento.
En cuntas formas puede una persona acomodarse para hacer alguno
de ellos?

R/18

8. Los estudiantes de un colegio privado de Humanidades se clasifican


como estudiantes de primer ao, de segundo, de penltimo, y tambin de
acuerdo con su sexo: hombre, mujer. Encuentre el nmero total de
clasificaciones

posibles

para

los

estudiantes

de

este

colegio.

R/ 6
9.

Un comit de 5 personas se va a elegir entre 10 principales y 7


suplentes. De cuntas maneras se puede hacer esto?

a.

Si en el comit ha de haber ms principales que suplentes. R/4242

b.

Debe haber 4 suplentes.

R/350

10. De cuntas maneras puede vestirse un individuo con 10 pantalones, 15


camisas y 2 chaquetas?

R/ 300

11. Cuntos nmeros con al menos 4 dgitos se pueden formar con las
cifras 1,2,3,5,7,8 sin repetir cifras? R/ 1800

12. En el ltimo ao de la escuela, en un grupo de 100 alumnos se encontr


Estadstica
279

que 42 cursaron Matemticas, 68 Sicologa, 54 Historia, 22 Matemtica


e Historia, 25 Matemtica y Sicologa, 7 Historia pero no Matemtica ni
Sicologa, 10 las tres materias y 8 ninguna de las tres. Si se selecciona
un estudiante aleatoriamente, encuentre la probabilidad de que:
a. Una persona inscrita en Sicologa haya estudiado las tres materias.
b. Una persona que no se inscribi en Sicologa haya tomado Historia y
Matemtica.
13. La probabilidad de que a un automvil al que se le llena el tanque de
gasolina necesite tambin un cambio de aceite es de 0.25. La de que
requiera un nuevo filtro de aceite, de 0.40, y de que la haga falta tanto
cambio de aceite como de filtro de 0.14.
a. Si debe cambiar el aceite, cul es la probabilidad de que necesite un
filtro nuevo?
b. Si necesita un filtro nuevo, cul es la probabilidad de que requiera que
se le cambie el aceite?
14. Para parejas de casados que viven en una cierta ciudad de los suburbios,
la probabilidad de que la

esposa trabaje es de 0.21 y la de que su

esposo lo haga, de 0.28. y la de que ambos trabajen, de 0.15. Si los


eventos son DEPENDIENTES, cul es la probabilidad de que
a. Al menos un miembro de la pareja de casados trabaje
b. Trabaje un esposo, dado que su esposa lo hace
c. Trabaje una esposa, dado que su esposo no lo hace

Estadstica

280

15. Un distribuidor de ligas garantiza que el 10% son defectuosas.

Un

consumidor controla cada paquete extrayendo 10 ligas sin reemplazo. Si


la muestra no contiene ligas defectuosas, l acepta el paquete. De otra
manera lo rechaza. Encontrar la probabilidad de que en este proceso
cualquier paquete se rechace
16. En una cierta rea de la ciudad se da como una razn del 70% de los
robos la necesidad de dinero para comprar estupefacientes. Encuentre la
probabilidad que dentro de los 5 prximos asaltos reportados en esta
rea:
a.

Exactamente 2 se debieron a la necesidad de dinero para comprar


drogas.

b.

Cuando mucho 3 se debieron a la misma razn arriba indicada.

17. Al probar una cierta clase de neumticos para camin en un terreno


escabroso se encontr que 25% de los camiones terminaban la prueba
con los neumticos daados. De los siguientes 15 camiones probados,
encuentre la probabilidad de que:
a.

De 3 a 6 tengan ponchaduras.

b.

Menos de 4 tengan pinchaduras.

18. Solo 40% de todos los insectos expuestos a un insecticida en condiciones


de laboratorio pudieron sobrevivir. Si se expone una muestra de 8
insectos a este insecticida, cul es la probabilidad de que:
a.

Sobrevivan 4 insectos

b.

No sobrevivan 3.

Estadstica

281

19. Segn NBC, el 40% de los televidentes de Colombia sintonizan


generalmente RCN. De una muestra aleatoria de 15 televidentes hallar
las siguientes probabilidades:
a.

Por lo menos cinco televidentes sintonicen RCN

b.

Catorce televidentes no sintonicen RCN.

20. Una fuerza de tareas gubernamental sospecha que algunas fbricas


violan los reglamentos contra la contaminacin ambiental con respecto a
la descarga de cierto tipo de producto.

Quince empresas estn bajo

sospecha pero no todas se pueden inspeccionar. Suponga que cuatro


de las empresas violan los reglamentos.
a.

Cul es la probabilidad de que la inspeccin de seis empresas no


encuentre ninguna violacin?

b.

Cul es la probabilidad de que la inspeccin de seis empresas


encuentre que mnimo tres de ellas violan los reglamentos?

21. Una compaa fabricante utiliza un esquema de aceptacin de produccin


de artculos antes de que se embarquen. El plan tiene dos etapas. Se
preparan cajas de 25 artculos para su embarque
muestra de tres en busca de defectuosos.

y se prueba una

Si se encuentra alguno

defectuoso, toda la caja se regresa para verificar el 100%.

Si no se

encuentran defectuosos, la caja se embarca.


a.

Cul es la probabilidad de que una caja que contiene tres defectuosos


se embarque?

b.

Cul es la probabilidad de que una caja que contenga slo un artculo


defectuoso se regrese para su revisin?

Estadstica

282

22. Para evitar que lo descubran en la aduana, un viajero ha colocado 6


tabletas de narcticos en una botella que contiene 9 pldoras de vitamina
que son similares en apariencia. Si el oficial de la Aduana selecciona 3
tabletas aleatoriamente para analizarlas, cul es la probabilidad de que
el viajero sea arrestado por posesin ilegal de narcticos?

23. Se est planeando un nuevo hospital para el pueblo x, una comunidad


que todava no tiene su propio hospital. Si el pueblo tiene en promedio 14
nacimientos por semana, calcule las probabilidades. de que el nmero de
nacimientos en un da sea:
a.

Al menos de 3 nacimientos.

b.

Entre 1 y 3 nacimientos.

24. Concediendo que el conmutador de una oficina de consultora recibe en


promedio 0.6 llamadas por minuto, determine las probabilidades de que:
a.

Haya ms de una llamada.

b.

Haya menos de tres llamadas.

25. El nmero promedio de quejas de pasajeros recibidas en la Secretara de


Transporte es de 6 quejas diarias. En un da cualquiera, cul es la
probabilidad de que la secretara de transporte reciba:
a.

No ms de dos quejas.

b.

Entre cuatro y siete quejas.

c.

No reciba quejas.

Estadstica

283

26. El dimetro interno ya terminado de un anillo de pistn est normalmente


distribuido con una media de 10 centmetros y una desviacin estndar
de 0.03 centmetros.
a.

Qu proporcin de los anillos tendr un dimetro interno que exceda


de 10.075 centmetros?

b.

Cul es la probabilidad de que un anillo de pistn tenga un dimetro


interno entre 9.97 y 10.03?

c.

Cul es la probabilidad de que un anillo de pistn tenga un dimetro


interno inferior a 10.03?

27. La resistencia a la traccin de cierto componente de metal se distribuye


normalmente con una media de 10,000 kilogramos por centmetro
cuadrado y una desviacin estndar de 100 kilogramos por centmetro
cuadrado.
a. Qu proporcin de estos componentes excede 10.150 kilogramos por
centmetro cuadrado de resistencia a la traccin?
b. Si las especificaciones requieren que todos los componentes tengan
resistencia a la traccin entre 9.800 y 10.200 kilogramos por centmetro
cuadrado inclusive, qu proporcin de piezas esperara que se
descartaran?
28. La vida til de cierto tipo de lavadora automtica tiene una distribucin
aproximadamente normal

con una vida promedio de 3.1 aos y una

desviacin estndar de 1.2 aos.


b. Cul es la probabilidad de que una lavadora dure entre 2.9 y 3.5 aos?
c. Si este tipo de lavadora tiene garanta de un ao, qu fraccin de la
cantidad vendida originalmente, necesitar ser reemplazada?

Estadstica

284

29. En un proceso industrial, el dimetro de un cojinete es una parte


componente importante. El comprador establece que las especificaciones
en el dimetro sean 3.0 0.01 cm. La implicacin es que ninguna parte
que caiga fuera de estas especificaciones se aceptar. Se sabe que en
el

proceso,

el

dimetro

de

un

cojinete

tiene

una

distribucin

aproximadamente normal con un promedio de 3.0 y una desviacin


estndar de 0.005. Qu porcentaje de cojinetes se descartarn?
30. Una muestra aleatoria de 36 cigarrillos de una determinada marca dio un
contenido promedio de nicotina de 3 miligramos, con una desviacin
estndar de 1 miligramo. Obtenga e interprete un intervalo de confianza
del 95% para el verdadero contenido promedio de nicotina en estos
cigarrillos, si el contenido en nicotina de estos cigarrillos sigue una
distribucin normal. El fabricante garantiza que el contenido promedio de
nicotina es 2.9 miligramos, qu puede decirse de acuerdo con el
intervalo hallado?
31. Los siguientes nmeros representan el tiempo (en minutos) que tardaron
15 operarios en familiarizarse con el manejo de una nueva mquina
adquirida por la empresa: 3.4, 2.8, 4.4, 2.5, 3.3, 4.0, 4.8, 2.9, 5.6, 5.2, 3.7,
3.0, 3.6, 2.8, 4.8. Supongamos que los tiempos se distribuyen
normalmente. Encuentre un intervalo de confianza del 95% para la media
poblacional.
32. Un fabricante produce focos que tienen un promedio de vida con
distribucin aproximadamente normal y una desviacin estndar de 40
horas. Si una muestra de tamao 30 focos tiene una vida promedio de
780 horas, encuentre un intervalo de confianza del 96% para la media
Estadstica

285

poblacional de todos los focos que produce esta empresa.


33. Una mquina de refrescos est ajustada de tal manera que la cantidad
de lquido despachada se distribuye aproximadamente normal con una
desviacin estndar igual a 0.15 decilitros. Encuentre un intervalo de
confianza del 95% para la media de todos los refrescos que sirve esta
mquina, si una muestra aleatoria de 36 refrescos tiene un contenido
promedio de 2.25 decilitros.
34. Un fabricante de fibras sintticas desea estimar la tensin de ruptura
media de las fibras. Disea un experimento en el que se observan las
tensiones de ruptura, en libras, de 16 hilos del proceso seleccionados
aleatoriamente. Las tensiones son: 20.8,

20.6,

21.0,

20.9,

19.9,

20.2,

19.8,

19.7,

19.6,

20.3,

20.7,

20.9.

Supngase que la tensin de ruptura se distribuye normalmente,

19.6,

21.1,

20.4,

20.6,

hallar un intervalo del 95% de confianza para estimar la tensin de


ruptura promedio de la fibra.
35. Se selecciona una muestra aleatoria de 500 fumadores de cigarro y se
encuentra que 86 de ellos prefieren la marca X. Encuentre el intervalo de
confianza de 90% para la fraccin de la poblacin de fumadores que
prefieren la marca X.

36. El gerente de una sucursal bancaria

en una ciudad pequea querra

determinar la proporcin de ahorradores a quienes se les paga su sueldo


semanalmente. Una muestra aleatoria de 100 indica que a 30 no se les
paga semanalmente. Estime un intervalo de confianza del 96% para la
proporcin real de ahorradores que reciben su sueldo semanalmente.

Estadstica

286

37. Una empresa elctrica fabrica focos que tienen una duracin que est
distribuida aproximadamente en forma normal con una media de 800
horas y una desviacin estndar poblaciones de 40. Pruebe la hiptesis
de que = 800 horas en contraposicin de la alternativa de que 800
horas si una muestra aleatoria de 30 focos tiene una duracin promedio
de 788 horas. Utilice un nivel de significancia de 0.04.

38. Una muestra aleatoria de 36 refrescos de una mquina despachadora


automtica tiene un contenido promedio de 21.9 decilitros, con una
desviacin estndar de 1.42 decilitros. Pruebe la hiptesis de que
22.2 decilitros en contraposicin a la hiptesis alternativa, < 22.2, en el
nivel de significancia de 0.04.

39. La altura promedio de las mujeres en el grupo de primer ao de una


institucin de enseanza superior es de 162.5 centmetros. con una
desviacin estndar poblacional de 6.9 centmetros. Hay alguna razn
para creer que existe un cambio en la altura promedio si una muestra
aleatoria de 50 mujeres del grupo actual tiene una altura promedio de
165.2 centmetros? Utilice un nivel de significancia de 0.05.

40. Se afirma que un automvil recorre un promedio anual de ms de 20.000


km. Para probar esta afirmacin, se le solicita a una muestra aleatoria
de 100 propietarios de automvil que lleve un registro de los km que
recorre. Estara usted de acuerdo con esta afirmacin si en la muestra
aleatoria resulta un promedio de 23.500 km y una desviacin estndar
poblaciones de 3.900 km? Utilice un nivel de significancia de 0.05.
Estadstica

287

41. Pruebe la hiptesis de que el contenido promedio en recipientes de un


lubricante en particular es de 10 litros si los contenidos de una muestra
aleatoria de 10 recipientes son 10.2,

9.7, 10.1, 10.3, 10.1, 9.8, 9.9,

10.4, 10.3, 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga


que la distribucin de los contenidos es normal.

42. Una muestra aleatoria de 8 cigarros de una marca determinada tiene un


contenido promedio de nicotina de 4.2 miligramos y una desviacin
estndar muestral de 1.4 miligramos.

Est esto de acuerdo con la

afirmacin del fabricante de que el contenido promedio de nicotina no


excede de 3.5 miligramos? Suponga que la distribucin de los contenidos
de nicotina es normal. Asuma un nivel de significancia de 0.01.

43. Un fabricante de televisores anuncia que el 90% de sus aparatos no


necesita ninguna reparacin durante los dos primeros aos de uso. La
Oficina de Proteccin al Consumidor selecciona una muestra de 100
aparatos y encuentra que 14 necesitaron alguna reparacin durante los
dos primeros aos de uso.

Al nivel de significancia de 0.01, a qu

conclusin puede llegar la Oficina de Proteccin al Consumidor?

44. Una compaa productora de combustibles asegura que una quinta parte
de los hogares en una cierta ciudad se calienta con petrleo. Se tiene
alguna razn para dudar de esta afirmacin si, en una muestra aleatoria
de 1000 hogares en esta ciudad, se encuentra que 236 se calientan con
petrleo? Utilice un nivel de significancia de 0.01.

Estadstica

288

45. Se cree que al menos 60% de los residentes en una cierta rea favorecen
una demanda de anexin de una ciudad vecina. Qu conclusin sacara
usted si slo 110 en una muestra aleatoria de 200 votantes favorecen al
acta? Utilice un nivel de significancia de 0.04.
46. Un cantante graba en vdeo-cinta sus actuaciones y registra el total de los
tiempos que debe esperar a que el pblico deje de aplaudir.

En

actuaciones anteriores, el tiempo promedio que tena que esperar era de


65.1 segundos. Interesado en saber si sus actuaciones son mejores,
seleccion una muestra aleatoria de 15 actuaciones en la que utiliz
nuevos tipos de msica, dando como resultado un tiempo promedio de
espera de 71.5 segundos y una desviacin estndar de 21.3 segundos.
Cree usted, a un nivel de significancia del 0.05, que sus viejas
actuaciones no son mejores que las actuaciones nuevas?
47. Se cree que un protector solar es efectivo slo en un 70% de los casos.
Resultados experimentales con un nuevo protector solar, mostraron que
de 60 personas seleccionadas aleatoriamente, 15 no fueron protegidas
contra el sol. Es sta suficiente evidencia para concluir a un nivel de
significancia de 0.05, que tanto el nuevo como el viejo protector solar son
igual de efectivos?
48. En el banco Jefferson, dado la cantidad de quejas por parte de los
usuarios por el tiempo (en minutos) que deben hacer fila para que los
atiendan, se hizo un estudio para mirar el tiempo (en minutos) que se
demoran en la fila antes de que los atiendan, para buscar la solucin al
problema despus de haber aumentado el nmero de ventanillas y los
resultados fueron los siguientes:
10.2
Estadstica

5.3

8.5

9.3

20.1

3.5

5.5

7.3
289

8.5

5.4

6.7

10.2

10.5

15.5

25

23.2

19.5

17.3

26.5

10.5

9.3

8.5

4.3

5.8

6.5

4.3

15.3

10.8

19.5

23.2

Despus del aumento de las ventanillas, cul es el tiempo promedio real


(con un nivel de significancia del 0.05 ) de espera de los clientes?
49. En el banco Z, dada la cantidad de quejas por parte de los usuarios
(cuenta con 30 clientes fijos, de los cuales 8 estn satisfechos) por el
tiempo (en minutos) que deben hacer fila para que los atiendan, se hizo
un estudio, para buscar la solucin al problema; se sabe:

El tiempo de espera se distribuye aproximadamente normal con un


tiempo promedio de 22.5 minutos y una desviacin estndar de 2.5
minutos.

En promedio se retiran del banco 2 clientes por mes.

De una muestra aleatoria de tamao 150 clientes, el 60% de ellos son


hombres.

Responder:
a. Cul es la probabilidad de que el tiempo de espera sea superior a 18
minutos?
b. De una muestra aleatoria de 15 clientes, cul es la probabilidad de que
al menos 12 estn satisfechos con el servicio del banco?
c. Si el 15% de los clientes se retiran del banco en menos de 20 das, cul
sera el tiempo promedio de retiro de ellos?
d. Con una confianza del 95%, cul sera la proporcin de clientes
hombres en el banco?
e. Los clientes afirman que consideran el servicio inefectivo si el promedio
de tiempo de espera es por lo menos de 18 minutos, cul es la
probabilidad de que sigan reclamando?
Estadstica

290

f. De una muestra aleatoria de 10 clientes, cul es la probabilidad de que


8 clientes estn satisfechos?
g. Si el 35% de los clientes esperan menos de 22 minutos, cul sera el
tiempo de espera promedio real?
h. Cul es la probabilidad de que ningn cliente est insatisfecho?
i. Cul es la probabilidad de que se retire un cliente en al menos 10 das?
j. Cul es la probabilidad de que en un mes no se retiren clientes?

Estadstica

291

ANEXOS

TABLAS DE PROBABILIDAD ACUMULADA

Anexo A
TABLA ACUMULADA DE LA DISTRIBUCIN BINOMIAL

p
n

0,10

0,20

0,25

0,30

0,40

0,50

0,60

0,70

0,80

0,90

0
1

0,9000
1,0000

0,8000
1,0000

0,7500
1,0000

0,7000
1,0000

0,6000
1,0000

0,5000
1,0000

0,4000
1,0000

0,3000
1,0000

0,2000
1,0000

0,1000
1,0000

0
1
2

0,8100
0,9900
1,0000

0,6400
0,9600
1,0000

0,5625
0,9375
1,0000

0,4900
0,9100
1,0000

0,3600
0,8400
1,0000

0,2500
0,7500
1,0000

0,1600
0,6400
1,0000

0,0900
0,5100
1,0000

0,0400
0,3600
1,0000

0,0100
0,1900
1,0000

0
1
2
3

0,7290
0,9720
0,9990
1,0000

0,5120
0,8960
0,9920
1,0000

0,4219
0,8438
0,9844
1,0000

0,3430
0,7840
0,9730
1,0000

0,2160
0,6480
0,9360
1,0000

0,1250
0,5000
0,8750
1,0000

0,0640
0,3520
0,7840
1,0000

0,0270
0,2160
0,6570
1,0000

0,0080
0,1040
0,4880
1,0000

0,0010
0,0280
0,2710
1,0000

0
1
2
3
4

0,6561
0,9477
0,9963
0,9999
1,0000

0,4096
0,8192
0,9728
0,9984
1,0000

0,3164
0,7383
0,9492
0,9961
1,0000

0,2401
0,6517
0,9163
0,9919
1,0000

0,1296
0,4752
0,8208
0,9744
1,0000

0,0625
0,3125
0,6875
0,9375
1,0000

0,0256
0,1792
0,5248
0,8704
1,0000

0,0081
0,0837
0,3483
0,7599
1,0000

0,0016
0,0272
0,1808
0,5904
1,0000

0,0001
0,0037
0,0523
0,3439
1,0000

0
1
2
3
4
5

0,5905
0,9185
0,9914
0,9995
1,0000
1,0000

0,3277
0,7373
0,9421
0,9933
0,9997
1,0000

0,2373
0,6328
0,8965
0,9844
0,9990
1,0000

0,1681
0,5282
0,8369
0,9692
0,9976
1,0000

0,0778
0,3370
0,6826
0,9130
0,9898
1,0000

0,0313
0,1875
0,5000
0,8125
0,9688
1,0000

0,0102
0,0870
0,3174
0,6630
0,9222
1,0000

0,0024
0,0308
0,1631
0,4718
0,8319
1,0000

0,0003
0,0067
0,0579
0,2627
0,6723
1,0000

0,0000
0,0005
0,0086
0,0815
0,4095
1,0000

0
1
2
3
4
5
6

0,5314
0,8857
0,9842
0,9987
0,9999
1,0000
1,0000

0,2621
0,6554
0,9011
0,9830
0,9984
0,9999
1,0000

0,1780
0,5339
0,8306
0,9624
0,9954
0,9998
1,0000

0,1176
0,4202
0,7443
0,9295
0,9891
0,9993
1,0000

0,0467
0,2333
0,5443
0,8208
0,9590
0,9959
1,0000

0,0156
0,1094
0,3438
0,6563
0,8906
0,9844
1,0000

0,0041
0,0410
0,1792
0,4557
0,7667
0,9533
1,0000

0,0007
0,0109
0,0705
0,2557
0,5798
0,8824
1,0000

0,0001
0,0016
0,0170
0,0989
0,3446
0,7379
1,0000

0,0000
0,0001
0,0013
0,0159
0,1143
0,4686
1,0000

0
1
2
3
4
5
6
7

0,4783
0,8503
0,9743
0,9973
0,9998
1,0000
1,0000
1,0000

0,2097
0,5767
0,8520
0,9667
0,9953
0,9996
1,0000
1,0000

0,1335
0,4449
0,7564
0,9294
0,9871
0,9987
0,9999
1,0000

0,0824
0,3294
0,6471
0,8740
0,9712
0,9962
0,9998
1,0000

0,0280
0,1586
0,4199
0,7102
0,9037
0,9812
0,9984
1,0000

0,0078
0,0625
0,2266
0,5000
0,7734
0,9375
0,9922
1,0000

0,0016
0,0188
0,0963
0,2898
0,5801
0,8414
0,9720
1,0000

0,0002
0,0038
0,0288
0,1260
0,3529
0,6706
0,9176
1,0000

0,0000
0,0004
0,0047
0,0333
0,1480
0,4233
0,7903
1,0000

0,0000
0,0000
0,0002
0,0027
0,0257
0,1497
0,5217
1,0000

0
1
2
3
4
5
6
7
8

0,4305
0,8131
0,9619
0,9950
0,9996
1,0000
1,0000
1,0000
1,0000

0,1678
0,5033
0,7969
0,9437
0,9896
0,9988
0,9999
1,0000
1,0000

0,1001
0,3671
0,6785
0,8862
0,9727
0,9958
0,9996
1,0000
1,0000

0,0576
0,2553
0,5518
0,8059
0,9420
0,9887
0,9987
0,9999
1,0000

0,0168
0,1064
0,3154
0,5941
0,8263
0,9502
0,9915
0,9993
1,0000

0,0039
0,0352
0,1445
0,3633
0,6367
0,8555
0,9648
0,9961
1,0000

0,0007
0,0085
0,0498
0,1737
0,4059
0,6846
0,8936
0,9832
1,0000

0,0001
0,0013
0,0113
0,0580
0,1941
0,4482
0,7447
0,9424
1,0000

0,0000
0,0001
0,0012
0,0104
0,0563
0,2031
0,4967
0,8322
1,0000

0,0000
0,0000
0,0000
0,0004
0,0050
0,0381
0,1869
0,5695
1,0000

Estadstica

292

(CONTINUACIN)

TABLA ACUMULADA DE LA DISTRIBUCIN BINOMIAL

p
n

0,10

0,20

0,25

0,30

0,40

0,50

0,60

0,70

0,80

0,90

0
1
2
3
4
5
6
7
8
9

0,3874
0,7748
0,9470
0,9917
0,9991
0,9999
1,0000
1,0000
1,0000
1,0000

0,1342
0,4362
0,7382
0,9144
0,9804
0,9969
0,9997
1,0000
1,0000
1,0000

0,0751
0,3003
0,6007
0,8343
0,9511
0,9900
0,9987
0,9999
1,0000
1,0000

0,0404
0,1960
0,4628
0,7297
0,9012
0,9747
0,9957
0,9996
1,0000
1,0000

0,0101
0,0705
0,2318
0,4826
0,7334
0,9006
0,9750
0,9962
0,9997
1,0000

0,0020
0,0195
0,0898
0,2539
0,5000
0,7461
0,9102
0,9805
0,9980
1,0000

0,0003
0,0038
0,0250
0,0994
0,2666
0,5174
0,7682
0,9295
0,9899
1,0000

0,0000
0,0004
0,0043
0,0253
0,0988
0,2703
0,5372
0,8040
0,9596
1,0000

0,0000
0,0000
0,0003
0,0031
0,0196
0,0856
0,2618
0,5638
0,8658
1,0000

0,0000
0,0000
0,0000
0,0001
0,0009
0,0083
0,0530
0,2252
0,6126
1,0000

10

0
1
2
3
4
5
6
7
8
9
10

0,3487
0,7361
0,9298
0,9872
0,9984
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000

0,1074
0,3758
0,6778
0,8791
0,9672
0,9936
0,9991
0,9999
1,0000
1,0000
1,0000

0,0563
0,2440
0,5256
0,7759
0,9219
0,9803
0,9965
0,9996
1,0000
1,0000
1,0000

0,0282
0,1493
0,3828
0,6496
0,8497
0,9527
0,9894
0,9984
0,9999
1,0000
1,0000

0,0060
0,0464
0,1673
0,3823
0,6331
0,8338
0,9452
0,9877
0,9983
0,9999
1,0000

0,0010
0,0107
0,0547
0,1719
0,3770
0,6230
0,8281
0,9453
0,9893
0,9990
1,0000

0,0001
0,0017
0,0123
0,0548
0,1662
0,3669
0,6177
0,8327
0,9536
0,9940
1,0000

0,0000
0,0001
0,0016
0,0106
0,0473
0,1503
0,3504
0,6172
0,8507
0,9718
1,0000

0,0000
0,0000
0,0001
0,0009
0,0064
0,0328
0,1209
0,3222
0,6242
0,8926
1,0000

0,0000
0,0000
0,0000
0,0000
0,0001
0,0016
0,0128
0,0702
0,2639
0,6513
1,0000

11

0
1
2
3
4
5
6
8
9
10
11

0,3138
0,6974
0,9104
0,9815
0,9972
0,9997
1,0000
1,0000
1,0000
1,0000
1,0000

0,0859
0,3221
0,6174
0,8389
0,9496
0,9883
0,9980
0,9983
0,9983
0,9983
0,9983

0,0422
0,1971
0,4552
0,7133
0,8854
0,9657
0,9924
0,9935
0,9936
0,9936
0,9936

0,0198
0,1130
0,3127
0,5696
0,7897
0,9218
0,9784
0,9821
0,9826
0,9827
0,9827

0,0036
0,0302
0,1189
0,2963
0,5328
0,7535
0,9006
0,9240
0,9292
0,9299
0,9299

0,0005
0,0059
0,0327
0,1133
0,2744
0,5000
0,7256
0,8062
0,8330
0,8384
0,8389

0,0000
0,0007
0,0059
0,0293
0,0994
0,2465
0,4672
0,6446
0,7333
0,7599
0,7635

0,0000
0,0000
0,0006
0,0043
0,0216
0,0782
0,2103
0,4671
0,6669
0,7601
0,7799

0,0000
0,0000
0,0000
0,0002
0,0020
0,0117
0,0504
0,2719
0,5671
0,8034
0,8893

0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0028
0,0738
0,2869
0,6704
0,9842

12

0
1
2
3
4
5
6
7
8
9
10
11
12

0,2824
0,6590
0,8891
0,9744
0,9957
0,9995
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0687
0,2749
0,5583
0,7946
0,9274
0,9806
0,9961
0,9994
0,9999
1,0000
1,0000
1,0000
1,0000

0,0317
0,1584
0,3907
0,6488
0,8424
0,9456
0,9857
0,9972
0,9996
1,0000
1,0000
1,0000
1,0000

0,0138
0,0850
0,2528
0,4925
0,7237
0,8822
0,9614
0,9905
0,9983
0,9998
1,0000
1,0000
1,0000

0,0022
0,0196
0,0834
0,2253
0,4382
0,6652
0,8418
0,9427
0,9847
0,9972
0,9997
1,0000
1,0000

0,0002
0,0032
0,0193
0,0730
0,1938
0,3872
0,6128
0,8062
0,9270
0,9807
0,9968
0,9998
1,0000

0,0000
0,0003
0,0028
0,0153
0,0573
0,1582
0,3348
0,5618
0,7747
0,9166
0,9804
0,9978
1,0000

0,0000
0,0000
0,0002
0,0017
0,0095
0,0386
0,1178
0,2763
0,5075
0,7472
0,9150
0,9862
1,0000

0,0000
0,0000
0,0000
0,0001
0,0006
0,0039
0,0194
0,0726
0,2054
0,4417
0,7251
0,9313
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0005
0,0043
0,0256
0,1109
0,3410
0,7176
1,0000

Estadstica

293

(CONTINUACIN)

TABLA ACUMULADA DE LA DISTRIBUCIN BINOMIAL

p
n

0,10

0,20

0,25

0,30

0,40

0,50

0,60

0,70

0,80

0,90

13

0
1
2
3
4
5
6
7
8
9
10
11
12
13

0,2542
0,6213
0,8661
0,9658
0,9935
0,9991
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0550
0,2336
0,5017
0,7473
0,9009
0,9700
0,9930
0,9988
0,9998
1,0000
1,0000
1,0000
1,0000
1,0000

0,0238
0,1267
0,3326
0,5843
0,7940
0,9198
0,9757
0,9944
0,9990
0,9999
1,0000
1,0000
1,0000
1,0000

0,0097
0,0637
0,2025
0,4206
0,6543
0,8346
0,9376
0,9818
0,9960
0,9993
0,9999
1,0000
1,0000
1,0000

0,0013
0,0126
0,0579
0,1686
0,3530
0,5744
0,7712
0,9023
0,9679
0,9922
0,9987
0,9999
1,0000
1,0000

0,0001
0,0017
0,0112
0,0461
0,1334
0,2905
0,5000
0,7095
0,8666
0,9539
0,9888
0,9983
0,9999
1,0000

0,0000
0,0001
0,0013
0,0078
0,0321
0,0977
0,2288
0,4256
0,6470
0,8314
0,9421
0,9874
0,9987
1,0000

0,0000
0,0000
0,0001
0,0007
0,0040
0,0182
0,0624
0,1654
0,3457
0,5794
0,7975
0,9363
0,9903
1,0000

0,0000
0,0000
0,0000
0,0000
0,0002
0,0012
0,0070
0,0300
0,0991
0,2527
0,4983
0,7664
0,9450
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0009
0,0065
0,0342
0,1339
0,3787
0,7458
1,0000

14

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14

0,2288
0,5846
0,8416
0,9559
0,9908
0,9985
0,9998
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0440
0,1979
0,4481
0,6982
0,8702
0,9561
0,9884
0,9976
0,9996
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0178
0,1010
0,2811
0,5213
0,7415
0,8883
0,9617
0,9897
0,9978
0,9997
1,0000
1,0000
1,0000
1,0000
1,0000

0,0068
0,0475
0,1608
0,3552
0,5842
0,7805
0,9067
0,9685
0,9917
0,9983
0,9998
1,0000
1,0000
1,0000
1,0000

0,0008
0,0081
0,0398
0,1243
0,2793
0,4859
0,6925
0,8499
0,9417
0,9825
0,9961
0,9994
0,9999
1,0000
1,0000

0,0001
0,0009
0,0065
0,0287
0,0898
0,2120
0,3953
0,6047
0,7880
0,9102
0,9713
0,9935
0,9991
0,9999
1,0000

0,0000
0,0001
0,0006
0,0039
0,0175
0,0583
0,1501
0,3075
0,5141
0,7207
0,8757
0,9602
0,9919
0,9992
1,0000

0,0000
0,0000
0,0000
0,0002
0,0017
0,0083
0,0315
0,0933
0,2195
0,4158
0,6448
0,8392
0,9525
0,9932
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0004
0,0024
0,0116
0,0439
0,1298
0,3018
0,5519
0,8021
0,9560
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0002
0,0015
0,0092
0,0441
0,1584
0,4154
0,7712
1,0000

15

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

0,2059
0,5490
0,8159
0,9444
0,9873
0,9978
0,9997
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0352
0,1671
0,3980
0,6482
0,8358
0,9389
0,9819
0,9958
0,9992
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0134
0,0802
0,2361
0,4613
0,6865
0,8516
0,9434
0,9827
0,9958
0,9992
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000

0,0047
0,0353
0,1268
0,2969
0,5155
0,7216
0,8689
0,9500
0,9848
0,9963
0,9993
0,9999
1,0000
1,0000
1,0000
1,0000

0,0005
0,0052
0,0271
0,0905
0,2173
0,4032
0,6098
0,7869
0,9050
0,9662
0,9907
0,9981
0,9997
1,0000
1,0000
1,0000

0,0000
0,0005
0,0037
0,0176
0,0592
0,1509
0,3036
0,5000
0,6964
0,8491
0,9408
0,9824
0,9963
0,9995
1,0000
1,0000

0,0000
0,0000
0,0003
0,0019
0,0093
0,0338
0,0950
0,2131
0,3902
0,5968
0,7827
0,9095
0,9729
0,9948
0,9995
1,0000

0,0000
0,0000
0,0000
0,0001
0,0007
0,0037
0,0152
0,0500
0,1311
0,2784
0,4845
0,7031
0,8732
0,9647
0,9953
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0008
0,0042
0,0181
0,0611
0,1642
0,3518
0,6020
0,8329
0,9648
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0022
0,0127
0,0556
0,1841
0,4510
0,7941
1,0000

Estadstica

294

(CONTINUACIN)

TABLA ACUMULADA DE LA DISTRIBUCIN BINOMIAL

p
n

0,10

0,20

0,25

0,30

0,40

0,50

0,60

0,70

0,80

0,90

16

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

0,1853
0,5147
0,7892
0,9316
0,9830
0,9967
0,9995
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0281
0,1407
0,3518
0,5981
0,7982
0,9183
0,9733
0,9930
0,9985
0,9998
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0100
0,0635
0,1971
0,4050
0,6302
0,8103
0,9204
0,9729
0,9925
0,9984
0,9997
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0033
0,0261
0,0994
0,2459
0,4499
0,6598
0,8247
0,9256
0,9743
0,9929
0,9984
0,9997
1,0000
1,0000
1,0000
1,0000
1,0000

0,0003
0,0033
0,0183
0,0651
0,1666
0,3288
0,5272
0,7161
0,8577
0,9417
0,9809
0,9951
0,9991
0,9999
1,0000
1,0000
1,0000

0,0000
0,0003
0,0021
0,0106
0,0384
0,1051
0,2272
0,4018
0,5982
0,7728
0,8949
0,9616
0,9894
0,9979
0,9997
1,0000
1,0000

0,0000
0,0000
0,0001
0,0009
0,0049
0,0191
0,0583
0,1423
0,2839
0,4728
0,6712
0,8334
0,9349
0,9817
0,9967
0,9997
1,0000

0,0000
0,0000
0,0000
0,0000
0,0003
0,0016
0,0071
0,0257
0,0744
0,1753
0,3402
0,5501
0,7541
0,9006
0,9739
0,9967
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0002
0,0015
0,0070
0,0267
0,0817
0,2018
0,4019
0,6482
0,8593
0,9719
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0005
0,0033
0,0170
0,0684
0,2108
0,4853
0,8147
1,0000

17

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

0,1668
0,4818
0,7618
0,9174
0,9779
0,9953
0,9992
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0225
0,1182
0,3096
0,5489
0,7582
0,8943
0,9623
0,9891
0,9974
0,9995
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0075
0,0501
0,1637
0,3530
0,5739
0,7653
0,8929
0,9598
0,9876
0,9969
0,9994
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0023
0,0193
0,0774
0,2019
0,3887
0,5968
0,7752
0,8954
0,9597
0,9873
0,9968
0,9993
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000

0,0002
0,0021
0,0123
0,0464
0,1260
0,2639
0,4478
0,6405
0,8011
0,9081
0,9652
0,9894
0,9975
0,9995
0,9999
1,0000
1,0000
1,0000

0,0000
0,0001
0,0012
0,0064
0,0245
0,0717
0,1662
0,3145
0,5000
0,6855
0,8338
0,9283
0,9755
0,9936
0,9988
0,9999
1,0000
1,0000

0,0000
0,0000
0,0001
0,0005
0,0025
0,0106
0,0348
0,0919
0,1989
0,3595
0,5522
0,7361
0,8740
0,9536
0,9877
0,9979
0,9998
1,0000

0,0000
0,0000
0,0000
0,0000
0,0001
0,0007
0,0032
0,0127
0,0403
0,1046
0,2248
0,4032
0,6113
0,7981
0,9226
0,9807
0,9977
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0005
0,0026
0,0109
0,0377
0,1057
0,2418
0,4511
0,6904
0,8818
0,9775
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0008
0,0047
0,0221
0,0826
0,2382
0,5182
0,8332
1,0000

18

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

0,1501
0,4503
0,7338
0,9018
0,9718
0,9936
0,9988
0,9998
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0180
0,0991
0,2713
0,5010
0,7164
0,8671
0,9487
0,9837
0,9957
0,9991
0,9998
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0056
0,0395
0,1353
0,3057
0,5187
0,7175
0,8610
0,9431
0,9807
0,9946
0,9988
0,9998
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0016
0,0142
0,0600
0,1646
0,3327
0,5344
0,7217
0,8593
0,9404
0,9790
0,9939
0,9986
0,9997
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0001
0,0013
0,0082
0,0328
0,0942
0,2088
0,3743
0,5634
0,7368
0,8653
0,9424
0,9797
0,9942
0,9987
0,9998
1,0000
1,0000
1,0000
1,0000

0,0000
0,0001
0,0007
0,0038
0,0154
0,0481
0,1189
0,2403
0,4073
0,5927
0,7597
0,8811
0,9519
0,9846
0,9962
0,9993
0,9999
1,0000
1,0000

0,0000
0,0000
0,0000
0,0002
0,0013
0,0058
0,0203
0,0576
0,1347
0,2632
0,4366
0,6257
0,7912
0,9058
0,9672
0,9918
0,9987
0,9999
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0014
0,0061
0,0210
0,0596
0,1407
0,2783
0,4656
0,6673
0,8354
0,9400
0,9858
0,9984
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0002
0,0009
0,0043
0,0163
0,0513
0,1329
0,2836
0,4990
0,7287
0,9009
0,9820
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0002
0,0012
0,0064
0,0282
0,0982
0,2662
0,5497
0,8499
1,0000

Estadstica

295

(CONTINUACIN)

TABLA ACUMULADA DE LA DISTRIBUCIN BINOMIAL

p
n

0,10

0,20

0,25

0,30

0,40

0,50

0,60

0,70

0,80

0,90

19

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

0,1351
0,4203
0,7054
0,8850
0,9648
0,9914
0,9983
0,9997
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0144
0,0829
0,2369
0,4551
0,6733
0,8369
0,9324
0,9767
0,9933
0,9984
0,9997
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0042
0,0310
0,1113
0,2631
0,4654
0,6678
0,8251
0,9225
0,9713
0,9911
0,9977
0,9995
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0011
0,0104
0,0462
0,1332
0,2822
0,4739
0,6655
0,8180
0,9161
0,9674
0,9895
0,9972
0,9994
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0001
0,0008
0,0055
0,0230
0,0696
0,1629
0,3081
0,4878
0,6675
0,8139
0,9115
0,9648
0,9884
0,9969
0,9994
0,9999
1,0000
1,0000
1,0000
1,0000

0,0000
0,0000
0,0004
0,0022
0,0096
0,0318
0,0835
0,1796
0,3238
0,5000
0,6762
0,8204
0,9165
0,9682
0,9904
0,9978
0,9996
1,0000
1,0000
1,0000

0,0000
0,0000
0,0000
0,0001
0,0006
0,0031
0,0116
0,0352
0,0885
0,1861
0,3325
0,5122
0,6919
0,8371
0,9304
0,9770
0,9945
0,9992
0,9999
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0006
0,0028
0,0105
0,0326
0,0839
0,1820
0,3345
0,5261
0,7178
0,8668
0,9538
0,9896
0,9989
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0016
0,0067
0,0233
0,0676
0,1631
0,3267
0,5449
0,7631
0,9171
0,9856
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0017
0,0086
0,0352
0,1150
0,2946
0,5797
0,8649
1,0000

20

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

0,1216
0,3917
0,6769
0,8670
0,9568
0,9887
0,9976
0,9996
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0115
0,0692
0,2061
0,4114
0,6296
0,8042
0,9133
0,9679
0,9900
0,9974
0,9994
0,9999
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0032
0,0243
0,0913
0,2252
0,4148
0,6172
0,7858
0,8982
0,9591
0,9861
0,9961
0,9991
0,9998
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0008
0,0076
0,0355
0,1071
0,2375
0,4164
0,6080
0,7723
0,8867
0,9520
0,9829
0,9949
0,9987
0,9997
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000

0,0000
0,0005
0,0036
0,0160
0,0510
0,1256
0,2500
0,4159
0,5956
0,7553
0,8725
0,9435
0,9790
0,9935
0,9984
0,9997
1,0000
1,0000
1,0000
1,0000
1,0000

0,0000
0,0000
0,0002
0,0013
0,0059
0,0207
0,0577
0,1316
0,2517
0,4119
0,5881
0,7483
0,8684
0,9423
0,9793
0,9941
0,9987
0,9998
1,0000
1,0000
1,0000

0,0000
0,0000
0,0000
0,0000
0,0003
0,0016
0,0065
0,0210
0,0565
0,1275
0,2447
0,4044
0,5841
0,7500
0,8744
0,9490
0,9840
0,9964
0,9995
1,0000
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0013
0,0051
0,0171
0,0480
0,1133
0,2277
0,3920
0,5836
0,7625
0,8929
0,9645
0,9924
0,9992
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0006
0,0026
0,0100
0,0321
0,0867
0,1958
0,3704
0,5886
0,7939
0,9308
0,9885
1,0000

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0001
0,0004
0,0024
0,0113
0,0432
0,1330
0,3231
0,6083
0,8784
1,0000

Estadstica

296

ANEXO B

TABLA ACUMULADA DE LA DISTRIBUCIN POISSON

0,1

0,2

0,30

0,4

0,5

0,6

0,7

0,8

0,9

0,9048

0,8187

0,7408

0,6703

0,6065

0,5488

0,4966

0,4493

0,4066

0,9953

0,9825

0,9631

0,9384

0,9098

0,8781

0,8442

0,8088

0,7725

0,9998

0,9989

0,9964

0,9921

0,9856

0,9769

0,9659

0,9526

0,9371

1,0000

0,9999

0,9997

0,9992

0,9982

0,9966

0,9942

0,9909

0,9865

1,0000

1,0000

1,0000

0,9999

0,9998

0,9996

0,9992

0,9986

0,9977

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9998

0,9997

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0

1,5

2,0

2,5

3,0

3,5

4,0

4,5

5,0

0,3679

0,2231

0,1353

0,0821

0,0498

0,0302

0,0183

0,0111

0,0067

0,7358

0,5578

0,4060

0,2873

0,1991

0,1359

0,0916

0,0611

0,0404

0,9197

0,8088

0,6767

0,5438

0,4232

0,3208

0,2381

0,1736

0,1247

0,9810

0,9344

0,8571

0,7576

0,6472

0,5366

0,4335

0,3423

0,2650

0,9963

0,9814

0,9473

0,8912

0,8153

0,7254

0,6288

0,5321

0,4405

0,9994

0,9955

0,9834

0,9580

0,9161

0,8576

0,7851

0,7029

0,6160

0,9999

0,9991

0,9955

0,9858

0,9665

0,9347

0,8893

0,8311

0,7622

1,0000

0,9998

0,9989

0,9958

0,9881

0,9733

0,9489

0,9134

0,8666

1,0000

1,0000

0,9998

0,9989

0,9962

0,9901

0,9786

0,9597

0,9319

1,0000

1,0000

1,0000

0,9997

0,9989

0,9967

0,9919

0,9829

0,9682

10

1,0000

1,0000

1,0000

0,9999

0,9997

0,9990

0,9972

0,9933

0,9863

11

1,0000

1,0000

1,0000

1,0000

0,9999

0,9997

0,9991

0,9976

0,9945

12

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9997

0,9992

0,9980

13

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9997

0,9993

14

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9998

15

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

16

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

Estadstica

297

TABLA ACUMULADA DE LA DISTRIBUCIN POISSON


(Continuacin)

5,5

6,0

6,5

7,0

7,5

8,0

8,5

9,0

9,5

0,0041

0,0025

0,0015

0,0009

0,0006

0,0003

0,0002

0,0001

0,0001

1
2

0,0266
0,0884

0,0174
0,0620

0,0113
0,0430

0,0073
0,0296

0,0047
0,0203

0,0030
0,0138

0,0019
0,0093

0,0012
0,0062

0,0008
0,0042

0,2017

0,1512

0,1118

0,0818

0,0591

0,0424

0,0301

0,0212

0,0149

0,3575

0,2851

0,2237

0,1730

0,1321

0,0996

0,0744

0,0550

0,0403

5
6

0,5289
0,6860

0,4457
0,6063

0,3690
0,5265

0,3007
0,4497

0,2414
0,3782

0,1912
0,3134

0,1496
0,2562

0,1157
0,2068

0,0885
0,1649

7
8

0,8095
0,8944

0,7440
0,8472

0,6728
0,7916

0,5987
0,7291

0,5246
0,6620

0,4530
0,5925

0,3856
0,5231

0,3239
0,4557

0,2687
0,3918

9
10
11

0,9462
0,9747
0,9890

0,9161
0,9574
0,9799

0,8774
0,9332
0,9661

0,8305
0,9015
0,9467

0,7764
0,8622
0,9208

0,7166
0,8159
0,8881

0,6530
0,7634
0,8487

0,5874
0,7060
0,8030

0,5218
0,6453
0,7520

12
13
14

0,9955
0,9983
0,9994

0,9912
0,9964
0,9986

0,9840
0,9929
0,9970

0,9730
0,9872
0,9943

0,9573
0,9784
0,9897

0,9362
0,9658
0,9827

0,9091
0,9486
0,9726

0,8758
0,9261
0,9585

0,8364
0,8981
0,9400

15
16

0,9998
0,9999

0,9995
0,9998

0,9988
0,9996

0,9976
0,9990

0,9954
0,9980

0,9918
0,9963

0,9862
0,9934

0,9780
0,9889

0,9665
0,9823

17
18
19

1,0000
1,0000
1,0000

0,9999
1,0000
1,0000

0,9998
0,9999
1,0000

0,9996
0,9999
1,0000

0,9992
0,9997
0,9999

0,9984
0,9993
0,9997

0,9970
0,9987
0,9995

0,9947
0,9976
0,9989

0,9911
0,9957
0,9980

20
21

1,0000
1,0000

1,0000
1,0000

1,0000
1,0000

1,0000
1,0000

1,0000
1,0000

0,9999
1,0000

0,9998
0,9999

0,9996
0,9998

0,9991
0,9996

22

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9999

23

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

24

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

Estadstica

298

TABLA ACUMULADA DE LA DISTRIBUCIN POISSON


(continuacin)

10

11

12

13

14

15

16

17

18

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0005

0,0002

0,0001

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0028

0,0012

0,0005

0,0002

0,0001

0,0000

0,0000

0,0000

0,0000

0,0103

0,0049

0,0023

0,0011

0,0005

0,0002

0,0001

0,0000

0,0000

0,0293

0,0151

0,0076

0,0037

0,0018

0,0009

0,0004

0,0002

0,0001

0,0671

0,0375

0,0203

0,0107

0,0055

0,0028

0,0014

0,0007

0,0003

0,1301

0,0786

0,0458

0,0259

0,0142

0,0076

0,0040

0,0021

0,0010

0,2202

0,1432

0,0895

0,0540

0,0316

0,0180

0,0100

0,0054

0,0029

0,3328

0,2320

0,1550

0,0998

0,0621

0,0374

0,0220

0,0126

0,0071

0,4579

0,3405

0,2424

0,1658

0,1094

0,0699

0,0433

0,0261

0,0154

10

0,5830

0,4599

0,3472

0,2517

0,1757

0,1185

0,0774

0,0491

0,0304

11

0,6968

0,5793

0,4616

0,3532

0,2600

0,1848

0,1270

0,0847

0,0549

12

0,7916

0,6887

0,5760

0,4631

0,3585

0,2676

0,1931

0,1350

0,0917

13

0,8645

0,7813

0,6815

0,5730

0,4644

0,3632

0,2745

0,2009

0,1426

14

0,9165

0,8540

0,7720

0,6751

0,5704

0,4657

0,3675

0,2808

0,2081

15

0,9513

0,9074

0,8444

0,7636

0,6694

0,5681

0,4667

0,3715

0,2867

16

0,9730

0,9441

0,8987

0,8355

0,7559

0,6641

0,5660

0,4677

0,3751

17

0,9857

0,9678

0,9370

0,8905

0,8272

0,7489

0,6593

0,5640

0,4686

18

0,9928

0,9823

0,9626

0,9302

0,8826

0,8195

0,7423

0,6550

0,5622

19

0,9965

0,9907

0,9787

0,9573

0,9235

0,8752

0,8122

0,7363

0,6509

20

0,9984

0,9953

0,9884

0,9750

0,9521

0,9170

0,8682

0,8055

0,7307

21

0,9993

0,9977

0,9939

0,9859

0,9712

0,9469

0,9108

0,8615

0,7991

22

0,9997

0,9990

0,9970

0,9924

0,9833

0,9673

0,9418

0,9047

0,8551

23

0,9999

0,9995

0,9985

0,9960

0,9907

0,9805

0,9633

0,9367

0,8989

24

1,0000

0,9998

0,9993

0,9980

0,9950

0,9888

0,9777

0,9594

0,9317

25

1,0000

0,9999

0,9997

0,9990

0,9974

0,9938

0,9869

0,9748

0,9554

26

1,0000

1,0000

0,9999

0,9995

0,9987

0,9967

0,9925

0,9848

0,9718

27

1,0000

1,0000

0,9999

0,9998

0,9994

0,9983

0,9959

0,9912

0,9827

28

1,0000

1,0000

1,0000

0,9999

0,9997

0,9991

0,9978

0,9950

0,9897

29

1,0000

1,0000

1,0000

1,0000

0,9999

0,9996

0,9989

0,9973

0,9941

30

1,0000

1,0000

1,0000

1,0000

0,9999

0,9998

0,9994

0,9986

0,9967

31

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9997

0,9993

0,9982

32

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9996

0,9990

33

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9998

0,9995

34

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

0,9998

35

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

36

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

0,9999

37

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

1,0000

Estadstica

299

ANEXO C
TABLA DE PROBABILIDADES ACUMULADAS NORMAL
Z

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

-3,9

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

0,0000

-3,8

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

-3,7

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

-3,6

0,0002

0,0002

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

0,0001

-3,5

0,0002

0,0002

0,0002

0,0002

0,0002

0,0002

0,0002

0,0002

0,0002

0,0002

-3,4

0,0003

0,0003

0,0003

0,0003

0,0003

0,0003

0,0003

0,0003

0,0003

0,0002

-3,3

0,0005

0,0005

0,0005

0,0004

0,0004

0,0004

0,0004

0,0004

0,0004

0,0003

-3,2

0,0007

0,0007

0,0006

0,0006

0,0006

0,0006

0,0006

0,0005

0,0005

0,0005

-3,1

0,0010

0,0009

0,0009

0,0009

0,0008

0,0008

0,0008

0,0008

0,0007

0,0007

-3,0

0,0013

0,0013

0,0013

0,0012

0,0012

0,0011

0,0011

0,0011

0,0010

0,0010

-2,9

0,0019

0,0018

0,0018

0,0017

0,0016

0,0016

0,0015

0,0015

0,0014

0,0014

-2,8

0,0026

0,0025

0,0024

0,0023

0,0023

0,0022

0,0021

0,0021

0,0020

0,0019

-2,7

0,0035

0,0034

0,0033

0,0032

0,0031

0,0030

0,0029

0,0028

0,0027

0,0026

-2,6

0,0047

0,0045

0,0044

0,0043

0,0041

0,0040

0,0039

0,0038

0,0037

0,0036

-2,5

0,0062

0,0060

0,0059

0,0057

0,0055

0,0054

0,0052

0,0051

0,0049

0,0048

-2,4

0,0082

0,0080

0,0078

0,0075

0,0073

0,0071

0,0069

0,0068

0,0066

0,0064

-2,3

0,0107

0,0104

0,0102

0,0099

0,0096

0,0094

0,0091

0,0089

0,0087

0,0084

-2,2

0,0139

0,0136

0,0132

0,0129

0,0125

0,0122

0,0119

0,0116

0,0113

0,0110

-2,1

0,0179

0,0174

0,0170

0,0166

0,0162

0,0158

0,0154

0,0150

0,0146

0,0143

-2,0

0,0228

0,0222

0,0217

0,0212

0,0207

0,0202

0,0197

0,0192

0,0188

0,0183

-1,9

0,0287

0,0281

0,0274

0,0268

0,0262

0,0256

0,0250

0,0244

0,0239

0,0233

-1,8

0,0359

0,0351

0,0344

0,0336

0,0329

0,0322

0,0314

0,0307

0,0301

0,0294

-1,7

0,0446

0,0436

0,0427

0,0418

0,0409

0,0401

0,0392

0,0384

0,0375

0,0367

-1,6

0,0548

0,0537

0,0526

0,0516

0,0505

0,0495

0,0485

0,0475

0,0465

0,0455

-1,5

0,0668

0,0655

0,0643

0,0630

0,0618

0,0606

0,0594

0,0582

0,0571

0,0559

-1,4

0,0808

0,0793

0,0778

0,0764

0,0749

0,0735

0,0721

0,0708

0,0694

0,0681

-1,3

0,0968

0,0951

0,0934

0,0918

0,0901

0,0885

0,0869

0,0853

0,0838

0,0823

-1,2

0,1151

0,1131

0,1112

0,1093

0,1075

0,1056

0,1038

0,1020

0,1003

0,0985

-1,1

0,1357

0,1335

0,1314

0,1292

0,1271

0,1251

0,1230

0,1210

0,1190

0,1170

-1,0

0,1587

0,1562

0,1539

0,1515

0,1492

0,1469

0,1446

0,1423

0,1401

0,1379

-0,9

0,1841

0,1814

0,1788

0,1762

0,1736

0,1711

0,1685

0,1660

0,1635

0,1611

-0,8

0,2119

0,2090

0,2061

0,2033

0,2005

0,1977

0,1949

0,1922

0,1894

0,1867

-0,7

0,2420

0,2389

0,2358

0,2327

0,2296

0,2266

0,2236

0,2206

0,2177

0,2148

-0,6

0,2743

0,2709

0,2676

0,2643

0,2611

0,2578

0,2546

0,2514

0,2483

0,2451

-0,5

0,3085

0,3050

0,3015

0,2981

0,2946

0,2912

0,2877

0,2843

0,2810

0,2776

-0,4

0,3446

0,3409

0,3372

0,3336

0,3300

0,3264

0,3228

0,3192

0,3156

0,3121

-0,3

0,3821

0,3783

0,3745

0,3707

0,3669

0,3632

0,3594

0,3557

0,3520

0,3483

-0,2

0,4207

0,4168

0,4129

0,4090

0,4052

0,4013

0,3974

0,3936

0,3897

0,3859

-0,1
0,0

0,4602
0,5000

0,4562
0,4960

0,4522
0,4920

0,4483
0,4880

0,4443
0,4840

0,4404
0,4801

0,4364
0,4761

0,4325
0,4721

0,4286
0,4681

0,4247
0,4641

Estadstica

300

TABLA DE PROBABILIDADES ACUMULADAS NORMAL


(Continuacin)
Z
0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,0

0,5000

0,5040

0,5080

0,5120

0,5160

0,5199

0,5239

0,5279

0,5319

0,5359

0,1

0,5398

0,5438

0,5478

0,5517

0,5557

0,5596

0,5636

0,5675

0,5714

0,5753

0,2

0,5793

0,5832

0,5871

0,5910

0,5948

0,5987

0,6026

0,6064

0,6103

0,6141

0,3

0,6179

0,6217

0,6255

0,6293

0,6331

0,6368

0,6406

0,6443

0,6480

0,6517

0,4

0,6554

0,6591

0,6628

0,6664

0,6700

0,6736

0,6772

0,6808

0,6844

0,6879

0,5

0,6915

0,6950

0,6985

0,7019

0,7054

0,7088

0,7123

0,7157

0,7190

0,7224

0,6

0,7257

0,7291

0,7324

0,7357

0,7389

0,7422

0,7454

0,7486

0,7517

0,7549

0,7

0,7580

0,7611

0,7642

0,7673

0,7704

0,7734

0,7764

0,7794

0,7823

0,7852

0,8

0,7881

0,7910

0,7939

0,7967

0,7995

0,8023

0,8051

0,8078

0,8106

0,8133

0,9

0,8159

0,8186

0,8212

0,8238

0,8264

0,8289

0,8315

0,8340

0,8365

0,8389

1,0

0,8413

0,8438

0,8461

0,8485

0,8508

0,8531

0,8554

0,8577

0,8599

0,8621

1,1

0,8643

0,8665

0,8686

0,8708

0,8729

0,8749

0,8770

0,8790

0,8810

0,8830

1,2

0,8849

0,8869

0,8888

0,8907

0,8925

0,8944

0,8962

0,8980

0,8997

0,9015

1,3

0,9032

0,9049

0,9066

0,9082

0,9099

0,9115

0,9131

0,9147

0,9162

0,9177

1,4

0,9192

0,9207

0,9222

0,9236

0,9251

0,9265

0,9279

0,9292

0,9306

0,9319

1,5

0,9332

0,9345

0,9357

0,9370

0,9382

0,9394

0,9406

0,9418

0,9429

0,9441

1,6

0,9452

0,9463

0,9474

0,9484

0,9495

0,9505

0,9515

0,9525

0,9535

0,9545

1,7

0,9554

0,9564

0,9573

0,9582

0,9591

0,9599

0,9608

0,9616

0,9625

0,9633

1,8

0,9641

0,9649

0,9656

0,9664

0,9671

0,9678

0,9686

0,9693

0,9699

0,9706

1,9

0,9713

0,9719

0,9726

0,9732

0,9738

0,9744

0,9750

0,9756

0,9761

0,9767

2,0

0,9772

0,9778

0,9783

0,9788

0,9793

0,9798

0,9803

0,9808

0,9812

0,9817

2,1

0,9821

0,9826

0,9830

0,9834

0,9838

0,9842

0,9846

0,9850

0,9854

0,9857

2,2

0,9861

0,9864

0,9868

0,9871

0,9875

0,9878

0,9881

0,9884

0,9887

0,9890

2,3

0,9893

0,9896

0,9898

0,9901

0,9904

0,9906

0,9909

0,9911

0,9913

0,9916

2,4

0,9918

0,9920

0,9922

0,9925

0,9927

0,9929

0,9931

0,9932

0,9934

0,9936

2,5

0,9938

0,9940

0,9941

0,9943

0,9945

0,9946

0,9948

0,9949

0,9951

0,9952

2,6

0,9953

0,9955

0,9956

0,9957

0,9959

0,9960

0,9961

0,9962

0,9963

0,9964

2,7

0,9965

0,9966

0,9967

0,9968

0,9969

0,9970

0,9971

0,9972

0,9973

0,9974

2,8

0,9974

0,9975

0,9976

0,9977

0,9977

0,9978

0,9979

0,9979

0,9980

0,9981

2,9

0,9981

0,9982

0,9982

0,9983

0,9984

0,9984

0,9985

0,9985

0,9986

0,9986

3,0

0,9987

0,9987

0,9987

0,9988

0,9988

0,9989

0,9989

0,9989

0,9990

0,9990

3,1

0,9990

0,9991

0,9991

0,9991

0,9992

0,9992

0,9992

0,9992

0,9993

0,9993

3,2

0,9993

0,9993

0,9994

0,9994

0,9994

0,9994

0,9994

0,9995

0,9995

0,9995

3,3

0,9995

0,9995

0,9995

0,9996

0,9996

0,9996

0,9996

0,9996

0,9996

0,9997

3,4

0,9997

0,9997

0,9997

0,9997

0,9997

0,9997

0,9997

0,9997

0,9997

0,9998

3,5

0,9998

0,9998

0,9998

0,9998

0,9998

0,9998

0,9998

0,9998

0,9998

0,9998

3,6

0,9998

0,9998

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

3,7

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

0,9999

3,8
3,9

0,9999
1,0000

0,9999
1,0000

0,9999
1,0000

0,9999
1,0000

0,9999
1,0000

0,9999
1,0000

0,9999
1,0000

0,9999
1,0000

0,9999
1,0000

0,9999
1,0000

Estadstica

301

ANEXO D

VALORES CRTICOS DE LA DISTRIBUCIN T

V
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
40
60
120

0,4

0,3

0,2

0,325

0,727

1,376

1,963

3,078

6,314 12,706 15,895 42,433 31,821 42,433 63,657 127,321

0,289

0,617

1,061

1,386

1,886

2,920

4,303

4,849

8,073

6,965

8,073

9,925

14,089

0,277

0,584

0,978

1,250

1,638

2,353

3,182

3,482

5,047

4,541

5,047

5,841

7,453

0,271

0,569

0,941

1,190

1,533

2,132

2,776

2,999

4,088

3,747

4,088

4,604

5,598

0,267

0,559

0,920

1,156

1,476

2,015

2,571

2,757

3,634

3,365

3,634

4,032

4,773

0,265

0,553

0,906

1,134

1,440

1,943

2,447

2,612

3,372

3,143

3,372

3,707

4,317

0,263

0,549

0,896

1,119

1,415

1,895

2,365

2,517

3,203

2,998

3,203

3,499

4,029

0,262

0,546

0,889

1,108

1,397

1,860

2,306

2,449

3,085

2,896

3,085

3,355

3,833

0,261

0,543

0,883

1,100

1,383

1,833

2,262

2,398

2,998

2,821

2,998

3,250

3,690

0,260

0,542

0,879

1,093

1,372

1,812

2,228

2,359

2,932

2,764

2,932

3,169

3,581

0,260

0,540

0,876

1,088

1,363

1,796

2,201

2,328

2,879

2,718

2,879

3,106

3,497

0,259

0,539

0,873

1,083

1,356

1,782

2,179

2,303

2,836

2,681

2,836

3,055

3,428

0,259

0,538

0,870

1,079

1,350

1,771

2,160

2,282

2,801

2,650

2,801

3,012

3,372

0,258

0,537

0,868

1,076

1,345

1,761

2,145

2,264

2,771

2,624

2,771

2,977

3,326

0,258

0,536

0,866

1,074

1,341

1,753

2,131

2,249

2,746

2,602

2,746

2,947

3,286

0,258

0,535

0,865

1,071

1,337

1,746

2,120

2,235

2,724

2,583

2,724

2,921

3,252

0,257

0,534

0,863

1,069

1,333

1,740

2,110

2,224

2,706

2,567

2,706

2,898

3,222

0,257

0,534

0,862

1,067

1,330

1,734

2,101

2,214

2,689

2,552

2,689

2,878

3,197

0,257

0,533

0,861

1,066

1,328

1,729

2,093

2,205

2,674

2,539

2,674

2,861

3,174

0,257

0,533

0,860

1,064

1,325

1,725

2,086

2,197

2,661

2,528

2,661

2,845

3,153

0,257

0,532

0,859

1,063

1,323

1,721

2,080

2,189

2,649

2,518

2,649

2,831

3,135

0,256

0,532

0,858

1,061

1,321

1,717

2,074

2,183

2,639

2,508

2,639

2,819

3,119

0,256

0,532

0,858

1,060

1,319

1,714

2,069

2,177

2,629

2,500

2,629

2,807

3,104

0,256

0,531

0,857

1,059

1,318

1,711

2,064

2,172

2,620

2,492

2,620

2,797

3,091

0,256

0,531

0,856

1,058

1,316

1,708

2,060

2,167

2,612

2,485

2,612

2,787

3,078

0,256

0,531

0,856

1,058

1,315

1,706

2,056

2,162

2,605

2,479

2,605

2,779

3,067

0,256

0,531

0,855

1,057

1,314

1,703

2,052

2,158

2,598

2,473

2,598

2,771

3,057

0,256

0,530

0,855

1,056

1,313

1,701

2,048

2,154

2,592

2,467

2,592

2,763

3,047

0,256

0,530

0,854

1,055

1,311

1,699

2,045

2,150

2,586

2,462

2,586

2,756

3,038

0,256

0,530

0,854

1,055

1,310

1,697

2,042

2,147

2,581

2,457

2,581

2,750

3,030

0,256

0,530

0,853

1,054

1,309

1,696

2,040

2,144

2,576

2,453

2,576

2,744

3,022

0,255

0,530

0,853

1,054

1,309

1,694

2,037

2,141

2,571

2,449

2,571

2,738

3,015

0,255

0,529

0,851

1,050

1,303

1,684

2,021

2,123

2,542

2,423

2,542

2,704

2,971

0,254

0,527

0,848

1,045

1,296

1,671

2,000

2,099

2,504

2,390

2,504

2,660

2,915

0,254

0,526

0,845

1,041

1,289

1,658

1,980

2,076

2,468

2,358

2,468

2,617

2,860

Estadstica

0,15

0,1

0,05 0,025 0,02 0,015 0,01 0,008 0,005 0,003

302

GLOSARIO
Ajuste de una recta: aproximacin a una ecuacin de una serie de parejas
de datos (x,y), relacionados linealmente.
Amplitud: es la distancia entre el valor mximo observado y el valor mnimo
observado en un conjunto o distribucin de datos.
Amplitud intercuartila: es la distancia entre la primera y tercera cuartilas del
conjunto de datos.
Al azar, estocstico: este trmino representa una idea que debe ser
expresada en trminos del concepto de probabilidad. Tenemos la nocin de
que un fenmeno ocurre en forma aleatoria cuando no sigue un patrn
particular que se pueda describir directamente por ecuaciones. As, no
podemos hacer una prediccin perfecta del resultado que se obtendr del
fenmeno. Al decir que un proceso es aleatorio estamos diciendo que sigue
alguna distribucin de probabilidad.
Atributo: caracterstica cualitativa de un objeto o individuo tal como sexo,
pas de origen, estado marital.
Censo: decimos que realizamos un censo cuando se observan todos los
elementos de la poblacin estadstica
Coeficiente de correlacin: medida de la intensidad de la relacin entre dos
variables.
Estadstica

303

Coeficiente de determinacin: medida en la cual las variaciones de una


variable se pueden atribuir a las variaciones en la otra variable.

Confiabilidad: indica cun seguros podemos estar de que el proceso


seguido resulte en valores que representen verdaderamente la poblacin. Se
usa ms comnmente con intervalos de confianza. En sentido probabilstico,
si tuviramos una confiabilidad del 95%, decimos que si repitiramos el
proceso muchas veces, en cerca del 95% de las veces obtendramos
resultados que reflejan verdaderamente la realidad. Cerca del 95% de los
intervalos as construidos contendran el valor desconocido del parmetro.
Correlacin: relacin existente entre dos variables sin un nexo definido de
dependencia.
Datos: valores que se obtienen al observar directamente los resultados de
una variable en la muestra o poblacin. Pueden ser numricos o cualitativos.
Diagrama de dispersin: grfica en la cual se presentan las parejas (x,y) de
datos de una muestra.
Distribucin bimodal: distribucin de datos que tiene dos modas.
Distribucin multimodal: distribucin de datos que tiene ms de una moda.
Distribucin unimodal: distribucin de datos que tiene una sola moda.
Estadgrafos: clculos realizados con los datos de la muestra.
Estadstica

304

Encuesta:

mtodo de obtener datos de una poblacin o muestra, sin

ejercer control alguno sobre los factores que pueden afectar las
caractersticas de inters o resultados de la encuesta.
Error tipo I: ocurre cuando rechazamos la hiptesis nula siendo sta cierta.
Error tipo II: ocurre cuando no rechazamos la hiptesis nula siendo sta
falsa.
Error muestral: es la diferencia entre un estadstico y su parmetro
correspondiente. Es una medida de la variabilidad de las estimaciones del
parmetro usando muestras repetidas en torno al valor de la poblacin; nos
da una nocin clara de hasta dnde y con qu probabilidad una estimacin
basada en una muestra se aleja del valor que se hubiera obtenido por medio
de un censo completo.
Error no muestral: son errores que ocurren en la seleccin, recoleccin,
anotacin y tabulacin de los datos. Son usualmente resultado de error
humano.
Espacio muestral:

es el conjunto de todos lo posibles resultados de un

experimento.
Estadstica: es una funcin real de los datos, concretamente, es un valor
que se calcula a partir de los datos. Ejemplos: suma, producto, mediana,
mximo, desviacin absoluta, media de los datos.

Estadstica

305

Estadstica Descriptiva: mtodos que usamos para describir los datos que
se han obtenido de la muestra o poblacin. Nos sirve para presentar una
idea de la realidad y para hacer inferencia informal.
Estadstica Inferencial: mtodos probabilsticos que usamos para tomar
decisiones, estimar, predecir o hacer generalizaciones sobre una poblacin
basados en una muestra.
Estadstica prueba: cantidad calculada de los datos maestrales, que se usa
para decidir si se rechaza o no la hiptesis nula. Generalmente, un valor
grande de esta estadstica es un indicador que nos apunta hacia el rechazo
de la hiptesis nula.
Estimador: el estimador de un parmetro poblacional es una funcin de las
observaciones que de alguna manera resulta en un valor cercano al
parmetro poblacional. Por ejemplo, la media de la muestra es un estimador
de la media poblacional.
Estimador insesgado: es un estimador cuyo promedio es el valor del
parmetro desconocido. Su valor esperado es el valor del parmetro
poblacional. Un estimador insesgado es uno que tiene la propiedad de
exactitud.
Evento: conjunto o coleccin de uno o ms posibles resultados de un
experimento. Un evento ocurre cuando cualquier resultado contenido en el
evento es observado.
Eventos independientes: dos eventos son independientes si el que uno
ocurra no afecta la probabilidad de que el otro ocurra
Estadstica

306

Eventos mutuamente excluyentes: son dos o ms eventos que no pueden


ocurrir simultneamente.
Exactitud: una medida (o un instrumento para medir) tiene la propiedad de
exactitud cuando las observaciones que se toman se distribuyen alrededor
del valor "real". El valor "real" es un parmetro de la poblacin cuyo valor es
usualmente desconocido, tal como la media poblacional. Un estimador de un
parmetro es exacto cuando es insesgado, es decir, cuando su valor
esperado o promedio es igual al parmetro que se estima. Por ejemplo, la
media muestral es un estimador exacto (insesgado) para la media
poblacional.
Experimento: es un proceso que cuando lo llevamos a cabo resulta en uno y
slo uno de los posibles resultados que podramos obtener (probabilidad).
Generalmente, son datos observados de los miembros de la poblacin o
muestra, ejerciendo control sobre uno o ms de los factores que podran
alterar la caracterstica de inters o los resultados del experimento (ciencia).
Funcin de densidad: se asocia a una variable aleatoria continua X. Es una
funcin, f(x), no negativa y su integral sobre todos los nmeros reales resulta
en 1. El rea bajo f(x) y sobre el intervalo [a, b] (el integral de f(x) desde a
hasta b) nos da la probabilidad de que X adquiera algn valor en ese
intervalo: P( a <= X <= b).
Funcin de distribucin acumulativa: se asocia a cualquier variable
aleatoria X. F(x) nos da la probabilidad de que

X sea menor o igual al

nmero x: F(x) = P( X x).


Funcin de probabilidad: se asocia a una variable aleatoria discreta X. Es
una funcin, f(x), no negativa, tal que la suma sobre todos los posibles
307

Estadstica

valores que puede asumir X resulta en 1. La funcin de probabilidad de X


evaluada en un nmero a es igual a la probabilidad de que X sea igual al
nmero a: f(a) = P( X = a).
Hiptesis nula: es una aseveracin sobre el valor de un parmetro
desconocido de una poblacin. Se presume cierta hasta tanto se demuestre
lo contrario. Esta hiptesis se rechaza o no (no decimos se acepta)
dependiendo del valor de la estadstica prueba o del valor p al nivel de
significancia deseado.
Individuos: se llama unidad estadstica o individuo a cada uno de los
elementos que componen la poblacin estadstica. El individuo es un ente
observable que no tiene por qu ser una persona, puede ser un objeto, un
ser vivo, o incluso algo abstracto.

Margen de error: cuando deseamos estimar el valor de un parmetro,


usamos una estadstica para ello y construimos un intervalo alrededor de esa
estadstica. Decimos entonces que con una confiabilidad establecida, el
intervalo incluye el valor desconocido del parmetro. El margen de error es la
mitad del ancho de ese intervalo.
Mtodo de mnimos cuadrados: mtodo para ajustar una recta, que hace
mnimo el promedio de los errores de las estimaciones de Y, a partir de X.
Muestra: es un subconjunto finito de elementos de la poblacin. A las
caractersticas que poseen los elementos de la poblacin y que son objeto
de estudio se denominan variables. A cada valor medido de la variable le
llamamos dato.
Estadstica

308

Nivel de significancia: probabilidad de rechazar la hiptesis nula cuando es


cierta. Probabilidad de cometer un error tipo I. Este nivel es seleccionado por
el investigador antes de realizar el experimento. Los valores ms
comnmente seleccionados son niveles de .01, .05 y .10.
Parmetros: clculos realizados con los datos de la poblacin.
Prueba de hiptesis: es un procedimiento por el cual establecemos
hiptesis nula y alterna con el fin de resolver un problema. El procedimiento
incluye el diseo y seleccin de la muestra. Luego de tomados los datos de
la muestra, se calcula el valor de una estadstica prueba. A un nivel de
significancia previamente seleccionado, la estadstica prueba se compara
con el valor obtenido de la tabla de la distribucin estadstica apropiada. Esa
comparacin nos lleva a tomar la decisin de rechazar o no la hiptesis nula.
Poblacin: llamamos poblacin estadstica, universo o colectivo al conjunto
de referencia sobre el cual van a recaer las observaciones.
Regresin: relacin que se da entre una variable independiente y otra
dependiente.
Significancia: corresponde a la probabilidad de error tipo I que estamos
dispuestos a permitir cuando hacemos una prueba de hiptesis. Usualmente
se expresa como un porcentaje. Los valores ms comunes son 1%, 5%,
10%. Una significancia del 5% quiere decir que de cada cien pruebas donde
rechacemos la hiptesis nula, nos permitimos la posibilidad de haberla
rechazado en 5 ocasiones a pesar de ser cierta. El nivel de significancia se
selecciona de acuerdo con una amplia gama de criterios que incluyen el
309

Estadstica

costo de cometer error tipo I y la tradicin en el rea de contenido sobre el


cual se est haciendo la prueba.
Tabla de contingencia: es una tabla que sirve para clasificar a

los

miembros de un grupo de acuerdo con algunas caractersticas cualitativas o


cuantitativas.
Variable: caracterstica de un conjunto de elementos.

Variable aleatoria: es una funcin que asigna un valor numrico a cada


suceso elemental del espacio muestral. Es decir, una variable aleatoria es
una variable cuyo valor numrico est determinado por el resultado del
experimento aleatorio. La variable aleatoria la notaremos con letras en
mayscula X, Y, ... y con las letras en minscula x, y, ... sus valores.

Variable aleatoria discreta: se dice que una variable aleatoria X es discreta


si puede tomar un nmero finito o infinito, pero numerable, de posibles
valores.

Una variable aleatoria discreta se obtiene despus de sumar o

contar; trabaja con nmeros enteros, ejemplo: nmero de artculos


defectuosos en una produccin, nmero de artculos vendidos por da,
nmero de personas que se presentan a la universidad, etc.
Variable aleatoria continua: se dice que una variable aleatoria X es
continua si puede tomar un nmero infinito (no numerable) de valores, o bien,
si puede tomar un nmero infinito de valores correspondientes a los puntos
de uno o ms intervalos de la recta real. Una variable aleatoria continua se
obtiene despus de hacer una medicin; trabaja con nmeros reales.

Estadstica

310

Ejemplo: temperatura, estatura, presin, tiempo, rea, dimensiones, peso


etc.
Variable dependiente: aquella cuyos valores dependen de los valores que
tome la variable independiente.
Variable independiente: aquella que puede manipular el investigador,
determinando los valores que puede tomar.

Estadstica

311

BIBLIOGRAFA
BIBLIOGRAFA FUNDAMENTAL
ANDERSON, David; SWEENEY, Dennis y WILLIAMS, Thomas. Estadstica
para administracin y economa. 8 edicin. Thomson, Mxico, 2003. 884 p.
BERENSON, Mark; LEVINE, David y KREHBIEL, Timothy. Estadstica para
administracin. 2 edicin. Pearson educacin, Mxico, 2001. 784 p.
MENDENHALL, William.
Estadstica
Mxico: Iberoamerica, 1995. 817 p.

para

administradores.

2.

ed.

BIBLIOGRAFA RECOMENDADA
CHAO, Lincoln y CASTAO, Jos Mara. Estadstica para las ciencias
administrativas, Lincoln. 3. ed. Bogot: McGraw-Hill, 1993. 464 p
LIND, Douglas A; MASON, Robert D. y MARCHAL, William G. Estadstica
para administracin y economa. Espaa: McGraw-Hill, 2000. 575 p.
SPIEGEL, Murray. Estadstica. 2. edicin.
1993.665p.

McGRAW-HILL, Espaa,

WALPOLE, Ronald E. y MYERS, Raymond H. Probabilidad y estadstica, 4.


ed Mxico: McGraw-Hill, 1992. 757 p.

Estadstica

312

Potrebbero piacerti anche