Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
,I
1 .
~ \
\
--. ----. --
dl".,n- .'"",;,? ~. ..
' -
Introducción
Unid ,
de
de
Contenido. ••••. '.'
- ..............•.;.;••••••••••.•. _
Unid
de
Contenido.
2.1 Introducción. Notación sigma o sumatoria - 60
2.2 Media, uso de la calculadora científica, mediana, y moda de datos no agrupados 64
2.3 Media, mediana y moda de datos agrupados en frecuencia simple 69
2.4 Media aritmética ponderada 72
2.5 Media, mediana y moda de datos agrupados. 75
Ventajas y desventajas de la media aritmética, de la mediana y de la moda
Unid
y
Contenido. ....._..................•.•.•. _
...
Desviación estándar y varianza de datos agrupados 101
3.9 Desviación relativa. Coeficiente de variación. Variable normalizada 112
o --.N...--Tú--¡¡ñ-e~z • •
probabilidad subjetiva
4.2 Reglas básicas de la probabilidad. Regla general de adición para todo tipo de eventos. 125
154
5.1 Elementos de muestreo. ¿Por qué muestrear la población? Técnicas de muestreo 159
168
6.4 Prueba de hipótesis con una y dos colas o extremos. Pruebas concernientes a medias 189
202
7.2 Estimación mediante la línea de regresión. Método de los mínimos cuadrados 207
T 218
a y 223
111I•
••
1.1Inttoducción, Población,
La palabra Estadística tiene varias acepciones para cada persona. Así, para un fanático de fútbol, es la
infonnación referente a los juegos jugados 11, juegos ganados lG, juegos empatados lE, juegos perdidos lP,
goles a favor GF, goles en contra GC y puntos P. Para el gerente de una central de energía eléctrica, la
estadística puede ser la infonnación sobre la cantidad de contaminantes que están siendo emitidos hacia la
atmósfera. Para el director de un colegio, es la infonnación acerca del ausentismo, las calificaciones de los
alumnos y los sueldos de los profesores. Para un investigador médico que indague los efectos de un nuevo
medicamento, la estadística es la evidencia del éxito de sus trabajos de investigación. Y para un estudiante
de cualquier nivel, la estadística son las calificaciones logradas en todos los problemas de un curso del
semestre o del año.
Todas estas personas están empleando correctamente el tennino estadística y sin embargo cada una le da un
significado ligeramente diferente y la usa para un propósito un poco distinto. Estadística es un vocablo que
en plural puede designar datos cuantitativos (por ejemplo la producción de frijoles por manzana cultivada)
y en singular puede designar una disciplina (por ejemplo, se dice que un estudiante se puede especializar en
estadística). En nuestros dfas la estadística se ha convertido en .un método efectivo para describir con
exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos o físicos y sirve
como herramienta para relacionar y analizar dichos datos.
La Estadística es la técnica por medio de la cual la ciencia se vale para la recopilación, clasificación,
presentación, análisis e interpretación de datos con el fin de realizar una toma de decisiones más efectiva.
Clasificación de la Estadística
La Estadística se preocupa en gran parte de los promedios o medidas de sucesos pasados, de la variabilidad
de estos procesos y de la probabilidad de ocurrencia de futuros sucesos de acuerdo con los promedios
pasados.
Se divide en:
I
a) Estadística Descriptiva: Que trata de los métodos de organizar, presentar y analizar datos numéricos de
modo que se haga fácil su interpretación.
. b) Estadistica Inferencial: Trata de los métodos de obtener conclusiones probables acerca de una
I
a) Cualitativas
b) Cuantitativas
A las variables cualitativas, también se les llama atributos, ya que son expresadas mediante palabras. A las
partes en que se divide un atributo se le llama
Una variable cualitativa, produce datos cualitativos los que se subdividen en:
a) Datos Nominales
b)Datos
Los Nominales se obtienen cuando se definen las categorías o atributos y se cuenta el número
observaciones o valores que quedan en cada una.
Ejemplos:
Los Jerarquizados constan de valores relativos para denotar orden: 1°, 2°, 3°,4°, etc.
Ejemplos:
1. Concurso de belleza
2. Campeonatos
Competencias
Las Variables Cuantitativas son las que se expresan mediante valores numéricos; es decir, que sus
resultados son números, peso, estatura, temperatura, etc, se subdividen en:
a) Variables Discretas
b) Variables Contínuas
••
._--------------
••"
. . . .".",..••••".,.*
Una variable cuantitativa es discreta, cuando sus resultados pueden ser números enteros, por ejemplo:
Una variable cuantitativa es continua cuando sus resultados pueden ser números enteros o decimales; por
ejemplo:
En la mayoría de los casos, ambas clases pueden distinguirse observando si los datos son el resultado de
contar o de medir. Un conteo siempre produce datos numéricos discretos y una medición por lo general
datos contínuos; por lo tanto, la medición y el conteo es lo único que será necesario tener presente al hablar
de datos numéricos. La edad y el peso de una persona, son ejemplos de variables cuyo dato es continuo y no
discreto. ¿Puede explicarlo?
1
Hay casos en que los datos se obtienen en forma numérica, y sin embargo, son informados y analizados
como atributos. Dos de tales casos son:
¿ Qué tipo de datos son los correspondientes a: la placa de un automóvil, si se considera solamente la parte
numérica?, ¿el número de un taxi?, ¿el número de la camiseta de un atleta?, ¿el número de teléfono?, ¿el
número de las aulas de la universidad? Apárentemente esos números corresponden a una variable discreta,
puesto que solo tienen números enteros, sin embargo; tales números sólo sirven como etiquetas o marcas Se r
de identificación. Como puede observarse, la apariencia de los datos, después de que se han anotado, puede de 1
ser engañosa en relación con su tipo. Si no se olvida examinar un dato individual, se tendrá poca dificultad
en distinguir entre datos que son atributos, y datos discretos y contínuos.
Los datos son originados de alguna forma. Los lugares-o sitios de donde se obtienen se llaman Fuente De
Datos, que pueden ser: Un
b) Boletines informativos
••
•
AIi.i . .
Variable
1. (4) * La velocidad de un automóvil en km/h
2. ) * El número de iglesias de Comayagua
3. (2 ) * Los árboles cortados por día en los bosques hondureños
4. ) * El total de tornillos producidos por día en una fábrica
5. (2) * Número de abortos reportados mensualmente en Tegucigalpa
6. ) * El tiempo requerido para realizar un trabajo
7. (5 ) * La religión de un individuo
8. * La raza de un individuo
9. ) * La altura de un tipo experimental de maíz
10. (4) * El período de duración de un bombillo eléctrico
11. * Carreteras en km por clase
12. * Producción agrícola seleccionada
13. ( ) * Longitud de cerrojos producidos por una fábrica
14. * El precio de un artículo
15. * El número de camas en un hospital
16. * El coeficiente intelectual de las personas
Se requiere saber el costo de la educación. Uno de los gastos que hace un estudiante es la compra de libros
de texto. Sea x el costo de todos los libros comprados este semestre por cada estudiante de cierta
universidad. Describir.
,
20. ¿Qué razones le daría sobre el porqué se debe tomar una muestra en vez de estudiar a cada
miembro de la Roblaciqn?J"" .
·.1
Determinar las modalidades en que se dividen las variables:
Un técnico de control de calidad selecciona partes de una línea de_ ensamblaje y anota para cada una de ellas
la siguiente informaci6n: Clasifique las respuestas como 1 =atributo; 2 =dato de variable discreta; 3 =dato
de variable continua. Escribirlos dentro del paréntesis.
Identificar uno de los siguientes casos y escribir dentro del paréntesis: 1= atributo; 2 = variable
discreta; 3 =varible continua
preferencia
37. El tiempo necesario para que una herida cicatrice cuando se utiliza un nuevo medicamento
38. (2) El nÓInero de llamadas telef6nicas recibidas en un conmutador en 10 minutos
39. La distancia a la que puede llegar un bal6n de fútbol al ser pateada
40 (2) El nÓInero de páginas escritas por minuto en una impresora de alta velocidad 1
41. La clase de árbol utilizado como símbolo navideño e
42. (2) Las marcas de las computadoras que tiene. un laboratorio de cómputo 1
p
a
1. O 1
Siempre que se hace un análisis estadístico, se cuenta con variables ya sean cualitativas o cuantitativas;
como las cualitativas están expresadas alfabéticamente, a cada modalidad se le puede asignar números que
son regidos por ciertas reglas; de esta, manera se está estableciendo una escala de medida para los datos
alfabéticos.
Los datos alfabéticos a los cuales se les asigna escala de medici6n numérica no pueden ser utilizados para
aplicarle algunas operaciones aritméticas; además, existen variables cuantitativas a las que tampoco se les
puede aplicar ciertas operaciones; es por eso que se han establecido 4 niveles de medici6n:
n• •. 'o-o-r e-y-e-s-.
M"·i"'Ijit·i,.-n.,,=.. .
Nivel Nominal
A este nivel se le considera como el más "primitivo", el más "bajo", o el tipo más limitado de medición.
Este nivel se refiere a los datos que solo pueden contarse colocarse en grupos o categoríaS, a los que con
frecuencia, para su procesamiento se codifican como 1,2,3,.. números que no podrán ser utilizados para
realizar aritmética, sino que solo como medio para identificar a los elementos de las categorías o clases, a
las cuales pertenecen los objetos estudiados. La información presentada en la siguiente tabla representa
s medición nominal:
o
disposición de las religiones podría haberse modificado. Se podría haber enlistado la Católica como en
10 lugar, la Judía en 20, Y astsucesivamente. Esto indica fundamentalmente que no existe orden particular,
su
para los grupos ni tampoco unidad de medida. En este nivel las categorías son mutuamente excluyentes, lo
por ejemplo, que una persona no podría ser protestante y al mismo tiempo no tener religión;
lto
además tambjén son exhaustivas, lo cual significa que los miembros de la población o muestra deben
aP.arecer necesariamente en una de las categorías. Si una persona se negara a indicar cual 'es su se
le incluiría en la categoría "religión no indicada". se convirtiera al budismo, su religión se incluiría en la
categoría "otra religión". .
En este nivel, los números son utilizados como medios para identificar los elementos de una' categoría; así
por ejemplo las categorías podrían codificarse con 1,2,3,... en donde 1 representa protestante, 2 católico y
así sucesivamente. Lo anterior facilitaría el conteo cuando se utiliza una computadora u otro dispositivo.
'as;
__ - " ! j Los siguientes son atnbfJtos que se miden con una escala o nivel nominal:
profesiones, nivel de organización, raza, religión, partidos políticos, estado
civil, etc.
lara
les
•
", ".
Nivel Ordinal
••
Este nivel implica que una categoría es mayor que la siguiente. En caso de que puedan detectarse diversos
grados de un atributo o propiedad, la medida ordinal es la indicada, puesto que entonces puede recurrirse a
la propiedad de "orden" de los números asignándolos a los objetos en estudio, de modo que si la cifra
asignada al objeto A es mayor que la de B, puede inferirse que A posée un mayor grado de atributo que B.
En este nivel los números pueden asumir el lugar de los objetos en estudio, puesto que los números son
representaciones parciales de éstos. En la medida ordinal, los números constituyen una especie de resumen
para trasmitir información. Por ejemplo en un concurso de belleza, en lugar de informar que "se juzgó que
Beatriz era la menos bonita, seguida de Juana, María y por último Alicia que fue la más bonita de todas", es
más fácil decir y establecer lo siguiente:
María
La principal diferencia entre un nivel de medición nominal y uno ordinal es la relación "mayor que" entre
las categorías de nivel ordinal. Por otra parte la escala ordinal de medición, tiene las mismas características
que la escala nominal, es decir, las categorías son mutuamente excluyentes y exhaustivas.
__ Los siguientes son atributos que se midén con esta escala o nivel de medición:
Incluye todas las características de la escala ordinal, pero además específica que la distancia entre números 1
o valores, es la misma. En este caso la unidad de medida se defme en términos de algún parámetro (grado, ,r,
pulgada, centímetro, onza, etc). Una de las características distintivas de la medida de intervalos es que el
cero no necesariamente implica que el objeto carece del atributo en estudio. Por ejemplo, el que el agua este
a O grados centígrados, no quiere decir en absoluto que carezca de temperatura puesto que en una escala de
intervalo el punto cero es puramente arbitrario.
Los números asignados en una escala de intervalo poséen la propiedad de distintividad y orden, y además,
debe tenerse en cuenta que, en este caso, la diferencia entre los números si es signficativa. Por ejemplo, si la
temperatura de hoyes de 60° F Yla de ayer fue de 55° F, sabemos entonces que la temperatura de hoyes de
5° F más alta que la de ayer y si la de mañana va a ser de 70° F, sabremos así mismo que, había más
semejanza entre ayer y hoy que entre hoy y mañana puesto que la diferencia entre 55 y 60 es la mitad de la
que hay entre 60 y 70.
Las medidas de intervalo implican la asignación de números de modo tal que, a iguales diferencias entre
grados del atributo estudiado en un objeto, corresponden iguales diferencias entre los números. El nivel de
medición por intervalo tiene las propiedades de ser mutuamente excluyentes y exhaustivas.
Es el nivel de medición "más alto". Tiene todas las características del nivel por intervalo, pero además
posée un punto cero significativo y la razón, relación por cociente entre dos números también es
s significativo. Siendo que cero ya no es arbitrario sino un valor absoluto, podemos decir que A tiene dos,
tres, o cuatro veces más la magnitud de la propiedad presente en B.
La estatura y el peso son ilustraciones de este tipo de escala, puesto que una persona que mide 6 pies, es el
doble de alto de un niño que mide solo 3 pies, y dichas escalas poséen denominación puesto que las
razones de los números en las escalas así denominadas tienen un determinado sentido, pudiéndose
interpretar como razones entre las cantidades de objetos medidos. Las magnitudes físicas fundamentales
(espacio, tiempo, masa) son medidas en este nivel.
;?::nW~t::.::~~:::::.:, . .
. . . .:.:.:.:.: : : : . . :
r::¡:¡::ttti q 1\1
Del N° 1 Si es falsa, anote la respuesta correcta sobre la
os
lo, raya.
el 1. Las gráficas, tablas y diagramas que muestran los datos, son ejemplos de Estadística
ste
de _
2. (V) Una muestra de consumidores probó una nueva hojuela de queso y la clasificó de
.ás, excelente, muy buena, regular o mala. El nivel de medición para esta investigación es
i la de intervalo.
de ----------------------_.:._------- •.. _----------------------------------------------------------------
l1ás 3. ) Un sindicato de plomeros y colocadores de tubería tiene 5020 agremiados. Se
la seleccionó e interrogó a un grupo representativo de 248 integrantes. Se considera que
_
4. ) Un total de 9386 madres solteras menores de 15 años tuvieron un hijo. El año pasado
I de hubo 6950 muertes accidentales en enero. La mayor trucha pescada en un lago pesó
25 kilogramos. A este conjunto de cifras y datos se le denomina estadística.
o-r-a-c--.¡.---o-----R:-e-y-e-s-. YC
'
•• •
•
. .
5. (V) Los métodos empleados para saber algo acerca de la pobláción de truchas en el Lago
de Yojoa con base en una muestra de 40 truchas se denomina Estadística Inferencial.
7. (V) La Cámara de Comercio preguntó a una muestra de personas que se asoleaba en Tela,
si vivían en Tela o en una zona a menos de 30 millas de la playa, si vivían fuera del
departamento, o en un· país extranjero. Este proyecto de investigación se relaciona
con datos de nivel nominal.
9. El nivel nominal se considera el "más bajo" nivel de datos y estos deben ser
mutuamente excluyentes. .
,
10. Se seleccionó una muestra de 3014 trabajadores en la industria del acero -para
indicaron que lo harían. Puesto que el número muestreado es grande y los que están a
favor la huelga constituyen más del 50%, puede suponerse que la mayoría de los
11. Una Cía Comercial de Puerto Cortés pidió a una muestra de 1960 consumidores que probaron un
platillo de,pescado congelado de elaboración reciente por un fabricante, denominado Fish Delight. D« .
los 1960 consumidores consultados 1176 dijeron que probarían el platillo si se pusiera a la venta.
a) ¿Qué informará la compañía al fabricante respecto a la aceptación de Fish Delight?
b) ¿Es éste un ejemplo de estadística descriptiva o inferencial?
12. La Dirección de Censos y Estadística de Honduras informó acerca de las poblaciones en los siguientes
lugares.
1m•
•
li. i.ll d .i.i
.
o de y
Básicamente las técnicas quepenniten organizar los datos son la tabular o cuadros y la gráfica. La primera
es una de las fonnas mas sencillas, se hace mediante tablas o cuadros. Generalmente se colocan los valores
en orden ascendentes o descendente de magnitud, lo que ofrece las siguientes ventajas:
de o
a) Título
b) Encabezado y Subencabezado
c) Concepto o columna matriz
ti) Cuerpo
e) Nota preliminar
f) Nota de
g) Fuente de
Las cuatro primeras y la última, son básicas y deben ser siempre incluidas en cualesquier tabla o cuadro
estadístico. Las partes restantes, no son relevantes y pueden no estar presentes.
•
La figura de la izquierda corresponde al esquema de un cuadro o tabla, que pennite" observar la ubicación de
cada unade las partes del mismo; la de la derecha es otro esquema que también se utiliza; en ella se puede
observar, que la parte superior de la primera columna se subdivide mediante una diagonal,compartiendo una
parte con "Encabezado· y la otra con "Matriz". El siguiente cuadro muestra lo antes descrito
El título es una descripción del contenido del cuadro. Un título completo usualmente indica:
_ Lo que son los datos incluidos en el cuerpo del cuadra
_ Dónde está el área representada por los datos
Cómo están clasificados los datos
b) El
El encabezado es el título de la parte superior de una columna o columnas. Los cuadros mas simples
..........N u..,.·
.m
z• •
i
¡
•
.. .
pueden consistir solamente de dos columnas y dos encabezados: uno para los conceptos y otro para los
datos. Sin embargo, muchas cuadros tienen más de dos encabezados y columnas y algunas veces tienen
encabezados principales y sub-encabezados.
¡
Las descripciones en filas del cuadro, son llamados conceptos o columna matriz. Los conceptos son
colocados alIado izquierdo del cuadro. Usualmente representan las clasificaciones de las cifras incluidas ,
dentro del cuerpo del cuadro. La naturaleza de ellas, es indicada por los encabezados de la columna,
;
incluyendo la columna matriz. ..
d) Cuerpo:
El cuerpo es el contenido de los datos estadísticos. Estos datos son arreglados de acuerdo con las
descripciones o clasificados de los encabezados y conceptos por lo tanto, la presentación efectiva de los
datos del cuadro depende de los arreglos de las filas y columnas.
e) Nota Preliminar
Las notas preliminares o notas del encabezado son usualmente escritas justamente arriba de los
encabezados y debajo del título. Son usadas para explicar ciertos puntos relacionados con el cuadro
completo que no han sido incluidos en el título ni en los conceptos.
t) Nota de Pié:
Las notas de pié son usualmente colocadas debajo de los conceptos. Son usadas para clarificar algunas de
las partes incluidas en el cuadro que no son explicadas en otras partes del mismo.
g) Fuente de Datos
La fuente de los datos se escribe debajo de las notas de pié. Si los datos fueron recopilados y representados
por la misma persona, no es necesario establecer la fuente en la tabla, ya que éstas se mencionan en la
explicación del cuadro. Si los datos fueron tomados de otras fuentes, estas deberán ser declarados en el
cuadro, u obtener información adicional de la fuente original, si es necesario y dará propio crédito o
responsabilidad al recopilador original de-los datos.
Cada uno de los siguientes cuadros,..muestran todas las partes del mismo tanto las que son partes básicas,
como las que pueden faltar sin que por ello la información se altere; además, también muestran las
categorias correspondientes en estudio.
Ejemplos:
Distribuci6n de Personas por Actividad
Matricula según sector de
Económica. Honduras 2005
Educación Media Honduras
.•' 1824.2
Mineria . 143.8
Industria
Construcción ..
m•
••
QU.i.' i
. .
Cuadro N° 3
CuadroN°4
s
o
. :'. •0.:.::.:•
..;
1. Identificar cada una de las partes de un cuadro.
2. Interpretar el significado de cada número en cada cuadro tanto en el cuerpo
del cuadro como en los totales marginales.
3. Presentar cuadros que tengan un esquema semejante al cuadro de la
derecha de la página 11 anterior
4. Ampliar el cuadro N° 4 a las Universidades nuevas de Tegucigalpa que no
aparecen en él, haciendo un estimado de docentes con el grado académico
correspondiente
H
.m
-ez• •
.. • • •MiR
Compara el número de casos de una categoría dada (f) con el número total de casos
en la distribución:
Ejemplo:
En una clase hay 40 estudiantes, 10 de los cuales son hombres. ¿Cuál es la
proporción de mujeres?
Solución:
40 - 10 = 30 Total de mujeres
Es la frecuencia de ocurrencia de una categoría por cada 100 casos. Indica que una
. .
(2)
Se
a)
El problema anterior se expresa en porcentaje así:
p = (100%)= 75 %
El 75% de son mujeres ... Resp.
Compara el número de casos de una categoría (fl ) con los de otra (f2), generalmente
e)
(3.1)
(3)
Ejemplo: .
En la clase de MAE - 200 hay 45 mujeres y 25 hombres. a) ¿Cuál es la razón de
hombres a mujeres?, b) ¿Cuántas mujeres habrán por cada 1000 hombres?,
c) ¿Cuántos hombres habrán por cada 1000 mujeres
m•
•
Q'i.i·¡'di'.i'.'d"" .
~. . ~, ~
Solución:
=
a) f l Frecuencia de hombres 25 = =
b) f l Frecuencia de mujeres = 45
f2 = Frecuencia de mujeres = 45 f2 = Frecuencia de hombres = 25
R= ¡~ (100) = 55.5 ~ 56 R = 45
25 (1000) = 1 800
Significado: Por cada 100 mujeres Significado: Por cada 1000 hombres
hay 56 hombres Resp.
oo. habrán 1 800 mujeres ... Resp.
R=. JL
=
'~laClase
f (1000)
2
25 .
R= 45 (1000) =555.6 ~556 Que el profesor indique la fonna de cómo el
alumno debe utilizar cada uno de los 4
Significado: Por cada 1 000 mujeres cuadros anteriores para calcular:
>. habrán 556 hombres oo. Resp. proporciones, porcentajes y razones.
a Ejemplo 1:
En el cuadro N°2 calcular a) La proporción de Bachilleres en 2005; b) El porcentaje de nonnalistas en
. 2006; c) ¿La razón y su significado de matriculados en el ciclo común en 2006 a matriculados en
aI:tística en 20051; d) ¿Cuántos matriculados en Ciclo Común hay por cada 1000 matriculados en
Bachillerato en el 20061..
Solución:
a) N = 1 208.1+328.7+120.9+110.4 = 1 768.1 miles ... Calculando N para 2005
N= 1211.5+433.0+121.3+110.5 1876.3 miles = ... Oilculando N para 2006
=
f 328.7 miles de personas ... Frecuencia de Bachilleres en 2005
R = \~~~l .'e~s (100) = 1 097.37~ 1098 OO. Sustituyendo y operando en la fómula (3)
i ".16
"H;-o-'r-a-c-'i'-o---¡¡R·e-'-y-::-::Ce-=s'--"Nr:'ú<'n;<~
-=e-=z• •
1
L_ i-·-~'('})·:·-"3r'~*-
: '
'mwiéirie
.
. .
. ) "MiR
d) f l = Frecuencia de matriculados en el Ciclo Común en el 2006 = 1 211.5 miles
f z = Frecuencia de matriculados en Bachillerato en el 2006 = 433.0 miles
Ejemplo 2.
En el cuadro N°4, calcular: a) El % de catedráticos universitarios con grado de Maestría, b) El % de
catedráticos con doctorado de la U.P.N. con respecto a supersona1 docente, c) ¿Cuántos catedráticos
con grado de Licenciatura hay UNITEC por cada 100 con título de Maestría de la U.l.C.V.? d)
¿Cuántos catedráticos con Doctorado hay en la U. CAT por cada 100 Licenciados de la U.N.A.H.?
Solución:
a) p= (100%) = 0J7(100%) =42.71% ... Explique lo que se hizo
42.71% : de "Master" ... Resp.
y
La calculadora científica no programable CASIO fx-82MS o cualesquiera de la misma familia, es la que se
utilizará en este curso de Estadística Aplicada. Una razón para ello, es el bajo costo de adquisición y otra,
es que es muy completa.
•• N"7:ú-,..ñ~ec-:::.z ~'
.••d JWdii 4.
En esta calculadora la pantalla tiene una presentación de dos líneas lo que hace posible la visualización de
la fórmula de cálculo y su resultado al mismo tiempo.
En este momento se usará la tecla • para hacer cálculos de potenciación y radicación. La primera se
identifica con la tecla cuyo símbolo de color blanco está sobre la tecla y se acciona con pulsarla
directamente. La segunda que es la radicación se identifica con • y está sobre el cuerpo de la calculadora
en color amarillo y para accionarla primero debe pulsarse la tecla gris • y después para activar la
radicación.
1. P = (1+0.0432)8
Solución:
Cualesquiera que sea el método seleccionado se le recomienda al usuario practicar con operaciones
;sp.
similares a [m de adquirir destreza en el uso de su calcuradora y especificamente en la potenciación
y radicación
2. =:! 4320 I
3840
Solución:
Shift
5 38400 ... Presionando primero el índice (5) de la
raíz, después la teclalShift" para activar
.esp
la radicación. En la pantalla aparece
5 y se sigue el algoritmo de la
izquierda utilizando los paréntesis y
los demás
le se 1 ... Valor desplegado en la pantalla
otra,
R 1.023836256 ... Resp.
o---..R·e'""y-,-e,,-s--.N"'u:>é·
.m
••
~
. . • •QJiH
5480 1_ 1
4750 i;
SoluciÓn:
demás datos
T de Promedio t.
Tasa: Indica una frecuencia relativa con que un hecho o suceso se presenta dentro de un conjunto dado, en
un determinado período de tiempo y expresa una probabilidad por 1000 u otro múltiplo de 10.
Se supone que la población un comportamiento de .tipo exponencial, dado por la fórmula (7).
donde:
t = Tasa crecimiento promedio anual La fórmula (7) se emplea para estimar
Pf = Población final proyección de poblaciones
Pi = Población inicial Eje:
n = Tiempo en años entre Pe YPi
• • H"o=-=r=-=aC-:c"'i-=o-R"'--=e-=-=y=-=e=-=s'-N'-'-:>Ií""ñ'---e=-=z
m".I·"""·,,.- 'n", ~ .
Si de la ecuación anterior se despeja la variable t, que representa la Tasa de Crecimiento Promedio Anual,
se tiene:
= (1+t)n
1
.
....
1.··.·.··.··.··-1 · (8)
_ . ' .
' ... ¿Qué se hizo?
- t.":."
Esta fórmula (8) se utiliza para estimar la tasa de_ cambio promedio anual. Pe Y Pi son datos históricos
dados en el problema. .
Ejemplo 1:
Con los datos del cuadro de abajo calcular a partir de 1992, la población de esa ciudad para 1998,
Solución:
Pe =? Pi = P92 = 4,604.8 (miles de personas) ... Datos del problema
t =1.03%= =0.0103 ... la tasa como decimal
n = 6 (años entre 1998 y 1992) ... (1998 - 1992 = 6)
P98 = P92 (1+t)n ... Empleando la fórmula (7) Sustituyendo y
operando. Usando la calculadora científica,
= 4 604.8(1+0.0103)6 y truncando el resultado a las décimas
= 4 604.8(1.0103)6 = 4604.8 (1.0634125)
= 4 896.8 (miles de personas) oo. Resp.
Este problema también se puede resolver con la calculadora utilizando el algoritmo de la potenciación así:
P98 = 4604.8 (1+0.0103)6 oo. Sustituyendo valores en la fórmula (7).
Ejemplo 2.
Con los mismos datos, proyectar la población de esa ciudad para el año 2008 considerando las
poblaciones de 1990 y 1993.
i
j
ú-::ñ.-e-z-:• •
.
.
. . •• ,,'uiR
Solución:
t =? P f = P93 = 4 700.3 (miles de personas) ... Datos del problema. Se desconoce el
n = 3 (años entre 1990 y 1993) valor de la Tasa de Cambio Promedio
Anual (t)
Pi = P90 =4313.4 miles de personas
I
t=
= (1.029047167) - 1
t = 0.029047167
Este valor para 1 también se puede calcular utilizando la calculadora y el algoritmo de la radicación así:
. ¡
= 7221.9 (miles de personas) oo' Truncando a décimas el resultado.
P 2OO8 = 7 221.9 (miles de personas) ... Resp.
Esta parte del problema puede resolverse con la calculadora utilizando el algoritmo de la potenciación asi:
P 2008 = 4700.3 (l +0.029047166)15 Sustituyendo valores en la fórmula (7)
de la potenciación
Reyes Núñez
__
mil,I.'IC.'.'.•'
l. El valor de la Tasa de Cambio Promedio Anual (t) siempre debe expresarse
48
. .
como decimal, al momento de proyectar la población.
2. El valor de t debe tener todas las cifras posibles de la pantalla de su
calculadora, lo que permitirá una proyección más aproximada.
3. En el ejemplo 2, la proyección bien pudo hacerse a partir de 1990 y el
resultado debe ser el mismo. Para la proyección, se selecciona el año que se
desée y qu.e esté dado en el problema. i i i co.mpruébelo haciendo la
a proyeccion desde 1990!!!
4. El resultado final de una proyección puede expresarse con la aproximación
que se desee. En los ejemplos anteriores los resultados se han dado
truncados a las décimas.
8) Elaborar un cuadro
·io 1. Se entrevistaron muestras aleatorias de hombres para determinar si fumaban cigarrillos o no.
Se encontró que de 29 hombres, 15 eran fumadores y que de 30 mujeres, 20 eran fumadoras.
2. En 2006 los graduados de la UNAR fueron 1979 de los cuales 1176 eran hombres. En el área Físico
ón
Matemática se graduaron 323 hombres y 225 mujeres; en el área Económica-Administrativa 280
Jla
fueron hombres y 193 mujeres; en el área de Ciencias BiológiCas y de la Salud fueron 273 hombres y
180 mujeres y en área de Ciencias SoCiales 300 fueron hombres y 205 mujeres. Los datos fueron
proporcionados por la Sección de Estadística de laUNAR, en ese mismo año.
El período de investigación fue del 25 al 29 de noviembre de 2006. Completar el cuadro con los
'. totales marginales y el gran total.
·.m
::"'z• •
~
. . •• ".i&
Matriculo. Universitaria de UPN En distribución de izquierda, calcular:
por modalidad de estudio. 2° y 3° período
Honduras 2003 ·2005 8.La tasa de cambio promedio anual para los
11
2(
por
Un
(pu
m•
•• ú ñ--:e-z
I iiiii.i.i"iii.i,w-d.dM1Cf,
. .
...VIENE DE LA PAGINA ANTERIOR
.•. ,••. • .• •
··· ·.•
.'.
. ·.:,•·. ·.•·,•,7•. •. .• •. .• . : :· :
·H·.
s .
. '
5
. ....
n .• t.• ...•. .• •. :.• .• . •. •.¡ :
" . ... ': ..:.:::: ·:0 ·" ,:".
::.- .., :..' ..: :.. .. ,":",
.... · :.
'.'
la
20. El porcentaje de matriculados por carrera en la Facultad de Humanidades en el año 2005 tomando
1.5
Para lograr una mayor comprensión números arreglados en forma tabular, utilizamos los gráficos
que nos destacan algunos hechos claramente. Un gráfico para ser de utilidad real, debe ser simple y
poner mayor énfasis en los rasgos significativos de los datos.
Un gráfico estadístico es la representación de un fenómeno estadístico por medio de figuras geométricas
(puntos, líneas, rectángulos, círculos, etc.) cuyas dimensiones son proporcionales a la magnitud los
datos presentados. Entre estos gráficos se tienen el de barras simples, el de barras el
.el de líneas, el de barras compuesto o de barras seccionadas. . l
TE... de barras bidireccionales, mapas, pictograma.
Horacio ••
di•
. .
..
a) La linea base: Todas las barras o rectángulos deben partir de una línea horizontal llamada linea base,
para poder establecer comparaciones entre los mismos, por una simple y rápida inspección.
b) El ancho de las barras: Todas las barras o rectángulos de un gráfico tendrán el mismo ancho, siendo
éste arbitrario. El ancho de cada barra generalmente depende del número de datos a representar con
c) Separacion entre barras: El espacio entre barras o rectángulos, no debe ser menor que la mitad del
ancho de una barra, ni mayor que el ancho la misma, teniendo siempre la misma distancia.
Algunos autores usan como espacio de separación entre barras, la mitad del ancho de la barra.
Producción de Café
Ejemplo. Honduras 1990 -1994
s
de Café a.
Honduras 1990 -1994
(Millones de sacos) c)
rr
1990 e)
1991
1992
1993 30
1994 48
Fuente de Información:
Solución:
b) En la vertical usar escala apropiada para representar la producción en millones de sacos (divisiones
iguales: I divo = 10 millones de sacos)
c) Dibujar el diagrama de barras correspondiente.
En este tipo de gráficas, se presentan dos o más indicadores que corresponde a una unidad del sujeto, esto
es, dos o más variables correspondientes a un dato identificativo.
Para el gráfico de barras comparativo se utiliza una escala que partiendo de la linea de base tenga la
amplitud necesaria para representar los datos de la investigación.
m •
• • H'-;-o-r-a-c....¡
.
-.:.. - .
I mil.I .I '.'.".- . .
Como cada unidad del sujeto corresponde a más de un indicador, las barras que las representan están
yuxtapuestas, separando cada dato identificativo de acuerdo con las normas expuestas para la separación
,. entre barras, esto es, que el espacio entre grupo no debe ser menor que la mitad del ancho de la barra, ni
mayor que el ancho de la misma, pero manteniéndose la separación una vez determinada. '
e
Los rectángulos o barras representativas se distinguirán unos de otros por los diferentes rayados o
sombreados. Este gráfico se utiliza para establecer comparaciones tanto entre los valores absolutos como
o
relativos.
'Ejemplo.
Carreteras en Km. Por
Honduras 1995 -1997
lo
fel
ia. ,.
Fuente de lnfonnación: Banco Central de Honduras
Solución:
a) Trazar divisiones iguales en la recta vertical, por ejemplo: 1 divo es igual a 1,000 kms.
b) Trazar la linea base, la horizontal para colocar en ella los períodos-años
c) Hacer el diagrama para los tres años tomando los datos del cuadro de arriba
d) Efectuar el rayado y/o sombreado para cada tipo de carretera en el mismo año y usar ese mismo
rayado y/o sombreado para los períodos restantes.
e) Especificar el indicador. (Véase el gráfico de barras comparativas de abajo).
iones
1000
, esto Pavimentadas
I
.r
• :.;;"""'"",.,,,.,,.,,,
'. ..
3. Diagrama de Barras Compuesto o de Barras Seccionadas
Este diagrama es muy similar al diagrama barras comparativas, su diferenciaestaba en el hecho de que
las barras se superponen para un mismo período de tiempo. Representan en una sola figura geométrica,
datos cuyos conjuntos forman un todo definido. También pueden representar la relación porcentual de cada
una de las partes, en base al 100% que forma la totalidad de ellos.
Ejemplo:
Una cadena de tiendas de descuento está organizada en tres grupos para ventas y compras. Cada grupo
está dirigido por un gerente general. El cambio en ventas totales para los años de 1987, 1988 Y 1989 Y
el «ambio para cada grupo en relaci6n con el total se ha de representar en una gráfica o diagrama de
barras compuestos o de barras seccionadas.
Ventas
*,
Construir un diagrama de barras compuesto para la información anterior:
*1
Solución:
a) Trazar un sistema de ejes cartesiano con escala apropiada y al gusto del investigador.
b)Dibujar las barras superpuestas de acuerdo con la escala y el valor dado en el cuadro, para cada año.
c)Trazar el diagrama con su respectivo indicador, tal como a aparece a
Lo
Diagrama de Barras Compuesto o de Barras Seccionadas dis
Ventas de la 'ase
Ropa
.,
Para
miSI
mét<
¿ Qué conclusiones se pueden obtener ? decr·
•
• • Horacio Reyes Núñez
I mii ..... . .
4. DÚlgrama de Barras Bidireccionales
A una gráfica bidireccional, se le denomina también de dos direcciones, de dos sentidos o bilateral. Una
gráfica bidireccional puede utilizarse para mostrar pérdidas y ganancias, actividades por encima y por
.a debajo de lo normal, y cambios porcentuales de un período a Para ilustrar esto, supóngase que las
ventas de aparatos electrónicos de casetes, tocadiscos compactos, etc., en un establecimiento durante los
primeros seis meses de 1998 se han de comparar con las de los primeros seis meses de 1999. En este
problema el objetivo es mostrar los cambios porcentuales en ventas, no el cambio en cantidades de dinero.
Los datos de las ventas (en Lempiras) son:
'Y
de Ventas los Cambio porcentual de
primeros seis mes 1998 1999
l
.,.-.-:",:-:.:.:.:.".:.:.:.:.:.:.:.:-:::::::.:.:.:.:,",",
* Obsérvese que las ventas de aparatos electrónicos disminuyeron 25% de 1998 a 1999
V99- V98 (3000-4000) x 100% =-0.25 x 100% =-25%
V98 4000
* Las ventas de tocadiscos compactos durante el mismo período aumentaron 50%
Los cambios porcentuales se dividen en dos grupos. Por lo general los incrementos porcentuales se
disponen en orden descendente, y por común los decrementos porcentuales se disponen en orden
ascendentes.
Para elaborar una gráfica de barras bidireccional, los cambios porcentuales por lo general se grafican en el
mismo orden ascendente o descendente (diagrama siguiente). La línea central es el origen de cada barra. El
método mas común consiste en graficar los incrementos porcentuales' a la derecha del origen y los
decrementos porcentuales a la izquierda, según se ilustra
¡
I •z~•
. . ,;,¡.'I"'C'ir.'.JJD!CD'C'
Diagrama de Barras Bidireccional de Cambios Porcentuales
El siguiente ejemplo muestra un diagrama bidireccional de la pirámide de edades que distingue entre la
PIRAMIDE DE EDADES
100 +
90 - 94
80 - 84
Varones . ~.
--------.,_._- .....
70 -74 - -----
------------._
60 - 64 ----------
50 - 54
40 -44
30 - 34
20 -24 Ej
10 - 14
0-4
Personas
¿Cuántas mujeres hay aproximadamente entre 25 y 39 años?, ¿entre 40 y 44 años?, ¿ entre 71 y 79 años?
¿Cuántos hombres hay aproximadamente entre 55 y 59 años?, ¿entre 30 y 34 años?, ¿ entre 11 y 29 años?
m
••
•
• 5. Diagrama de Líneas
. .
El diagrama de líneas es ideal para representar tendencias de ventas, importaciones, precios, y otras series
de valores durante un cierto período.
Este diagrama, es un gráfico en el que se emplea un sistema de ejes cartesianos y puntos en el plano para
representar un fenómeno estadístico. Los puntos del plano que identifican las magnitudes que
intervienen, se unen con segmentos de rectas teniendo el cuidado de que siempre debe quedar un punto
sobre el eje YY'para "amarrar" la gráfica para que no dé la impresión que "esta flotando en el aire".
Se suelen usar los indicadores para identificar las magnitudes representadas en la gráfica, especialmente
cuando se analizan más de una.
Ejemplo 1
la La tabla siguiente muestra el número de quintales de trigo y maíz que Honduras cosechó durante el
In decenio de 1989 a 1999. Utilizar estos datos para elaborar un diagrama o gráfICO de l{neas de
ambos productos.
150
100
50
o
1989 1991 1993 1995 1997 1999
Años
Ingreso Compañía Monsato
600 1993 -1999
Ejemplo 2.
El siguiente diagrama de líneas 400
perdió aproximadamente en
-200
1995?
os?
-600
Este diagrama también llamado de sectores, resulta muy útil para representar una distribución de
subdivisión de un total en sus partes componentes y porcentajes que cada una de ellas representa. Para
porcentaje de observaciones que integran cada parte con relación al total de observaciones del conjunto.
Ejemplo:
l
De 450 personas, 125 hablan inglés; 100 hablan francés; 75 alemán y el resto hablan español?
Solución:
a) 450 - (125+100+75) = 450 - 300 = 150 hablan español 7.
p- 75 x 10O%
- 450 = 16.7% hablan alemán Ej<
c) Para hacer el gráfico circular, convertimos los porcentajes (%) en grados con la relación: 1% = 3.6° y se
a
a
el
los
Una autoridad urbana desea diseñar una gráfica que muestre a los causantes que asistan a una próxima
reunión, lo que sucede con el dinero que pagan por impuestos. El monto total recolectado es 2 millones de
ol?
lempiras. Los gastos fueron L. 440 000.00 para escuelas, L. 1 160000.00 para carninos, L. 320000.00 para
administración y L.. 80 000.00 para suministros. Una gráfica de sectores parece ideal para mostrar la
fracción de cada Lempira de impuestos que se escuelas, carninos, administración y suministros:
Convierta las cantidades totales a porcentajes del total general y represente los una gráfica ..
de sectores.
7. Pictograma
Es un diagrama de figuras. Es la forma mas amena de mostrar una situación, sin embargo, no la mas exacta
y las comparaciones que pueden hacerse son limitadas. Este tipo de gráfico son dibujos representando algo
que ilustran magnitud, comportamiento u otro fenómeno en estudio. Son utilizados a menudo para
representar datos estadísticos en forma que llame la atención a todo público que los vea. Muchos de estos
Ejemplos:
1.
Resp
y se
Ejemplos:
2.
Causa de mortalúúul en San Pedro Sula
30 muertes)
Es un señalizador visual y luminoso que orienta al usuario sobre como opera por ejemplo, la puerta
giratoria de acceso a un banco (Molinete).
Ejemplos:" Molinete liberado o bloqueado para paso, o también para compas de espera.
¿Qué es un Pictorama de
Es un visual y luminoso (flecha verde o señal roja o de contramano) que le permite al usuario
visualizar a distancia cual será el molinete que utilizará.
8. Mapas EstmIísticos
Mapas sombreados: Muestran para cada área geográfica, la magnitud del fenómeno que se estudia por
medio de diferencias progresivas en el rayado o sombreado. También puede mostrarse diferencias
utilizando colores.
Mapas punteados: Muestran la distribución geográfica de sucesos de tal manera que las regiones con
mayor frecuencia, muestran fuertes concentraciones convertidos en puntos o manchas negras.
Mapa de alfileres: Se consideran un caso particular de los mapas punteados donde en vez de puntos por
cada suceso, se colocan alfileres particularmente con aquellos de cabeza grande y de colores.
¡
I
.. .
"
70
0
- ....
.
0<1 1...
130 11I.
Lerta
uario
1. Construya un diagrama de barras simples usando las alturas de las montañas dadas en la tabla de abajo.
~.•e .'
a por
ncias
I. i J. . !.
s con
por
3. Se hizo un estudio del número de automóviles que pasaban por un cruce de calles. Los resultados
en la tabla. Construya un de barras simples para-la
9.
4. La siguiente tabla muestra la matrícula de escuelas privadas de Tegucigalpa, San Pedro Sula Ceiba de
2004 a 2006. Construir un de barras comparativas y otro de barras compuesto para la
siguiente información:
2004
2005
2006
10.
5. Trazar un diagrama circular para los valores dél cuadro de carreteras del año 1997 del cuadro de
carreteras de la página 25.
6. Trazar un diagrama de barras comparativa para la siguiente información de algunas escuelas normales.
También trazar un diagrama de barras compuesto.
<2003 \IV
. ,~.':. :.
.. ..
_
.. ;.;j. .. :;.. '
I;: ;;.:
h
• -o-'-a-c..¡. .
•
g'¡.i."'iii·'.•
7. Construír un diagrama circular para la siguiente información que permita ver comparativamente el área
~
. .
de los 7 países descritos en la tabla cuyas extensiones territoriales en Km2 Ud. tiene que investigar. (Sin
respuesta)
Honduras
El Salvador
:en 8. El Ministerio del Trabajo, realizó una investigación sobre la distribución de obreros de acuerdo con el
tipo de industria en que se emplean y obtuvo los siguientes resultados:
9. El precio al cierre de las acciones comunes de NCR, por trimestre, de 1995 de acuerdo con el informe
anual de NCR y con el Wall Street Journal es:
ade
66118
74112
82318
.•. . u .... .• 63114
Represente la tendencia de los precios al cierre de las acciones en un gráfico simple de líneas.
10. El Departamento del Ejército de Estados Unidos informó estas cifras sobre el personal en servicio
ro de activo en 1999 y 2006:
nales.
I
- 5235
10000
•·
Represente los cambios porcentuales, por sexo, para cada uno de los tres grupos entre 1999 y 2006 en
1
forma de gráfica de barras bidireccional. .
I
L Horacio Reyes
~
. . •• "m¡"
11. De acuerdo con el Bureau of Justice (de Estados Unidos) el número de reclusos con sentencia de muerte, por
grupo de edad, es:
(
a) Dependiendo de su objetivo, seleccione una forma de gráfica y represente los datos.
b) ¿Cuál es el objetivo de su gráfica?
s
12. Una empresa petrolera en su informe anual mencionó las siguientes ventas netaS y el costo de ventas F
desde 2002 (en millones de dólares): SI
S(
Represente en una gráfica la tendencia de estos dos conceptos desde 2002.
Cuando la toma de datos contiene mucha información, no es práctico escribirlos todos ellos en una misma
columna, sino que se emplea la. agrupación de los valores de la variable en clases o calegorias y se
Sol
detennina el número de valores de la variable que pertenecen a cada clase que se llamará frecuencia de
clase. Usaremos el símbolo "X" para las Clases o Categorías y "f' para las Frecuencias de Clase.
Rango: En una serie de datos, la diferencia entre el Valor Máximo (Vmax) y el Valor Mínimo (Vmin) de la
variable, se llama rango.
- Vmin (9)
El número de clases debe ser suficiente para que no se pierda excesiva información primaria y para que la
estadística resultante, sea manejable y útil para expresar las características de la variable. Algunos
investigadores rara vez utilizan menos de 6 o más de 15 clases. El número exacto que se utilice en una
situación dada, dependerá de la naturaleza, magnitud y orden de los datos.
••
.
.
I
Si en un momento dado no se está seguro del número de clases a utilizar, la fórmula (10) dada por
dará un número de clases sugerido (k):
La respuesta dada por la aplicación de la fórmula de Sturges no debe considerarse como final, sino solo
como una guía o sugerencia. El número de clases especificado por la regla, debe aumentarse o disminuirse
según convenga y en beneficio de una presentación clara.
lO" .
Para la aplicación de la fónnula (lO) utilizando la calculadora se usa la tecla situada en la parte
.tas superior de las teclas de funciones. Las letras de "log" son blancas y están sobre la tecla, lo que indica que
es una función que se acciona directamente con solo pulsar la tecla.
1. Log 75.38
Solución:
Después de conocer el número de clases sugeridos (k) es importante determinar el ancho de clase (C)
sugerido con la aplicación de la siguiente fórmula.
que la
19unos
en una
I
L Horacio Reyes
~
. . ".ii'
Ejemplo 1:
Cierta distribución de datos acerca de la contaminación del aire, fueron proporcionadas por 57 grandes
ciudades. ¿cuántas clases se sugiere fonnar con esos datos?
Solución:
N=57
k = 1+3.322 Log N ...Fónnula de Sturges
k = 1+3.322 Log 57 ...Usando la calculadora científica para hallar Log57 y
operando para hallar el valor de k==7 .
=1+3.322 (1.755874856)
k = 6.83 7
k = 7 Número de clases sugerido ... Resp.
k =6.83
k = 7 Número de clases sugerido ...Resp.
Una vez fijado el número de clases también llamadas intervalos de clase, se calcula el ancho o tamaño de S(
para lo cual se usa la fónnula (11) en la que tiene que conocerse necesariamente el Vmax y Vrnin de a)
la distribución y el número de clases deseado.
b)
Ejemplo 2:
c)
En una distribución de 50 elementos, el Vmax = 98 Y Vrnin = 47; a) Calcular el número de clases
(k) sugerido y b) El ancho de clase (C) sugerido.
Solución:
- k - k
e - 98-47 - 51 7 .2857
... Resp.
'-o-r
•
__ 1. En muchos casos al investigador utiliza un número prefijado de clase y por
lo tanto ya no es necesario utilizar la fórmula (lO) de Sturges.
les
2. El número de clases debe ser número entero, por tanto, si el resultado de la
operación es un número decimal, se aproximará al número entero inmediato
superior. (Véanse ejemplos 1 y 2 anteriores).
3. Hasta donde sea posible. debe de omitirse trabajar tanto con clases de anchos
diferentes, como con clases abiertas.
4. El ancho de clase no necesariamente será número entero, en algunos casos
7y podrá ser un decimal.
5. Si su calculadora es de otra marca debe consultar el manual para calcular el
logaritmo de un número
6. No existe el logaritmo de un número negativo. Su calculadora le enviará el
mensaje de MATIl ERROR. Pruébelo calcuhido log (-3.23)
Ejemplo 3:
La tabla 15 de la izquierda corresponde a la toma de datos
de las calificaciones finales de 50 alumnos de un Instituto
agruparlos en 10 clases.
c) Hacer una tabla que contenga las 10 clases, (X), los
datos ordenados correspondientes y la frecuencia (f).
o de Solución:
de a) Rg = Vmax - Vmin
=98 -51 =47 ... Resp.
b) Tamaño o anchura del intervalo C = = = 5 ... Resp.
c) Tabla de clases. Datos ordenados y frecuencias
lases
rando
1. Los intervalos de las clases bien pudieran tomarse a partir de 51; también
pudo haberse pedido 6, 8, 15 etc., clases, o simplemente calcularlos con la
fórmula de Sturges.
2. La clase 55 - 59 se forma contando 5 a partir de 55, así: 55, 56, 57, 58, 59.
C = 5 = anchura o tamaño del intervalo de clase.
3. La ordenación de datos además de ser útil para calcular la frecuencia de
clases, sirve para contestar algunas preguntas que pudieran ser pedidas de
acuerdo al problema que se analiza y resuelva.
••
.dil.,.'IIi"".'."".'"
. .
. '
T
f
Supóngase que en lá::Universidad Pedag6gica N.acional (UPN) se midió la estatura en púlgadas de 100
estudil!lltes' y se decidió formar una OistrilJuci6n con 5 clases tal como se muestra la
Tabla (Las aitúras
.. se registraron " ,
'. .'. ., ." ' . ". . P
El tamaño o anchura' de es la diferencia entre dos lúnites sucesivos de clase ya sean inferiores' o
Suele repre'sentarse por "C". anterior es válido para datos agrupados como los de la Tabla
N°16.
Solu
Si deseamos conocer el tamaño de un intervalo de clase dado por datos agrupados en una distribuci6n de a)
frecuencias como la de la Tabla N° 16, podemos optar por calcularlo con lítnites inferiores o superiores, así:
b) e
límites inferiores (Li) Con límites superiores (Ls)
c) D
C=63-60=3 C=65-62=3
C=66-63=3 C=68 -65=3
La marca de clase es el punto medio de intervalo de clase y se obtiene sumando los lúnites inferior y
superior de la clase y ·dividiendoesta por 2. La marca de clase se suele representar por el súnbolo
"Xm"; también se llama Punto medio de la La marca de clase se calcula con la f6rmula i2.
','
• •Horacio Reyes Núfiez
•
Ejemplos:
..................... .
¿Cuál es la marca de clase de la segunda clase? ¿De la quinta clase de la Tabla N°16?
Solución:
Para la segunda clase: Li = 63; Ls = 65
100 Xm = Li + Ls= 63 + 65 = 64 .., Resp.
2 2
Para la quinta clase: Li =72; Ls =74
Xm =Li +Ls= 72 + 74= 73 ... Resp.
2 2
62
ella Para formar la distribución de frecuencias, se sugiere lo siguiente:·
1. Determinar el número de clases con la fórmula de Sturges.
esa 2. Determinar el mayor y el menor entre los datos registrados y calcular el
RangoRg. ,
,Qué 3. Dividir el rango entre el número de clases, para hallar el ancho de clase.
4. Determinar el número de observaciones que caen dentro de cada intervalo, es
decir, encontrar la frecuencia f.
-73 5. Evitar muy pocas o demasiadas clases.
6. El ancho de clase debe ser el mismo, para todas las clases.
7. Deben evitarse las claSes de extremos abiertos.
on el
y68, Ejemplo:
Las calificaciones obtenidas por SO alumnos en la asignatura de Matemática del Instituto HRN fueron
'el las siguientes:
ferior y
símbolo 65-69
70.:.74
Xm_ Li + Ls 50 +54 52
- 2 2
Xm 55+ 59
57
2
Xm 60+64
2 62, e ct
.
=-=.-
ú:-:Oñr:e
.. . ".i.••••••••
Límites reales Son números que se emplean para representar las clases. El menor de ellos se llama
límite real inferior (Lri) y el mayor, el limite real superior de la clase (Lrs).
En la distribución de frecuencia anterior, se tienen los Límites Reales de cada clase en la columna 3. He
. "
aquí algunos de ellos:
.'
2.
Los Umites reales de una clase cualquiera se obtienen prácticamente, sumando al límite superior de una
clase, el límite inferior de la clase contigua siguiente y dividiendo este resultado por 2. Ejemplos:
m • --'-,
•• o ..•
• gii.I.C""'.".' """".. .
Uama
Los salarios mensuales de una muestra de 87 empleados de una empresa tienen valores que van de
3. He L. 1 041.00 hasta L. 2 548.00
le una 40- 60
60 - 90
150y más
801 641 628 731 641 446 342 545 909 568
¡ 335 449 727 848 649 229 347 309 575 757
a los i
lSe La compañía piensa que una tienda realmente no puede esperar financieramente el punto de equilibrio
con menos de 450 servicios prestados mensualmente. Además dá un bono financiero al gerente que
genere más de 700 servicios al mes. a) Disponer los datos en forma ascendente, b) calcular el
rango, c) ¿cuántas y que porcentaje de esas tiendas no están consiguiendo el punto de equilibrio?, d) ¿a
5 a los cuántos y que porcentaje de gerentes les dan un bono fmanciero?
lsedada
2. Con los datos de la compañía del problema anterior, el vicepresidente ha establecido lo que se llama
"lista de vigilancia de tiendas", que es una lista cuya cantidad de servicios es muy baja como para
justificar su atenci6n especial por parte de la oficina central. En esta categoría quedan las tiendas cuyos
servicios oscilan entre 500 y 600 servicios al mes. ¿Cuántas y qué porcentaje de esas tiendas están en
inferior
lista?
ua clase 3. El número de horas que tardan los mecánicos de transmisiones en quitar reparar y reemplazar una transmisión
en una tienda especializada, en un día son:
'
•
. . ••d.ii'
2
1.
2 ' , .
La gerencia de la tienda, dá un estímulo económico a los mecánicos que tarden menos de 4 horas;
.
1 L
ne
de descanso pagado, a los que tarden entre 4 y 6 horas y una llamada de atención a los que tarden más de
6 a) disponer los datos en forma ascendente, b) calcular el rango, c) ¿cuántas y que porcentaje de ut
personas estimula la gerencia? d) ¿cuántos y que porcentaje de mecánicos los mandan a descansar un fr,
día? e) cuántos y que porCentaje de mecánicos, les lhiman la atención?" .. ,
' . . . . .
4. Una cierta compañía muestreó sus registros de embarque durante cierto día y obtuvo los siguientes
resultados: . se:
4 12 8 14 11 67 13 11 13
11 20 5 19 10 15 7 24 29 6
El
a) Construir una distribución de frecuencias. Usar intervalos de 6 días . cer
b) Calcular Xm. ¿Qué afIrmación se puede hacer sobre la eficacia del procesanuento de pedidos a pilitir de a Cj
esta distribución?
Eje
c) Calcular los límites reales de las clases formadas.
5. Se muestrearon 30 comunidades en el país y se ha explicado los precios en cada una de ellas al inicio y al
final de agosto 1999, a fin de averiguar aproximadamente cuanto ha cambiado en ese mes el índice de
precios al consumidor. El cambio porcentual de precios en las 30 comunidades fue:
61
0.8 0.2 -0.1 0.1 -0.2 0.2 0.3 0.5 -0.1 -0.2
0.0 0.6 0.3 0.2 1.0 -004 0.0 0.1 0.3 0.1
-0.5 -0.2 0.0 004 0.6 0.0 0.1 -0.2 0.1 0.3
b) Con las siguientes clases de igual tamaño, formar una distribución de frecuencias: -0.5 a - 0.2;
d) S
- 0.1 a 0.2; 0.3 a 0.6; 0.7 a 1.0;
II
c) Formar la columna Xm. ¿Cuál es el ancho de cada intervalo?
e) S
d) ¿Cuántas comunidades tenían precios que no cambiaron?
(,
e) Calcular los límites reales de clase.
al
f) S.
6. Dada la siguiente distribución de frecuencia: pe
a) ¿Cuántos elementos forman la muestra?
b) ¿Entre qué límites reales está el peso de mayor frecuencia?
c) ¿Entre qué límites reales está el peso de menor frecuencia?
d) Determinar las marcas de clase
e) ¿Cuántas y qué % de elementos pesan al menos 144 lbs?
f) ¿Cuántas y qué % de elementos pesan 135 o menos lbs?
g) ¿Cuántas personas pesan cuando mucho 153 libras? ¿Qué % le
corresponde?
h) ¿Cuál es el tamaño del intervalo de clase?
i) Formar la columna de límites reales.
a-c""'i
•
' .
.
H • ii• •. • •
.
.
o"
El Histograma deFrecuencÚls. Es uno de los medios gráficos de más fácil interpretación y consiste en una
serie de rectángulos que: .... ..•.... " .'.
a). Tienen su base en el eje horizontal (eje llamada también línea de ,un sistema cartesiano
con centro en las marcas de clase (Xm) y longitud o ancho, igual al 'de inte..valós de
clase (C). Véase Fig. 40 ..' ' . ' . .•. ..
b). Tiene superficies las frecuencias de clase. Las frecuencias se
elel eje vertical (eje YY') de un sistema cartesiano. .... . .."
'
El Poligonode FrecuencÚls es un gráfico de líneas trazado sobre las marcas de clase(Xm). Se acostumbra
cerrar el polígono con PQ y RS hasta las marcas de clase inferior y superior inmediatas corresponderían
a clases de frecuencias cero (f =O). . ' . '
tirde
Ejemplo.
la siguiente distribución Tabla W 18, construir el histograma y el poligqno defrecuencÚlS.
. . . . " .
.0y al Solución:
ice de ,.. ili6Z:iS: a) Se calcula la columna Xm y de la Tabla W 18.
63-65 ······:·:\:,:.•. :.Jg:
.•. . . b) traza un sistema de
... ".:. '.' escala adecuada para ambos ejes. Véase Fig. 40.
. :: Total 39
c) Se levantan por los límites reales, rectángulos de
alturas iguales a las frecuencias de clase f.
. 18 .
- 0.2; d) Se dibuja en otro sistema de ejes cartesianos, lo mismo que en b) solo que en el eje se colocan las
marcas de clase X m . . . .
e) Se trazan los puntos del polígono de frecuencias con las marcas de clase Xm y la respectiva frecuencia f
(véase Fig. 41). Los puntos Q y S corresponden a marcas de clase de frecuencia ceró (O), los cuales deben.
aparecer siempre para cerrar el polígono. .
f) Se une con segmentos de recta todos y cada uno de los puntos en forma. consecutiva hasta cerrar el
polígono (Véase Fig.41).
Histograma de FrecuencÚls
~z • •
'. . I
1.
frecuencias
b.:;~~~~~en:~o~:
8 clases de anchura la distribución A y 10 clases de anchura 7 para la distribución B.
A. 3 2 .6 1 42 35 3 5 2.8 17 1 7 2 O B. 64 54 34 34 64 54 44 47 64
21211821203520351817 4455456785 64 84
32 3261 21 35 61 20 68 34 44 54 64 3454 64 74 87 88
322118 21 20 17 17 35 28 42 34.65 92,54 67 87 3459 88 55
33 61 17 20 35 18 17 35 64 84 45 64 67 87 45 64 84 98
La Tabla siguiente muestra una distribución de frecuel'lcia de duración de ciertos tubos de radio, determinar:
1
SI
.
• •Horado ¡
• Dada la siguiente distribución de los pesos en libras de 50 niños:
16. Dibujar un histograma y un polígono de frecuencias de la tabla del problema 2 de esta guía de estudio
encias
Las edades de 50 bailarinas que se presentaron a concurso de selección para una comedia musical, fueron:
En una calle de la ciudad policía de tránsito midió las velocidades de los automóviles km/h,e hizo
;iónB. el siguiente registro:
La prueba KSW de aptitud en ciencias de la computación fue aplicada a 50 estudiantes y los resultados
se
lor de 80 3
1
=-z• •
.. .
La prueba de Hemoglobina Ale, es una prueba sanguínea aplicada a los diabéticos durante sus exámenes
rutinarios de control, e indica el nivel de azúcar en la sangre durante 26 3 meses anteriores a prueba.
r L
I
,
Los siguientes datos se obtuvieron de. personas diabéticas diferentes en un hospital que atiende pacientes L
la
de este tipo:
Er
6.5 5.0 5.6 7.6 4.8 8.0 7.5 7.9 Clasificar estos valores en una distribuci6nde
ca
8.0 9.2 6.4 6.0 5.6 6.0 5.7 9.2 frecuencias. Calcular el ancho de clase si se utilizan las
8.1 8.0 6.5 6.6 5.0 8.0 6.5 6.1 clases 3.7 - 4.6; 4.7 - 5.6; etc.
la
6.4 6.6 7.2 5.9 4.0 5.9 4.0 5.7 26. Calcular las Xm de cada clase
fa.
27. Trazar el histograma y el polígono de frecuencias de la
col
distribución
;::
Las puntuaciones obtenidas en una prueba de aptitud mecánica se organizaron en la siguiente distribución. La j
-¡
Frec
La Cía Automotriz Toyota está estudiando los reclamos por daños a automóviles de 5 años de antigüedad
o más, y para automóviles con menos de 5 años. Los datos son los siguientes: Ejem
Número
===== 34. Representar las distribuciones en un mismo
eje para facilitar la comprensión.
35. Trazar el polígono de frecuencias para
ambas distribuciones
36. Interpretar las gráficas La Dj
relativ
1
2.
•
• •Horacio Reyes Núñez
• Aii.I"I.".".-""".'. ~. .
Diagramas de Frecuencias Acumuladas u Ojivas Porcentuales
nes
La Frecuencia Acumulada (fa) para cualquier clase, es la suma de las frecuencias de esa clase y la suma de
Ites las frecuencias de todas las clases precedentes.
En la distribución de frecuencias de abajo, se puede ver que la columna de frecuencia acumulada (fa) se ha
de calculado, sumando a la frecuencia de la primera clase, la frecuencia de la segunda (1+2=3); a este
las resultado se le suma la frecuencia de la 3& Clase (3+5=8); a este nuevo resultado se le suma la frecuencia de
la 4& clase (8+10=18) y así sucesivamente hasta sumar la frecuencia de la última clase de la distribución. La
fa. de la última clase necesariamente debe ser igual al tamaño de la muestra o de la población. Véase
e la columnas 1 y 2 del cuadro.
2 3 4
===
ión:
as
La Frecuencia Relativa Acumulada Porcentual (fra, %) de una clase, se calcula dividiendo la frecuencia
acumulada (fa) de la clase por el número total de casos (N) de la distribución y multiplicando éste resultado
:ias
por 100%. Gene se expresa como %.
.ción
üedad
Ejemplos:
1
x 100% = 2.94%
¡a. clase es: (fra,%) =( 34)
3
nismo 2a clase es: (fra,%) =( 34 ) x 100% = 8.82%
8
3a clase es: (fra,%) =( 34) x 100% = 23.53% ... columna 5
; .para
La Ojiva es un gráfico de líneas de una distribución de frecuencia acumulada (fa) o de una frecuencia
relativa acumulada porcentual (fra,%). Tiene las siguientes componentes:
En la la clase: (fra,%) = )x100% = 10.00% .:. Calculando la frecuencia relativa de cada clase,
. multiplicando por 100% la frecuencia relativa
a
2 clase: (fra,%) = ( )x100% = 22.50% acumulada de cada clase (Columna 3. Fórmula 4).
a
3 clase: (fra,%) = ( )x100% = 60.00% 10
4a clase: (fra,%) =( )x100% = 91.25% 13-]
5a clase: (fra,%) = ( )x100% = 100.00% 16-]
En la 1aclase: =
Lri 60 - 0.5 59.5 = ... Calculando los lúnites reales (L.R.) de cada clase,
Lrs = 62 + 0.5 =62.5 restando 0.5 a cada lfmite inferior y sumándole 0.5
al lfmite superior de cada clase, porque los lúnites
2a clase: Lri =63 - 0.5 = 62.5
son números enteros. ¿De qué otra manera se
Lrs =65 + 0.5 =65.5... etc. pueden calcular? Explique (Columna 4).
m • ¡
• • !Hioo-'-a-c...... ...
•
le la
5(%)
rario,
lo en
J
.
71.51
c) El 60% de los estudiantes tienen estatura ... Resp. (obtenida de la tabla y de la gráfica).
meno': que 68.5 pulgadas.
1S fa.
lse, la
d) El 91.25% los estudiantes tiene estatura ... Resp. (obtenida de la misma tabla y gráfica).
ia de la
:a la de
menor que 71.5 pulgadas
Ejemplo 2.
La siguiente distribución de frecuencias corresponde a un estudio hecho sobre el número de horas
l clase, semanales de 40 estudiantes que hacen uso del laboratorio de cómputo para sus prácticas.
relativa
Ila 4). a) Elaborar una tabla de distribución de frecuencias que incluya: f,
fa, (fra,%), L.R.
b) Elaborar una tabla que" y construir la ojiva "mayor que"
c) ¿Qué % de usan el laboratorio más de 18.5 horas
semanales?
d) ¿Qué % de estudiantes usan el laboratorio más de 21.5 horas
la clase, semanales?
dole 0.5 e) ¿Qué % de estudiantes usan el laboratorio más de 15.5 horas
s límites N=40
semanales.
mera se
'l z~• •
. . .......
Solución:
1 2 3 4
.
Calculando la frecuencia acumulada (fa).
Columna 2
a) •... . . . •. , 18 clase: fa =4
:
...
8
13 - 15 lS.S clase: fa = 4 +8 =12
16 - 18 .38 clase: fa = 12+12 =24. 1.
13 48 clase: fa 24+6 30
8 . •. :.: :.: 1:.:.:.:.·. . : 1
.. S8 clase: fa =30+4 = 34
:. •. ·
21 .... . •: : . • :. . .
•..·.:::::::.:.: .. :.'
40 . 68 clase: fa = 34+6 =40
Calculando (fra, %) con la fórmula (4)
Columna 3
¿Cómo se formó la columna de los límites
reales L.R.? (Columna 4) .
o" Esta tabla se construye utilizando los Lrs de
cada y la columna de las frecuencias
acumuladas fa, calculada en la columna 2 del
cuadro del inciso a). Del último valor 40,
se restan todas y cada una de las fa. de abajo
para arriba. Se incluye un intervalo al inicio 2.1
tal que su fa =00 JI
40 - 40 O; 40 - 24 = 16;
40 - 34 = 6; 40 - 12 = 28;
40 - 30 = 10; 40 - 04 = 36;
40-00=40
En Laboratorio
Horas Semanales. 40
... Gráfica de la Ojiva "mayor que"
\\
3. La
O V
- . Laboratorio
m•
•• ú,-.,ñ"e..,..-z
.. .".i.CiMi.i,.+diJ".'W . .
a (fa).
136 92 115 121 137 132 120 104 125 119 115
101 129 87 108 110 133 135 126 127 103 110
(4)
128 118 82 104 137 120 146 95 126 119 119
105 132 126 118 100 113 106 125 117 146148
límites
: Lrs de a)Formar una distribución de frecuencias de estos pesos, que tenga clases 80 - 89; 90 - 99; ... 140 - 149
Yque tenga las columnas de f, fa, (fra,·%) y L.R.
;uencias
b) Elaborar la tabla de "más que" y trazar la .ojiva "mayor que"
na 2 del
c)¿Qué porcentaje de muestras pesan más de 109.5 gr? ¿más de 129.5 gr? ¿más de 139.5 gr?
40,
de abajo
2. Las siguientes son las calificaciones obtenidas por estudiantes de comercio en la asignatura de Contabilidad
al inicio
Intermedia.
73 65 82 70 45 50 70 54 32 32 75 75
75 67 65 60 75 87 83 40 72 64 58 89
70 73 55 61 71 88 89 65 93 43 51 59
38 65 71 75 85 65 85 49 97 55 60 76
a)Fonnar una distribución de frecuencias que tenga clases de 30 - 39; 40 - 49; 50- 59; ... 90 - 99 Y
las columnas f, fa, (fra, %) YL.R.
b)Elaborar una tabla de "menos que" y dibujar la ojiva respectiva, "menor que"
c)¿Qué porcentaje de alumnos obtuvieron notas menores que 59.5?; ¿menores que 79.5%?; ¿menores
que 89.5%?
3. La siguiente es una distribución de frecuencias de las edades de los miembros de un club de servicios de
presentación para personas solteras.
I
.:35-39
16
rática. 10 4. Lasque siguen, son las millas por galón que recorren 40 tanques de gasolina:
I 24.8 24.1 25.6 24.5 25.1 24.6 24.3 25.2 24.7 23.3
L o-ra~· -c ¡ ñ'e::-::"z• •
~
. . • •"MIR I
I}
a) Agrupar estos datos en una distribución que tenga las clases: 23.0-23.4; 23.5-23.9; 24.0-24.4; 24.5-24.9;
25.0-25.4; 25.5-25.9
b) Formar la tabla de distribución de frecuencias con las columnas f, fa, (fra, %) Y L.R.
c)Fonnar la tabla y la ojiva "mayor que" comenzando con: "más que 22.95" y tenninando con: "más
que 25.95". .
5. El Hospital Escuela de Honduras tiene, los siguientes datos que representan control de peso neonatal en
libras de 200 niños prematuros:
6. Antes de construir la represa se hacen una serie de pruebas para medir el flujo de agua más allá del sitio
propuesto para la obra. Los resultados fueron los siguientes:
7. Pedro Mena capitán de un barco pesquero de Islas de la Bahía, tiene la creencia de que la pesca mínima
para recuperar la inversión debe ser de 5000 libras por viaje. A continuación se tienen los datos de una
muestra de la pesca de 20 salidas al mar.
6500 6700 3400 3600 2000 Construir una ojiva para responder
7000 5600 4500 8000 5000 a) Aproximadamente, ¿qué fracción de los viajes recupera
4600 ,8100 6500 9000 4200 exactamente la inversión?
4800 7000 7500 6000 5400 b) ¿Cuál es el valor medio aproximado del arreglo de
datos para los viajes del capitán?
c) ¿Qué pescas del señor Mena exceden al 80% del
tiempo?
m•
•• e-z
. _....
•
24.9;
Giii.i.iiRir.i,.M• •
. .
8. Osiris Montoya, asesora de una peq\leñ",empresa de corretaje intenta diseñar programas de inversión
atractivos para jubilados, Ella sabe qü¿ mi inversionista potencial pudiera obtener un nivel de
"más intereses, estaría dispuesto a invertir su capital; pero debajo de un cierto nivel de intereses, no estaría
dispuesto a hacerlo. De un grupo de 50inrlividuos, Osiris obtuvo los siguientes datos con respecto a los
diferentes niveles de réditos requeridos por cada individuo para que pueda invertir L. 1 000.00.
len
Construir distribuciones de frecuencia relativa acumulada
porcentual "menor que 11 y "mayor que ".
1ta:
pesan
,adora
aturos
lOS de
s 2.95
9. Una fábrica de cremalleras de San Pedro Sula manufactura 15 productos básicos. La compañía tiene
registros del número de elementos de cada producto fabricados al mes, con el fin de examinar los niveles
relativos de producción. Los siguientes corresponden a números de cada elemento que produjo la
el sitio compañía durante 20 días laborables.
9908 9897 10052 10028 9722 Construir una ojiva que le ayude a responder las
10098 10587 9872 9956 9928 siguientes preguntas: (Sugerencia, hacer 5 clases
ojiva 10132 10507 9910 9992 10237 comenzando con 9 700 - 9 899)
a) ¿En cuántos de sus productos. la compañía el
a ojiva punto de equilibrio de 10000 unidades?
b)¿Qué nivel de producción excedió el 75% de sus
1250.5 productos durante ese mes?
c)¿Qué nivel de producción, excedió el 90% de sus
1300.5 productos de ese mes?
1O.El administrador de un hospital ordenó un estudio del tiempo que un paciente tiene que esperar antes de
ser tratado por el personal de la sala de urgencias. Los siguientes datos fueron tomados de un día normal.
mínima
de una
de espera (minutos) a) Organizar los datos en forma ascendente. ¿Qué
comentario puede hacer con respecto al tiempo de
espera de los pacientes a partir del ordenamiento?
recupera b) Construir una distribución de frecuencias de 6 clases.
¿Qué interpretación adicional puede dar a los datos a
reglo de partir de la distribución de frecuencias?
c)A partir de una ojiva, establecer ¿cuánto tiempo se debe
suponer que el 75% de los pacientes aguarden en la
80% del . sala de espera?
e~z •
•
• • - . .
J
. .
Conteste fonna de a lo
5.
El 2 17. 2006 /
I
I
I
a) Calcular el porcentaje de la Pico Bonito
m•
•• a-e'--¡
•
3. La siguiente tabla muestra el total de desocupados en San Pedro Sula en el período comprendido del año
2000 al 2006
b) Proyectar la población al año 2016, tomado como base el 2006 y la tasaca1culada en el inciso a)
:lase? 4. La siguiente tabla de doble entrada muestra las finanzas de 4 sectores del INPREMA.
,'.:~ ~,:a.~
layor
IS como
I ,•. . ,•. . ,•. .
:,il :I ,.,:I.
.. :.I·
•
:. .
Diario El
.•. •. ,1.,,: ,';.'.. . . .•. . •. .: ::•.·. . ..
:; :• ..
:. . : :0.,,.. •', ':.,.:.•,,.• :. . •.•.•,.,•:.:,•.:,..•'. •. .'.,........
: :: •......
• • •
10 2006. 3
..
reserva
a) Construya un diagrama de barras comparativos para Media y Superior
b) Construya un diagrama circular para el sector Administrativo
c) Construya un diagrama de barras simples para Valor en Mora
I siguiente tabla:
Reyes
A •••
Y
Y y
y
Y Y
y
y
y •.
..
y
:[,;
/~,
,~
•
. .
2.1Inftoducción.
.
o
Una fonna útil de describir un grupo en su totalidad, es encontrar un número único que represente lo
•
"promedio" o lo "típico" de ese conjunto de gIlntajes o valores. A este número se le puede considerar como
"representativo" de todos los datos. En la Estadística, a ese valor se le conoce con el nombre de medida de
tendencia central, ya que está· generalmente localizado hacia el centro de la distribución, en la que la
mayoría de los puntajes o valores tjenderl a concentrarse. Por lo general, la tendencia central se refiere al
punto medio de una distribución.
L
Las principales medidas de central y que por lo general son mas utilizados en educación,
administración, econonúa, ciencias de la salud, etc. son: la media aritmética, la media
la media cutUlrática, la J.edia armónica, la mediana y la moda. Cada una de ellas tiene sus·
ventajas y desventajas.
La letra griega sigma mayúscUla se utiliza mucho en matemática y estadística para simbolizar la suma
indicada o un conjunto de sumandos, valores o elementos de una sucesión. Cada uno de éstos, 2.
debe ser de lafonna de la variable que subsigue al símbolo. Por ejemplo:
A partir de la expresión definida en (5), los siguientes ejemplos se pueden interpretar en lenguaje corriente,
así:
3
1. = x1+XZ+X3 Sumar todos los valores consecutivos de x, desde 1 hasta 3
i=l
m•••
• 4
3. = 3x¡+3x2+3x)+3x4 Sumar todos los valores consecutivos de x
i=¡ multipli«ados por 3, desde 1 hasta 4.
lo
no
de
al
1. La variable de adición en una sumatoria, es la que tiene el subíndice; todos los otros súubolos que no lo
llevan se consideran constantes. Ejemplos:
)
a) = Yl+Y2+Y)
i=l
4
b) = x
2+x)+x,¡
i=2
a la 3. La ausencia del Índice de la sumatoria, señala que todos los se están considerando. Ejemplos:
,dice
Si Xl =3; X 2 = x) = -5; = 10
do a
Yl=-2;Y2=8;'y)=0;Y4 =5
a) = 2+x)+x,¡ = 3 + 4 + (- 5) + 10 = 12
asX¡
b) 2 2 2 2 = (-2)2
= Yl+Y2+Y)+Y4 +82 2= 4 + 64 + 0
+O2+5 +2 5
=39
e) = = 3(-2)+4(8)+(-5)0+10(5)
-6+32+0+50 76.
iente, 3 3 2
4. La expresión es diferente de Ejemplos:
i=l i=¡
3 2 2 2 2
b) = (X l+X 2+X) = (2+3+4) = 9 =81
1=1
a) significa: "Elevar al cuadrado cada valor de x y luego sumar estos resultados". El ejemplo del inciso b)
"::;.
Si XI = 2, Xz = 3, x 3 = -1, =-2
Yl = 1, Yz = -1, Y3 = 2, Y4 =-3
Comprobar si son iguales los resultados de:
4 4
2 Y L(XiYi+ 2)
i=l i=l
2 3 Dadas:
c) (Xl + xz) • (YI + Y2 + Y3) ... ¿Qué se hizo? sumatoJ
i=l i=l
= (6+8)(2-3-2) ... ¿Qué se hizo?
11
:iso b) del signo n:::n se le llama forma compacta de la y el de la derecha,
se le llama forma desarrollada de la
Ejemplos:
Determinar laforma compacta de las siguientes sumatorias:
3
a) 2XI+2x2+2x3 ::: .,. Resp.
i=1
2
b)(x¡-l) + ... Resp.
i=l
3
- a) '" Resp.
3
= 3Yi) ... Resp.
i=1
matorias
Escribir laforma
6 5 5
oria
1. 2. 3.
i=1 1=1 i=¡
7 4 3 2
4. 5. 6.
i=1 i=l i=1
ltoria
7. 8.
9. 10.
11. 12.
Dadas x¡= 1; X2 = 3; x3 ::: 5; X4 ::: 7; f I = 1, f 2 = -5; f 3 ::: O; f 4 = -2; evaluar cada una de las siguientes
sumatorias:
4 4
32
14. 15.
13. ¡=2
i=¡ i=l
3 3 3
4 2 2
16. 3Xi f i 17. 18.
i=2 i=l i=1
•
Xl = -2; X2 = 3; X3 = 1; =O
YI= O;Y2=-1;Y3=-2;Y4=-3
=
a 3; b = -2; c = 1; f =-3
4 4 3 2
19. + by0 - c 20. f(3Xj-2Yi) 21. ab(2xi-Yi )
i=l i=\ i=l
de y de no
Cuando se han obtenido los datos, se procede al cálculo de cie,rtos valores que describen la muestra o la
población Los cálculos de usualmente afectan a todos
datos. número de datos es grande se procede a agruparlos, 'calculándose las medidas correspondientes
de esta última forma. Se comienza por el cálculo o se tienen pocos datos, de fOrma que
no se efectuará ningún tipo de agrupación. La m
peque
Cuando los datos que se han recabado, no se han hecho con ellos ninguna agrupación se tiene que se
llaman: no agrupados. Este tipo de datos lo único que requiere de preferencia para el estudio
estadístico, es una ordenacion ascendente de ellos. el nún
es la 1
mediá aritmetica: Es una medida que da el centro de un corijunto de datos organizados preferentemente repres,
en orden ascendente. Para su cálculo, se suman todos los valores de las observaciones y se divide por el Ejt
número de observaciones realizadas. Usualmente se usa la letra X con una barrita sobre ella:
El número único. que representa lo "promedio" o "típico" de un conjunto de datos valores o puntajes. por
lo general se localiza hacia el centro o hacia el medio de la distribución en la que la mayoría de los puntajes
tienden a concentrarse.
oraclo Re es Núñez
- "
•
Ejemplo l.
M""E'.·Nu"·"'é"i"'M . .
Hallar la media aritmética de los pesos de cinco estudiantes, si sus pesos son: 56, 47, 61, 44,
78libras.
Solución:
Ejemplo 2.
Una compañía tiene 8 empleados, los cuales ganan al mes L. 876.50; L. 786.87, L. 567.00,
L. 800.00, L. 669.80, L. 700.00, L. 550.60, L. 567.13 respectivamente. ¿Cuál es la media
mensual que se paga?
L. = L. 5 90 = L. 689.7375
i o la
)s Elpromedio de pago por empleado
que
La media se calcula muy fácil y es muy utilizada. Tiene un inconveniente, si el tamaño de la muestra es
pequeño y hay una observación muy grande, la media crece desmensuradamente.
se mediana: Es el valor de la variable que ocupa la posición central de una distribución. Una vez
studio ordenados de menor a mayor los datos de una muestra o población, si el número de datos es impar entonces
el número del medio de la distribución es la mediana; y si el número de datos es par entonces la mediana
es la media de los dos. números del medio de la distribución. Generalmente se usa el símbolo "Me" para
representarla.
por el Ejemplo l.
Solución:
puntajes
mediana Me = 6.5 ... Resp.
••
. .)
~
La mediana al igual que la media, puede ser un número que no corresponde a ninguna observaci6n.
11
moda: de un conjunto de observaciones es aquel valor que ocurre mayor número de veces en una.
distribución. Generalmente se usa el símbolo "Mo" para representarla.
Ejemplo 1.
Hallar la moda de las observaciones: 7, 8, 4, 6, 5, 6, 6,
Solución:
Ejemplo 2.
Hallar la moda de las observaciones: 2, 7, 5, 3,4,6,5,7 Sol
Solución:
2,3,4,5,5,6, 7, 7 ...Ordenando de menor a mayor
Se dice en este caso que la muestra es bimodal porque tiene dos modas
A se pregunta cual de las medidas de tendencia central debe usarse. No puede responderse a esta
interrogante satisfactoriamente para todos los casos. es muy fácil de calcular y dá mucha
infonnaci6n, pero se ve afectada por valores extremos de la muestra. mediana no viene afectada por las
medidas extremas y por eso, a veces es más aconsejable como medida de tendencia central. moda es
casi inútil como medida de tendencia central cuando la. muestra solo contiene un número reducido de
observaciones, su significación aumenta con el tamaño de la muestra.
.
La calculadora científica CASIO'fx-82 MS y modelos equivalentes en su modo estadísticos (SD) puesto en
pantalla, permiten la resoluci6n de problemas estadísticos en una y dos variables. En una variable las
operaciones estadísticas que se pueden realizar son: la media aritmética muestral la desviaci6n
estandar muestral (s) y la desviaci6n estandar poblacional (a). Veamos algunos casos:
Ejemplo 1.
Hallar la la media aritmética de los pesos de 5 estudiantes si sus pesos son 56, 47, 61, 44 y 78 libras En toe
respectivamente para el
l. Los
Solución: eXpl
a) Encender su calculadora Teclear: l. l. 3 111 para borrar todo el contenido de la 148,
memoria de la calculadora 145.
m
••
• ñ-,e,---z
- I b) Seleccionar el modo estadístico en una variable. Con su calculadora encendida pulsar •
MODECLR
y
I
S-YAR .
luego teclear ; aparecerá en la pantalla en ícono "SD"
una
c) Ingres·ar los datos de la siguiente manera: 56 y aparecerá en la pantalla "n=" en la parte
superior izquierda y "1" en la parte inferior derecha; 47 la inferior derecha a "2"
I Ejemplo 2.
La media aritmética de los pesos de los 5 estudiantes es: = 57.2 libras oo. Resp.
I
Resolver el problema número 2 de la página 65 que dice: "Una compañía tiene 8 empleados.... "
Solución:
MODE
a) Teclear: • • 3 (11 (11 oo' Para borrar todo en la memoria de la
calculadora
S·YAR
b) Teclear: _ oo. Aparecerá en pantalla el ícono "SD"
·78 libras
para comprobar el resultado ..
1. Los siguientes valores corresponden a las estaturas un grupo de alumnos de una institución "HGB"
expresada en centímetros:
mido de la 148, 160, 145, 184, 155, 138, 174, 156, 150, 156, 159, 156, 148, 173, 172, 145, 145, 160, 145, 146, 150,
145.
ú'"ñ.-ec-:z'";• •
'. . •.• ii,i.ij,iifM'i,im
I
2. Roberto encontró que las edades de 10 de sus profesores del colegio eran 29,26,37,28,30,45,22,27,31
3. Luis Antonio obtuvo las siguientes puntuaciones en una carrera de obstáculos: 78, 89, 76, 77, 77, 77, 78,
78, 79, 70, 68, 75, 80 puntos. ¿ Cuál es la media, mediana y moda de esas puntuaciones?
4. Las temperaturas más bajas de cada día en grados centígrados fueron las siguientes: 13, 14, 15,23, 13, 15,
12.
12, 13, 12, 14, 13, 12, 13,20,20 ¿Cuál es la media, mediana y moda de esas temperaturas?
5. Las alturas en m. de cierto número de estudiantes fueron las siguientes: 1.60, 1.65, 1.65, 1.65, 1.65, 1.65,
1.70, 1.70, 1.70, 1.75, 1.80, 1.67, 1.80, 1.90, 1.77, 1.75 ¿Cuál es la media, mediana y moda de estas
estaturas?
1
6. La distancia media del sol a cada uno de los nueve planetas aparece en la tabla siguiente: (distancia en
e
millones de Km):
13.L
Venus
.
·Z~~::
7. Una empresa informó que la participación de los accionistas (ajustada para una cartera de acciones
comunes de 5 a 3 pagada en enero de 1999) durante los últimos 11 años es: (por acción común en
lempiras); .
Los sil
6253,9555, 12496,14708,17717,19116,15856,14154, 15344,17096 enprol
9. El Ministerio de Educación informó que durante los últimos años recibieron grados de Licenciatura en
Ciencias Matemáticas e Informática Administrativa el siguiente número de personas: 5 033, 5 652, 6407,
7201,8719, 11 154, 15 121. ¿Cuál es el promedio anual de personas graduadas? ¿es una media muestral
o pob1acional?
10. El mismo Ministerio informó que durante los últimos años, el número de mujeres que recibieron grados
doctorales en Ciencias Matemáticas e Informática Administrativa fue: 23, 19, 15,30,27, 25. ¿Cuál es el
número medio anual de mujeres que reciben ese grado? ¿Se trata de media muestral o pob1acional?
11. El Gerente de Producción de la imprenta Prografip desea determinar el tiempo promedio que se necesita
para fotografiar una placa de impresión. Utilizando un cronómetro y observando a los operadores, registra
m•
•• ....ú ñ.-e-z
-
27, 31 20.4, 20.0, 22.2, 23.8, 21.3, 25.1, 21.2, 22.9, 28.2,24.3,
22.0, 24.7, 25.7, 24.9, 22.7, 24.4, 24.3, 23.6, 23.2, 21.0
7,77, 78, Un tiempo promedio por placa menor a las 23.0 seg. indica una productividad satisfactoria. ¿Debería
13, 15, 12. Un fabricante de cosméticos adquirió una máquina para llenar botellas de perfumes de 3 mI. Para probar
la precisión de volumen que deposita la máquina en cada botella, se hizo una corrida de prueba con 18
recipientes. Los volúmenes resultantes (en ml) de la prueba fueron:
l,65, 1.65, 3.02, 2.89, 2.92, 2.84, 2.90, 2.97, 2.95, 2.94, 2.93,
a de estas 3.01, 2.97, 2.90, 2.94, 2.96, 2.99, 2.99, 2.97.
La compañía no está dispuesta a recalibrar la máquina, a menos que el volumen promedio de llenado
l3.La compañía XYZ tiene un contrato de crédito rotativo con El crédito tiene los siguientes
saldos mensuales el año anterior:
le acciones
común en
Una distribucion de frecuencia simple, es aquella en donde figuran los valores de la variable realmente
observados, con sus respectivas frecuencias o número de veces que aparece repetida en la distribución.
La tabla o distribución siguiente muestra un ejemplo de datos agrupados en frecuencia simple, en la que
no existen agrupaciones, sino los valores reales de la variables y la suma de las frecuencias
millones de correspondientes al total de observaciones: f = n
Los siguientes datos corresponden al aumento de peso en gramos, de pollos alimentados con una dieta rica
en proteínas.
:enciatura en
652, 6407,
:dia muestral
,ieron grados
i. ¿Cuál es el
ional?
le se necesita
lores, registra
•
r (7.1j
N = Total de observaciones de la población
= Sumatoria de los productos fX
= Media muestral
c)
La mediana: Es el valor de la variable que ocupa la posición central de la distribución. La posición de ese
valor, se calcula con la fórmula:
Para calcular su valor, se necesitan las frecuencias acumuladas de la distribución y después determinar en
cuál de ellas está contenido el valor de la posición P.
La moda: Es el valor de la variable que tiene mayor frecuencia en la distribución. Para su cálculo, no
se necesita efectuar ninguna operación. a)
Ejemplo l.
En la distribución de la tabla de la página anterior, calcular el valor de: a) la media, b) la mediana, c) la
moda
Solución:
2 3
a) ... Calculando el producto de la frecuencia (f) con
su respectivo valor de la variable (X) y sumando
estos productos. Columna 2. =980.7 x
oo. Sumando las frecuencias (f). Columna 1.
=n
oo. Calculando fa. Columna 3. b) P
n= 75 980.7 (
Fórmula (8)
-.Horado Reyes
- Clase mediana: 13.1 ... Es la clase de menor valor de fa. que contiene el
)lación
II c)
Me = 13.1 gramos
Mo = 13.1 gramos
valor de P = 38. El valor 38 está contenido en
59. Columna 3.
... Resp.
Ejemplo 2.
Se pidió a reclutas de una academia de policía, se sometieron a una prueba que mide la capacidad para
el ejercicio. Se midió dicha capacidad en minutos y se obtuvieron los siguientes datos: Calcular a) la
1 de ese
lación
ninar en
Solución:
.culo, no 2 3
a) ... Sumando las frecuencias (t) Columna 1.
=n
... Calculando el producto de fX y la suma de ellos.
ana, c) la Columna 2
n = 20 550
ia (t) con
sumando
x= n
= 550 = 27.5
20
... Calculando' la media
0.7
1. 27.5 minutos ... Resp.
•m
o-r-a-c-,i.-o--¡;¡R.,e::-y-e.,--s-=---iN~ú-:;;¡ñ~e~z • •
'. .
A veces se asocia a los números Xl, XZ' X3, ... Xk, ciertos factores o pesos w¡, W3,... Wk que dependen de la
significaci6n e importancia de cada uno de los números. En este caso se llama media aritmétil:a ponderada
la cual viene dada por la f6rmula:
en 1
600 (L. x asesor)+340 (L. x asesor)+ 125 (L. x asesor) = 1 065 L. x = L. 71.00
15 asesores 15 x 8. Por
últi¡
Entonces: L. 71.00 es media aritmética ponderada ... Resp. que
cali:J
2. Un profesor de matemática decide medir la importancia relativa de las 5 calificaciones bimestrales
de un alumno que obtuvo 50%, 80%, 70%, 70% Y 65% de acuerdo a la duración; esto es, 1,2,3,2,3 9. Las
a) ¿Cuál es la media aritmética simple? b) ¿Cuál la ponderada?
¿CU¡
a) 50% + 80% + + 70% + 65% = = 67.00%
10. Una
pesa:
Entonces: 67.00% es media aritmética simple ... Resp. los c
b) ¿ W= 1+2+3+2+3 = 11 H. Una
L.
= 50%(1)+80%(2)+70%(3)+70%(2)+65%(3) = (50+160+210+140+195)% = 755% es la
= = 755%= 68.64%
12. Una
w 11
. aCUer
utilid
Entonces: 68.64% es media aritmétil:a ponderada ... Resp.
!derada
número
lta una
I simple.
......:.. :.: : :.. :
. :.:.:.:.:
.:
.
10
de las siguientes distribuciones de frecuencia
l. 3.
1 2.5
lsesores .... 3.8 15.3 .
) de sus 5 8 4.9 17.2 8
, que es 7 5 5.1 5 19.2 10
tos para 9 3 2 21.2 1
a media 1 4 4
4. :~¡ :¡:¡ ¡ : 5. 6.
12.5 22.55 123.8
15.5 6 23.6 2 126.9 10
18.5 11 24.7 3 129.0 8
21.5 9 27.1 9 133.1 15
24.5 7
29.2 13 . 136.2 9
4
8 7
7. Un elevador de un hotel está diseñado para soportar un peso máximo de 2 000 libras. ¿Se sobrecarga si
en un viaje transporta 8 mujeres que pesan 123 libras y a 5 hombres que pesan 174 libras cada uno?
00 8. Por un error un profesor ha borrado la calificación que recibió uno de 10 alunmos en u'! examen del
último parcial de Contabilidad. Sin embargo él sabe que los alunmos promediaron 71 % en el examen y
.. , Resp. que los otros 9 recibieron calificaciones de 99, 44, 82, 70, 47, 44,82,78, 82. ¿Cuál debe haber sido la
calificación que borró? Calcular la mediana y la moda de esas calificaciones de los 10 estudiantes.
mestrales
.2,3,2,3 9. Las puntuaciones finales en Inglés, Computación, Contabilidad, Matemática y Español de un
estudiante fueron: 78%, 85%, 63%, 70%, 80% respectivamente. Si tenían 4,6,5,5,3 créditos o U.v.,
¿Cuál es su promedio adecuado?
10. Una línea naviera embarca 80 contenedores con aguacates que pesan 2235 lbs c/u, 60 con bananos que
pesan 4280 lbs y 40 con piñas que pesan 2 835 lbs c/u. Calcular el peso promedio ponderado de todos
... Resp. los contenedores.
11. Una compañía de TV pagó dividendos en efectivo por acción de L. 53.20 a 500 de sus socios en 1993;
L. 65.32 a 575 socios en 1994; L. 73.20 a 608 socios en 1995 y L. 87.32 a 660 socios en 1996. ¿Cuál
¡% es la media ponderada del dividendo anual del período?
12. Una compañía embotelladora ofrece 3 tipos de servicio de entrega. La utilidad por entrega varía de
acuerdo con el tipo. Para determinar que efecto tiene si lo hay, cada tipo de entrega en el cuadro de
utilidades, la empresa ha hecho la tabulación que sigue en base en las entregas del trimestre anterior.
... Resp.
.m
••
,'. .n .
13. En cierto año, el lenguado, el bacalao, la perca,· el abadejo y el atún han producido a los pescadores
comerciales 54.0, 58.6, 26.6, 33.9, Y 61.6 centavos por cada libra de pescado respectivamente. Dado
que la pesca correspondió a 254 millones de libras de lenguado, 33 millones de libras de bacalao, 13
millones de libras de perca, 112 millones de libras de abadejo y 279 millones de libras de atún. ¿cuál es
el promedio general de los precios por libra que reciben los pescadores?
14. En un análisis de las llamadas telefónicas que salían a diario de una oficina se determinó que 64
llamadas de 3 minutos o menos promediaron 2.3 minutos; 47 llamadas de mas de 3 minutos pero no
mas de 10 minutos promediaron 6.1 minutos; y 4 llamadas de mas de 10 minutos duraron un promedio
de 20.6 minutos. ¿Cuál es el promedio de la duración de esas llamadas?
15. Como parte de un proyecto de investigación, los investigadorert>btuvieron los siguientes datos respecto
a los niveles de peróxido lípido en el suero informados por un laboratorio para una muestra de 10
individuos, adultos bajotrátamiento de diabetes mellitus; 5.85, 6.17, 6.09, 7.70, 3.17, 3.83, 5.17,4.31,
3.09,5.24. Calcular la media, mediana y moda. Explique su resultado Ejell
1
I
16. Los siguientes datos representan los valores de lípido obtenidos a partir de la muestra de 10
adultos aparentemente sanos; 4.07, 2.71, 3.64, 3.37, 3.84, 3.83, 3.82,4.21,4.04,4.50. Para estos datos;
calcular la media, mediana y moda. ¿Qué representa cada uno de esos· valores?
17. En 4 depllI'ÚlIIlentos de una compañía, 190 trabajadores reciben en promedio un salario de L. 4.80 por
hora; 610 trabajadores una paga por hora cuya media es L.8.90; 180 reciben un promedio de L. 12.65
por hora y 20 reciben. una paga en promedio de L. 14.10 por hora. ¿Cuál es el promedio general del
.salario por hora que se paga a estos trabajadores?
18. Si un trabajador recibe L. 9.50 por hora en las.4O horas de trabajo ordinario, una y media veces este
sueldo por 10 horas extras entre semana' y el doble de la tarifa por 4 horas de trabajo en Sol
¿Cuál es el promedio del sueldo por hora de ese trabajador?
19. Durante la campaña de ventas de fabricantes de cierto equipo, los 20 trabajadores del centro
promediaron 150 nuevos contactos de compra, los 2S del norte promediaron 180 y los 15 del sur
promediaron 160. ¿Cuál fue el promedio total de los nuevos contactos de compra logrados por esos
vendedores?
Reyes Núñez
-
la
de
y
y
de y de
pañía
los La media
de
ladosa Algunas veces la .variable toma muchos valores distintos y se organizan en tablas de distribución de
Id por
frecuencias, donde no figuran los valores de la variable realmente observados. El cálculo de la media en
,licitan
on al casos como éste, será una aproximación. En esa tabla de distribución de frecuencias, los intervalos de
clase (X), se sustituyen por sus puntos medios o marcas de clase (Xm), que son valores singulares y, la
media resultante puede variar ligeramente según sea el agrupamiento.
adores . La aritmética con ·las características anteriormente apuntadas, se calcula con la fórmula (lO)
. Dado cuando es media muestral y con la (lO. 1) cuando es poblacional.
lao.,13
cuál es
donde: Media aritmética poblacional
(lO) = Media aritmética muestral
que 64 .f = Frecuencia de la clase
)ero no Xm = Marca de clase
omedio
n = Tamaño de la muestra (n = f)
(10.1) N = Tamaño de la población
'especto
a de 10
7,4.31, Ejemplo 1.
La siguiente tabla muestra la distribución de la estatiuaen pulgadas de 80 estudiantes de un instituto de
Educación Media. Calcular la media de las estaturas esos estudiantes, si se supone que es una
'a de 10 muestra.
)s datos;
...... :.:.:.:.:.:
4.80 por
L. 12.65'
neral del
•.• :• •.••.
:: •.:·..:.••...•.:.•.•.• ..
eces este
Solución:
jomingo, 1 2 3
el centro
5 del sur
: por esos
t
Horacio Reyes Núñe.
.,: ••"•.• ... ".
•
Pasos: 1. Elaborar una distribuci6n de frecuencias igual al cuadro dado.
2. Calcular n = = 80. Columna 1. L'
3. Calcular las marcas de clase (Xm) de cada clase con: Xm = 1)
4. Calcular el producto de la frecuencia (f) por las marcas de clase (Xm) para cada clase y sumar
estos productos. Columna
la clase: fXm= 15x61 =915; 2a clase: fXm= 19x64 = 1216; ... etc.
=66.36
estaturas de esos estudiantes es: 66.36 pulg ... Resp. 1.
2.
Ejemplo 2.
Calcular la media aritmética de la siguiente dislribuci6n suponiendo que es una muestra. 3.
4.
5.
.
Desl
1.
2.
~ 3.
Soluci6n:
1 2 3
Lal
Es UI
50%
Para,
En di
f6rm\
•
• •Horacio Reyes Núñez
..
.•ii,i.ij,d'.j,im ~. .
4. Calcular el producto de la frecuencia (f) por la marca de clase (Xm) de cada clase y sumar estos
productos. Columna 3.
= = 10,690 82.23
n 130
y de
. Resp. 1. Todo conjunto de datos posée sola media. Es una medida calculable.
2. Sirve para realizar procedinúentos estadísticos como la comparación de las medias a partir de varios
conjuntos de datos.
3. Es una medida confiable y no necesita ninguna ordenación de los datos.
4. El uso de la media se restringe exclusivamente a datos por intervalo.
5. Si se desea utilizar un estadístico muestral como estimación de un parámetro de la población, la media,
es la mas fácil de aplicar.
1. La media es afectada por los valores extremos (Valores muy pequeños o muy altos) que no son
representativos del resto de ellos.
2. Su cálculo es tedioso debido que usa todas las observaciones de la distribución, salvo el caso cuando
éstas se agrupan en clases.
3. Es imposible calcular la media para un conjunto de datos que tengan clases abiertas en su extremo
superior o inferior (investigar lo que son las clases abiertas).
La media1Ul:
Es un valor central de una distribución. El 50% de las observaciones está por arriba de este valor y el otro
50% está por debajo de él. Se suele representar con el súnbolo "Me".
Para obtener el valor de la (Me) de datos agrupados, se usa la fórmula (11) dada a continuación.
En dicha fórmula se necesitan los limites reales de clase (Lrs, Lri) y la frecuencia acumuladas (fa). Esta
fórmula se emplea para una muestra (n) o una población (N).
•• , •••••••••••• , •••••••
...
o" •
.. donde: Me = Mediana
(ll) . Lri = Límite real inferior de la clase mediana
••...•....... .( C Tamaño o ancho de la clase mediana
= Suma de todas las frecuencias de las clases
por debajo de la clase mediana
n =La mitad de las observaciones. Posición de
la mediana.
fMe = Frecuencia de la clase mediana
Horado Reyes
I
Ejemplo 1.
Calcular la (Me) de las estatura de los 80 estudiantes, cuya distribución se da en la página
69.
Solución: 2 3
5. Calcular la suma de todas las fa. por debajo de la de la clase mediana. Este valor corresponde a:
= 34. Columna 2.
6. Ubicar la frecuencia de la clase mediana: fMe = 21. Columna l.marcada con doble asterisco (**).
(Ver cuadro de arriba).
7. Determinar el límite real superior (Lrs) y el inferior (Lri) de la clase mediana. Columna 3.
Me=65.5+3 [40-34]
... Sustituyendo valores en la fórmula
21
(11) y operando
= 65.5 + 3[
= 65.5 + 3(0.2857)
= 65.5 + 0.8571 = 66.3571 Venta)
Me = 66.36 pulgadas valor de distribucion ... Resp. ¿qué significa? 1. Los
2. Pue<
lam
3. Pue<
m
••
• Reyes Núñez
•
ágina
I Ejemplo 2.
Calcular la mediana (Me) de la distribución del ejemplo 2 de la página 70·
~
. .
Solución: 1 2 3
130
= 43
menor
6.fMe =32
onde a: 7.Lri = 80 - 0.5 = 79.5 ... Calculando los limites reales de la clase mediana
Lrs = 84 + 0.5 = 84.5 Columna 3.
co (**). 8.C = Lrs -Lri = 84.5 -79.5 = 5 oo. Calculando el ancho (C) del intervalo de la clase
mediana.
= 79.5 + 5(0.6875)
Ventajas:
moda:
Es el valor que más se repite en una distribución de frecuencias. Se suele usar para representarla, el símbolo
"Mo".
Para obtener el valor de la (Mo) de datos agrupados, se usa la fórmula (12) dada a continuación, la Eje]
que es utilizada tanto para una muestra (n) como para una población (N).
la moda.
.
C = Tamaño o ancho de la clase modal
= Frecuencia modal menos la frecuencia
de la clase contigua anterior
z = Frecuencia modal menos la frecuencia
de la clase contigua posterior
Ejemplo 1.
Calcular la moda de la estatura de los 80 estudiantes de la distribución del ejemplo 1. de la página 69 Pasos
Solución:
1 2
5. Calcular Al y A
2
Al = f Mo - 19 = 21 - 19 = 2
Ventaja
z = fMo -18 = 21-18 = 3
D!I•
• • !-.----o-ra-c..--¡ z
-
7. Calcular la moda (Mo) con la fórmula (12)
2
mh"dU.f.".....
. .
Mo = 65.5 + 3 [ ]
... Sustituyendo valores en la fórmula
dia. 2
(12) y
=65.5 +
=65.5++
nbolo
Mo = 66.70 pulgadas valor de la moda de la distribucion ... Resp.
Ejemplo 2.
ón, la
Calcular la moda (Mo) de la distribución del ejemplo 2 de la página 70
Solución: 2
modal
:iene a
al
uencia
uencia
2 :::: fMo - 30 = 32 - 30 = 2
6. C :::: Lrs - Lri :::: 84.5 - 79.5 :::: 5 ... ¿Qué es este valor de 5?
22
.., Sustituyendo valores en fórmula (12) y
Mo = 79.5 +5(22 + 2)
operando
22
Ventajas:
1. La moda puede usarse a semejanza de la mediana, como una localización central para datos cualitativos
y cuantitativos.
~_-.----=--
Horacio Reyes Núñez• •
'. .
•
2. No le afectan demasiado los valores extremos de la distribución 7.
3. Puede usarse sin importar la magnitud o la dispersión de los valores de la distribución
4. Se puede emplear cuando hay clases abiertas
Desventajas:
2. Es una medida inútil cuando no hay un valor modal, porque el conjunto de datos no contiene valores que
ocurran más de una vez y, también cuando todos los valores son la moda, ya que ocurren el mismo
número de veces.
3. Cuando la distribución contiene 2, 3 ó más modas, es difícil interpretarlas y comparar.
8. 1
c
9. La
de
1. 1
3.
1 :1 8 - 10
15 -19 4 . 11 -13
10
20 -24 10
6
5. 6. 10. La
4. pese
-
. 6- 9
9- 11 .
14 O.
7 2 25.'
m•
• • HO::o,--'.,--,a-c-.¡--=o-R..--=e"':":y=-=e--=s=-N.....-.ú""jire=-=z
- .•
7. La distribución de frecuencias que se da en seguida, representa los pesos en kilogramos de una muestra
de paquetes que en mes de junio, transportó una compañía aérea.
... . 1
mismo
8. La distribución siguiente muestra la carga máxima en Ton. cortas de ciertos cables producidos por una
compañía. .
·11 7
::~Jr-~';+J2:26
~ 12.7 3
9. La siguiente distribución corresponde a los pesos registrados en el correo de las cartas distribuidas el 31
:uencias de agosto de 1999. Peso en gramos.
Calcular a) la media, b) la mediana, c) la moda de los
pesos de esas cartas.
10. La siguiente distribución de frecuencias corresponde al peso de peces atrapados en las redes de los
pescadores en un día de la semana. Peso en libraS.
úo;ñ,-e...JzO;• •
. . n
11. Las edades de los residentes en la Colonia Jardines de Loarque del Bloque 19 están descritas en la
siguiente distribución de frecuencias.
Calcular a) la media, b) la mediana, c) la moda de las
edades de los residentes en dicha colonia.
. 17.0
12. Los reclamos al del seguro de accidentes, se ajustan a la distribución de frecuencias siguientes:
Reclamos hechos durante el mes de enero de 1999.
13. Una máquina automática llena latas de jugo de naranja. Una verificación de los pesos del contenido de
un cierto número de latas reveló lo siguiente:
Redondeando a décimas de gramos, estimar: a) la
media b) la mediana, c) la moda de los pesos del
contenido de una lata.
14. El número de sistemas de calentamiento solar disponibles al público es bastante grande y su capacidad
de almacenamiento de calor es diversa. A continuación se presenta una distribución de la capacidad de
almacenamiento de calor (en días) de 28 sistemas que fueron probados recientemente por Laboratorios
Universal.
Calcular a) la media, b) la moda, c) la mediana y
d) seleccionar la respuesta entre los resultados de a),
0. b) y c) que mejor refleje la tendencia central de los
.J . datos y justificar su respuesta.
..
• •HoracioReyes Núftez
-
en la
de las
ientes:
_de los
nido de
r: a) la
:sos del
apacidad
.cidad de
oratorios
ediana y
os de a),
al de los
.. .) •. i •.i·iiii8.i,••.•• i"·U¡ji.i,
•
La
Las de posici6n sirven para describir la localización de un dato específico, con relación al resto de
la muestra. Tres de las medidas de posición más populares son los llamados:
1.
2. Deciles
3. Percentiles
Los (Q): Son los números que dividen a los datos ordenados en 4 partes iguales
Los decUes (O): Son los números que dividen a los datos ordenados en 10 partes iguales
Los percentiles (P): Son los números que dividen a los datos ordenados en 100 Partes iguales
Existen 3
9 deciles:
D 2• D3•···• D9
99 percentiles: P2• P3•···• P99
El Tercer Cuartil
Es un número tal que el 75% a lo más de los datos tienen un valor más pequeño que Q3. y a lo más el
25% tienen un valor mayor.
El Tercer Decil D 3:
Es un número tal que el 30% a lo más de los datos tienen un valor menor que D 3 y a lo más el 70%
tienen un valor mayor.
El Quinto Decil D s:
Es la mediana. Es el segundo Cuartil ¿Qué significa?
El k-ésimo Percentil. Pt :
Es un número tal que el k% a los más de los datos tienen un valor menor que P k y a lo más (100-k) %
son mayores.
Cale
. .
-.Horacio Reyes
•
•••••
La siguiente escala muestra la relación entre: percentiles,
•.••.i'fJA"" ••
y cuartiles
--"
; el y no
Para calcular el valor de la posición (p) y el valor (v) de los percentiles en datos no agrupados, se usará la
siguiente regla:
Pasos 1. Ordenar los datos de la distribución en forma ascendente.
2. Determinar la posición (p) del percentil deseado, con la fórmula (13) siguiente:
10% 3. Si el valor de la posición (p) resulta entero, entonces sumar 0.5 a ese valor y en caso contrario.
aproximar el valor de (p) al entero mayor siguiente (no usar la regla del redondeo).
Ejemplos:
a
más
4. Localizar el valor del percentil deseado en la distribución comenzando por la izquierda
Los ejemplos siguientes ayudarán a interpretar mejor la regla arriba mencionada:
Ejemplo:
Se tomó una muestra de 30 calificaciones de una población de resultados de un examen de Estadística'
de la Universidad Pedagógica, que aparecen a continuación:
54 58 65 68 71 71 71 73 73 74
75 76 77 79 80 81 82 82 84 84
·k) % 8688 88 91 91 93 9494 94 96
N •. .
I
Solución:
Pasos: 1. Ordenar los datos en formas ascendente ... Paso 1. Ordenar datos
a) Q¡ = P25 entonces: n = 30 ... Paso 2. Determinar la posición del
k=25 percentil deseado. Fórmula (13)
nk
p= 100
1.
30x25 a
... Paso 3. Si P =7.5a entonces la verdadera
p 7.5
posición es la S8.
p=S8 2 .1
Q¡ =P2s =73 ... El valor de este cuartil es el que ocupa la
S8 posición en la distribución contando
de la izquierda a la derecha.
Ql =73 ¿Qué significa? ...Paso 4. ... Resp. 3. 1
í
b) D4 = P 40 entonces: n=30 ... Paso 1. y paso 2. Explique lo que hizo. s
k=40
4. (
_30x40 _ 128 h
P - 100
5. E
p= 12+0.5 ... Paso 3. Si P = 12. entonces la verdadera 8
P =12.58 posición está en 12.5 8
6. L
- 76 2
D4- + 77 -- 76.5 ... 3. El valor de este decil es la media si
entre los valores que ocupan la 128 y
138 posición dentro de la distribución.
Esos valores son 76 y 77
respectivamente 7.
D4 = 76.5 ¿Qué significa? ... Paso 4 un
D4 =P40 =76.5 ... Resp.
tiel
Cal,
Detenninar la posición. el valor y el significado de a) b) D 8• c) pss • d) P 90• e) D 3 en la siguiente
distribución: 9.
22 21 19 19 18 20
21 20 21 18 17 24
19 18 17 19 20 21
22 17 23 23 24 20
Cale
1:1:1.
• • H,-o-r-a-c-.--i
-
:,:-~':::~~::'fFt;'~:~~::;;~~::?%r.':0;~r:~;!!.@.t::2:::'!!§~"@y:i~y
•. C•• iij.i¡'ji.
.
~
. ..
2. Ciertas fallas de energía eléctrica duraron: 18, 125,44,98,31,26, 80,49, 125, 89,44,33,39, 12, 103,
cupala 75,40,80 Y28 minutos. Calcular la posición y el valor de a) b) Q¡, c) Explicar sus respectivos
significados.
,ntando
3. En 1993, 12 hacendados vendieron respectivamente hatos de: 58, 70, 86, 42, 64, 46, 89, 44, 93, 58, 70 Y
. Resp. 70 novillos a una empacadora de carne. Calcular la posición y el valor de: a) b) c) Q¡. Explicar
sus respectivos significados.
,hizo.
4. Calcular la posición de Q¡ y Q3 en una distribución que tiene 21 términos y verificar cuántos valores
haya la izquierda de la posición de Q¡; entre Q¡ y entre y Q3 y a la derecha de
5. En una semana el número de comidas que ingirieron 13 personas fueron: 3,10, 15, 1,8,5,6, 12, 15, 11,
rdadera 8,7,5. Determinar el valor de: a) b) D6 , c) Pso, d) e) D7 , f) Pn
6. Los siguientes datos son rendimientos de una hortaliza en libras, calcular la posición, el valor y el
significado de: a) Q¡, b) Q2, c) D7, d) P95 , e) D3, f) P71
a media
.a 128 y 3.9 3.4 5.1 2.7 4.4 7.0 5.6 2.6 4.8
ibución. 7.0 4.8 5.0 6.8 4.8 3.7 6.8 3.6 4.0
y 77
7. La siguiente tabla muestra el tiempo en segundos que corredores de los 100 metros planos, hicieron en
una competencia durante las Olimpiadas:
10.9 11,1 12.0 10.5 10.7 11.8 12.5 10.9 11.8 10.3
11.5 11.0 12.0 10.6 10.8 11.0 10.9 10.8 11.0 10.5
8. Una investigación sobre destreza manual abarcó el tiempo requerido para terminar cierta tarea, los
tiempos correspondientes en minutos fueron los siguientes:
7.1 7.2 7.2 7.6 7.6 7.9 8.1 8.1 8.1 8.3
8.3 8.4 8.4 8.9 9.0 9.0 9.1 9.1 9.1 9.1
9.1 9.1 9.2 9.2 9.3 9.3 9.5 9.7 9.8 9.8
Calcular la posición y el valor de: a) b) D2, c) P27 , d) e) Ds, f) P66 , g) Q¡, h) D3, i) P59
siguiente
9. La siguiente tabla muestra la concentración de cloro en ppm. de 30 galones de agua tratada:
16.2 15.8 15.8 16.3 15.6 15.7 16.0 16.2 16.8 16.0
16.4 15.2 15.9 15.9 16.8 15.4 15.7 15.9 16.0 16.3
16.4 14.7 18.3 15.6 16.9 16.0 16.6 17.3 15.8 16.9
10. El siguiente conjunto corresponde al tiempo en segundos, del encendido de todas las máquinas de una
fábrica de hilados y tejidos:
11. La siguiente tabla muestra las edades en años de los compradores de artículos en un supermercado que
entraron de 10.00 a 12.00 m durante cinco días de la semana.
24 29 38 21 16 44 34 16 32 35 Se
19 33 23 21 44 34 18 30 24
18 17 19 34 54 29 18 30 27 28
de y del de
Para el cálculo de la posición y los valores de este tipo de números, empleando una distribución de
frecuencias de datos agrupados, se hace uso de la fórmula (14) que a continuación se presenta:
a) Q
= Percentil k-ésimo *C
= N° del percentil deseado
n = Tamaño de la muestra *n
Q¡:
m•
• • .H.-o-r-a-c...... .
-
de una
Ejemplo:
ado que 14
7
Solución:
2 3
n=55
lción de
=59.5 + 10(0.6)
=59.5 +6
=65.5 oo. Significa que el 25% de los casos, a lo más de
las observaciones son menores que el valor 65.5
Ql = P25 = 65.5 Resp.
••
•
..
b) * D 7 =P70 = ?
•
C)*P85 =?
* n =55; k =85 entonces p = nk =55x85 =46 7 a
100 100 .
¿Qué se hizo? ¿cuál es la posición de P85 ?
a
3. La
=47 ¿Porqué?
* =34
¿Qué es esto? ¿Cómo se .calcula? Columna 2.
* f p = 14
¿Qué es esto? ¿Cómo se obtiene?
.
* P 85 _ 79 5 + 1O( 47-34)
13
=79.5 +
=79.5 + 10(0.9285)
= 79.5 + 9.285 = 88.79 Explique el significado de este valor.
* P 85 =88.79 Resp.
m •
• • '"o-ra-c·i
-
Esta
que
2.
). Ver Calcular y explicar el significado de:
2 4 a) Pso e) Ql
- 7 b) P70
1.
8 c) D s g) P4S
IjO de
d)Ds h) PS9
..
de la
Las descripciones más comprensivas de las dispersión son aquellas que tratan con la desviación promedio
con respecto a alguna medida de tendencia central. Dos de tales medidas importantes para el estudio de la
Estadistica son: y desviaci6n estándar. Ambas medidas nos dan una distancia promedio de
cualquier observación de la distribución de datos, con respecto a la media de dicha distribución.
Las fórmulas a utilizar para el cálculo de la varianza y la desviación estándar para los tres tipos de datos,
está son matematicamente equivalentes a la defInición, y son las que se usan a menudo por que nos liberan de
te, por calcular las desviaciones con respecto a la media de dicha distribución
. de los
que la
19rama
como
Con base a lo anterior, la expresión para calcular la desviación estándar para datos no agrupados viene dada
por la fórmula (17) para la población y la (17.1) para la muestra
Desviación estándar
6 36
2
=202
8 64
.9 81
••
. . ..
'. . •.i •.i·'iiii.i,•••i.·"i·ij'ji."
•
... Paso 3. Sustituir los resultados "de los pasos 1 y 2 en la
a fórmula de la desviación estándar, operar y
calculara
a -25'
2. Cuál será el valor de la desviación estándar del problema anterior, si se consideran los datos como una
muestra? ¿Cómo considera usted esta diferencia?
Solución:
... Paso 1. Hacer una tabla corno la de la izquierda en la que se
consigne y calcule: X, X 2, n, = 202
La
n=6
Sólo
- 30 -2
la
X n
5'' X = 25 ... Paso 2. Calcular la-media de la distribución y elevarla
al cuadrado en Cl
202 6(25)
s= ... Paso 3. Sustituyendo y operando en la fórmula (17.1) la va
202 6(25)
s=
- 30' =3.22
í.•
estandar poblacional como la muestral, así: -
l.
Solución
MODBCUl
a
Paso 4) Presionar: ¿e
••
• -z
MORFi,.i.,i·ilo,·".,'.·"'·'j"'· ~. .
Resp.
no una
Teclear:
Presionar: 3
l.
Si lo que se pide es calcular la desviaci6n estandar de los datos tomados como una muestra entonces:
VAR
... Aparecerá en pantalla lo descrito en el
paso 4)
... Se desplegará en pantalla el número
3.224903099 que corresponde a la
desviaci6n estandar de los datos
tomados. como muestra (s)
l que se s =3.22 muestral ...Resp.
202
La
La de la poblaci6n se parece a una Desviaci6n Absoluta Promedio calculada para una poblaci6n.
S610 que en este caso, se obtiene la suma de los cuadrados de las distancias entre la media y cada valor de
la variable, divididos entre el número total de los elementos de la poblaci6n. Al elevar al cuadrado cada
elevarla distancia, automáticamente se hacen positivos todos los números y por consiguiente, no se necesita tener
en cuenta el Valor Absoluto de cada desviaci6n. La varianza de la poblaci6n, se representa con el símbolo
(sigma al cuadrado). La Fórmula (18) se usa para calcular la varianza de la poblaci6n y la (18.1) para
7.1) la varianza de la muestra, cuando se tienen datos no agrupados
(18)
... Resp.
estándar __ 1. La f6rmula de la varianza, es la misma que la de la desviaci6n estándar, s610
.va.)
que sin la raíz cuadrada.
2. La es el cuadrado de la desviaci6n estándar o la desviaci6n
estándar es la raíz cuadrada de la
3. Al tener calculada una de ellas, fácilmente se obtiene la otra elevando al
cuadrado o extrayendo raíz cuadrada, según el caso.
¡memoria En el problema anterior N° 1; si la desviación estándar es: = entonces con solo elevar el
cuadrado esta expresión, se tiene así
la pantalla
Desviación estándar poblacional ... Resp.
oblema
8.67 Varianza poblacional ... Resp.
.
Horacio Reyes Núñez• •
•
3. En seis domingos consecutivos un operador de grúa recibió: 9, 7, 11, lO, 13, 7 llamadas de servicio.
Calcular la desviación estándar para la población dada.
Solución:
'" Paso 1. Hacer una tabla como la de la izquierda. Elevar al
¡
f cuadrado cada puntaje no procesado y después
calcular la sumatoria de estos cuadrados.
ll Si
10
49
9
_ _ 9 + 7 + 11 +6 10 + 13 + 7 oo. Paso 2. Obtener la media y elevarla al cuadrado.
= =9.5
= (9.5)2 = 90.25
_ 2 I
-90.25'
=2.14
Solución
Paso 1) Teclear:. • 3 [11 [11 oo' ¿Qué se hizo?
Horacio Reyes
_ úñ.z
-
• Mm.,,'··.·'·".'·"."»""·""C, . .
...¿Qué se hizo?
7 y
sp.
Cuando se trata de datos agrupados en frecuencia simple, las fónnulas (19) y (20) nos pennite efectuar los
sp. cálculos de la desviación estándar y de la varianza poblacional y la (19.1) y (20.1) la desviación estándar y
la varianza muestral respectivamente.
x =Valor de la observación
ional se (19) estándar pobúu:ional =Media poblacional de la
distribución
N =Tamaño de la Población
f = de las observaciones
=
fX2 Producto de la frecuencia por
.. .: '. .. ,": ,"-:
- ", (19.1)
ll:4(\i"' - ••
"
estándar muestral
el respectivo valor de la
-l-o-1 observación elevado al
cuadrado
n =Tamaño de la muestra
=Media muestral
•
~
. . •. i"jiii.i,• .i •.i'j·D¡j'·"
2.
J (20.1)
En los siguientes ejemplos, se explica paso a paso, la metodología que debe seguirse para calcular la
desviación estándar y la varianza en un conjunto de datos que están agrupados en frecuencia simple.
Solución:
1 2
... Paso 1. Multiplicar' cada valor (X) por su frecuencia f
para obtener fX. (Columna l.)
... Paso 2. Multiplicar cada fX por X para obtener fX2
(Columna 2.)
... Paso 3. Calcular de la Columna 1. y de la
Columna 2.
N = 16; = 65; = 303
... Paso 4. Calcular la media y elevarla al cuadrado
s =
65
= 16 = 4.06
=(4.06)2 =16.48
=
a = : '
a =1.57
••
• T
'
- •.i.¡¡A,.i,q.i•.i,,.¡¡¡iii'
llar la
uencia Solución:
1 2
... Paso 1. Multiplicar cada valo.! de X por su respectiva
frecuencia f para obtener fX. Columna 1.
... Paso 2. Multiplicar cada fX por su propia X para obtener
fX2 Columna 2.
... Paso 3. Calcular de la Columna 1. y de la
Columna 2.
2
encia f n = 30; = 286; = 3 358
286 3358
=
pasos 1,
sviaci6n s =4.67 Desviación estándar mues/rrll ... Resp.
varianza
S2 = 21.78
S2 = 21.78
Varianza muestral ... Resp.
... Resp.
La columna 2. puede calcularse de otra manera: Elevando al cuadrado cada valor de X y después
.., Resp. multiplicar este valor por su respectiva frecuencia f. Ud. debe seleccionar la que le parezca mejor o la más
fácil.
~. . •.•.i·ijDi·',n·.·i'i·i.".i,
•
E11
una
cale
Las
17 21 18 27 17 21 20 22 18 23
para
El gerente de producción de la compañía siente que una desviación estándar de más de 3 botes por día
indica variaciones de tasas de producción inaceptables ¿deberá preocuparse por las tasas de producción
de la planta?
2. Una compañía de teatro de Honduras está seleccionando una muestra de extras para una película. La
edad de los primeros 20 aspirantes que van a ser entrevistados es: I
50 56 55 49 52 57 56 57 56 59
54 55 61 60 51 59 62 52 54 49
El director de la película desea tener personas cuya edad se agrupe estrechamente alrededor de los 55
años. Como es aficionado a la estadística, sugiere como aceptable una desviación estándar de 3 años. I
3. Los números de casa vendidas semanalmente por una compañía de bienes raíces, durante un período de
8 semanas fueron 3, O, 6,4, 1,5,4 Y1. Calcular la desviación estándar de esta población de casas.
4. Una estación de pesca en el Lago de Yojoa tiene registros de los peces atrapados. La pesca en libras de
los últimos 20 días fue:
101 132 145 144 130 88 156 188 169 130
90 140 130 139 99 100 208 192 165 216
Calcular a) rango, b) varianza, c) desviación estándar para estos datos, como muestra, d) En este
ejemplo, ¿es el rango una buena medida de variabilidad? ¿por qué?
23 9
n=
•
"'"R""'."'iJd"".,.'(j,ljil'·.. . -
El método del cálculo de la desviaci6n estándar y de la varianza, para el caso de frecuencias descrito por
una muestra agrupada, es esencialmente el ya descrito en páginas anteriores, s610 que las desviaciones se
de la calculan con los puntos medios de cada clase (Xm).
Las f6rmulas (21) y (22) se pueden usar para calcular la desviaci6n estándar y la varianza para una
distribuci6n de frecuencias con datos agrupados, cambiando solamente el valor de X por Xm. Sin embargo,
para evitar dificultades, estas f6rmulas se dan a continuaci6n:
Jor día
iodo de
s.
(22) Varianza poblacional
ibras de
En este
(22.1) Varianza muestral
Los siguientes ejemplos ayudarán a interpretar lo antes expuesto, siguiendo los pasos que se especifican:
5
8 -10
11 - 13
- 16
-19
. _ . _ _••• • AO .•• , - - _ _ • •
• . .._~ ...
Horacio Reyes
.
'. ..
Solución:
•
Paso 1. Calcular los las marcas de clase Xm. Columna l. y multiplicar cada uno de estos valores por la
2.
frecuencia en el intervalo de clase, fXm. Columna 2. y sumar estos productos
1 2
5
10
N=17
Pase
Paso 2. Calcular la media y elevarla al cuadrado
=9.35
= (9.35)z = 87.42
Paso 3. Multiplicar cada marca de clase por tXm para obtener f(Xm)z y sumar estos productos para
obtener Columna 3.
1 2 3
Paso
Paso.
Paso 4. Sustituir los valores obtenidos en los pasos 1,2 Y3 en la fórmula (21) haciendo X = Xm L
2
a = N ... Fórmula (22) para calcular la varianza
Z
=104.29 - 87.42 =16.87
Z
= 16.87 ... Resp.
• •H
• ""'y===.=="c=j=¡;;N'""'rl1 l\"'.7.z
:;:C·
• L'10""'-'_·'·"A'-"'.·'.·"'·""«· . ..
2. La siguiente tabla de distribución de frecuencias de datos agrupados, corresponde al tiempo en horas
la
que 80 estudiantes dedicaron a actividades en sus horas libres durante una semana en la UNAH.
Calcular la desviación estándar y la varianza de la distribución, si los datos correspondan a una muestra.
Solución:
Paso 1. Calcular las marcas de clase Xm de cada clase. Columna 1. y multiplicar cada uno de ellas por la
frecuencia; para formar fXm Columna 2. y sumar estos productos fXm. Calcular
Columna 3
1 2 3
Jara
(20.625)2 = 425.39
Paso 4. Sustituir los valores obtenidos en los pasos 1,2 Y 3 en la fórmula (21.1) y (22.1) para obtener
la desviación estándar: s y la varianza S2, respectivamente.
2
f ()(m)2 nX i
36180 80(425.39) ... Sustituyendo y operando en la fórmula
s-
-
-0-1
---- -
n-1- 80-1 - 80-1
(21.1)
1
1 en la -430.77
3. El número de cheques cobrados diariamente en la sucursal de un banco durante el mes anterior, tuvo la
siguiente distribución de frecuencias muestrales: . 2.
Solución:
s= 592.9295' = 24.35
s= 24.35
Con tUS'Viaci6n estálU1ar de 24.35 cheques diarios, ." Resp.
tUbería preocuparse porque es menor que 28
• • H;-o-r-a-c-'-i ...
•
..
uvo la
•.i.¡,nl,¡,.··.·'¡,·i,,ji. ~
. .
2. De los empleados de una empresa, se obtuvo la siguiente distribución de frecuencia sobre los recorridos
en los viajes entre el hogar y la oficina. El recorrido X se da en Km. Hallar la media, la desviación
iación
liarios estándar y la varianza de la distribución. Considérese como población (N) primero y después como
lo a la muestra (n). Explique la diferencia si la hay.
ad de
..
5.0
Y
Y 3
3. La siguiente distribución, corresponde al gasto en Lempiras de los viajes que los técnicos en reparación
de computadoras hicieron en un día. Hallar la media, desviación estándar y varianza de los gastos
ambién diarios, de la siguiente población:
Llcióny
lUestral
Calcular la desviación estándar '/ varianza para cada una de las siguientes tablas de distribución de
frecuencias.
4.
5. 6. 7.
60 - 6 - 6 - 8-10-
70 -79 9 -11 10 - 13 11-13 6
80 - 89 8 - 14 9
14 - 17 14 14 - 16 5
90 - 99 6 15 - 17 8
18 - 21 10 17 - 19 1
N=23 4 25 9 7
2 4 n=24
N=47 n=81
lutomóviles
Iistribución, 9.
10.
8.
O 2 9\::5/:
1
4-5 11 20.01 -
6-7 5 20 -24 2 30.01 - 40.00
8-9 8 29 7 40.01 - 50.00 4
n=67 30- 34 10 - 60.00 3
5 70.00 1
n=41 N=34
-
~
. . •.i.iidC·i"¡'·.·"j·'i¡ji.i, •
La desviación estándar es una medida absoluta de dispersión y expresa la variación en las mismas unidades·
una = 5, los valores varían en una cantidad que es el doble de la media; en cambio, si se tiene una a = 10
*
Y una = 5000 la variación relativa a la media, es insignificante. Por tanto, no se puede conocer la
dispersión de un conjunto de datos sin conocer la a, la y la relación del tamaño existente entre ésta y la *
Lo que se necesita es una medida que nos dé una idea general de la magnitud de la desviación
q
estándar en relación con la magnitud de la media. Esta medida de dispersión es el de
(cv). Relaciona una y otra, expresando la a como un porcentaje de la De ahí que la unidad de medida, se
llame "por ciento" en vez de las mismas unidades que la de los datos originales.
.
..
.
(23) .
.."
.. (23.1) donde:
cv = Coeficiente de variación
= Media muestral
= Media poblacional
s = Desviación estándar muestral
a = Desviación estándar poblacional La de
distril
El coefICiente de variación es una medida relativa que resulta de utilidad al comparar la cantidad de
variación en grupos de datos que posean medias diferentes. deten
nomb
Ejemplos:
calcul
1. El técnico de laboratorio A en promedio realizó 40 ariálisis, con una a = 5. El técnico B hace 160
análisis diarios como promedio con una a = 15. ¿Cuál de los dos muestra menor variabilidad?
Solución:
* Para tener una respuesta concreta, calcular
b)
DE•
•• ~~
-
"'··.·'·".'··'••
2. Una fabricante de tubos de TV tiene dos tipos de tubos: A y B. El A tiene una duraci6n media de 1 495
horas con una desviaci6n estándar de 280 horas. El tubo B tiene una duraci6n media de 1 875 horas
··.·"'·ij"C·
-- . .
con una desviaci6n estándar de 310 horas. ¿Qué tipo de tubo tiene mayor dispersi6n relativa?
Sohición:
nidades
* cv = x 100% ... Coeficiente de variación. F6rmula (23)
r= 10 Y
la= 10
* cv(A) = x 100% = 18.72% ... Coeficiente de variaci6n para el tubo de tipo A
¡tral
lCional La desviaci6n estándar,· es también útil para describir que tan lejos las observaciones individuales de una
distribuci6n se apartan de la media de la distribuci6n. Una medida denominada puntuación estándar o
idad de puntuación normalizada o puntuación nos dá-el número de desviaciones estándar a que está
determinado valor de la variable, por arriba o abajo del valor de la media. Este proceso se conoce con el
nombre de o estandarización. Si se denota con X el valor de la variable, entonces la
normalizaci6n, estandarización o puntuaci6n estándar o puntaje z correspondiente a esa observaci6n, se
calcula con la f6rmula (24) para la poblaci6n y con la (24.1) para la muestra.
ilce 160
. -
.....
Ejemplo 1.
-
_______________________ ._. . . _~,_",.,, '"""'
__ ' • . , ._ _ - ¡¡¡líl.d.iíIIi _4
..
Solución:
•.i,'j·C··,¡:¡·i•.'".",,,.,
•
3. I
En un examen final de Matemática la media de la muestra fue de 72% y la desviación estándar de 15.
Determinar las puntuaciones z o normalizadas de: a) 60%, b) 93%, c) 72%. 6.
Solución:
a) =_12 =-08 '" 0.8 desviaciones estándar por de la
s 15 15 .
media. ... Resp.
b) =X = 93-72 = 14 ... 1.4 desviaciones estándar por de la
s 15 15 .
media. ... Resp.
c) = ... Está sobre la media 7.
1572 = = 0.0
2. Con las siguientes observaciones se describen las edades de los estudiantes que asisten al programa
diurno y nocturno de postgrado en computación:
Curso diurno: 24 30 28 23 25 22 26 27 28 25
Curso Nocturno: 26 33 29 28 27 29 33 34 37 28
Si la homogeneidad del grupo es un factor positivo en el aprendizaje, aplicar una medida de variabilidad
relativa que indique a cuál de los dos grupos es más fácil enseñarles.
- M'I"F"··.·¡·ij"'·¡'.·'W·;'J·i¡'ji.
3. En los 3 últimos años la compañía A alcanzó un promedio de rendimiento sobre la inversión del 28%
con una desviación estándar de 5.3% y la compañía B, un rendimiento promedio de 37.8% con una
desviación estándar de 4.8%. Si se supone que el riesgo se acompaña de una mayor dispersión relativa,
..
l.
I
,.
¿cuál de las dos compañías ha logrado una estrategia más riesgosa? ¿por qué?
de la
l.
4.' La constancia con que un vendedor cumple con las metas establecidas, es un factor que la compañía
L de la "DELR" toma en consideración para incentivar económicamente a los vendedores. Los datos siguientes
edia, la Patricia 88 68 89 92 73
más Juan José 76 88 90 86 79 ¿Cuál de los vendedores es más
viación Francisco 88 95 78 88 63 constante? ¿por qué?
I
5. Una máquina diseñada para producir dosis de cierto medicamento tiene una dosis media de 100 cc con
una desviación estándar de 5.22 cc. Otra produce 180 cc como promedio con una desviación estándar
de 8,6 cc. ¿Cuál de las dos máquinas tienen la menor exactitud desde el punto de vista de la dispersión
relativa? ¿por qué?
: de 15.
6. El gerente de un banco, revisa las, cuentas por cobrar de 3 clientes y el tiempo promedio de días que se
,han atrasado en sus pagos. El gerente considera que además de un promedio mínimo, es de suma
importancia la consistencia basada en la dispersión relativa. ¿cuál de los 3 es el mejor cliente?
de la
H. Reyes N. : 62.2 61.6 63.4 63.0 61.7
G. Reina C. :.62.5 61.9 62.8 63.0 60.7
de la A. CanosM. : 62.0 61.9 63.0 63.9 61.5
7. El dueño de un supermercado emplea dos fórmulas diferentes para predecir las ventas mensuales. La
primera fórmula tiene. una falla promedio de 700 discos con una varianza de 1225. La segunda de 300
discos con una desviación estándar de 16. ¿Cuál fórmula es relativamente menos precisa?
l que el
lr de la 8. Se van a comparar la variabilidad en los precios anuales de las acciones que se venden a menos de
L. 10.00 y la dispersión en los precios de aquellos que se venden por arriba de L. 60.00. El precio medio
l que el de las primeras es de L. 5.25 con una varianza de L. 2.3104; en las segundas el precio medio es de
ledia. L. 92.50 y la varianza es L. 27.8784. a) Calcular la dispersión relativa en el precio de ambos tipos de
numero acciones y explicar cualquier diferencia, b) ¿Porqué utilizar el coeficiente de variación para esta
.able es comparación?
9. Un analista de investigación para una empresa de corretaje de acciones, desea comparar la dispersión en
las razones precio-rendimiento para un grupo de acciones comunes, con la distribución de su pago sobre
la inversión. Para las razones precio-rendimiento la media es 10.9 y la varianza 3.24. El rendimiento
medio sobre la inversión es 25% y la desviación est<Í!ldar de 5.2% a) Comparar la dispersión relativa
para las razones precio-rendimiento y el rendimiento sobre la inversión, b) ¿Por qué debe utilizarse el
coeficiente de variación para comparar la inversión?
paquete
quete B
10. Un ingeniero probó 9 muestras de cada uno de 3 diseños de soporte para un nuevo tomo electrónico.
, mostró
Los siguientes datos corresponden al número de horas que tardó cada soporte en fallar teniendo el
motor del tomo funcionando continuamente a su máxima potencia, con una carga en él, equivalente a
1.9 veées su capacidad esperada.
rograma
OlA: 16 16 53 15 31 17 14 30 20
B:18 27 23 212226391728
C: 31 16 42 20 18 17 16 15 19
a) Calcular la media y la desviación estándar para cada grupo.
abilidad
b) Basándose en las respuestas del inciso anterior, ¿ cuál diseño es mejor y por qué?
mecánicas (AM) y otra de destreza manual (DM). La media de la primera prueba fue de 200 y la
desviación estándar de 10. En la segunda, la media fue de 300 y la varianza de 36; Comparar la
dispersión relativa de ambos grupos y explicar cualquier diferencia.
12. La media y la desviación estándar de una población son 120 y 20.0 respectivamente. Encontrar el valor
de X que corresponde a:
13. ¿Cuál valor de X tiene la mayor magnitud relativa al conjunto de datos del cual procede?
1.
A: X = 85 donde = 72.0 ya = 8.0
B:X = 93 = 87.0 ya= 5.0
14. ¿Cuál valor de X tiene menor posición relativa con respecto al conjunto del cual procede?
15. El número de aciertos en un examen de aptitud, aplicado a nivel nacional, tiene una media y una
desviaci6n estándar de 500 y 100 respectivamente, calcular el número de aciertos para cada valor de'z:
18. El precio promedio de lechuga es L. 0.711a libra con desviaci6n estándar de 0.05; el tomate L. 0.40 la
libra con desviación estándar de 0.03 y el pepino L. 0.19 la libra en promedio con una desviación
estándar de 0.02. Si en cierto mercado se tienen los precios de 0.78 la libra de lechuga, L. 0.45 la de
tomate y L. 0.21 la de pepino, ¿cuál de estas verduras tiene relativamente un precio excesivo?
19. En una compañía, la acción e tiene un precio normal medio de L. 58.00 con una desviación estándar de
L. 11.00 Y se vende actualrnenteen L. 76.00. La acción D se vende a un precio medio de L. 38.00 con
una desviación estándar de L. 4.00 Y se vende actualmente en L. 50.00. Si una persona posée ambos
tipos de acciones, ¿cuál deberá vender primero? ¿por qué?
20. Dos personas están haciendo dieta. La primera tiene un peso medio de 146 libras con desviación
estándar de 14 libras y la segunda pertenece a un grupo de edad en la que el peso medio es 160 libras
con una desviaci6n estándar de 17 libras. Sus respectivos pesos son 178 y 193 libras. ¿Cuál de las dos
personas están seriamente pasada de libras con respecto a su grupo de edad?
21. Los solicitantes a ingresar a la UPN tienen una calificación de matemática ACf promedio de 21.4 con
desviación estándar de 3.1, mientras que los solicitantes a íngresar a UNITEC tienen una calificación
de matemática ACT promedio de 22.1 con desviación estándar de 2.8. ¿Con respecto a cuál de estas 2
. universidades está un estudiante en una posición relativamente mejor, si obtiene: a) 26 en su examen
b) 31 en su examen? 5. El
re
'
•• orado Reyes úij.ez
-
itudes
) y la
rar la
•.•.•.".,.,•.••.•".•j",. ~. .
.::::::" ..:.::.0.': ....
. valor
"
Dé respuesta a cada una de las siguientes preguntas:
3. los siguientes datos representan las calificaciones, en porcentaje, que los estudiantes de la sede de
Comayagua obtuvieron en la asignatura de Cálculo 11 en el primer período del año 2006: 64, 61, 60, 60
valor z
68, 71, 68, 68, 73,80 y 82. Calcule a) La mediana de los datos, b) La varianza de los datos c) El percentil
75 y su significado.
4. Sea una distribución de frecuencia agrupada de calificaciones de examenes finales para 20 estudiantes de
educación a distancia en la asignatura de Algebra 1
0.40 la
lviación
la de
indarde
1.00 con
ambos
sviación
50 libras
las dos
bosque nublado.
Darlo Alberto Mejía en el libro "Bosques del los define y explica a cabalidad: "En
Honduras se utiliza el término Bosque Nublado (BN) para definir áreas que existen en las partes
altas de las montañas y están cubiertas con neblinas o lluvias durante más del 70% del Más
adelante continúa el autor diciendo: "Los BN de Honduras se encuentran en de 35 montañas
(formando cerca de 4% del territorio), distribuidos en altitudes desde 800 hasta 2,859 metros sobre
el nivel del mar. La altura normal sobre los 1,800 metros".
Los bosques nublados poseen una gran abundancia de plantas epifitas. es decir, plantas que
crecen sobre otras plantas.
Debido a la poca presencia de luz solar bloqueada por las nubes, los árboles no crecen tanto,
como aquellos de tierras bajas, entre otros factores.
El principal beneficio que proporciona al los bosques nublados es la producción de agua.
Tegucigalpa, por citar un ejemplo, recibe del Parque Nacional La Tigra, entre el 30 y el 40% del
agua que consume. Eso sin contar comunidades cercanas que también se' del
parque.
Lo mismo pasa con Celaque y cerca de 100 comu'nidades, entre ellas Gracias; Pico Bonito que
sustenta a200 pueblos, aldeas, caserios y, por supuesto, La Ceiba; oCusuco que le da vida aSan
Pedro Sula y 20 centrospoblacionales Dicho de otra forma, es muy probable qué Ud. amigo
, 'lector, dependa hoy de un bosque nublado para agua.
y animales de los bosques nublados constituyen un extraordinario banco genético
irremplazable. Son la cura de innumerables enfermedades que nos agobian yla esperanza
ticia de los próximos años, son nuestro futuro. Una vez que desaparecen de su entorno, las
y los zoológicos nos los recuerdan.
"Aislados en las partes altas de las montañas nacionales,'los bosques nublados son verdaderas
olvidadas por
de Hlbueras·, Edición 2 Diario "El Heraldo·, Tegucigalpa M.D.C. '
: "En
artes
Más
tañas
que
tanto,
agua.
% del
del
:0que
aSan
amigo
nético
Iimen
las
..
~ •••••••.,",•.•.+.••.•;.••••• I
E
Ptobabilidad. d(
Ptobabilidad Ptobabilidad como Ptobabilidad
Jacob Bemoulli, Abrahamde Moivre, Thomás Bayes y Joseph Lagrange inventaron fónnulas y técnicas de
probabilidad. En el siglo XIX Pierre Simón, Marquis de Laplace unificó esas primeras ideas y fonnuló la
La Teoría de la Probabilidad fue aplicada con buenos resultados a las mesas de juego y, lo que es aún más El
en
importante, con el tiempo se aplicó a otros problemas socioeconómicos. La industria de los seguros, que
nació en el siglo XIX, requería un conocimiento exacto del riesgo de pe,rder, pues de lo contrario no se La
podían calcular las pólizas. En la actualidad la teoría matemática de la probabilidad constituye el pe:
fundamento de las aplicaciones estadísticas tanto en la investigación social romo en la toma de decisiones.
op,
La probabilidad forma parte de nuestra vida En las decisiones de carácter personal y gerencial, se
Au
enfrenta la incertidumbre y nos valemos de la teoría la probabilidad, sin importar si se admite o no el ha
empleo de una cosa tan Cuando se escucha el pronóstico del tiempo según el cual hay un 80% de prc
probabilidad de lluvia, lo más aceptable es que tome. precaución al salir, de llevar consigo un paraguas.
Los administradores deben preguntarse sobre las posibilidades de que las ventas de cierto artículo alcancen
o excedan uÍl cierto nivel. ¿Qué debería preguntarse un profesor? ¿un sociólogo? Est
ent
reSl
Vivimos en un mundo donde se es incapaz de pronosticar el futorocon absoluta certeza La necesidad de
sortear la incertidumbre, nos lleva a estudiar y aplicar la Teoría Probabilidad. En muchos casos se COI
tendrán algunos conocimientos sobre Jos posibles resultados de una decisión. Si se organiza esta deb
infonnación y se analiza sistemáticamente, se podrán reconocer las suposiciones, comunicar a otros el
prol
razonamiento y tomar una decisión mas inteligente de la que se lograría recurriendo a un método que no sea
científico.
En las ciencias, constantemente se están haciendo experimentos. A fin de poder obtener resultados, es
necesario que estos experimentos puedan repetirse cuantas veces se desée, con la exigencia de que dichas
-.Horado
•
Espacio Muestral: Es el conjunto de todos los resultados posibles de un experimento. Por lo general, se
designa con S. Se le llama también Universo o lista colectivamente exhaustiva. . .
Ejemplos:
En general la probabilidad es la posibilidad de que algo ocurra. El cálculo de probabilidad tiene aplicación
más en todos los aspectos de la vida: en la ciencia, en el comeido, en la ooucacióil, en las comunicaciones, etc.
. que
10 se La idea de probabilidad se encuentra relacionada con el o Por ejemplo, cuando una
le el persona juega al naipe o las cartas, primero se asegura de que las cartas estén bien barajadas para garantizar
Iles. que ninguna carta o cartas tengan un lugar especial en la baraja y asegurar que cada carta tiene la misma
oportunidad de encontrarse en cualquier parte de la baraja.
al, se Aunque separados, la Probabilidad y la Estadística son campos de Matemática con relación entre sí. Se
no el ha dicho que es el vehículo de estadlstica". Es decir de ser por las leyes
de probabilísticas, la Estadística no sería posible.
os, es
lichas
En la aplicación de esta regla, lós ténninos "favorable" ó "triunfo" ó "éxito", se utilizan libremente y se
pueden aplicar a cualquier tipo de resultádos, aunque favorable ó triunfo ó éxito sea por ejemplo, caer
enfermo. Generalmente lo que es un éxito o triunfo para unjugador, es una falla o fracaso para sU oponente;
La probabilidad clásica, a menudo se le conoce como probabilidad a priori debido a que si se sigue·
utilizando ejemplos previsibles, como monedas no alteradas, dados no cargados y de barajas normales,
entonces se puede establecer la respuesta de antemano (a priori) sin necesidad de lanzar una moneda, un
dado o tomar una carta; es decir, no se tiene que realizarel experimento para obtener conclusiones en un
razonamiento lógico antes de realizar el experimento.
La probabilidad a priori no se puede aplicar a los· problemas de toma de decisiones como los que se
encuentran en administración y ciencias sociales.
En el siglo XIX los estadísticos británicos, interesados en la fundamentación teórica del cálculo del riesgo
de pérdidas en las pólizas de seguros de vida y comerciales, empezaron a recoger datos sobre nacimientos y
defunciones. En la actualidad, a este planteamiento se le llama Frecuencia Relativa de Presentación de un
evento y define la probabilidad como:
I dado
1. La frecuencia relativa observada de un evento durante un gran número de intentos
2. La fracción de veces que un evento se presenta a la larga, cuando las condiciones son estables.
_. .: ••••.11.1.1,1.,•.".•••
•
Este método utiliza la frecuencia relativa de las presentaciones pasadas de evento como probabilidad.
Determina que tan frecuente ha ocurrido algo en el pasado y usa esa cifra para predecir la probabilidad de
que suceda de nuevo en el futuro. Por ejemplo, una compañía de seguros sabe por información obtenida de
los datos actuariales registrados, que de los. hombres de 50 años de edad, 60 de cada 100,000 morirán de un
período de un año; con esos datos, la compañía estima la probabilidad de muerte de ese grupo, de edad en
particular como:
60 =0.0006
100 000
Una dificultad del presente planteamiento de la probabilidad como frecuencia relativa, es que la gente lo
utiliza a menudo, sin evaluar el número suficiente de resultados.
Otro tipo de probabilidad lo constituyen las las que basadas en las creencias de
las personas efectúan la estimación de probabilidad. De hecho, la probabilidad subjetiva se puede definir
como la probabilidad asignada a un evento por parte de un individuo, basada en la evidencia que se tenga
disponible. Esta evidencia puede presentarse en forma de frecuencia relativa de presentación de eventos
pasados, o puede tratarse simplemente de una creencia meditada.
(
Quizá la más antigua estimación de probabilidad subjetiva de que fuera a llover, se dió cuando los abuelos
decían: "Los gallos cantan en la madrugada, creo que mañana lloverá". .
Las asignaciones de probabilidad subjetiva se dan con más frecuencia cuando los eventos se presentan sólo
una vez o un número muy reducido de veces; por ejemplo: si una población sólo es de 4 personas y se
desea una de ellas para un puesto de gerencia de producción; cada pe¡sona.tiene buena apariencia, alto nivel
educativo y de actividad, experiencia, bastante confianza en sí mismo, buen récord de trabajo anterior y
disposición para enfrentarse a los retos que se presenten, ¿cuál es la probabilidad de que cada candidato se
relacione exitosamente con el cliente? El'responder a esta pregunta y escoger a uno de ellos requerirá que
se asigne una probabilidad subjetiva al potencial de cada aspirante.
Como casi todas las decisiones sociales y administrativas de alto nivel se refieren a situaciones específicas
y únicas, los responsables de tomar decisiones en este nivel hacen uso considerable de la probabilidad
subjetiva.
Ejemplos:
P(A) *
= = 0.0769
2. ¿Cuál es la probabilidad de obtener un número par en el lanzamiento de un dado?
... Resp.
rr.
Solución: Hay s =3 números pares entre {l, 2, 3,4,5, 6}, n = 6 posibles casos, de modo que
3. Una ruleta tiene inscritos los números del 1 al 20 encontrándose éstos igualmente espaciados. Se le
da vueltas y después se detiene en forma aleatoria, en alguno de los números.
.
• •Horacio Reyes Nuñez
•
•.•m.¡.dC.•.•.C..... . ..
a) ¿Cuál es la probablidad de que se detenga en el número 14?
idad.
Id de Soluci6n:
la de
le un
Hay s = 1 (un número 14) dentro de n = 20 números de la ruleta, de modo que:
id en
s 1
ias de Hay s =10 (Diez números pares entre 1 y 20) dentro de n = 20 números de la ruleta, de modo que:
efinir
tenga s _10_ 1- 05
P(A) -- n ... Resp.
'entos .
lUelos
Soluci6n:
n s610 Hay s = 6 (números mayores o iguales que 15: 15, 16, 17, 18, 19, 20) dentro de n = 20 números
s y se (1 a 20) de la ruleta, de modo que:
1 nivel
:rior y peA) = = = 0.3000 ... Resp.
lato se
rá que Si A es un evento cualesquiera, entonces:
peA) significa: probabilidad de ocurrencia del evento A
peA') significa: probabilidad de no ocurrencia del evento A.
cíficas
)ilidad
Es la variable que asume un valor numérico único para cada uno de los resultados
que aparecen en el espacio muestral de un experimento de probabilidad.
En otras palabras, para denotar los resultados de un experimento de probabilidad se usa una variable
aleatoria. Esta puede asumir cualquier valor numérico que pertenezca al conjunto de todos los resultados
posibles de un experimento (Se denomina "aleatoria" porque el valor que asume es producto de un evento
al azar o aleatorio). Cada evento en un experimento de probabilidad también debe definirse de modo que se 1.
le asigne solo un valor de la variable aleatoria, y todo evento debe poseer un valor asignado.
2. Sea el "número de llamadas telefónicas recibidas" por día en una compañía una variable aleatoria. Los 3.I
valores posibles para esta variable son enteros que varían desde Ohasta un número muy grande.
4. a
3. Sea la "longitud del cable" de un aparato eléctrico una variable aleatoria. Esta es un valor numérico entre b
12 y 72 pulgadas para casi todos los aparatos eléctricos.
4. Sea la "velocidad de calificación" de los automóviles de carrera, que intentan calificar para la carrera 5.
final de 500 millas, una variable aleatoria. s(
vo
Las variable aleatorias numéricas pueden subdividirse en dos clases: variables aleatorias discretas y
variables aleatorias continuas 6. U
Y
Variable Aleatoria Discreta: Es la variable aleatoria cuantitativa que puede asumir una cantidad medible Id
numerable de valores pe
Variable Aleatoria Continua: Es una variable aleatoria cuantitativa que puede asumir una cantidad 7. U
innumerable de valores.
va
En muchos casos, los dos tipos de variables pueden distinguirse al decidir si estan relacionadas con un
conteo o con una medición. Las variables de los ejemplos 1 y 2 soº, discretas; los valores de las variables se
encuentran al contar el número de escudos observados o al contar número de las llamadas recibidas (ar'
contar no pueden ocurrir valores fraccionarios).
Las variables en los ejemplos 3 y 4 son variables aleatorias continuas; los valores de las variables se
encuentran midiendo la longitud del cable y la velocidad (al medir puede ocurrir cualquier valor
fraccionario).
Cuando se intenta determinar si una variable es discreta o continua es necesario observar la variable y
pensar en los valores que podrían ocurrir. por ejemplo en el 1 y 2 no puede ocurrir ningun valor numérico
entre 3 y 4 (3.7 escudos no es posible, como tampoco 3.52 llamadas telefónicas). Sólo son posibles valores
enteros; así hay "huecos" entre los valores posibles..
Las pi
ciertas
variable aleatoria continua está rel;lcionada con una recta numérica continua y con todos los números
deben
representados en ésta. Cuando son posibles todos los números reales, racionales o iracionales, entonces la
variable es continua. El número de valores posibles es ilimitado.
••
. R.-:e-::c:y-,-e.,....s-,-···--.N"·-.-ú---ñ,-e-z
- mM."".-mm·""C·"-·'.·"·'M."".1)
Considere la variable "puntajes otorgados por un juez" en una competencia de patinaje artístico. Si se
considera algunos puntajes.ya ocurridos, 9.9, 9.5, 8.8, 10, Y se advierte la presencia de cifras decimales,
ledida podría pensarse que son posibles todas las fracciones y así concluir que la variable es continua. Sin
, es la embargo, esto no es cierto. No es posible un puntaje de 9.134, así entre los valores posibles hay "huecos" y
la variable es discreta.
ltados
..::=
lItados
1. Se aplicará una encuesta a los estudiantes de una universidad con respecto al número de cursos en que se
que se inscribieron cada uno para este período. Identifique la variable aleatoria de interés y enumere sus valores
posibles.
2. Se aplicará una encuesta a los estudiantes de una universidad con respecto al peso de los libros y útiles
que llevan según los cursos del día. Identifique la variable aleatoria de interés y enumere sus valores
lero de posibles.
3. Las variables en los ejercicios 1 y 2 anteriores son ¿discretas o continuas?, ¿qué son y porqué?
Los
4. a) Explique por qué la variable "puntaje" para el equipo local de un juego es discreta
o entre b) Explique por qué la variable "número de minutos para trasladarse al trabajo" de los trabajadores de una
maquila local es discreta.
carrera 5. Una trabajadora social está llevando a cabo un estudio sobre la estructura familiar; obtiene informaciones
sobre el número hijos por familia, en cierta comunidad, a partir de los datos del censo. Identifique la
variable aleatoria de interés, determine si es discreta o continua y enumere sus posibles valores.
y
6. Un experimento implica la prueba de un nuevo interruptor encendido/apagado. El interruptor se enciende
y se apaga hasta que se descompone, y se anota el número de intento en el que se descompuso.
nedible Identifique la variable aleatoria de interés, detennine si es discreta o continua y enumere sus valores
posibles. .
antidad 7. Un arquero dispara flechas a un blanco y se mide la distancia que hay entre la diana y la flecha
disparada. Identifique la variable aleatoria de interés, determine si es discreta o continua y enumere sus
valores posibles
con un
ibles se 1. A pÍlrtir del inciso 4.1 hasta el 4.3 inclusive de esta unidad, se trabaja con
idas (ar· las probabilidades cuya variable de estudio es cuantitativa discreta.
2. A partir del 4.4 hasta el 4.5 de esta misma unidad se trabaja con
lbles se
probabilidades cuya variable de estudio es cuantitativa continua.
:r valor
todo
riable y
Jmérico
valores
Las probabilidades pertenecen siempre a la incidencia o no incidencia de eventos. Estos deben cumplir
ciertas reglas en las cuales se "comportan" las probabilidades; es decir, son reglas matemáticas que siempre
lúmeros deben cumplirlas. Las siguientes son algunas de estas Reglas Básicas:
la
HoracioReyes ••
'. . •.i'G'·',M"."¡""Mf@.
•
RI. Las probabilidades son números reales que están en el intervalo [0,1] es decir: So
P(A):s 1
a)
R2. Si se tiene certeza de que siempre ocurrirá un evento, su probabilidad es l. Y si se tiene la
certeza de que nunca ocurrirá, su probabilidad es O.
P(S) = 1
. =0 •
R.3. SI dos eventos son mutuamente excluyentes o mutuamente exclusIvos (o sea que no pueden b)
ocurrir al mismo tiempo, AnB = la probabilidad de que uno o el otro ocurran es igual a la
suma de sus probabilidades.
P(A) + P(A') = 1
Ejemplo 1. d)
Si A es el evento de que un estudiante se quedará en casa; B el evento de que irá al cine; P(A) =0.64 Y
P(B) =0.21, detenninar: a) P(A'); b) P(AUB); c) p(AnB)
Solución:
Da(
a) * P(A) + P(A') = 1 ... Regla 4. R4 vale
P(A') = 1 - P(A) .oo P(A') = Probabilidad de que no
se quedará en la casa.
P(A') = 1 - 0.64 =0.36 oo. Sustituyendo valores y
operando Det.
P(A') =0.36 Probabilidad de que no se quedará en casa oo. Resp. cart
7. l
b)* P(AUB) = P(A) + P(B) oo. R.3. Son eventos mutuamente
excluyentes. 8. l
0.64 + 0.21 = 0.85 oo. Sustituyendo. Operando
Ac
P(A U B) = 0.85 Probabilidad de que se quedará en casa o oo. Resp.
estu
irá al cine
Si e es el evento de que a las 9:30 a.m. un cierto médico esté en su consultorio y D es el evento de que
= =
esté en el hospital; P(C) 0.48 y P(D) 0.27. Determinar la probabilidad de que: a) no esté en el
consultorio; b) no esté en el hospital, c) no esté en el consultorio ni en el hospital; d) que esté en el
hospital y en el consultorio.
coro
13.1
14.
••
• -iJ
• Solución:
•. mm·l'di·•.• ·.·¡'·.aM"" ~. .
a) * P(C') ... Probabilidad de no estar en el
consultorio.
:ne la P(C') = 1 - P(C) ... Despejando . de la fónnula
= 1 - 0.48 =0.52 sustituyendo y operando. R.4.
al. c) * P(C' nD') =1- P(CUD ) ... ¿Por ser mutuamente excluyentes
= 1 - (0.48 + 0.27) Sustituyendo y operando
= 1-0.75 =0.25
P(C' nD') =0.25 Probabilidad de no en el Resp.
ni en el hospital
).64 Y
[ue no
1. P(A') 2. P(B') 3. P(AUB) 4. p(AnB) 5. P(A'UB) 6. p(A'nB')
y
Determinar la probabilidad de los siguientes eventos que se dieron al sacar una carta de llila baraja de 52
cartas:
7. Un7 9. Un as o un rey ll. Una figura roja (rey, reina, sota)
mente 8. Una carta negra 10. Un 2 o un 3 negros 12. Un 4 rojo y un as negro
B son
de que
é en el
é en el
Basándose en esta información ¿cuál es la probabilidad de que un vendedor promedio obtenga una
comisión:
18. El secretario de un sindicato, redactó una lista con un conjunto de demandas salariales y de prestaciones
que se presentará al gerente de la empresa. Para darse una idea del grado de apoyo que existe entre los
trabajadores con respecto al paquete de demandas, hizo un sondeo aleatorio entre los dos grupos
principales de trabajadores, los maquinistas (M) y los inspectores (1). Tomó 30 trabajadores de cada Si
grupo con los resultados siguientes:
jU[
62
La
pre
30 30
a) ¿Cuál es la probabilidad de que un maquinista, seleccionado al azar del grupo sondeado, apoye
levemente el paquete?
b) ¿Cuál es la probabilidad de que un inspector, seleccionado al azar del grupo sondeado, esté indeciso dOI
con respecto al paquete?
c) ¿Cuál es la probabilidad de que un trabajador (maquinista o inspector), seleccionado al azar del
grupo sondeado, apoye el paquete, ya sea fuerte o levemente?
d) ¿Qué tipos de estimación de probabilidades son éstos?
Eje
19. Clasifique las estimaciones de probabilidad siguientes según su tipo (clásica, de frecuencia relativa o
subjetiva):
a) La probabilidad de anotar en tiro de castigo durante un juego de fútbol es de 0.47
b) La probabilidad de que el director actual de la escuela renuncie es de 0.85
c) La probabilidad de obtener dos seises al lanzar dos dados al mismo tiempo es de 1136
d) La probabilidad de que un presidente electo en un año que termine en cero muera en su oficina es de
e) La probabilidad de que usted vaya a Europa este año es de 0.14.
20. El gerente administrativo de una compañía de seguros tiene los datos siguientes acerca del
funcionamiento de las fotocopiadoras de la compañía:
Sol
Segón los datos ¿cuál es la probabilidad de que una fotocopiadora esté fuera de servicio?
21. Un tazón tiene 18 bolitas rojas, 12 blancas, 14 azules y 6 negras. Si se saca una bolita al azar,
determinar la probabilidad de sacar:
Se 1
a) una bolita roja; b) una bolita blanca o roja; c) una bolita azul; d) una bolita que no sea ni roja ni
con
negra; e) una blanca y una negra
• Horacio Reyes
• ••,·I,··".·,.··'··MM"" ~. .
iones
"e los
cada Si dos eventos no son mutuamente excluyentes, es posible que ambos se presenten al mismo tiempo.
Ejemplo: sacar un as 6 un 2 de diamantes de una baraja de 52 cartas son eventos que pueden presentarse
juntos ya que puede aparecer uno u otro al momento de extraer una carta de la baraja. en consecuencia, as
6 2 de diamantes son eventos no mutuamentes excluyentes.
La R.3. de las probabilidades se debe ajustar para evitar conteo doble, es decir, se tiene que reducir la
probabilidad de obtener un as o un 2 de diamantes en la posibilidad de que se puedan obtener ambos
eventos juntos. Como resultado de lo anterior, la ecuación correcta para la probabilidad de uno 6 más
eventos A, B que no son mutuamente excluyentes es:
(24.1)
eciso donde: P(AUB) = Probabilidad de que ocurra el evento A 6 el B siendo no mutuamente excluyentes
P(A) = Probabilidad de que ocurra el evento A
del P(B) = Probabilidad de que ocurra el evento B
p(AnB) = Probabilidad de que ocurran Ay B juntos
Ejemplo 1.
iva o
Los empleados de la compañía XYZ han elegido a 5 de ellos para que los representen en el Consejo de
Administraci6n. Los perfiles de los cinco elegidos son: .
1. Hombre 30 años de edad
2. Hombre 32 años de edad
3. Mujer 45 años de edad
4. Mujer 20 años de edad
5. Hombre 40 años de edad
¿Cuál es la probabilidad de que el vocero sea mujer o cuya edad esté arriba de 35 años?
a del
Soluci6n:
Sea A = evento de ser mujer ... Especificando los eventos
B = evento de ser mayor de 35 años
AnB = evento de ser mujer y mayor de 35 años
. - ...· ·- - . 1
'. . •.
•
Ejemplo 2:
La siguiente tabla muestra el resultado de 527 entrevistas 'durante una encuesta para estudiar las
opiniones que tienen al aborto legalizado los residentes de cierta ciudad. Los datos están
clasificados por área de la ciudad.
1.
Si se elige al azar una de las entrevistas de las 527, ¿cuál es la probabilidad de que el entrevistado
2.
a) Estuviera a favor del aborto legalizado?
b) Estuviera indeciso?
3.
Solución: P(R) = 0.1745 ... Resp.
e) Viviera en el área E?
las
están
1. Total de resultados = 50
P(A) =
P(B)=
P(AUB)=
p(AnB)=
2. Total de resultados = 60
P(A) =
P(B) =
P(AUB) =
p(AnB) =
3. La compañía Herr-McFee, que produce barras de combustible nuclear, debe revisar con rayos X y hacer
una inspecci6n meticulosa de cada barra antes de entregarla. Karen Wood, una de las inspectoras, se ha
dado cuenta de que cada 1 000 barras de combustible que revisa, diez tienen defectos internos, ocho
tienen defectos en su contenedor y cinco tienen ambos tipos de defectos. En su informe trimestral,
Karen debe incluir la probabilidad de que haya defectos en las barras de combustible. ¿Cuál es esta
probabilidad?
4. Una urna contiene 75 canicas: 35 son azules y 25 de estas canicas azules están veteadas. El resto de
ellas son rojas, y 30 de éstas también están veteadas. Las canicas que no están veteadas son
transparentes. ¿Cuál es la probabilidad de sacar:
5. La Hal Corporation desea mejorar la resistencia de sus computadoras personales que construye, con
respecto a fallas en la unidad de disco y el teclado. En la actualidad, el diseño de sus computadoras es
tal que las fallas de la unidad de disco significan un tercio de las fallas del teclado. La probabilidad de
que se presente una falla conjunta en la unidad de disco y en el teclado es de 0.05.
a)Si la computadora es 80% resistente a fallas en la unidad de disco y/o en el teclado, ¿qué tan baja
debe ser la probabilidad de que se presente una falla en la unidad de disco?
b)Si el teclado se mejoró de tal modo que s6lo falla el doble de veces que la unidad de disco (y la
probabilidad de falla conjunta sigue siendo de 0.05), ¿la probabilidad de falla en la unidad de disco
del inciso a) producirá una resistencia a fallas en la unidad de disco duro, en el teclado, o en ambos,
mayor o menor que 90%?
~. . •.• m.i'Gi.i,M.i••
•
!í
6. Un inspector de Alaskan Pipeline tiene asignada la tarea de comparar la confiabilidad de dos estaciones Si
de bombeo. Cada estación es susceptible de dos tipos de falla: fallas en las bombas y fugas. Cuando una se
de éstas (o ambas) se presentan, la estación debe quedar fuera de servicio. Los datos disponibles indican cal
que prevalecen las siguientes probabilidades: res
Las
igu.
Frecuentemente un evento A contiene elementos muestrales que son elementos de otro evento B, o sea que
AnB Ya que los dos eventos tienen como mínimo un elemento en común, entonces pueden ocurrir
simultáneamente. El propósito de esta sección es examinar la probabilidad de dos eventos con elementos
comunes, sabiendo que uno de los sucesos ya se ha realizado; es decir, la probabüidad de que ocurra el se o
evento A que haya ocurrido el evento B ó viceversa. A lo anterior es lo que se le llama: probabilidad
condicional. .
y e
prol
.'J. .'-an~ .
.•..... ~ .(24.2) donde: P(AIB) = ocurra
Probabilidad
B de ocurra A dado que
. =
p(AnB) Probabilidad de que ocurra A y B que
P(B) = Probabilidad de que ocurra B
.. 1= La línea vertical se lee: "dado que"
Ejer
Para interpretar con mayor facilidad la Probabilidad Condicional, se analizarán los siguientes ejemplos:
Ejemplo 1
Solu
Una organización investigadora en pro del consumidor, ha estudiado los servicios que prestan 150
técnicos en reparación de aparatos eléctricos de cierta ciudad y se resumen en la siguiente tabla:
86
ISO
Si G = Evento de que un técnico brinda buen servicio
G' = Evento de que un técnico brinda servicio deficiente
F = Evento de que un técnico esté capacitado en la fábrica
F' = Evento de que un técnico no esté capacitado en la fábrica
*
-
iones Si se selecciona un técnico al azar (es decir, cada uno tiene misma probabilidad de ser seleccionado: l/ISO),
".18
ouna se describe que las probabilidades de escoger: a) un técnico que brinde buen servicio, b) un técnico que esté
dican capacitado en fábrica, c) un técnico que ofrezca buen servicio y que esté capacitado en fábrica, son
respectivamente:
_72_
a) P(G) -150 - 0.48 ... Se designa cada evento con una letra, por ejemplo
G y F Y sus respectivos complementos o
b) P(F) = 0.43
negaciones con la misma letra solo que con un
apóstrofe: G' y F'.
48
... GnF es obtenido de la tabla donde se intersecta la
c) p(GnF) =150 = 0.32
columna de G con la línea de F (48) Y este número
se divide por el total de las observaciones. (150).
El cociente obtenido (0.32) es probabilidad pedida.
a que
:urrir
r
Las probabilidades anteriores se obtuvieron con la fórmula de abajo en relación con probabilidades
lentos Al apreciar el espacio de eventos reducido que se presenta (columna total y/o ftla total del cuadro) la tabla.
rra el se obtiene:
48
P(GIF) = 64 = 0.75
Y esta es en realidad una mejora sobre P(G) = 0.48, como se podría esperar. Obsérvese que esta
probabilidad condicional 0.75, también puede expresarse como:
48
P(GIF) = p(GnF) = = 48 150
P(F) 6 4 6 4 x 150
150
.0 que 48
P(GIF) = 64 = 0.75
que es la razón de la probabilidad de: elegir un técnico que brinde buen servicio G que esté
capacitado en fábrica F. En símbolos, lo anterior se escribe: P(GIF).
Ejemplo 2.
De la tabla del ejemplo 1. ¿Cuál es la probabilidad de seleccionar un técnico que brinde un buen
servicio que no esté capacitado en fábr..
Solución:
n 150 * P(GIF') =p(GnF') ... Probabilidad condicional pedida
P(F')
... Probabilidad de que un técnico brinde buen
servicio y que no esté capacitado en fábrica. Ver
cuadro
P(F') ... Probabilidad de no estar capacitado en la fábrica.
150
24 Ver cuadro
* P(GIF') = p(GnF') = ISO = 24 x 150 ... Sustituyendo y operando
P(F') 86 86 x 150
150
= 24 =0.28
86
P(GIF') = 0.28 ... Resp.
....
_ .. ..-: .
Ejemplo 3. s(
De la misma tabla del ejemplo 1. a) ¿Cuál es la probabilidad de seleccionar un técnico que brinde
servicio deficiente dado que sea capacitado en fábrica? b) Cuál es la probabildad de seleccionar un
técnico que no esté capacitado en fábrica que brinde mal servicio.
Solución:
150
62
Siempre que el evento A sea independiente del evento B, se acostumbra decir simplemente que A y B
independientes. Si A YB no son independientes, se dice que son
Ejemplo 1.
.. .. ..
l.
• •. 1)
..
Solución:
inde =
*P(EIM) p(EnM) ... Probabilidad condicional pedida
P(M)
r un
p(EnM) =0.63; P(E) = 0.75; P(M) =0.84 ... Datos dados en el problema
* Como P(EIM) = P(E) =0.75 son eventos independientes ... Resp. Ambas probabilidades son iguales
P(EIM) = P(E) por definición
Ejemplo 2.
La probabilidad de que habrá escasez de cemento es 0.28, la de que obra se terminará a tiempo es
0.53 y la de que la obra se terminará a tiempo y no habrá escasez es 0.64. a) ¿Cuál es la probabilidad
de que la obra se terminará a tiempo dado que no habrá escasez de cemento? b) Son eventos
independientes? ¿Por qué?
Solución:
el =
a)* Sea N Evento de que habrá escasez de cemento ... Identificando los eventos
N' = Evento que no habrá escasez de cemento
Ter el F = Evento de que la obra se terminará a tiempo
F' = Evento de que la obra no se terminará a tiempo
b)* Como P(FIN') =0.89 es diferente de P(F) =0.53, ... Resp. P(FIN') P(F)
entonces los eventos no son independientes
. 1. Si ambos lados de la ecuación 24.1 se multiplican por P(B) se obtie,'.e lo que
E~ se llama la regla de multiplicacion general que permite cal\.ular la
probabilidad de que ocurrirán dos eventos:
ó
• . .• '
.. •
Ejemplo 1.
Si P(C) = 0.60; P(D) =0.40 Yp(CnD) = 0.24 ¿son indpendientes los eventos C y D? ¿Por qué?
Soluci6n:
p(CnD) = P(C) . P(D) ... Definici6n de eventos independientes.
0.24:b 0.60 (0.40) Fónnula 24.3. Sustituyendo y operando 6.
=
0.24 0.24 Son eventos independientes ... Resp. Los productos son iguales
Ejemplo 2.
Si P(A) = 0.56; P(B) = 0.45 Yp(AnB) = 0.89 ¿Son independientes los eventos Ay B? ¿Por qué?
Soluci6n:
p(AnB) =P(A) . P(B) ... DeflIÚci6n de Eventos independientes
0.89 0.56 (0.45) ... Sustituyendo y operando
No son eventos independientes ... Resp. Los productos no son iguales
7.
8.
2. Con referencia al ejercicio anterior, exprese con, palabras las probabilidades que expresan las siguientes
proposiciones: 9.
a) P(HI W') d) P(H') g) P(W'UH')
b) P(W'IE') e) p(H'nE) h) P(W'IE)
c) p[(WnE)IH] t) p(WnH) í) P[(HUW)UE]
3. Si D es el evento de haber suficientes médicos: H el de haber suficientes camas en un hospital, expresar
en palabras las siguientes probabilidades:
= =
5. En una prisión hay 400 convictos. Si H evento de ser criminal empedernido, L evento de condena
larga y el c.uadro siguiente resume la calidad del convicto, calcular las probabilidades a partir de las
e.ntradas y los totales de las filas y columnas,.·
-
·.m·lil'···,_·,.··'·'MM"",:. 1.
a) P(H)
b) P(L)
c) p(LnH)
d) p(H'nL)
e) P(LIH)
t) P(H'IL)
entes.
ando 6. En un banco de la localidad llevan estadísticas de clientes morosos y los tienen clasificados en el
siguiente cuadro donde L =evento de que debe menos de L. 100.00 YM =evento de ser moroso un mes
o más. Hallar las probabilidades a partir de las entradas y los totales de las filas y columnas:
a) P<L)
b)P(M)
Menos de L. 100.00 c).p(LnM)
L. 100.00 o más d)p(M'nL')
Ites e) P(L1M')
t) P(M'IL')
7. Utilizar los resultados del problema 5 para probar los incisos a) y b) dados abajo y con los resultados
del problema 6 comprobar los incisos x) y z) de abajo. ¿Cómo son entre si respectivamente?
,ólica 8. Cierto departamento de sanidad municipal, ha recibido 25 solicitudes de empleo para una plaza de
enfermera. De las aspirantes 10 tienen más de 30 años y 15 menos de este valor. Sólo 17 de las
aspirantes tiene grado de Licenciatura y 8 de maestría. De las que son menores de 30 años, 6 tienen el
grado de maestría. se hace una selección al azar, ¿cuál es la probabilidad de que: a) sea seleccionada
una aspirante de mas de 30 años o que tenga maestría?; b) sea seleccionada una aspirante menor de 30
años dado que tenga una licenciatura?; c) Sea seleccionada una menor de 30 años con licenciatura?
Haga el cuodro respectivo.
entes
9. Un diputado por el departamento de Yoro, sabe que pronto deberá votar acerca de un controvertido
proyecto de Ley. Para darse una idea de las inclinaciones de los ciudadanos acerca del proyecto, hizo
reuniones con algunos grupos en 3 ciudades y apuntó las opiniones de 15 de los asistentes a cada
reunión:
'resar
e} Se seleccione una persona de Progreso y que esté fuertemente a favor del proyecto de ley?
' ..
~
. . mm·¡'iir·i,M·.·ii·i"MU:FF
I
1O. El desglose por partido político de los 435 miembros del Congreso Nacional de una república "X" antes
y después de las últimas elecciones es:
(
e
p
d
Determinar la probabilidad: t
a) De que un miembro seleccionado al azar antes de las elecciones, sea republicano·
L
b) De que un miembro seleccionado al azar después de las elecciones, no sea republicano
Cl
c) De seleccionar un miembro que sea del partido independiente
d) De seleccionar un miembro que sea demócrata dado que se haga después de las elecciones
E:
m
11. Un transportista de productos tiene 10 000 cajas de bananos que vienen de Honduras y Costa Rica. Una
inspección a la carga ha arrojado la siguiente información:
fó
de
Las distribuciones de frecuencias se preparan haciendo una lista de todos los resultados posibles de un
experimento y, después, indicando la frecuencia observada de cada resultado posible. Las distribuciones de
probabilidad están relacionadas con las distribuciones de frecuencias. De hecho, se puede pensar, en la
distribución de como una distribución de frecuencias teóricas. Lo anterior quiere decir que
una distribución de frecuencias teórica es una distribución de probabilidades que describe la forma en que
se espera que varíen los resultados. Debido a que estas distribuciones tratan sobre expectativas de que algo
suceda, resultan ser modelos útiles para hacer inferencias y tomar decisiones en condiciones de
incertidumbre.
..
• •HoracioReyés
-
Como se explic6 anterionnente, una variable aleatoria, es aquella variable que asume diferentes valores a
consecuencia de los resultados de un experimento aleatorio.
Esas variables pueden ser discretas o continúas, según adopte un número limitado de valores o que se le
permite asumir cualquier valor dentro de determinados límites. A la primera se le llama variable aleatoria
discreta y a la segunda variable aleatoria continua.
La distribución normal es una distribución continua de probabilidad. La variable aleatoria puede asumir
cualquier valor dentro de ciertos límites.
Esta distribuci6n, con frecuencia se le identifica como la piedra angular de la Estadística moderna y a
menudo se le dá el nombre de Distribuci6n de Gauss en honor al matemático y astr6nomo Karl Gauss.
. Una
La representación gráfica de esta distribuci6n es una curva en forma de campana que obedece a una
fónnula matemática especial y se utiliza para describir distribuciones de puntajes, para interpretar la
desviaci6n estándar, para infonnes de probabilidades, etc.
Existen dos razones básicas para las cuales la distribuci6n nonnal ocupa un lugar prominente en la
Estadística:
1. Tiene algunas propiedades que la hacen aplicable a un gran número de situaciones en las que es
necesario hacer inferencias mediante la toma de muestras.
ilidad 2. Casi se ajusta a las distribuciones de frecuencias reales observados en muchos fenómenos, incluyendo
nente características humanas (pesos, alturas, coeficiente intelectual), resultados de procesos físicos
(dimensiones y rendimientos) y muchas otras medidas de interés para quienes trabajan en la docencia,
las ciencias de la salud y para los administradores tanto en el sector público como privado.
un Moda
les de
en la
ir que
n que
algo
de
ución -3
uci6n
1. La curva tiene un solo pico; por consiguiente es Tiene forma de campana
2. La media de la población distribuida normalmente, se encuentra en el centro de su curva normal. 1
(
3. Es simétrica con respecto a la recta que está en el centro y que representa la media, la mediana y la moda
de la distribución; todas ellas tienen el mismo valor.
E
4. Las "colas" o "extremos" de la curva de la distribución normal de probabilidad se extienden de manera
indefinida y nunca tocan al eje horizontal. (Imposible de demostrarlo gráficamente).
z
5. Para defInir este tipo de distribución, se necesitan conocer dos parámetros: La Media y la Desviación
(a) de la población. La distribuci6n normal que tiene a = 1 Y = O, se llama unitaria.
No importa cuales sean los valores para y a para una distribución de probabilidad normal, el área bajo la
curva es 1.00 de manera que se puede pensar en áreas bajo la curva como si fueran probabilidades.
pr
pr
la
m·
Er
va
2.25%
dé
do
Ex
Relación entre el área
bajo la curva de
distribución normal de
probabilidad y la
distancia a la media
medida en desviaciones
estándar.
B• ••H'"o-ra-c"--¡
• 1
ii
Estas figuras muestran tres formas diferentes de medir el área bajo la curva normal. Sin embargo. muy
pocas de las aplicaciones que se hacen de la distribución normal de probabilidad implican intervalos de i;
exactamente ±1, y desviaciones estándar a partir de la media. Para los otros casos por fortuna se
pueden utilizar las tablas estadísticas las que indican porciones del área bajo la curva normal que están "
Gontenidas dentro de cualquier número de desviaciones estándar (mas menos) a partir de la media.
lOda
En la tabla N° 1 del final del libro se muestra el área bajo la curva normal entre la media y cualquier valor
nera de la variable aleatoria normalmente distribuida. La clave para trabajar con esta distribución. es el valor de
z que es considerado como una variable aleatoria 7 'lda o normalizada ya que sus unidades de
ción medida son desviaciones estándares.
jo la
r (244)
donde: x = valor de la variable aleatoria a estudiar
= media de la distribución de la variable aleatoria
=desviación estándar de la distribución
z = número de desviaciones estándar que hay desde
x hasta la media de la distribución
o de
ción En general. se puede afirmar que z es un cambio en la escala de medición del eje horizontal de la
curva normal.
de z de de
La Tabla N°l del fmal del libro que corresponda a valores del bajo la curva normal. enlista las
probabilidades asociadas a los intervalos centrados en la media para valores específicos de z. Otras
probabilidades pueden encontrarse por adición ó sustracción en base al concepto de simetría que existe
la distribución normal y el hecho de que el área total bajo la curva es 1. (0.5 a la derecha e izquierda
media).
En la Tabla No. 1 de las áreas bajo la curva normal de O a z (al final del libro) puede observarse que los
valores de z están en la primera columna encabezada con "Z" al margen izquierdo, y contiene las unidades y
décimas de z desde 0.0 hasta 3.4; en la parte superior y en la primera fila. se encuentran las centésimas de z
donde 0.00 hasta 0.09, marcadas unicamente con O, 1.2,3•...• 9.
Ejemplo 1.
Explicación:
área Se busca 1.5 en la columna "Z " y el 2 en la primera fila superior.
de El valor del área se encuentra dentro de la tabla. en la intersección de la horizontal trazada por 1.5 y
1 de vertical trazada desde 2.
En esa intersección está el valor 0.4357 que corresponde al área buscada (ver el cuadro de la página
la
siguiente)
edia Esa área es también la medida de la probabilidad asociada al mismo intervalo, es decir:
ones
P(O < Z < 1.52) =0.4357
~
. . ) •
Ejemplo 2. S(
Explicación:
* El signo negativo "-" indica que este valor de z, está a la izquierda de z =O ó que está abajo de la
media.
* Se busca 2.0 en la columna "z" y el 5 en la primera ftla superior.
* El valor del área se encuentra en la intersección de la ftla 2.0 con la columna 5. 2.
* En esa intersección está el valor 0.4798 que corresponde al área buscada. (Ver cuadro de abajo)
* Escrita como probabilidad asociada al intervalo, se tiene: P(-.2,05 < z < O) 0.4798
Sol
Los siguientes ejemplos muestran algunos cálculos de las áreas bajo la curva normal y la probabilidad
asociada al mismo intervalo.
Ejemplos:
e• •.H"=-o-r-a-c-·..--fO-·--R--.,--y-e-::-·s-·--N..-u
T
•
."Mdb.·em·l'dl .',;.•. ~. .
Solución:
A(1.52. = A(O. -A(O, 1.52)
... Planteando el problema como una
= 0.5 - 0.4357
diferencia de áreas
= 0.0643
... A(O. 1.52) = 0.4357 obtenido de la Tabla N°1
A(z> 1.52) = 0.0643 Como área
... Resp.
ajo de la P(z > 1.52) = 0.0643 Como ... Resp.
2. A la izquierda de z = 1.52
o)
+ 00
z=O z= 1.52 z
Solución:
A(-oo, 1.52) = A(-oo, O) + A(O. 1.52) ... Planteando el problema como una suma de
bajo de áreas
otra a la = 0.5000 + 0.4357 ... A(0.1.52) = 0.4357 obtenido de la Tabla 1
=0.9357 ... Operando
lia. =
A(z < 1.52) 0.9357 Como ... Resp.
. z en la P(z < 1.52) = 0.9357 Como probabilidad ... Resp.
ciada al
3. Entre O y z =-2.1
: porque
:ión:
Area por la que se Area en la tabla:
ha preguntado 0.4821
abilidad
_00 _ _ +00
z =-2.1 O Z =2.1 z
: 0.4357
que se
Solución:
. .~.,,".m m".i'iiC·i,M.i•.
4. A la izquierda de = -1.35
L
""
O z= 1.35 z
Solución: el
-1.35) = A(-oo,O) - A(-1.35, O) ... Planteando el problema como una
diferencia de áreas
= 0.5 - A(O, 1.35) ... Por simetría. Explique
= 0.5 - 0.4115 e
=0.0885 el
A(z < -1.35) = 0.0885 Como área ... Resp.
P(z < -1.35) = 0.0885 Como probabilidad ... Resp.
d)
z = -1.5 O
__ +""
z= 2.1 z
Solución:
A(-1.5, 2.1) = A(-1.5, O) +A(O, 2.1) ... Planteando el problema como una suma de
áreas
_c
= A(O, 1.5) + A(O, 2.1) ... Por simetría. Explique
= 0.4332 + 0.4821 oo. Valores obtenidos de la Tabla N° 1
A(-1.5, 2.1) = 0.9153 Como área oo. Resp.
P(-1.5 < z < 2.1) = 0.9153 Como probabilidad oo. Resp. g)
6. Entrez=0.7 y z = 2.1
+""
O z=0.7 z=2.1 z
0.4821
A(0.7, 2.1) =A(O, 2.1) -A(O, 0.7) ... Planteando el problema como una diferencia
de áreas
=0.4821 - 0.2580 ... ¿Qué se hizo?
A(0.7, 2.1) =0.2241 Como área Resp.
P(0.7 < z < 2.1) =0.2241 Como probabilidad Resp.
La Tabla N° 1 de la distribución normal puede utilizarse también para determinar el valor de z si se conoce
el área bajo la curva. Es importante aclarar que para no interpolar, se aceptará el valor de la tabla que esté
más próximo al valor del área dada. El valor del área dada se busca en el cuerpo de la tabla y se identificará
el valor de z en la fila y columna correspondiente. en ese orden.
una
lnvestigacion
Calcular el valor aproximado de z, para cada uno de los siguientes casos, en los cuales se dá el área bajo la
curva normal respectiva.
a) b) c)
0.1844
d)
la de
+00
h) i)
0.025 0.01
_ 00
O O
~
. . •.ii,m."';i.i" .•.
-
4-.5
Las p
..:.;.:.:. :.::::::. .. ....- ..
infore
Determinar el área bajo a los siguientes valores de z. desvió
1. Entre O y 1.5 3. Entre -2.15 y O estan<
2. A la derecha de 1.59 4. A la izquierda de 3.21
Calcular el valor del área bajo la curva normal situada entre los pares de valores de z:
5. z = -1.23 Y z = 1.35 7. z =-1.30 y z = 2.85
EjemI
6. z = -1.67 Yz = 1.86 8. z = -2.5 Y z = -0.39
Determinar las siguientes áreas bajo la curva normal: Le
no
9. A la derecha de z = 0.01 13. A la izquierda de z = -2.57 az;
10. A la derecha de z = 1.87 14. A la derecha de z = -1.74 b)
11. A la derecha de z = 2.30 15. A la izquierda de z = 1.89 es
12. A la izquierda de z = 1.60
Soluci
Obtener el valor de:
16. P(0.03 < z < 2.35) 19. P(z> 1.47) a:
17. P(-2.15 < z < 2.34) 20. P(-3.16 < z < -1.88)
18. P(z < 1.38) 21. P(-2.22 <'Z < -1.11) a) * p(
Hallar la probabilidad de que un dato seleccionado aleatoriamente de una población normal que tenga un
valor z que caiga:
*(
Hallar los valores de z para cada distribución normal estándar:
28. 30. e
00 o z
=- =-_ _ =- _
0.4590
*p
*L
L-_oo - o z + 00
oo
_------....:----=-....:.-
• •Horado
•
mM."".·mm.lili'."_.'•. ~. ..
de
Las probabilidades asociadas a cualquier distribución pueden encontrarse aplicando las técnica discutidas y
analizadas en la sección anterior. Sin embargo, primero deben "estandarizarse" o "normalizarse" la
información dada. Cuando se trabaja con una distribución normal, es necesario conocer su media y su
desviación estándar a. Una vez que se conocen estos valores, cualquier valor de la variable aleatoria
puede ser convertida facilmente en el valor z estándar utilizando la fórmula de normalización o
estandarización ya conocida:
Ejemplo 1.
Los coeficientes intelectuales CI de los alumnos de una escuela primaria están distribuidos
normalmente con una media = 100 Y una desviación estándar a = 10: Si una persona es elegida al
azar, a) ¿Cuál es la probabilidad de que su CI esté entre 100 y 115; es decir, cual es P(IOO < <115)?
b) ¿Cuál es la probabilidad de que una persona seleccionada aleatoriamente tenga un CI mayor que 95;
es decir, P(x. > 95)?
Solución:
= 100 ... Datos del problema
0= 10
a) * P(IOO < x < 115) está presentado por el área sombreada de la figura de abajo
un
* Cuando x = 100 entonces z =100 100 0.00 ... Normalizando los valores de la variable,
usando la fórmula (24.4), para z.
00
_
100 115 x
O 1.5 z
* P(lOO < x < 115) =P(O.OO < z < 1.50) =0.4332 ... Escribiéndolo como probabilidad y
empleando la Tabla N° 1
-
* La que la persona selecciontula ... Resp.
00
tenga un el entre 100 y 115, es 0.4332
~ .. •. mm.¡'iii.i,M.i••
. I
b) * P(x > 95) está representada por el área de la figura que se presenta abajo
_00 95 100 X+ OO
-0.5 Z
fórmula respectiva.
* P(x > 95) = P(z > ... ¿Qué se hizo? ¿Por qué?
=0.1915 + 0.5000
=0.6915
Ejemplo 2.
Un estudio de los participantes anteriores indica que el tiempo medio para completar el programa es de
50 horas, y que esta variable aleatoria normalmente distribuida tiene una desviación estándar de 10
horas.
Solución:
P(z >2) = 7
•
• • H'--o-,-a-c--'¡-o-'R=-e-y-e-s---=-N"-lI--·
• em·i"'t·',M.•. ..
A(2,'+ = A(O, +(0)
=0.5000 - 0.4772
A(2, + = 0.0228 Como área ... Planteado como área; en ténninos de z y
P(z > 2) = 0.0228 como probabilidad
P(x > 70) = 0.0228 Probabilidadpedida ... Resp.
l de
ores _00
o 0.5 1.50 + 00
o la
. . •.i •.
•
d) * P(4O < x < 48) =?
Si x = 40 entonces z = 40-50 =-1 ... ¿Qué se hizo?
10
Si x = 48 entonces z = 48 50 = -0.20
P(-l <z<-0.20)=? ... ¿Qué se hizo?
28.
29.:
-
2. Plantear y calcular el valor de z para cada caso:
b)
I 30.1
1
00 z o 1.85
(
(
32.
1. P( x > 60) x < 83) 5. P(38 < x < 58) (
(
2. P(60 < x < 72) 4. P(65 < x < 82) 6. P(x < 40) 1
Si h es una variable aleatoria distribuida normalmente con = 26.7 Y = 3.4, hallar la probabilidad de
que un valor individual h seleccionado al azar: 33. [
28. Un vendedor maneja de una ciudad a otra y descubre que el tiempo que tarda en el recorrido es una
variable aleatoria que tiene más o menos una distribución normal con = 4.3 horas = 0.2 horas.
Detenninar la probabilidad de que un viaje dure:
a) Más de 4.5 horas b) Menos de 4.0 horas c) Entre 4.1 y 404 horas
29. La experiencia con respecto al número de pasajeros en el buque Queen Elizabetb II reveló que el número
medio de pasajeros es de 1 820 Y la desviación estándar de la distribución normal es 120. a) ¿Qué
porcentaje de las travesías tendrán entre 1 820 Y 1 970 pasajeros?; b) ¿qué porcentaje de los recorridos
tendrán 1970 pasajeros o más?; c) ¿qué porcentaje de las travesías tendrán 1 600 pasajeros o menos?
30. Un fabricante de garajes para anexar a las casas descubrió que los tiempos que necesitan dos
trabajadores para construir un modelo, se distribuye normalmente con una media de 32 horas y una
desviación estándar de 2 horas. a) ¿Qué porcentaje de garajes necesitan entre 30 h Y 34 h para ser
construidos?; b) ¿qué porcentaje de los gJIajes necesitan 28.7 h o menos para su construcción?; c) ¿qué
porcentaje necesitan entre 29 h Y 34 h'!; d) ¿qué porcentaje de garajes requieren 35 h o más para ser
construidos?
31. Una industria produce cojinetes de bolas en forma automática. Para uno de los cojinetes, la media
aritmética de los diámetros dIstribuye normalmente con media de 20 mm y desviación estándar de
0.15 mm. ¿Qué porcentaje de los cojinetes a) tendrán diámetros, entre 20nun y 20.27mm?; b) tendrán
diámetros de 20.27mm o más?; c) tendrán diámetros entre 19.85 mm y 20.30 -1?; d) tendrán diámetros
de 19.91 mm o menos?
32. Se determinó hi resistencia a la tensión de un gran número de alan.ores y después se organizó una
distribución de frecuencias. La distribución es aproximadamente normal con media de 300 lbs y
desviación estándar de 20 lbs. ¿Qué porcentaje de los alambres probados a) quedaron entre 296 y 310
lbs?; b) por encima de 332 lbs; c) quedaron por debajo de 298 lbs?
d de
33. La puntuación media en una prueba de ingreso a una universidad es 500 y la desviación estándar 75. Las
puntuaciones se distribuyen normalmente; a) ¿qué porcentaje de los estudiantes tuvieron puntuaciones
por debajo de los 320 puntos?; b) ¿qué porcentajes tuvieron puntuaciones entre 400 y 510 puntos?; c)
qué porcentaje tuvieron puntuaciones mayores que 640 puntos?;
.
Universidad de Greifswald, Alemania
Aquí conviven cuatro grupos étnicos hondureños: Garífunas, Pech, Miskitos y Tawahkas.
Con ellos Jaguares, Dantos y Jagliías, recorren los bosques húmedos, manglares y plani
cies costeras, mientras el águila harpía señorea los nítidos cielos azules.
5.1
Una de las aplicaciones más importantes de la Estadística es hacer inferencias acerca de grupos muy
grandes, basándose en la infonuación obtenida en pequeños grupos. En otras palabras, se trata de conocer la
población entera a partir de datos de una o más muestras de esa población; la medida en que estas
inferencias sean exactas, dependerá de lo adecuado de las muestras.
.0
Tipo de muestras: ju
pe
Las muestras se clasifican en aleatorias y no aleatorias. Las muestras aleatorias son aquellas donde los
elementos por seleccionar se tornan de acuerdo con las leyes probabilísticas. Cada elemento en una Ej
población tiene la misma probabilidad de ser seleccionado corno parte de la muestra. Las muestras no
aleatorias, son aquellas que se seleccionan a partir de su consideración corno "típicas".
A menudo no es posible estudiar la población completa. Alguna de las razones principales son: La
qu
1. La naturaleza destructiva de ciertas pruebas
2. La imposibilidad revisar todos los integrantes de la población
3. El costo de estudiar todos los elementos de la población, a menudo es prohibitivo
4. Lo adecuado de los resultados de la muestra
5. En ocasiones se necesitaría mucho tiempo para entrevistar a toda la población Es
fOI
Existen dos técnicas para seleccionar las muestras de una población: el muestreo no aleatorio y el muestreo
aleatorio:
no Co
dal
Es el método que recoge las muestras de manera que no todos los elementos de la población tienen la
misma posibilidad de ser seleccionados. Este muestreo puede ser por accidente, por cuota e intencional o da1
de juicio. tab
Consiste en estudiar los datos que a criterio del investigador conviene analizar. La
pUl
Ejemplo: pre
En la U.P.N. se realiza un trabajo de investigación sobre el transporte colectivo universitario, para Se
ello se elabora una encuesta y se le aplica a un grupo de estudiantes seleccionados por el investigador
libJ
con elprop6sito de establecer una conclusión del problema en estudio.
Consiste en· fonuar las muestras considerando las diversas características de la población de acuerdo al
porcentaje que ocupan dentro de ella; estas características pueden ser, edad, sexo, religión, etc. La selección
se hace siguiendo un criterio no aleatorio.
Ejemplo:
Se hace un trabajo estadístico en una población estudiantil en la que el 54% son mujeres y 46% son
varones. Corno la muestra debe ser estimada mediante este método, significa que la muestra debe
constar de un 54% de y un 46% de varones. Si la ll1uestra consta de 300 estudiantes, entonces
deben haber 162 mujeres y 138 varones obtenidos así:
46 =138 varones
1)
muy (162 mujeres) + (138 hombres) =300 estudiantes
cer la
estas EI'!'uestreo intenciontJl o de juicio:
Consiste en tomar los datos para fonnar la muestra de acuerdo a experiencias. al sentido común o al
juicio del investigador es decir. solo tomará aquellos datos que considere son representativos en la
población.
le los
Luna Ejemplo:
IS no
¿Qué revistas ejercen una marcada influencia en el comportamiento de mujer latinoamericana? Para
un investigador serían: Cosmopolitan. Vanidades, Buenhogar. Otro investigador podría tener criterios
adversos o parciales.
La ventaja principal del empleo de muestras no aleatorias, es que son más económicas y rápidas; mientras
que las aleatorias pueden ser caras y laboriosas.
Es aquel que le permite a cada elemento de una población la misma probabilidad de ser seleccionado para
fonnar parte de la muestra. Este muestreo puede ser: simple, sistemático, estratificado y por congwmerado.
Consiste en enumerar cada dato de una población para después escoger aleatoriamente cada uno de los
datos que fonnarán la muestra. El procedimiento a seguir cuando la población es pequeña, es depositar en
la una urna cada uno de los números que representan los datos y luego ir sacando al azar de uno en uno los
Jalo datos de muestra. Para evitar tener que usar una gran urna cuando la población es grande, se han creado
tabla de dígitos aleatorios, que son números que se han seleccionado al azar y escritos en el orden que
hayan salido. Estos mlmeros pueden generarse con una computadora programada para tal efecto, o con las
calculadoras científicas que tienen la función RND.
La manera de usar una tabla de dígitos aleatorios es escoger en fonna aleatoria, un punto de partida que
puede ser en la intersección de una fila y una columna o emplear otra metodología sistemática, clara y
precisa definida al comienzo del proceso.
para Se presenta a continuación, una parte de esta tabla de dígitos aleatorios. (Ver la Tabla N°2 del final del
ador libro).
[o al 8374856049 4637567488
ción 7055508767 6472382934
0684012006 0933147914 .
1291265130 4890031305
5973470495 9776035501
2229367983
son 5432114610 2966095680
iebe
nces 4011966963.
0385998136 9999089966 7544056852
- -
Horado •• ,
_. ~_. ._, • _ ••• .~_. ._._ •• __ 4 ._._. ~ ••• _ _ • _ _ • ._. •• _ " _ .
. . .•.•,,"dlili.•.mm.".li,,¡¡QiM I
Esta porción de tabla tiene una cierta cantidad de dígitos ·aleatorios escritos en conjuntos de 10 dígitos. La
probabilidad de que un dígito cualesquiera de O a 9 aparezca, es la misma que la que tienen los restantes, y
la probabilidad de que ocurra una secuencia de dígitos es idéntica a la de cualquier otra secuencia.
Para aprender a usar la Tabla N°2 de dígitos aleatoriós, se analizará el siguiente ejemplo:
F
Se desea formar una muestra aleatoria de tamaño 10 de una población de cien elementos. Usando la
Tabla de dígitos aleatoria, ¿qué elementos formarán esta muestra? P
a
Solución:
E
Paso 1. Asignar numeración correlativa a cada elemento, teniendo el cuidado de que todos los
elementos tengan mismo número de cifras o dígitos que el del último elemento de la
población (2 cifras en este caso). E
Paso 2. El número correspondiente al primer elemento debe ser 00, el del segundo 01, el del tercero
02, el del cuarto 03 y así sucesivamente hasta el último que debe ser 99.
Paso 3. Seleccionar un método sistemático, ejemplo pasar de la parte superior a la inferior de .las
columnas comenzando con la primera columna de la izquierda y leer solamente los dos
primeros dígitos de cada renglón. Notar que el primer número, usando este método será el
15, el segundo 09, el tercero 41, el siguiente 74, el siguiente 00 y así sucesivamente hasta
. llegar al décimo número que será 35.
Paso 4. Si al llegar a la parte inferior de la columna, todavía no se tienen los 10 elementos
deseados de la muestra, entonces se puede volver al inicio, es decir, a la parte superior de la Se
primera columna de la izquierda de la tabla y luego comenzar a leer los dígitos tercero y 01
cuarto de cada grupo de dígitos; estos empezarán con 81,28, 12,57, etc. (Véase la tabla). H
Paso 5. Los 10 elementos de la población que tengan asignados los números obtenidos en los pasos
Muestreo sistemático: M
En este los elementos son seleccionados de la población dentro de un intervalo uniforme que se Es
mide con respecto al tiempo, al orden o al espacio. es·
Consiste en dividir la población entre el tamaño de la muestra, para así formar tantos grupos como datos co
tendrá la muestra. Para obtener el primer eletnento que formará párte de la muestra, se toma al azar un el
elemento del primer grupo; para escoger, el segundo dato de la muestra se le suma al primero el tamaño de
cada grupo y así sucesivamente hasta completar todala muestra.
Ejemplo:
Si se desea formar una muestra de tamaño 10 de una población de 800 datos. PJ;imero se divide 800
entre 10, dando 80, que corresponde al tamaño de cada grupo. Luego, se selecciona al azar un número
entre 1 y 80, por ejemplo, el 53 que será el primer elemento que formará la muestra. Para seleccionar el
segundo elemento solamente se le suma 80 a 53, dando 133; después al 133 se le 80 y así
sucesivamente, hasta completar la muestra deseada. La muestra quedará formada por los siguientes
Muestreo estratificado:
Para utilizar este muestreo, se divide la población en grupos relativamente homogéneos llamados estratos.
o la Este muestreo es similar al muestreo por cuotas, excepto en que después de haber determinado los
porcentajes de cada grupo o estrato, los elementos se extraen de cada estrato mediante un muestreo
aleatorio.
El muestreo estratificado es una combinación del muestreo por cuota y el aleatorio simple. Este muestreo es
los
adecuado cuando la población ya está dividida grupos o estratos de diferentes tamaños.
e la
Ejemplo:
Se hace una encuesta sobre la asistencia dominical a las iglesias de una población. En esa población hay
1200 habitantes y 4 tipos de religiones: Católica, Evangélica, Testigos, y Mormones. Para hacer un
dos
trabajo representativo es necesario estudiar cada religión por separado y formar 4 estratos:
á el Estrato 1. Católicos
asta Estrato 2. Evar:gélicos
Estrato 3. Testigos
ltos Estrato 4 Mormones
e la Se sabe que el 40% son católicos, 30% evangélicos, 20% son testigos y el 10% son mormones. Se desea
obtener una muestra de tamaño 1200 aplicando el muestreo estratificado.
Haciendo los cálculos necesarios, la muestra estará formada así:
LSOS
Católicos: 40% 1200 x 0.40 = 480
Evangélícos: 30% 1200 x 0.30 =360
Testigos: 20% 1200 x 0.20 = 240
los Mormones: 10% 1200 x 0.10 = 120
ay Una vez que se ha establecido la cantidad de elementos de cada estrato, se toma la lista de católicos y por
medio del muestreo aleatorio simple, se obtienen los elementos católicos (480) que integrarán la muestra.
Se hace lo mismo con los demás estratos hasta obtener los 1200 elementos que formarán la muestra a
analizar.
: se Es el más adecuado para realizar censos y consiste en dividir geográficamente una población para después
escoger al azar los grupos que formarán parte de la muestra. Esos grupos se llaman cúmulos o
Itas conglomerados. En un censo, las principales limitaciones son el presupuesto, el tiempo, y en algunos casos
un
el personal y, para evitar muchos problemas, se hace lo siguiente:
de
ero Ejemplo:
r el
así . Se va a establecer un censo en una ciudad X del país. La disponibilidad que presenta es limitada, la
tes oficina encargada de recoger la muestra, tiene a su cargo 8 encuestadores y decide realizar un muestreo
por cúmulos. Se provee de un mapa de la ciudad, se divide en áreas, se escogen 8 de ellas así:
Cada cuadro representa un cúmulo y los sombreados son los 8 cúmulos que serán encuestados para
realizar el trabajo, aplicando un tipo de muestreo aleatorio para obtener las respectivas muestras y
5.
P~tü'llit1Ñ~'2g
La
val
......
1. Una reportera desea 6285 personas. Estas personas se numeran 0001.
0002•...• 6284. 6285. ¿A quienes seleccioD'anttjjiM la entrevista, si se obtiene la muestra con la Tabla La
N°2. de dígitos aleatorios empleando las primeras 4 columnas de la tabla, recorriendo la tabla hacia la
abajo y comenzando en el renglón 10 inclusive de la 1& columna? Utilizar los dígitos de las posiciones:
3&. 5& Y 7&. La
apr
2. Un sociólogo desea incluir en una muestra. 10 de 83 personas. Si las numera con OO. 01. 02•... 82. ¿qué apr
personas incluirá en la muestra si mediante la tabla de dígitos aleatorios. selecciona el uso de las 2
primeras cifras de la izquierda comenzando con 22 en el 6° renglón de la 2a columna y hacia abajo? N.,
3. Se tiene una población de 10,000 y se desea muestrear 20 aleatoriamente. Usar la Tabla N° 2 de dígitos COI
aleatorios para seleccionarlos. Enumerar los elementos de la muestra que se han seleccionado. Describa car;
su propia metodologia y explíquela.
4. Con un calendario muestrear sistemáticamente cada día décimo octavo de un año. comenzando con el 6
de enero.
5. Una población está constituida por grupos que tienen una gran variación entre sí pero poca variación
7. Un investigador desea reevaluar una muestra aleatoria de 20 de 8312 casas. Si las numera del 0001.
0002, 0003,... 8311, 8312. ¿cuáles se seleccionarán si con la tabla de dígitos aleatorios utiliza las 4
cifras del centro de cada grupo. comenzando en la Isa fila de la 2& columna de arriba para abajo.
1m•
••
•
ji¡"'j,'i·¡j·'M,,·"¡jiij·.·mm·I'lii.',M,,¡"¡'@ ~
. .
8. Los empleados de una compañía tienen distintivos enumerados del 001 al 544. Utilizando los 3 últimos
dígitos de cada grupo de la tabla de dígitos aleatorios, comenzando en la 12" fIla de la 2" columna de
arriba para abajo. ¿Cuáles serían los elementos de esa muestra? Seleccionar 10 de ellos.
Se ha decidido muestrear 25 de 250 accidentes laborales. Un empleado ha sugerido que se use la técnica del
muestreo sistemático y que sea seleccionado cada 8° informe en archivo para la muestra. ¿Cuáles serían
los elementos seleccionados de la muestra? ¿será apropiado este método en el presente caso? ¿Por qué?
Jara
y
La media, la mediana y la desviación estándar de una muestra, son ejemplos de variable aleatoria, cuyos
valores varían de una muestra a otra Las distribuciones que reflejan estas variaciones de oportunidad,
desempeña un papel importante en la Estadística y recibe el nombre de distribución de muestreo o
distribución muestral.
J01,
La distribución muestra! de una estadística, es la distribución de todos los valores posibles que puede tomar
la estadística, a partir de muestras del mismo tamaño y extraídas al azar de esa población.
acia
nes:
La construcción real de una distribución muestral, es una tarea muy grande si la población es de un tamaño
apreciable (y es totalmente imposible si la población es En dichos casos pueden obtenerse
qué aproximaciones de la distribución muestral tomando un gran número de muestras de un determinado
lS2
tamaño. El número de muestras posibles de tamaño n obtenidas con reemplazo de una población de tamaño
2
N, es igual a •
Desde un punto de vista matemático, se pueden describir las muestras y poblaciones, mediante medidas
como la media, mediana, moda y la desviación estándar. Cuando estos términos describen las
itos
características de una muestra se les llama y cuando describen las características de una
riba
población se les llama A continuación se presentan los símbolos utilizados en esta sección.
el6
:ión
Si se toman varias muestras de una población por uno de los métodos aleatorios antes mencionados, no es
del necesario que los estadísticos que se calculan en cada muestra, sean iguales; lo mas probable es que varíen
o la de una muestra a otra.
Toda distribución de probabilidad, puede describirse en parte, mediante su media y su desviación estándar.
En vez de usar la "desviación estándar de la distribución de las medias y de las proporciones muestrales" ,
los estadísticos hablan del en-or estándar de la y en-or estándar de la proporci6n respectivamente.
La desviación estándar de la distribución de las medias muestrales, mide el grado en que se espera que las
medias de las diferentes muestras, vanen por este error accidental en el proceso de muestreo y también la
exactitud que alcanzará si se usa un estadístico muestral para estimar un parámetro. Cada distribución
muestral de media tiene su propia media y su propia desviación estándar.
__ 1. El en-or estándar de la j
) es el cociente entre la desviación estándar
afirmarse que x ' es una medida de dispersión de las medias de las muestras
Cuando el muestreo es a partir de una· población con distribución normal, la distribución muestral de la
media, tendrá las siguientes propiedades:
x n
4. El error estándar de la distribución muestral de medias, es menor que el error estándar de la población:
<a
Muchas de las poblaciones que examinan los encargados de la toma de decisiones son finitas; es decir,
tienen un tamaño limitado o establecido. La fórmula diseñada para calcular el en-or estándar de la
cuando la población es fmita, y el muestreo se hace sin reemplazo, es:
ándar. El término:
iij,,·j,'i·"·'M,,¡i'¡i"j·.·mm·"A'·i,¡,,¡i'4'.
error
Ejemplo 1.
Considérese una población normal con = 100; = 20. Si se selecciona aleatoriamente una muestra de
n ¿cuál es la probabilidad de que esta muestra tenga un valor medio entre 90 y 110?; es
decir, qué es igual P(90 < < 1lO)? -.
Solución:
de la
, '
_ 00
lOO . x
-2.0'0 z
z,=110Z0100=110S100= 1
5
°= 2.00 ... Evaluando z, cuando x = 110. Normalizando
Ejemplo 2.
La distribuci6n de las ganancias anuales de todas las cajeras de un banco, tiene un sesgo negativo .como
lo advierte la figura a). Esta distribuci6n tiene una media de L. 15000.00 Y una desviaci6n estándar de
L. 2 000.00. Si se extrae una muestra aleatoria de 30 cajeras, ¿cuál es la probabilidad de que sus
ganancias promedien más de L. 15 750.00?
=L. 365.16
0.5000
0.4798 .
L. 15000 L. 15 750 +
=L. 15000 o 2.05 z
*La figura a) muestra el sesgo negativo y la figura b) muestra la media que resultará. La parte
* = 15 000; a = 2 000; n = 30; = 15 750 ... Datos del problema para calcular el error
estándar de la media
x 365.16 365.16
* A(2.05, = A(O, +(0) - A(O, 2.05) ... Véase la gráfica del inicio. Planteando como
=0.0202 en la tabla N° 1.
Se desea conocer la poblaci6n de 20 compañías textiles del mismo tamaño, todas las cuales sufren una
Soluci6n:
* N = 20; a = 75; n = 5 ... Datos del problema. Se quiere conocer la
* = = 0.25 Correcci6n
¿F~~~':J;~ "'"
.. ::: :: : :: ..
3. Si una población normal tiene una desviación estándar de 25 unidades, ¿cuál es el error estándar de la
media si se utilizan muestras de tamaño:
a) n = 16 b) n = 25 c) n = 50 d) n = 100 e) n = 150
4. En una población de tamaño N = 80 con una media de 8.2 y una desviación estándar de 2.1, calcular el
error estándar de la media para los siguientes tamaños de la muestra:
6. Se escogieron 64 elementos de una población de 125 elementos, con una media de 105 y una
desviación estándar de 17. a) ¿Cuál es el error estándar de la media?; b) ¿Cuál es la P(107.5 < < 109)?
7. Las estaturas de los niños de un jardín están distribuidas normalmente con una media de 39 pulg. y una
desviación estándar de 2 pulg.
a) Si se un niño aleatoriamente, ¿cuál es la probabilidad de que tenga una estatura entre 38 y
40 pulg.?
b) Se utiliza como muestra un grupo de 30 niños, ¿cuál es la probabilidad de que-la media del grupo
esté 38 y 40 pulg.?
c) Si se selecciona un niño aleatoriamente, ¿cuál es la probabilidad de que su estatura supere las 40
pulg.?
d) Se utiliza como muestra un grupo 30 niños, ¿cuál es la probabilidad de que la media del grupo
exceda a 40 pulg.?
... _
Horado • • ·' .
~
. . •.i."i'iij¡iJ.•. mm.i,,;,.',M,,"'ijm
•
Ej
La proporción de unidades que poséen una caracteóstica particular en determinada población, se representa
por p. Si se conoce la proporción de unidades de muestra que tiene una misma caracteóstica denotada
Se
por se puede utilizar esta última como un estimador de p. Los estadísticos' a menudo' emplean una
muestra para estimar una proporción de ocurrencias. Por ejemplo, el gobierno estima mediante un
x que en n ensayos. Las fórmulas (S), (S.l) y (6) son utilizadas para calcular la desviación
estándar de las proporciones y la referencia tipificada o normalización de una muestra para proporción.
donde: q =(l-p)
p .. .• ·Jl. : : ,. (S) - x
• ,,'o ••• " ",.
= Error estándar de la proporción
(5.1)
2.
Ejemplo 1.
Un psicólogo social entrevistó a ISO ejecutivos de alto nivel y encontró que el 42% de ellos eran
incapaces de sumar fracciones. Estimar el error estándar de la proporción muestra!.
3. :
Solución:
* n = ISO; P 42% 0.42; = = ... Datos del problema
4. ]
=
q (l-p) (1-0.42) 0.58 = = 1
= = 10.42(0.58) i = '= 001624' oo. ¿Qué se hizo?
p n V ISO ISO .
5.1
* p =0.0403 = 4.03%
* 4.03% E"or estándar de proporción muestral: oo. Resp.
6. ]
• ii¡"'j,.'.i.".""',j'ij·.·.W·'iCit···¡,,¡i'¡im ~
. .
Ejemplo 2.
El 8% de los estudiantes de Estadística son zurdos. Se seleccionan 150 personas de esa población.
:nta ¿Cuál es la probabilidad de que la muestra de los que sean zurdos, sea 15% o más?
Solución:
una * p = 8% = 0.08; n= 150; = 15% = 0.15 oo. Datos del problema
un q = (l-p) = (1-0.08) = 0.92
o.
* a- = YO.08(0.92) j = i = 0022 ... Calculando el error estándar de la proporción,
ene P n 150 150' usando la fórmula (5)
p =0.022
* =p-p=0.15-0.08= 0.07 =318 oo. Calculando el valor de z con la fórmula (6)
z p 0.022 0.022 .
para normalizar. Utilizar la Tabla z.
* z = 3.18 ... Trazando la del área bajo la curva
correspondiente
ión
O 3.18+ 00
* P(z 3.18) =A(O, +00) -A(O, 3.18) 'oo ¿Qué se hizo? ¿Por qué?
= 0.5000 - 0.4993
= 0.0007 ó 0.07%
* 0.07% ... Resp.
1, el
1 es
......
1. En Si se seleccionan al azar 150 individuos de esa
población, ¿cuál es la que los que son daltónicos sea: a) tan grande como
0.15; b) esté entre 0.10 y 0.13?; c) menores que 0.12?; d) mayores que 0.14?
2. En una población de adultos, el 15% están sometidos a algún tipo de dieta. ¿cuál es la probabilidad de que una
al azar de tamaño 100, dé una proporción de aquellos que se encuentran a dieta; a) sea mayor o igual
a 0.20; b) esté entre 0.10 y 0.20; c) no mayor de 0.12?
,ran
3. En cierta ciudad se observa que el 20% de las familias tienen por lo menos un miembro que sufre de algún
malestar debido a la contaminación atmosférica. Una muestra al azar de 150 familias dió = 0.27. Si el valor
del 20% es correcto ¿cuál es la probabilidad de obtener una proporción de la muestra así o mayor?
4. En una muestra al azar de 75 adultos, 35 dijeron que consideraban que el cáncer mamario era curable. Si la
proporción real de quienes piensan que dicho cáncer puede ser curado es de 0.55, ¿cuál es la probabilidad de
obtener una proporción tan pequeña o menor que la obtenida en esta muestra?
5. El 60% de los adultos de cierta ciudad asisten regularmente a los oficios religiosos. Se obtiene una muestra
aleatoria de 150 de ellos; ¿cuál es la probabilidad de que la proporción muestra! esté comprendida a) entre
0.50 y 0.6O?; b) sea menor que 0.70?; c) sea mayor que 0.55?
6. En cierta ciudad el 18% de los jóvenes han tenido algún contacto con la policía por efecto de las drogas. Se
selecciona una muestra aleatoria ¿Cuál es la probabilidad de que la proporción muestral esté comprendida a)
entre el 15% y 25%; b) sea menor que 20%; c) sea mayor que 23%? n = 36.
.. ---
Horacio Reyes úñez• •
a lo solicitado empleando sus.propias en se aplique:
cada en clara
2. Si los datos que lleva una agencia muestran que, en un período de tiempo 50 de 65 aereonaves que
volaban de la Ceiba a Roatán llegaron a tiempo l cuál la probabilidad de que algun miembro de la
flota aerea que cubre tal ruta arribe a la hora indicada.
3. Suponga una clase de 100 estudiantes formada por varios grupos
Si se elige al azar un estudiante para que presida la clase, lcuál es la probabilidad de que tal estudiante
sea: a) Un hombre? b) una mujer? c) que curse Matemáticas? d) un hombre o alguien que curse
\ Matemáticas? e) una mujer que curse Matemáticas?
4. Con los datos de cada inciso, determine la independencia o no de los eventos A y B:
a) P(A«B)= 6.12%; P(A) = 0.17; P(B) = 36%. b) = 80%; P(B) =0.3; = 0.28
5. Dada una distribución normal de calificaciones brutas en la cual la media es 60 y la desviación estandar es
3.5, calcular: a) la probabilidad de estudiantes que obtuvieron notas de 55 ó menos b) El porcentaje de
encontrar un estudiante que haya logrado una nota entre 55 y 65 c) la probabilidad de estudiantes que
obtuvieron notas de 55 ó más.
6. El 55% de los adultos de cierta ciudad -asisten regularmente a los oficios religiosos. Se obtiene una
muestra aleatoria de '100 de ellosl cuál es la probabilidad de que la proporción muestral sea mayor que
.
7. Sean 60 estudiantes de un colegio determinado practicando diversos deportes y distribuidos así: fúbol, 30;
basquetbol, 20; béisbol, 20; fútbol y basquetbol 5; basquetbol, y béisbol, 5; los tres deportes, 2. Supongase
ll
'que se elige al azar un estudiante para hacerle una entrevista. Auxiliándose de un diagrama de Venn,
calcular la probabilidad que el estudiante sea: a. un atleta que practique por lo menos un deporte. a) un
jugador de fútbol exclusivamente. b) un jugador de fúbol o uno de béisbol. c) un jugador de basquetbol
."
, exclusivamente. d) un jugador tanto de basquetbol como béisbol.
. '• • ~=,
. -. -
•
la
nte
Irse
res
: de
que
30¡
:ase
nn,
un
:bol
. .
. .:_..",gl.','•.IIII'." ,".I."'"
Jnttoducción. - . - .. .
y
Todo el mundo hace estimaciones. Cuando se va a cruzar una calle; se hace una estimación de la velocidad
de los automóviles que se acercan, de la distancia que hay entre Ud. y el automóvil más cercano y de su
propia velocidad. Habiendo estimado rápidamente estos factores, usted decide si espera, camina o se echa a
correr.
(
Los administradores utilizan las estimaciones debido a que hasta en las cosas más triviales, deben tomar c
decisiones racionales, sin que tengan la información pertinente completa y con gran incertidumbre acerca p
de lo que pueda deparar el futuro. Los jefes de departamento de una Universidad hacen estimaciones acerca
de las inscripciones para el período de estudio siguiente. Los directores de crédito estiman si un cliente
pagará o no sus débitos. Los compradores de casas hacen estimaciones al comportamiento de las tasas de
interés de los préstamos hipotecarios, etc. Todas estas personas hacen estimaciones sin preocuparse de que
su comportamiento sea o no científico, pero con la esperanza de que las estimaciones posean una semejanza
razonable con el resultado.
e
Los conceptos básicos de probabilidad y de distribución muestral, sirven como introducción al método de d
Inferencia Estadística. Generalmente ésta se descompone en dos áreas: Pruebas de Hipótesis y
Estimación. La Prueba de Hipótesis constituye el proceso relacionado con aceptar o rechazar declaraciones
acerca de los parámetros de la población, mientras que la Estimación se ocupa precisamente de estimar los
valores de los parámetros de la población..
S1
si
Se ocupa del uso de los conceptos de la probabilidad para afrontar la incertidumbre en la toma de
decisiones. Se basa en la estimación y en la prueba de hipótesis. En ellas se harán inferencias respecto a las
características de la población a partir de la información contenida en las muestras. La estimación puede
ser:
Estimación puntual:
Es una gama de valores dentro del cual es posible que esté un parámetro desconocido de una población.
En Estadística la probabilidad asociada a una estimación de intervalo se llama nivel de confianza., Esta
probabilidad indica pués, la confianza que se tiene de que la estimación por intervalo, comprenda el
parámetro de la población. Una probabilidad mayor significa más confianza. En una estimación los niveles
de confianza mas utilizados son 90%, 95% y 99%; pero se pueden utilizar otros como el 95.5%. Con
frecuencia los intervalos de confianza, se expresan así:
'
• O rae i O es--M6itez
I
. .
Como el nivel de confianza o probabilidad es de que una variable aleatoria, que tiene una
e distribución nonnal estándar tome un valor entre -zan y + zan es
y
s
s
Se puede sustituir en esta desigualdad, la expresión z de normalización (ver fórmula 4) y obtener mediante
sustitución y algunas operaciones algebraicas, la misma desigualdad, pero reescrita en las formas
siguientes:
1-- = Z..
.... .U.• .··.d7....l .
(7 1) 2. La fónnula (7.1) se emplea cuando
desviación estándar de la población finita
conoce la
0.05
:.
Horacio
~
. . • .i¡'ij.,•.•,ii.i·iiij'
Todas las fórmulas anteriores representan los lúnites superiores e inferiores de un intervalo de confia1Wl 1
para muestras grandes de la media poblacional y se puede afirmar con la probabilidad t
(l-a)xloo% de confianza, que el intervalo contiene la media poblacional o parámetro que se intenta
estimar.
__ 1. Los coeficientes o valores críticos de confianza más usados, de acuerdo al
nivel de confianza,son:
Ejemplo l.
De una muestra de lOO pacientes se obtiene una media = 4.6 minutos con una desviación estándar de
s = 1.1 ¿Cuál es el intervalo del.95% de confianza para el tiempo promedio que tarda un
analgésico en hacer efecto?
Solución:
* n = lOO; s= 1.1; = 4.6; NC= = 95% ... Datos del problema. Muestra grande. Nivel de
* s = 1.1 (Se desconoce confianza NC = 95%
Lo anterior quiere decir, que ·se tiene la certeza en un 95% de que la verdadera media poblacional del
¡dad tiempo que tarda un analgésico en efecto, está entre 4.38 y minutos.
enta
Ejemplo 2.
lo al El departamento de vivienda está interesado en estimar el ingreso medio anual de 700 familias que
viven en una sección de 4 manzanas de una cierta comunidad. Selecciona en forma aleatoria una
muestra de 50 familias y en ellas encuentra un ingreso medio de L. 11 800 con desviación estándar de
L. 950. Calcular un IC del 93% de confianza de que la media de la población está dentro de este
intervalo.
lera,
Solución:
y se
y la
* N = 700; n = 50; = 11 800; s= 950; NC= 93% :.. Datos del problema. n = muestra grande
a es * = = 0.071 0.05 ... Calculando el valor de la fracción de muestreo
es: para definir que ecuación utilizar
__
s _ni _ 950 1700-50'
* N -1 - 3o=l V 700 -1 ... Calculando
que
tico = i= 135.7142 (0.9643) ... Sustituyendo y operando para calcular el error
estándar de la media ( al( )
el * = 130.87
LIC = 11 800 - 1.81 (130.87) = 11 800 - 236.87 ... Calculando los límites del intervalo de
= 11563:13 confianza: LIC y LSC [(fórmula (8.1)]
de LSC = 11 800 + 1.81 (130.87) = 11 800 + 236.87
un = 12036.87
IC(93 %) = 11 563.13 < < 12036.87 ... Resp. Formando el IC del 93%. Explique su
significado
de Ejemplo 3.
Se obtiene una muestra de 38 calificaciones para estimar el puntaje medio de un primer parcial
de Estadística, obteniéndose una media de 74.3%. Determinar el intervalo de confianza del 98% de la
dia media de todas las calificaciones obtenidas en dicho examen si a = 14%
Solución:
') y * n = 38; a = 14; = 74.3%; NC = 98% ... Datos del problema. n = 38 : muestra grande
alo = 98% ó = 2%
* = 98% 0.9800 ... Calculando ZaJ2 auxiliándose de la Tabla z.
= 0.4900 entonces:
* ZaJ2 = 2.33 exceso (ver figura de la siguiente página)
.
Horacio Reyes
. .
~ ••·ii¡ij.,• • •",.i.iiii'
z ... ...
próximo a 0.4900
z (0.01) = 2.33
1
74.3 - 2.33 (2.27) =74.3 - 5.29 =69.01 LIC ... Calculando los límites de IC con la fónnula
(7). ¿Por qué?
74.3 + 2.33 (2.27) =74.3 + 5.29 =79.59 LSC
.1
L Al
media es 76.3. Encontrar un intervalo de para la media poblacional del: a) 91 %; b) 97%;
c) 89%
1
2. Un estudiante muy escrupuloso escribió su trabajo de grado de 700 páginas. El desea conocer el
promedio de errores tipográficos por página. Seleccionó al azar 40 páginas y descubrió que el
promedio de errores por páginas era 4.3 con una desviación estándar de 1.2 a) Calcular el error estándar
estimado de la media y b) Construir un IC del 93% para el valor promedio verdadero de errores por
página en su tesis.
3. Una muestra de 35 individuos se escoge de una población de 360. En la muestra se descubre que la
media es 20.9 y la desviación estándar es de 6.1. Construir un intervalo de confianza para la verdadera
media pob1acional del: a) 96%; b) 90%; c) 98%. .
4. Un corredor de bolsa muestreó 45 órdenes y descubrió que el tiempo medio de ejecución era de 24.3
minutos con una desviación estándar de 3.2 minutos. Construir un IC para el verdadero tiempo medio de
1
ejecución del: a) 96%; b) 88%; c) 99%.
5. Una muestra de 36 obreros no calificados tienen un sueldo medio de L. 7 280.00 con una desviación
estándar de L. l 200.00. Construir un intervalo de confianza para la verdadera media poblacional, del:
a) 94%; b) 97%; c) 99%. 1
6. Se estudió una muestra aleatoria de 75 estudiantes para estimar el dinero medio que gastan en la compra
de libros. Se descubrió que gastan L. 85.30. Si la desviación estándar de la población es L. 15.00
IC del: a) 87%; b) 94%; c) 96% para la verdadera media poblacional.
..
• Dil"f"i·".·"'O·"·.""·'R'.. .
7. Las longitudes de 200 peces capturados en el Lago de Yojoa, tuvieron una media de 14.3 pulg. La
desviación estándar poblacional es 2.5 pulg. Construir IC del: a) 90%; b) 98%; c) 84% para la
-
verdadera media poblacional.
. 8., El gerente de la división de bombillas de la Cardinal Electric debe estimar el número promedio de
horas que durarán los focos fabricados por cada una de las máquinas. Fue elegida una muestra de 40
focos de una máquina A y el tiempo promedio de funcionamiento fue de 1 416 horas. Se sabe que la
desviación estándar del tiempo de duración es de 30 horas. .
a) Calcular el error estándar de la media
b) Cons1!Uir un intervalo de confianz¡l del 90% para la media de la poblaci6n
9. Después de recolectar una muestra de 250 elementos de una población con una desviación estándar
lUla conocida de 13.7, se encuentra que la media es de 112.4
a) Encontrar un intervalo de confianza del 95% para la media
b) Encontrar un intervalo de confianza del 99% para la media
10. En una prueba de seguridad automovilística efectvada por el Centro de Investigación en Seguridad
Carretera, la presión promedio en la llantas de los automóviles de una muestra de 62 neumáticos fue de
24 libras por pulgada cuadrada y la desviación estándar fue de 2.1 libras por pulgada cuadrada.
. a) ¿Cuál es la desviación estándar estimada para esta población? (hay aproximadamente un millón de
automóviles registrados)
b) Calcular el error estándar estimado de la media
c) Construir intervalo de confianza del 95% para la media de la población
11. De una población de 540 individuos, se toma una muestra de 60. A partir de esta muestra, se encuentra
que la media es de 6.2 y la desviación estándar de 1.368
: la a) Encontrar el error estándar estimado de la media
'%; b) Construir un intervalo de confianza del 96% para la media
12. El gerente de producci6n de la compañía Citrus Groves Inc. esta preocupado debido a que las heladas
. el tardías de los' últimos tres años han estado dañando los 2 500 naranjos que posee la Citrus Groves. Con
el el fm de determinar el grado de daño ocasionado a los árboles, ha recogido una muestra del número de
dar naranjas producidas por cada árbol de un total de 42 naranjos y encontró que la producción promedio
por fue de 525 naranjas por árbol, con una desviación estándar de 30 naranjas por árbol.
Estimar la desviación estándar de la población a partir de la desviación estándar de la muestra
.b) Estimar el error estándar de la media para esta población finita.
: la c) Construir un intervalo de confianza del 98% para la producción media por árbol del total de 2 500
era árboles.
d) Si la producción media de naranjas por árbol fue de 600 frutas hace cinco años, ¿qué puede decirce
acerca de la posible existencia de daños en el presente?
4.3
de 13. Un corredor de la Bolsa de Valores tiene curiosidad acerca de la cantidad de tiempo que existe entre la
de una orden de venta y su ejecución. Se hizo un muestreo de 45 órdenes y encontró que el
tiempo medio para la ejecución fue de 24.3 minutos, con una desviación estándar de 3.2 minutos.
ión construir un intervalo de confianza del 95% para el tiempo medio para la ejecución de una orden.
lel:
14. La jefa de Policía Kathy Ackert recientemente estableció medidas enérgicas para contrarrestar a los
traficantes de droga de su ciudad. Desde que se pusieron en funcionamiento dichas medidas, han sido
pra capturados 750 de los 368 traficantes de droga de la ciudad. El valor promedio, de las drogas
.00 . decomisadas a estos 750 traficantes es de L. 250000.00 Y la desviaci6n estándar es de L. 41 000.00
Construir para la jefa Ackert un intervalo de confianza del 90% para el valor medio de los
estupefacientes que están en manos de los traficantes de droga de la ciudad.
.
Horacio Reyes tez• •
Distribución t para el
El
=
tamaño de muestra n 15
IDl
tOl
o
En esta distribución presentada en la figura de arriba, para muestras de tamaño 15 y tamaño 2, se tiene que:
l. Es simétrica con respecto a la media =O
2. Su forma es muy semejante a la distribuciQn normal, sólo que es menor en la media y más alta en los
3. La forma exacta de la distribución t, depende de un parámetro llaltladas grados de libertad (gl) que Se
no es mas que "El tamaño de la muestra menos 1: gl = n-1" en otras palabras, es el m1mero de
valores que se pueden escoger libremente.
4. Esta distribución usa la Tabla 3 llamada Tabla de distribución t de o simplemente Tabla t.
__ ... 1. La Tabla t es más compacta que la Tabla z y muestra las áreas y valores de t
para unos cuantos porcentajes exclusivamente (25%, 10%, 5%, 2.5%, 1%,
0.5%). Una tabla más completa resUltaría demasiado larga, pues hay una
distribución t para cada número de grados de libertad (gl).
2. La Tabla t mide la probabilidad de que el parámetro poblacional que está
siendo estimado no caiga dentro del intervalo de confianza, es decir la
probabilidad de que esté fuera de éste. Si se hace una estimación con un
nivel de confianza del 90% se buscará en la Tabla de Distribución l, bajo la
columna 0.10 (100%- 90% = 10% =0.10). Esta probabilidad de error del
10% = 0.10 está representado por a. Se encontrarán los valores
correspondientes a t para intervalos de confianza del 75% 90%, 95%, 97.5%,
99% y 99.5% bajo las columnas encabezadas por 0.25, 0.10, 0.05, 0.025,
0.010 Y 0.005 respectivamente en la· Tabla· t del final del libro.
¡jiVerifíquelo! !!
3. En el uso de la distribución l, siempre debe especificarse los de
(gl) con que ha de trabajarse.
Utilizando el hecho de que esta distribución es simétrica con respecto a t =O,
se descubre que la probabilidad de que una variable aleatoria que tiene
la distribución t tome un valor entre:
• ."",";.i'.·""'·E-·"'"·''''' . .
io
lo
•I':~J
..............
•••• o • • • • __ ••••
El grado de confianza es es una diferencia existente entre esta fórmula.(lO) del IC y la fórmula de la
muestra grande dada en la fórmula (7) (donde se sustituye por s). También hay diferencia en que
toma el lugar de zaJ2'
Ejemplo 1.
e: El gerente de una empresa desea una estimación por intervalo de la media del consumo de carbón y
quiere tener la confianza del 95% de que el consumo caiga dentro de dicho intervalo. Los datos
los obtenidos son n = 10 semanas, = 11 400 ton. s = 700 ton
lue Solución:
de
* Usar la distribución t ... Porque n < 30 y se desconoce
t. n = 10; = 95%; = 11 400; s = 700 Datos del problema
. ..... .....-- -
Horacio Reyes .
n =10
gl=9
0.025 del área 0.025 del área
bajo la curva bajo la curva
0.95 del área
bajo la curva
........... ,........ : z
10 x =11 400 11 901
1
Figura del problema anterior: una t con 9.g1 de libertad y un intervalo de confianza de 95%
Ejemplo 2.
Una parada de camiones ha conservado registros de diversas transacciones con los clientes. Una muestra
aleatoria de 15 de ellos revelan ventas en promedio de 63.9 galones de diesel con una s = 2.8 galones.
Construir un IC del 99% de las ventas en promedio de diesel que se hacen.
Solución:
* n = 15; = 63.9; s =2.8; =99% ... Datos del problema
* Usar la distribución t. oo. ¿Porqué?
* a = 100% - 99% = 1% = 0.01 Calculando la probabilidad del error
8
=0.005 .oo ¿Para que? ¿Por qué?
* Si n = 15 entonces gl = 15-1 = 14 gl
oo. ¿Qué se hizo?
* tal2 =2.98 ... ¿Cómo se encontró este valor?
9
* LIC = 63.9 - 2.98 ,) 63.9 - 2.98 (0.72) oo. ¿Qué se hizo?
15
=63.9 + 2.15 = 66.05
IC(99%) =61.75 < 66.05 oo. Resp.
El intervalo de confianZJI. está entre 61.75 y 66.05 oo. Resp. ¿Qué significa?
11
de diesel
4. La siguiente muestra de 8 observaciones está tomada de una población infinita con distribución normal:
10.3, 12.4, 11.6, 11.8, 10.9, 11.2, 10.3, 12.6. Calcular: a) la media; b) estimar la desviación estándar de
la población; c) un IC de 99% para la verdadera media de la población.
5. Siete amas de casa fueron muestreadas aleatoriamente y se investigó que caminaban un promedio de
39.2 km por semana durante sus tareas domésticas, con una desviación estándar de 3.2 km por semana.
Construir un IC del 90% para la media de la población.
6. Nueve soportes construidos por medio de ciertos procesos tienen un diámetro medio de 1.005 cm con
una desviación estándar de 0.004 cm. Construir un IC del 95% para la verdadera media poblacional.
7. Las autoridades de Salud han encontrado, que la población posee severos problemas relacionados con
ra
su placa dental. Cada año, el departamento de salud dental local examina una muestra tomada de los
habitantes y registra la condición de la dentadura de cada paciente en una escata que de l al lOO, en
la que 1 iJÍdica que no hay dentadura y 100 indica que la dentadura está en excelentes condiciones. En
el presente año, el departamento de salud dental examinó a 21 pacientes y encontró que tenían un
resultado de revisión dental (RRD) de 72, con una desviación estándar de 6.2. Construir para el
gobierno un intervalo de confianza del 98% para la media del RRD.
or
8. En 6 intentos un cerrajero tardó 9, 14,7,8, 11,5 segundos en abrir un cierto tipo de cerradura. Calcular
a) la media; b) la desviación estándar de esa muestra y c) construir un IC del 95% en relación con el
tiempo medio que la toma abrir este tipo de cerradura.
. '.
9. La siguiente muestra de ocho observaciones fue tomada de una población con distribución nonnal:
75.3 76.4 83.2 91.0 80.1 77.5 84.8 81.0
a) Encontrar la media
b) Estimar la desviación estándar de la población
c) Construir un intervalo de confianza del 98% para la media
10. El número medio de accidentes que se presentaron en los 7 días de la Semana Santa en las playas de
Tela fue de 31, la desviación estándar de esa muestra fue de 9 accidentes por día. Construir un IC del
99% para el número real de accidentes por día.
de confianza
on
Ya se sabe que = comesponde a la media de la proporción de la muestra, donde x es el número de veces
que ha ocurrido un evento en n ensayos. Por ejemplo, si a 63 de 150 televidentes entrevistados en una
muestra, les gusta el programa "cinco entonces: = = = 0.42 = 42%. También ya se
conoce, que la distribución de muestras de una proporción, utiliza la distribución normal como sustituto de
.os la binomial, cuando np > 5 y nq >5, entonces:
i%
=• . (11)
..
s
n = Tamaño de la muestra
zaJz = Coeficiente crítico de confianza
A partir de la fórmula (12) se obtienen el Límite Inferior de Confianza (LIC) con el empleo del signo
negativo (-) y el Límite Superior de Confianza (LSC) en el signo positivo (+)
Ejemplo 1.
Si a 400 personas, que constituyen una muestra tomada al azar, se les aplica una vacuna contra la
influenza y 136 de ellas experimentan cierta incomodidad, construir un IC del 95% en relación con la
proporción correspondiente.
Solución:
IC (95%) ':: 0.295 < p < 0.385 ... Resp. ¿Qué significa? 4.
••
. --
• .""*,""".'11 1".,••••11.1.11#11 .. .
Ejemplo 2.
Con el objeto de determinar el grado de reprobación en un examen de Estadística del primer período de
estudio, se tomaron al azar las secciones "A", "F" Y "H" de la UPN, observándose que se reprobaron 67
alumnos de 132. Construir un IC del 99% para determinar la proporción de alumnos que reprobaron en
todas las secciones.
Solución:
no
* LSC = 0.51 + 2.58 0.5 i =0.51 + 2.58 (0.044)
=051 + 0.113 =0.623
IC (99%) =0.397 < p < 0.623 ... Resp.
El inteTllalo de confianza está entre 0.397 y ... Resp.
la 0.623 Ó que es lo mismo decir que entre el 39.7%
la y el 62.3% está el índice de
la
1. En un estudio de
~~~ti1ifi'lr~~~ dijeron que hacen sus compras en el
supermercado, cuando menos una vez Construir un IC del 99% de confianza para la
la proporción verdadera correspondiente. ¿Qué significa ese resultado?
4. En una muestra tomada al azar de 250 alumnos del último año de Ingeniería en Sistemas, 175
contestaron esperar continuar sus estudios de post-grado. Construir un IC. del 90% para la proporción
verdadera correspondiente. ¿Qué significa ese resultado?
5. En una muestra tomada al azar de 80 personas convictas, 36 recibieron libertad condicional. Construir
un IC del 92% para la proporción verdadera correspondiente, si las personas convictas estaban acusadas
de posesión de drogas. Explicar el resultado. -
- ----
6. De 300 personas entrevistadas que hacen sus compras en un almacén de abastos, 207 de ellas utilizaban
su tarjeta de crédito. Construir un IC del 90% para la proporción verdadera de los que compran con
tarjetas de crédito. ¿Qué significa ese resultado?
7. Una tienda de aparatos electrónicos, compra 250 chips para computadora. El dueño comprueba
mediante muestreo aleatorio que el 5% de esos chips son defectuosos: a) estimar el error estándar de la
proporción de chips defectuosos; b) construir un IC del 98% para la proporción verdadera
correspondiente. Explicar el resultado.
8. De una muestra de 70 ejecutivos minoristas, el 65% de ellos creyó que la disminución de ventas se
debía a lo caro de las divisas; a) estimar el error estándar de la proporción de ejecutivos que pensó eso;
b) construir un IC del 95% para la proporción verdadera correspondiente.
9. De 1500 consumidores, 956 pensaron que el nuevo producto era cera para pisos según su tipo de
envase, cuando en realidad era un nuevo detergente; a) estimar el error estándar de la proporción de
personas con ideas erróneas; b) construir un IC del 96% de. confianza para la verdadera proporción
correspondiente. Explicar el resultado.
10. Un jugador profesional de baloncesto lanzó 150 tiros libres de los cuales encesto 126; a) estimar el
error estándar de la proporción de tiros libres encestados; b) construir un IC del 93% para la proporción
de tiros libres que encesta el jugador. Explicar el resultado.
11. Un dueño de inmobiliaria revisó en forma aleatoria 3000 cuentas de la compañía y encontró que el 60%
de ellas están al día en sus cuentas; a) estimar el error estándar de la proporción de esas cuentas;
b) construir un IC del 91 % para la proporción verdadera correspondiente. Explicar el resultado. I
12. Durante año y medio las ventas han estado disminuyendo de manera coherente en las 1,500
sucursales de una cadena de tiendas de comida rápida. Una empresa de asesores ha determinado que el
30% de una muestra de 95 sucursales tiene claros signos de una mala administración. Construir un IC
del 98% para esta proporción. Explicar el resultado.
s
13. La directiva estudiantil de una universidad tomó una muestra de 45 libros de texto de la librería
universitaria y determinó que de ellos, 60% se vendía en más del 50% por arriba de su costo de
mayoreo. Formar un IC para la proporción de libros, cuyo precio establecido es más del 50% por arriba
del costo al mayoreo, que tenga la certeza de un 96% de contener la proporción verdadera.
Muy a menudo en la práctica, se toman decisiones sobre poblacjones partiendo de la información muestral
de la misma. Tales decisiones se llaman Decisiones Estadísticas; para llegar a ellas conviene oocer ciertos
supuestos o conjeturas acerca de las poblaciones que se estudian. Tales supuestos se llaman Hipótesis
Hipótesis Estadística: Es una afirmación o conjetura del parámetro o parámetros de una población.
•
• • '--o-r-:-a-c-'ir:07 u
:>'"'
I mi""" .•.••.• .
.•",, . ..
Contra esa hipótesis nula, se pueden considerar tres posibles hipótesis alternativas, así por ejemplo:
Ha: 200
Ha:JI<200
Ha:JI>200
s;
Ejemplo:
Una compañía fabrica arandelas con un espesor de 1.0 mm. Se sospecha que el proceso no mantiene su
10 promedio previsto. Si la compañía desea modificar su proceso: a) el espesor promedio es menor de 1.0
el mm. ¿Qué Ho y;Ha deberá usar?; b) El espesor promedio es diferente de 1.0 mm. ¿Qué Ho y Ha deberá
e usar?
Solución:
ía
ie a) Ho : =1.0 mm
la Ha : < 1.0 mm La palabra "menor que" sugiere el símbolo" < "
b)Ho : =1.0 mm
Ha : 1.0 mm La palabra "diferente" sugiere el símbolo" "
.
. . •.i¡'ij.'M. •,ii.i.iiJj'
decisión que se tome. Puede llegarse a 4 resultados posibles como consecuencia de Ho sea "verdadera" o
Si la hipótesis Nula Ho es verdadera.y se acepta, o es fal§a y se rechaza, la decisión que se tome en un caso
u otro es correcta; si es verdadera y se rechaza, o si es falsa y se acepta, la decisión que se tome en uno u
l
Regi6n donde no existe I I Aceptar la hip6tesis nula si el I
I estad{stico muestral cae en
diferencia significativa entre : I
I el estad{sticode la muestra y I I esta regi6n (no rechazar Ho) 2.
I el supuesto parámetro de la I 1
I
: poblaci6n : I
I I
I
0.025 I I 0.025 : 0.025
I I
del área I I I del área área: I del área
I I I I
I I I
I 0.95 del área J I 0.95·del área
I I I I I
••
•
•
·""flii·¡,g·i1'U·fi.d\jIJ.ldJi.. .:
la
= 1. Es posible probar las hipótesis en cualquier nivel de significancia.
o ~ 2. Cuanto más alto es el nivel de significancia empleado al probar una
lúpótesis, mayores son las probabilidades de rechazar una lúpótesis que sea
verdadera.
u 1. Una prueba de hipótesis de dos extremos o colas rechazará la lúpótesis nula si la media muestra! es
significativamente más alta o más baja que la supuesta media de la población. Este tipo de pruebas es
apropiado cuando: .
¡e
le
Si la media de la muestra cae i
en esta regi6n, aceptaremos I
Ho: = donde: =Supuesto valor de la la hip6tesis nula I
Ha: media poblacional I
I
I
el I
I
I
¡e I
Prueba de lúpótesis de
dos extremos, que
muestra las dos regiones Rechazaremos la hip6tesis nula
si la media de la muestra cae en
de rechazo. una de estas dos regiones.
2. Una prueba de hipótesis de extremo o cola izquierda rechazará la lúp6tesis nula si la media muestral
cae significativamente por debajo de ·la supuesta media de la población. Este tipo de pruebas es
apropiado cuando:
En la prueba de hipótesis es apropiado seguir en forma sistemática los siguientes seis (6) pasos:
Paso 1. Formular una hipótesis nula Ha simple y una hipótesis alternativa Ha apropiada
Paso 2. Especificar el nivel de significancia a. Decidir la distribución a usar (t ó y encontrar los
valores críticos para a. - .
Paso 3. Establecer un criterio de demostración que incluya la estadística de prueba.la(s) regíón(es) de
rechazo y aceptación. y los valores críticos, auxiliado de una gráfica de la distribución, a
utilizar
Paso 4. Realizar los con los datos del problema y la estadística de prueba.
de
Ejemplo 1.
Se ha asegUrado que el peso medio de los alumnos de una universidad es de 54.4 kg. Unos profesores
no creen que tal ·aseveración sea correcta. COIi el fm de comprobar la afirmación. reúnen una muestra
aleatoria de 100 pesos registrados de los estudiantes. De ello resulta una media muestral de 53.75 kg.
En el nivel de significancia (a) del 5% y con una desviación estándar de 5.4 kg. ¿es esta evidencia
suficiente para rechazar Ha?
Solución:
1
al2 =0.025/
\ /
I
¡ \. L
al2 = 0.025 1 relación La región crítica está
dividida en dos partes iguales, una a
cada extremo. Ver de la
Se
Paso 4.
_e
=-1.20 Oo, El z calculado localizado en la
a
fig. del paso 3., cae dentro de la
i zona de aceptación. Ver fig. de la
I izquierda.
II
r
r
1>-.
I -1.96 u 1.96 zI
Z* = -1.20 _
res Paso 6.
:tra Conclusi6n: En el nivel de significancia
kg. del 5%, probablemente el
cia peso medio de los alumnos
de esa universidad, es de
54.4 kg.
Ejemplo 2.
las
Se hizo la pregunta en la UPN: ¿Qué distancia promedio en un solo sentido, debe recorrer el estudiante
promedio para llegar la universidad?· Se respondió: "No más de 9.0 Km" Para comprobar esta
hipótesis se tomó una muestra aleatoria de 50 estudiantes y se calculó una distancia media de 10.22
la Km. Probar la hipótesis al nivel de significancia 5% utilizando = 5 Km.
stá
aa Solución:
la
Como n 30 Yse conoce la desviación estándar de la población a, entonces se utiliza la Distribución z .
0.
I
rechazo está a la derecha de la
media muestral. Ver figura de la
izquierda.
.
= 0.05 entonces 0.5000 - 0.05 =
. a=0.051
1.65
zO=I.73J
probablemente el estudiante
Una oficina de investigación de contaminación ambiental afirma que: "El nivel medio de mon6xido de
carbono "no es mayor que 4.9". ¿Constituye suficiente evidencia una muestra de 25lecturilS (resultados
muestrales = =
5.1; s 2.1) para rechazar esta afmnación?Utilizar 5%. =
•
• •:!H!-o-o-r-a-c ¡
•
'a'II''W
Soluci6n:
t* =0.48
z
de
* Paso 6.
Conclusión: No se tiene suficiente
evidencia en el nivel de
significancia del 5%, para
:le rechazar la aseveración de
os que el nivel medio de
mon6xido de carbono, es
no mayor de 4.9.
• un o • .. o.· .
Horado Reyes úñe4-,
_ _ _ • • _ _ , __ ~ ~o __ •
~
. . • .i¡'ij.'M ,ii.i.iiij'
"'?-..;. ,.,....., __
... ro····· o 29
1. .....
b) ¿Qué error puede cometerse en la decisión si falsa?
2. Para los siguientes casos especificar que distribución de probabilidad se empleará en una prueba de
hipótesis:
1
a) Ho : = 19.5 Ha: 19.5 =23.2 a=5 n=36
b) Ho: = 536 Ha: < 536 s=42 n= 26
c) Ho : = 307 Ha: > 307 a=63 n= 19
d) Ho: = 38 Ha: 38 . s=3.6 n=42 1
e) Ho : = 1297 Ha: > 1297 x = 1325 s = 163 n= 13
4. Una empresa industrial supone que la vida de su prensa rotativa más grande es 14550 horas con una
desviación estándar de 2100 horas. De una muestra de 25 prensas con una media de 13000 horas, en un
nivel de significancia del 1%, ¿debe la empresa concluir que la vida media de las prensas es menor que
las horas propuestas?
5. El gerente de una empresa de servicio de paquetería tiene la impresión de que el peso de los envíos que
ha manejado es inferior al que tenía en el pasado. Los registros pasados tuvieron una media de 36.7
. libras con una desviación estándar de 14.2 libras. Una muestra aleatoria de 64 paquetes manejados el
mes anterior indica un peso promedio de 32.1 libras. ¿Es esta evidencia suficiente en un nivel de
significancia del 2%, para rechazar la hipótesis nula a favor de la impresión del gerente?
Pa
6. Un fabricante de lámparas fluorescentes utilizadas por un gran complejo industrial asegura que tienen cUJ
una vida útil de por lo menos de 1600 horas. Se identifica aleatoriamente una muestra de 100 lámparas. obl
¿Respalda una media muestra! de 1562.3 horas con una desviación estándar de 150 horas, el parecer del el,
jefe del departamento en el sentido de que la duración efectiva de las lámparas es menor de 1600 horas
en el nivel de significancia de15%? .
7. El puntaje medio obtenido en una prueba de autoestimaciónpor quienes reciben ayuda del gobierno es
igual a 65, con una desviación estándar de 5. La prueba se aplica a 52 beneficiarios de dicha ayuda en
una muestra aleatoria reunida en cierto distrito. Estas personas alcanzaron un puntaje medio igual a 60.
¿Difiere de la media puntaje del distrito relativo a esa variable, en un nivel de significancia del 0.01?
La
8. Una tienda de implementos deportivos ha iniciado una promoción especial para su pelota de fútbol y
pro
piensa que la promoción deberá culminar con un cambio de precio. Antes de comenzar la promoción, el
promedio al menudeo de las pelotas era de L. 41.95 con una desviación estándar de L. 5.36. La tienda
muestrea a 16 de sus detallistas una vez comenzada la promoción y descubre que el promedio de la disl
·venta de las pelotas es de L. 38.95. En un nivel de significancia del 1% ¿tiene motivos para pensar que sol<
el precio al menudeo ha disminuido? z<
I .'...",e,i,.·j"')·"·."'·'·"I" ~. .
9. La comisión promedio que cobran las empresas en la venta de acciones comunes es de L. 144.00 con
una desviación estándar de L. 52.00, Un corredor ha extraído aleatoriamente una muestra de 121
transacciones y determinó que pagaron una comisión promedio de L. 151.00. En un nivel de
significancia del 10%, ¿se puede afirmár que las comisiones de su cliente son superiores al promedio de
la industria? .
10. En un experimento con un nuevo tranquilizante, se determinó el pulso cardíaco de 12 pacientes antes de
administrarle el tranquilizante y una vez más cinco minutos después se descubrió que su pulso se redujo
en promedio 7.2 pulsaciones con una desviación estándar de 1.8. En el nivel de significancia del 5%,
¿se puede concluir que en promedio este tranquilizante reducirá el pulso cardíaco en un paciente en
menos de 9.0 pulsaciones?
le
11. Un fabricante garantiza que cierto rodamiento tiene un diámetro exterior medio de 0.75 pulgadas con
una desviación estándar de 0.003. Si una muestra tomada al azar de 10 de estos rodamientos tienen un
diámetro exterior medio de 0.7510. ¿Se puede rechazar la garantía que dá el fabricante con respecto al
diámetro exterior medio con el nivel de significancia del 1%?
12. Una muestra elegida al azar de 12 muchachas graduadas de una escuela secretarial, promedian 72.6
palabras por minuto con una desviación estándar de 4.2 palabras por minuto. Utilizar el nivel de
significancia del 5% para demostrar la afirmación de un empleador de que las graduadas de la escuela
promedian menos de 75.0 palabras por minuto.
13. Una máquina vendedora de refrescos está programada para servir 6.0 onzas por vaso. Si la máquina se
examina 9 veces, produciendo un llenado medio del vaso de 6.2 onzas con una desviación estándar de
la 0.15 onzas ¿es evidencia en el nivel de significancia del 5% que la máquina está llenando los vasos más
de lo debido?
le
ue
,.7
el
de
Para n 30, las pruebas de hipótesis concernientes a proporciones suelen basarse en la aproximación de la
curva norrnal a la distribución binomial. Mediante el uso de la misma estadística que se empleó para
en
1S.
obtener el intervalo de confianza de muestra grande de p, se basan las demostraciones de la Ho de p = Po en
lel el valor que se obtiene de la fórmula (13) que tiene aproximadamente la distribución norrnal estándar.
:as
(13)
es
en
?
La, expresión (13) anterior, es la estadística que se utilizará en las pruebas de hipótesis concernientes a
IY proporción de muestra grande.
, el Los criterios de demostración y se sustituyeron por p y Po Y corresponden a los mismos que la
Ida distribución z. Para la Ha de un solo extremo o cola p < Po se rechaza la Ho si z < -Za. Para la Ha de un
la
solo extremo o cola p > Po, se rechaza Ho si z > Za y para la Ha en la que p Po' se rechaza la Ho si
lue
z < -Za/2 Ó z > Za/2'
•
#
. . • .iEii·E'·.,"·i.ii'"
•
Ejemplo 1.
Un nutricionista afirma que cuando menos el 75% de los niños de pre--escolar de ciertos país, tienen
dietas deficientes en proteínaS y que en un estudio de muestra revela que esto es cierto de 206 niños de
pre--escolar en una muestra de 300. Probar la hipótesis en el nivel de significancia del 5%.
Solución:
Sustituyendo valores y
dietas deficientes en
Ejemplo 2. proteínas.
2.
En una muestra tomada al azar de 400 accidentes automovilísticos, se descubrió que 128 de ellos se
debieron en parte a fatiga del conductor. Utilizar el nivel de significancia del 1% para probar si esto
soporta la afirmación de que el 35% de tales accidentes se deben en parte a fatiga del conductor.
3.
Solución:
* Paso 1. Hipótesis: Ho : p = 0.35 ... ¿Qué se hizo? ¿Por qué?
• Ha: p
4.
* Paso 2. Nivel de signijicancia: =1% =0.01 ... ¿Qué tipo de prueba es?
¿Por qué?
•
• •Ho ra e
I
s
* Paso 4. Cálculos
n
n =400; x = 128; P =Po =35% =0.35 ... Datos del problema
e
= z= x - npo 128 :....140 ... Usando la estadística z, cuando
V4OO(0.35) n = 400, x = 128, Po = 0.35 para
o calcular el valor de z*
e -12
a
=9.5393 =-1.26
e z* =-1.26
* Paso 5. Decisión: no se puede rechazar Ho. ...Explicar la razón. Ver figura del
paso 3.
:e * Paso 6.
Conclusi6n: No se tiene suficiente evidencia
estadística en el nivel de
significancia del 1%, para rechazar
la aseveración de que el 35% de
le los accidentes automovilísticos se
). deben a la fatiga del conductor.
y
.*
'~em~f;mJif'~O
el
2. Un crítico de TV asevera de que cuando menos el 80% de los televidentes encuentran inconveniente el
se nivel de ruido de cierto comercial. Si 9 de 35 personas objetan el ruido de este comercial, ¿qué se puede
oto concluir de esta afirmación en el nivel de significancia deI5%?
3. Un fabricante de un removedor de manchas afirma que su producto elimina cuando menos el 90% de
ellas. Si en una muestra aleatoria el removedor de manchas elimina solo lO de 44 manchas, demostrar
esta aftrmación en el nivel del 1%.
4. En un esfudio de aviofobia, un psicólogo afirma que el 30% de todas las mujeres temen a volar en
avión. Si 54 de 200 mujeres de una muestra aleatoria afirman que temen volar en avión, ¿refuta esto la
afirmación del psicólogo? Utilizar un nivel de significancia de12%
'
. .' •. i¡'n.•.•,F'.i.ii4j¡
5. Una línea aérea afirma que solo el 6% de todo el equipaje que se extravía, nunca se recupera. Si 37 de
200 unidades de equipaje perdido no se encuentran, demostrar la Ho : p =0.06 contra la Ha : p > 0.06 en
el nivel de significancia del 5%.
6. Para verificar la afirmación de un servicio de ambulancias que cuando menos la mitad de las llamadas
que reciben son urgentes de vida o muerte, se tomó una muestra aleatoria de sus archivos yse descubrió
que solo 63 de 150 llamadas fueron urgencias de vida o muerte. Demostrar la Ho : p =0.50 contra la Ha
adecuada en el nivel de signiflcancia del 5%.
7. En una muestra aleatoria de 500 automóviles que viran a la izquierda en cierta intersección, 169 se
metieron al carril equivocado. Probar la Ho de que la producción real de conductores que cometen este
error (en el cruce dado) es de 0.30 contra la Ha de que este número es demasiado bajo. Utilizar un nivel
de significancia del 1%.
8. Se ha observado que el 30% de todas las familias que salen del campo se van a la ciudad. Si en una
muestra tomada al azar de los registros de varias compañías de mudanzas grandes, se descubrió que las
pertenencias de 104 de 400 familias que salen del campo se enviaron a la ciudad.
Demostrar la Ho : p =0.30 contra la Ha : p < 0.30 en el nivel de significancia del 5%.
Ji T
Los estadísticos en muchos casos necesitan saber, si la diferencia que observan entre varias proporciones
muestrales son singillcativas o si solo se deben a la casualidad. Supongamos que el director de la campaña
de un candidato presidencial estudia 3 regiones geográficamente diferentes y descubre que el 35%, 42% Y
51 % de los votantes entrevistados en ellas, respectivamente reconocen el nombre del candidato. Si la
diferencia es significativa, ( es decir, si el director de la campaña llega a la conclusión de que la diferencia
se debe exclusivamente al azar), tal vez decida que el lugar escogido para pronunciar determinado discurso
sobre la plataforma del candidato, no influirá en la acogida por parte del público. Así pues, para realizar con
éxito la campaña, el director necesitará conocer si el lugar y la aceptación son dependientes o
independientes entre sí. La
ma
T
Es una disposición de datos en una tabla o cuadro de doble entrada. Los datos se ordenan en casillas o
celdas y reporta el número de datos ofrecuencia obsenada (fo) ofrecuencia real en cada casilla.
En la tabla de contingencia están indicadas dos factores o variables y la pregunta común en relación con
tales tablas, es si los datos indican que las dos variables son dependientes o independientes.
El siguiente ejemplo muestra una tabla de contingencia considerando la clasmcación por sexo, de los
estudiantes de una escuela y su área académica favorita, en la que se resume la preferencia de 300
estudiantes entrevistados acerca del área de su predilección:
El
Ob
X2,•
fón
Esta tabla contiene:
11
s
Ó
a
donde: fe = Frecuencia.esperada
(14) TR = Total de renglones al que
e pertenece la fe. deseada.
e Te = Totalde columnas a la
pertenece la .deseada.
n=
.a
4. Las frecuencias esperadas (fe), se refieren a los términos de la hipótesis nula
LS
de acuerdo con lo cual se espera que la frecuencia relativa (proporción) sea
l.
la misma de un grupo a otro.
En contraste, las frecuencias observadas (fo) se refierenalos resultados que
se obtienen realmente al realizar un estudio, y por lo tanto pueden variar o
no de wi grupo a otro. .
5. Los grados (gl) de una tabla de contingencia de dimensión (RxC)
se calculan con la fórmula (15).
ía
donde: R = Renglón o Fila
y
la
ia
so
(15) e = columna
gl = Grados de Libertad
)n
o La tabla de contingencia anterior, para efectos de cálculos numéricos, se puede escribir de la siguiente .
manera, en la cual ya se han calculado las frecuencias esp!?radas con la fórmula (14). .
- 122x72 _ 29 28
le: 300 - .
_122x1l3 -4'595
o le: 300 -, .
122x115- 46 77'
on e: 300 - . .
178x72 '.
fe: 300 =42.72
.os 178x1l3 - 67 05
e: 300 - .
00
gl = (2-1)(3-1)
• . .
El Ji (X2): Si se desea ir más allá de las meras intuiciones respecto a las frecuencias
Observadas o reales (fo) y esperadas o W6ricas (fe), se emplea el ji representado por
X2 ; este se usa para hacer comparaciones entre dos o más muestras. Este estadístico se calcula con la
fórmula (16) siguiente: .
Horado
'. . •.
La distribución Ji se utiliza para hacer las pruebas de hipótesis que involucran tablas de
contingencia que sirven para comparar casos experimentales con resultados esperados a fin de determinar:
l. Preferencias
2. Independencia
3. Homogeneidad
La información que se usará en esta técnica será colocada en categorías y contada. Si la hipótesis nula
es verdadera, entonces la distribución muestral del estadístico Ji Cuadrada, puede ser aproximada por
distribución Ji cuadrada diferente para cada número de grados de libertad. La figura siguiente muestra 3
pequeños de grados de libertad, esta distribución muestra un fuerte sesgo hacia la derecha. Conforme
crece el número de grados de libertad, la curva se toma rápidamente mas simétrica hasta que el número
alcanza valores altos, punto en el cual la distribución puede ser aproximada por la normal.
Distribución de 1
grado de libertad
Distribución de S
grados de libertad
s
Distribución de 10
_____ grados de libertad
Distribuciones ,de Ji
cuadrada de 1,5 Y 10
grados de libertad . __
O 2 4 6 8 10 12 14
La distribución Ji cuadrada,es una distribución de probabilidad; por tanto, el área total bajo la curva en
dicha distribución, es 1.0. a semejanza de la distribución t, son posibles tantas distribuciones Ji cuadradas
diferentes que no resulta práctico construir una tabla que contenga las áreas bajo la curva para todos los
valores posibles \lel área. La Tabla N°4 del final del libro, muestra solo las áreas en el extremo que más se
I Valor Ji
I cuadrada de 2.764
0.10 del
•
2.764
.' . .
.
.
de Ejemplo l.
ti""fiil·".·II'IJ·'··d,",i.IA'K..
Un sociólogo desea determinar si existe una relación entre la inteligencia de muchachos que se han
sometido a un programa de capacitación especial en el'trabajo y su desempeño subsiguiente en' sus
empleos. Una muestra de 400 casos tomados de archivos muy grandes, produjo la información de la
tabla. de abajo. Utilizar el nivel de significancia del 1% para demostrar hipótesis nula de que la
lor inteligencia y el desempeño en el trabajo son independientes en relación con muchachos que se han
na sometido al programa especial de capacitación.
uy
ne
:ro
'
Solución:
la
de
ido
ltre
1 el Paso 4. Cálculos:
{ el
lcia
1
.., .
X~*
.. ... .•.••I m.
fe 19 = 46.4 fe: = 63.6 fe: = 46.0 .oo Estructurando el cuadro de
cálculos. Calculando fe con la
fe: =51.8 fe: = 70.9 fe: = 51.3 fórmula (14) y escribiendo la
columna (2). Calculando la
fe: =20.8 fe: = 28.5 fe: = 20.8 columna (3) y (4). Sumando la
columna (5) para calcular
=40.89 ... Valor calculado de Ji Cuadrada
Paso 5. Decisi6n: rechazar Ho porque > ... Ver figura del paso 3
es decir 40.89 > 13.3
Paso 6.
Conclusi6n: Existe una relación entre el
coeficiente intelectual y el
desempeño en el trabajo.
Ejemplo 2.
Cada persona de un grupo de 300 estudiantes fue identificado como hombres o como mujer,
preguntándosele si preferería recibir cursos de matemática 00, Ciencias Sociales (CS) o Humlmidades
(H). La tabla de contingencia de abajo muestra las frecuencias para cada categoría:
¿Presenta esta tabla con el nivel de significancia del 5%, la suficiente evidencia para rechazar la
hipótesis nula de que la preferencia por las matemáticas, ciencias sociales o humanidades, es
Solución:
Paso 1. Hipótesis: Ho : La preferencia por el área de estudio oo. ¿Qué se hizo? ¿Qué tipo de 2.
es independiente del sexo. tabla es? ¿De cuántos gl?
Ha : La preferencia por el área de 'estudio
no es independiente del sexo.
Paso 2. Nivel de = 5% = 0.05
o
~
i ..
6.00
.
2
ti""i·i'.',.,¡"ij.¡W·d"n·"iJ . .
Paso 4. Cálculos:
4.604 ~ 4.60
N o compra marca 40
Compra marca . 60
a) Elaborar una tabla con las frecuencias observadas y esperadas. b) Calcular el valor muestral para X2 .
c) Formular la Ho y la Ha. d) Si se utiliza un nivel de significación del 5%, ¿debe rechazarse la Ho?
_--_. té /·:W#r·1td
• .¡ 11 .....
3. Para averiguar si las pastillas de siliciQ independiéntes del punto donde se lialla'eicicloecon6nrlco .
de un país, se recabaron datos, íos'que s"epresentiri a cóntinuación: . .'.
. ... :
En aumento
. En . 5.
total
a) Elabor¡rr unll y esperadas; la Ho yla Ha; catclilar el valor
. muestral para b) ¿Cuál será su conch.isióJi en un nivel de significancia del 1O%?'
'.- ".'
4. Un financiero quiere conocer las diferencias en la estructura de capital de varios tamafios de empresas
en cierta industria. Para ello hace u'na encuesta en un grupo de fmuas que cantidades de
activos y las divide en 3 grupos. Clasifica cada una según que su deuda sea mayor que el capital
con14ble de los accionistas que su "deuda"íotaI sea A contihuación se resumen estos:datOs: .
. '. ..' .. ; . .
defectos
_
... . . .. """"' _---
.i'''f·'··i'.''''ij.,'.• -
. .
7. Una psicóloga está investigando como reacciona una persona en cierta situación. Cree que la reacción
puede estar influida por el grado de sentido ético que impera en el entorno de la persona. Los datos
constituyen la información que reunió sobre 500 personas:
Entorno Reacci6n
En un nivel de significancia del 5% ¿parece existir una relación entre el entorno y la reacción?
8. 400 individuos fueron clasificados poüticamente como Conservador; Moderado y Liberal. Además,
cada uno se clasifica por edad, como se indica a continuación:
9. A [m de determinar si existe relación entre el tipo de sangre y la severidad de los resfriados en invierno,
se realizó un estudio y se obtuvieron los siguientes resultados:
10. Se enviaron muestras tomadas al azar de papas cultivadas en varios lugares a un comerciante, que las
examinó para determinar su calidad. Los resultados son los siguientes (libras de papas):
1 Lugares de
Probar con el nivel de significación de a =0.01 si los tres lugares cultivan papas de la misma calidad.
. f .,.- -
-- ..
. . ...111.1 "
1. En un estUdio de las actitudes de empleados hacia su programa de beneficios médicos, un fabricante de
automóviles importante toma una muestra al azar de 385 de sus empleados,' clasifica sus puestos como
soldadores, pintores o terminadores, y pide a cada persona que' clasifique el programa de beneficios
.como bueno, regular o deficiente. Los resultados son los siguientes.
. Con el nivel. de significación de 0.01 ¿existe una relación entre la actitud del empleado hacia el
programa de beneficios y el trabajo querealiza?
12. En un estudio realizado para determinar si existe relación entre los grados académicos que tienen los
empleados de firma y los salarios que perciben, una muestra tomada al azar los,resultados
que se muestran en la tabla siguiente: . , -.
Tipo de
de
Grado de Licenciatura
Título de E. Media
Utilizar el nivel de significación de 0.05 para probar la hipótesis nula de que no existe una relación real
entre los grados académicos y los salarios de estos empleados.
13. El departamento administrativo de cierta universidad desea determinar, con base en los siguientes
resultados de un estudio, si existe relación entre la clase social de un estudiante y su evaluación de un
curso de producción.
Ultimo año
.
r.¡.'i.!.I.'.,I.I.
I.
:I. II 'I:.:i '· •. .•'.• .:• '
' :
. .
, cio Reye$
"
I
e
o
8
18
18
al
m
~ • .'iiim"i,.jF"i·ii'
. ..
7.1lnftoducción
Todos los días los administradores se toman decisiones personales y profesionales que se basan en las
predicciones de sucesos futuros. Para hacer tales pronósticos, debe coÍlfiar en la relación (intuitiva y
calculada) entre lo que se conoce y lo que se debe estimar. Si se puede determinar como se relaciona lo
conocido con el evento futuro, se contribuirá de manera importante al proceso de toma de decisiones.
Es la relación existente entre la media de una variable aleatoria y los valores de una o más
. variables independientes de los cuales depende.
En el Análisis de Regresión se desarrolla una· ecuación de estimación, es decir, una fórmula matemática
que relaciona las variables conocidas con las desconocidas y el Análisis de Correlación permite determinar
el grado de relación que hay entre las variables, de tal manera que éste afirma con que grado de precisión,
la ecuación de estimación describe la relación.
Para determinar si existe una relación entre dos o más variables, es oportuno primero examinar su gráfica
de datos observados o conocidos llamada diagrama de dispersión el que visualmente puede primero buscar
los patrones de relaciones entre las variables y después buscar la relación entre ellas.
Variable independiente
Variable dependiente
Trazar el diagrama de dispersión. y "ajustar" una linea recta a través del diagrama para representar la
relación.
Solución:
La primera figura muestra el diagrama de dispersión completo y en segunda figura se ha "ajustado" una
. .
".H Ji1t"!k:c
.
Diagrama de dispersión de
calificaciones de
estudiantes en exámenes de
admisión representadas
gráficamente contra
promedios de puntos de
grado acumulativos.
Diagrama de dispersión en
donde la línea recta
X y Y "ajustada" a ella.
En este caso, la línea trazada a través de nuestros puntos de datos representa una relación directa, porque Y
a .. se incrementa al incrementarse X. Como . los puntos de datos· están relativamente cerca de esta línea,
.r podemos decir que existe un alto grado de asociación entre las calificaciones de exámenes y el GPA
.acumulativo. En la segunda figura podemos ver que la relación descrita por los puntos de· datos está bien
descrita por una línea recta. Por tanto, podemos decir que es una relación lineal.
Las siguientes figuras muestran algunas posibles relaciones entre X y Y en los diagramas de dispersión:
o
(a) Lineal directa (b) Lineal inversa (c) Curvilínea directa
y y y
•
••• • •• ••
• • •• •
• ••
•• •• •• ••
• •• •
• • ••• •
•• • • ••
Relaciones ••
X X
posibles entre X y
(d) CurvilInea inversa (e) Lineal inversa (f) Ninguna relación
Y en diagramas de y Y con más dispersión y
la dispersión
• •• •• • • •
• • • • •• ••
•...
• ••• •
•.:
• •• ••
• • •••• • •
• • • • • ••
• •
•• • • • • • •• •
•
X
~
. .
En los diagramas de dispersión anteriores, las líneas de regresión (Regresión Líneal) han sido dibujadas
ajustando las líneas visuahnente entre los puntos de datos.
7.2
¿Cómo "ajustar" una línea matemáticamente, si ninguno de los puntos se halla sobre ella? Para un
estadístico, la línea tendrá "buen ajuste" si minimiza el error entre los puntos estimados sobre la línea y los
puntos reales observados empleados para dibujarla. De tal manera que la Ecuación de L{nea de
Estimación del Mejor Ajuste, está dado por:
r a= J (19)
= Media de los valores de Y
=Número de puntos de datos
b = Pendiente de la línea de estimación
a = Intersección en el eje YY'
Con estas dos ecuaciones (18) y (19) se puede encontrar la ecuación de la línea de regresión del mejor
reajuste para cualquier conjunto de puntos de .dos variables.
Ejemplo 1.
El director del departamento de salubridad quiere conocer la relación entre la edad de un camión de
basura y los gastos de reparación anual entre los cuales se espera que incurra. Si el departamento tiene
un camión de 4 años, predecir con la ecuación estimada, el gasto anual de reparación destinado a ese
camión. La infonnación es la siguiente:
SI
n=4
(1) (2) (3)
Solución:
• n=4
¡'¡."¡".,.'.'I"'u'·."",·,: ~. .
... Datos dados y calculados en el cuadro de la
-
n 4 página anterior.
=6;
ajuste
* ... Calculando la Intersección de la línea con la
= 6 - 0.75(3) = 6 - 2.25 = 3.75 fórmula (19) y operando
a = 3.75 ... Valor de la intersección de la línea con el eje YY'
*y = 3.75 + 0.75X Ecuación de estimación ... Resp
* Para 4 años (X=4) el gasto estimado (Y) será: ... Sustituyendo X = 4 en la Ecuación de
* Y = 3.75 + 0.75(4)
Estimación encontrada
= 3.75 + 3 = 6.75
Ejemplo 2.
La tabla siguiente muestra el tiempo que 6 personas han estado trabajando en un taller de revisión de
automóviles y el número de unidades que cada uno de ellos ha revisado entre las 12:30 y las 3:30 p.m.
de un día dado:
Jr a) Calcular la ecuación de estimación de la línea del mejor ajuste
b) ¿Cuántos automóviles se pueden esperar que una persona revise durante 10 semanas?
ie
le
se
Solución:
..
'. .
* n = 6; = 36; = 108; = 715 ... Calculando los elementos para formar la
ecuaci6n de estimaci6n. Datos dados y
= = 108 = 18
n 6
*y= a+ bX ... Ecuaci6n de la recta de estimación
*b - _ 715 - 6(6)(18) 715 - 648 ... Calculando la pendiente b de la linea del
- _ nX2 - 304 - 6(6)2 =304-216
mejor ajuste. Fórmula (18)
67
.
b= = 0.7614
a = 18 - 0.7614(6) = 18 - 4.5684
mejor ajuste con el eje YY'
La calculadora científica CASIO fx-82MS, permite calcular problemas de regresión lineal si se tienen n
datos en parejas (x,y); la ecuación de estimación de la línea del mejor ajuste ( = a + bX ); el valor del
coefiCiente de corelaci6n de Pearson (r); la estimación para X la estimación para Y las sumatorias
el valor de n.
Para utilizar esta calculadora se resolverá el ejemplo 2 anterior con el siguiente algoritmo:
(
-.Horacio
¡',.'iti····.p··il'il " . •"""': ~. .
paso 5. Teclear. e 1 ... Aparece en pantalla = 2 008
S-VAR
• '" '" 2 ... Aparece en pantalla b = 0.761363636
Paso 7. y = a + bX ... Ecuación de estimación
= 13.4318 + 0.7613 X ... Sustituyendo valores obtenidos en el paso 6 con
. 4 cifras decimales y con truncamiento '
a) = 13.4318 + 0.7613 X Ecuru:ión de estimación ... Resp.
Paso 8. Teclear • • • 2 • . . . Aparece en pantalla = 21.04545455 cuando X=lO
Compare los resultados del ejemplo 2 del libro con los obtenidos con su calculadora
¿Cómo son estos resultados?
Siguiendo el· algoritmo propuesto en estos 8 pasos del problema 2, comprobar con la calculadora el
ejemplo 1 anterior. ¿Cómo son estos resultados?
·
Con el propósito de medir la confiabilidad de la ecuación de estimación, los estadísticos han desarrollado el
Error estándar de la estimación (se), el cual mide la variabilidad o dispersión de los valores
alrededor de la línea de regresión. La ecuación (20) pemúte hacer su cálculo de manera abreviada,'
donde: X =Variable independiente
..- -.y2..... (2.0) Y = Variable dependiente
a =Intersecto en el eje YY'
.
se = 150 ..... 3.75(24) ..... 0.75(78) , ,.. Sustituyendo valores en la fórmula (20) y
4-2
se= =0.866
2 2
Ejemplo 2.
Solución:
se=
4
y
Y=a+bX+ 3 se
Y=a+ bX+ 2se
Y=a+ bX+ 1 se
se • y
=a + bX (línea de regresión
Y=a+ bX-l se
Y=a+ bX-2 se
Y=a+bX-3se 5
. .w
Y 1.0 2.0 1.4 0.8 2.2 0.5 1.1 2.8 3.0 1.2
2. Usando los datos de la tabla siguiente: a) graficar el diagrama de dispersión, b) desarrollar la ecuación
de estimación que mejor describa los datos, c) predecir Y para cada valor dado de X =5, X =6, X = 7,
X = 8, d) Calcular el error estándar de la estimación.
X 15 6 10 5 12 14
Y 6 16 15 18 9 10
3. A partir del siguiente conjunto de datos: a) encontrar la ecuación de la línea de estimación, b) calcular el
error estándar de la estimación, c) para cada valor de X = 3.6, X = 1.7, X = 4.0, X = 2.5
X 46 48 42 58 40 39 50
4. Supóngase que está encargado del dinero de un país. Recibe los siguientes datos históricos sobre la
oferta de dinero y el producto nacional bruto (ambos en millones de lempiras):
.
10.0
a) des.lITollar la ecuación de estimación para determinar el producto nacional bruto (Y) y de la oferta de
,n dinero (X); b) ¿cómo se interpreta la pendiente de la lfuea de regresión, con respecto al signo de la
IIÚsma?; c) calcular e interpretar el error estándar de la estimación; d) calcular cuando X = 2.7,
= =
X 5.3, X = 3.8, X =4.7, X 5.6, X =7.25
5. Una tenista se pregunta si la altura de su oponente contribuye a explicar el número de lanzamientos que
no son devueltos durante un partido. Se reunieron los siguientes datos en 8 p_artidos jugados:
.........::::::
'I. ..•'..
. ..: - ·;;'.····. .·" ,.,··)·"...0,
6. En un estudio efectuado por un departamento de transporte, sobre el efecto que los precios del autobús
tienen en un número de pasajeros, produjolos siguientes resultados:
Precio del boleto (Lps.) 15 20 25 30 35 40 45 50
Pasajeros por 100 Km 440 430 430 370 360 340 350 350
X (No. interrupciones) 5 10 10 15 15 20 20 25
y (Puntuac. /trabajador) 58 41 45 27 26 12 16 3
a) Dibujar el diagrama de dispersión; b) desarrollar la ecuación que mejor describa la relación entre el
número de veces de la interrupción y la puntuación conseguida en la prueba; c) calcular el error
estándar de la ecuación de la estimación, d) determinar la_puntuación esperada de la prueba, si se
interrumpe al trabajador en 18,23,28,32 Y 35 veces.
7.4
El análisis de es la herramienta estadística que describe el grado de relación que hay entre dos
variables. Los estadísticos han inventado dos medidas para describir la correlación entre dos variables, ellas
son los coeficientes de correltu:wn, que expresan numéricamente tanto lafuerza como la dirección de la
correlación lineal en la línea recta. Tales coeficientes
1. El coeficiente de determinación
2. El coeficiente correlación _
El valor de estos coeficientes de correlación, generalmente se encuentran en 1 y -l. Con respecto al grado
de asociación, mientras más cerca esté de 1.00 en una u otra dirección, mayor es la fuerza de la
correlación. En vista de que la fuerza de correlación es independiente,de su dirección, se puede decir que
-0.10 y +0.10 son iguales en cuanto a fuerza (ambas son muy débiles) y que -0.95 y +0.95 también tienen
igual fuerza (ambas son muy fuertes).
Este tipo de coeficiente de correlación, es uno de los más utilizados en la estadística. Lleva este nombre en
- honor a Karl Pearson (1857-1936) uno de los fundadores de la Estadística Moderna, se representa con la
letra r y se utiliza para medir la relación lineal entre dos conjuntos de medidas y permite determinar con
grado de exactitud se ajusta en realidad a los datos.
-
• •Horacio Reyes
"
¡'j.i'¡Ji.• ,.p.¡""gl·IMji,,'.• . .
El Coeficiente de correlación (r) es una valor entre -1.00 y +1.00. Si r = +1, se dice que existe una
correlación positiva perfecta. Si r = -1, se dice que existe una correlación negativa perfecta. Si r = O
entonces no hay correlación. La fórmula para calcular el de de Pearson, está dada
en la siguiente expresión:
donde: r =Coeficiente
de correlación de
Pearson
n = Número de puntos dados
X =Valor de la variable
independiente
y =Valor de la variable
dependiente
La fórmula anterior (22), es una fórmula alternativa que trabaja con los datos reales, crudos o no
estandarizados y facilita el cálculo del coeficiente de correlación de Pearson. Tiene la ventaja adicional de
que a r le asigna el signo correcto en forma automática.
Ejemplo 1.
En una investigación sobre el número de años de estudio que completó el padre (X) y el número de años
de estudio que completó su hijo 00, se especifican en la tabla. Calcular el coeficiente de correlación de
Pearson para la relación entre X e Y. Interpretar su significado.
6
11
10
8
Solución:
... ..
. . . . :.:
n=7
'.
~. . •.';',,"«.•j'"'.'''
*r = 7(720) - 73(66) ... Calculando X, X 2,Y, y 2, XY en el
[7(825) - (73)2] [7(650) - cuadro anterior.
5040 -4818 222
..; Sustituyendo valores y operando en
= " 446(194)1 la fórmula (22) para calcular el
222 222 Coeficiente de correlación de
= = 29415 =+0.7547 Pearson (r).
V 86524 .
Ejemplo 2.
Seis estudiantes sustentan una serie de exámenes con un consejero vocacional, con los resultados que se
a) Calcular el coeficiente de correlación de Pearson para las calificaciones en Matemática (X) y las de
interés por el Teatro (Y). Interpretar el significado; b) Lo mismo que en a) para Matemática (X) y el
n=6
-9050
= 41948.9 =-0.22
a) calculár de la línea de estimación del mejor ajuste, b) el valor del coeficiente de correlación de Pearson,
les
2).
lIa
de
. --------------- - --- - - - - - - - - - - - -
_ _____________ .. = -- · '''
'. .
Solución
M&Wl
Paso 1. Teclear _ 3 ... Borrando el contenido de la memoria
Paso 5. Teclear
.03.e
lIi D
1
... Aparece en pantalla
y2 =650
VAR
Paso 8. Teclear 7 0'0
• 0"
• •
° , , 2 . . . . Aparece en pantalla y" = 7.721973094
Reyes Núftez
-
l. para cada una de las siguientes distribuciones de
datos, e indicar el tipo de relación entre
b)
1
5
4
2. La tabla siguiente proporciona los tamaños de algunas piezas de pladera en pies y pulgadas:
a) El diagrama de dispersión
b) La-ecuación de estimación del mejor ajuste
c) El error estándar de la estimación
d) El coeficiente r de Pearson y su significado
3. Se llevó a cabo un experimento para saber si existía alguna correláción entre el volumen de agua de una
pecera y la longitud promedio que crecen 4 peces de colores que habían sido creados en la pecera. Los
siguientes son los resultados:
4. llevo a cabo un experimento en el que se dejaba caer un objeto dentro cierto líquido. La distancia
por el ºbjeto fue anotada cada segundo a lo largo de 6 segundos. Los siguientes fqeron los
resultados:
Calcular lo mismo que en el problema N°2
l.
l.
5. A continuación se tiene una lista de todas las distancias que necesitan ciertos vehículos para detenerse
cuando viajan a diferentes velocidades:
Calcular lo mismo que en el problema N°2
.... ---------------------------------------------
.•.••.iiijm,.j',,'.'A
. .
.
6. A continuación se dan los días y las temperaturas Max. y Min. en grados °F que fueron registrados en
una ciudad:
Calcular lo mismo que en el problema N°2
7. Una inversionista que estaba estudiando la posible correlación entre dos tipos de valores, notó que le
pareció un patrón de relación entre los precios. ¿Existe una relación lineal entre los precios? ¿Cómo es
esta relación? .
en fonna breve
........, , , ,,., ,.,
a lo
.. :, 'w/ /
1. a) lCuál es la idea fundamental de la inferencia estadística?
b) lA qué se le llama nivel de confianza?
c) lCuáles son los valores críticos de confianza más usados deacuerdo al nivel de confianza cuando n es
mayor o igual que 301
j) ¿Cómo se llamalo que los estadísticos han desarrollado con el propósito de medir la confiabilidad de'
la ecuación de estimación?
3. El número medio de accidentes que se presentaron en los 7 días de la Semana Santa del 2006 en las
playas de Tela fue de 35, las desviación estándar de esa muestra fue de 9 accidentes por Contruir un
Le. del 99% para el número real de accidentes por día.
4. Una psicóloga desea determinar si el tiempo promedio que tarda un conductor adulto en reaccionar a
cierte situación de emergencia es en realidad de 0.56 segundos, como lo han afinndo otros. De la
información recopilada en estudios similares, ella puede suponer que la variabilidad de estas mediciones
está dada por una desviación estándar 0.082 segundos. As! mismo, ella decide basar la demostración en
una muestra aleatoria de tamaño 35 y utilizar el nivel de significacia del 0.05. lQué concluirá si sus datos
producen una media de 0.59 segundos?
Sin defectos
. Defectuosos. 15
¿Existe la evidencia suficiente para rechazar la hipótesis de que el número de artículos defectuosos es
indepediente del día de la semana qen que se un nivel de significancia del 5%
6. La tabla que sigue muestra el periódo de tiempo (X) que 6 personas han estado trabajando en una
estación de inspección de y el número de unidades (Y) que revisó cada uno entre el medio
día y la 1:00 pm en un determinado día
f
--
. . ?·'i"·'I'.·M."'.' '.'
,
DD•
• •I"!Hfo-o-r-a-c....-¡
"" ~. .
Tabla 1
O z
Areas bajo curva normal
_ ._.._ .. .~_ . ·
--
~
. . ••• 'F,i¡'umi.'
TablaN"2
Reyes
.
Valores Criticos de la Distribución t de
_________ -- --.----------_ _
--
. ..: . ·,ga'''·41.''·'
'H
o (gl, a)
'
, '''Horacio Reyes Núñez
,.'I"'" ••••••••••••••••••••••••
1. m
9000
7000
3.
400
5000 Automóviles
3S0
3000
1000
ISO
Horas _
5.
=
= Transitable tltinnpo
= 'n-ansitable verano
7. Sin respuesta;
a) Una posibilidad es:
9. 80 11.
800
70
..
o.
60 600
50
Mostrar que el mayor grupo
40 con sentencia muerte
el de edades de 2S - 34 Y
30 200 que muy pocos tienen
menos de 20 6 SS 6
•.
'lnmestres
HoracioR-eyes·N
i·'j·¡IuJC ~
. .
O. a) 7,6; b) 8,6; e) 8, 5; d) 8,5; e) 8,7; 8, 5; 1. b) 680; c)7, 35%; d) 6, 30%; 3. b) 6.5; e) 12,
50%; d) 8, e) 4, 16.6%;
s.
.' '2
:.'.[...·.' . . .
.. ~.:¡ [;.,':;.~
~
..'•.
. 4
b) e) e)
'2
N=60
HIstograma de Frecuencias
f
36
32
15. A) 28
24
20
16
12
f Polígono Frecuencias
32
28
24
20
16
12
12 19 26 33 40 47 S4 61 68 7S Xm
20
16
12
C=5
25. C=1
•••••••••••••••••••••••••••
15
12
40
::.:
. :. ...
"
....
30
.
20
Z
10
:: ..
.:.. :, ::
.. .:::.
....
: .:
33. Las calificaciones de pruebas tienden a entre 140 y 160. Una puntuación representativa es
aproximadamente 150. la puntuación mínima es cercana a 100, y la maxima, 200
Polígono de Frecuencias
- ._-
HoracioReyes ••
~
. .
l.
5. a) 54.50%; b) 71.50%; e) 45.5%; 7. a) 65% es decir, obtiene 5 000 lbs o más; b) 6000 lbs., 4 300
lbs. 9. a) aproximadamente 50% (7 u 8 elementos) exceden el punto de equilibrio; b) aproximadamente
9 900 unidades, e) aproximadadmente 9 800 unidades.
oracio
¡'iJ.""" . .' :
S 6 S
10 Página 73
11 Página 82
Página 89
1. a) = 7.5 a , v (<b) = 9, El 50% de los casos son menores que 9 minutos de espera, b) = 11 a,
a
= 10, el 75% de los casos son menores que 10 minutos de espera, e) p(Qt)= 4 , v(Qt) = 5, el 25% de
los casos son menores que 5 minutos de espera; 3. a) p(<b) = 6.5 8 , = 67, el 50% de los casos son
menores que 67 hatos; b) P(Q3) = 9.5 a , V(Q3) = 78, el 75% de los casos son menores que 78 hatos;
e) p(Qt) = 3.5 a , v(Qt) = 52, El 25% de los casos son menores que 52 hatos; 5. a) = 8,
8
b) v(D 6) = 8, c)v(Pso) = 12, d) V(P7S) = 12, e) v(D7) = 11, 7J = 11; 7. a) P(D9) = 18.5 ,
v(D9) = 12.0; b)P(D3) = 6.5 , v(D3) = 10.8; e) P(P30) = 6.5 , V(D3) = 10.8; d) P(P9Q) = 18.5 ;
a 8 3
1. a) Pso = 9, el 50% a lo más de los casos son menores que 9 años, e) Pso = 12.375, el 80% a lo más de
los casos son menores que 12.375 años, e) Qt = 6.9, el 25% a los más de los casos son menores que 6.9
años, g) P4S = 8.7, el 45% a lo más de los casos son menores que 8.7 años; 3. a) P30 = 27.13,
.te
e) Pso = 36.17; e) Pss = 57.19.
.
' •.•,ii.i.i4i'
1. a) RP(25) = 17.14%,eI17.14% de las edades de los obreros al comienzo de su incapacidad, están por
debajo de 25 años, c) RP(36) = 55.60%, el 55.60% de las edades de los obreros al comienzo de su
incapacidad, están por debajo de 36 años, e) RP(27) = 20.70%, el 20.70% de las edades de los obreros
al comienzo de su incapacidad, están por debajo de 27 años; 3. a) RP(96) = 11. 22%, el 11.22% de los
alumnos tienen un coeficiente intelectual por debajo de 96, c) RP(110) = 31.29%, el 31.29% de los
alumnos tienen un intelectual por debajo de 110, e) RP(l18) = 50.98%, el 50.98% de los
alumnos tienen un coeficiente intelectual por debajo de 118;
5. a) RP(22) = 15.26%, el 15.26% de los socios en el Club tienen edad por debajo de 22 años,
c) RP(28) = 45.99%, el 45.99% de los tienen edades por debajo de 28 años;
e) RP(33) = 65.15%, el 65.15% de los socios tienen edades por debajo de 33 años.
Página 106
1. s = 3.13, representa un nivel inaceptable de variabilidad, el.gerente debe preocuparse por las tasas de
producción de la planta; 3. = 2 casas; 5. a) s = 6.8 pisos, b) s = 4.5 pisos. 7. s = 1.8247
Página 110
1
Página 114
1. cv(1) = 25.70%, cv(2) = 42.71 %, el programa del grupo (1) mostró menor variabilidad, porque tiene
menor porcentaje de dispersión; 3. cv(A) = 18.93%, cv(B) = 12.70%, la compañía A porque presenta
mayor porcentaje de dispersión; 5. cv(1) =5.22%, cv(2) = 4.78%, la máquina (1) tiene menor exactitud
I
porque presenta mayor porcentaje de dispersión; 7. cv(1) = 5.00%, cv(2) = 5.33%, la fórmula (2) es la
menos precisa; 9. a) cv(1) = 16.51%, cv(2) = 20.8%, hay mayor dispersión relativa en las ganancias
sobre la inversión, b) las razones precio- rendimiento y rendimiento - sobre inversión están en unidades
diferentes; 11. cv(AM) = 5%, cv(DM) = 2 %; los aspirantes presentaron mayor rendimiento en las
pruebas experimentales de AM.; 13. el X = 85 del conjunto A porque zA=1.63 es mayor que ZB = 1.20;
15. a) X = 680, b) X = 297, c)X = 380, d) X = 622, e) X = 802; 17. a) z = -3.75, b) z =-6.00, c) z = O,
d) z = 2.25, e) z = 5.00; 19. Deberá vender primero la acción C porque presenta menor separación de la
media en términos de la variable normalizada z. (z = 1.64); 21 a) UPN por que (1.48 > 1.39) en
términos de z; b) UNITEC por que 3.18 > 3.10 en términos de z
Página 127
1.0.59; 3. 0.77' 5. 0.95' 7. ;9. 11. 13. 15. t; 17. 19. a) Frecuencia Relativa, ¡
Subjetiva. e) d) Relativa (6 Subjetiva); 21. a) b) • e) d) e)0_.
•• I
¡'ij·il'¡", ~ .
19 Página 131
' .
j (86.25%).
3. 0.013; 5. a) 0.0625, b) Menor
1. 0.4332; 3. 0.4842; 5. 0.8022; 7. 0:9010; 9. 0.4960; 11. O. 0107; 13. 0.0051; 15. 0.9706;
17.0.9746; 19.0.0708; 21. O. 1203; 23.0.4949; 25.0.9987; 27.0.8389; 29. z = 0.47; 31. Z = 0.86;
=
33. Z 2.23.
1 1. 0.5000; 3. 0.6072; 5. 0.4068; 7. 0.4292; 9. 6.1826; 11. 0.38%; 13. 27.89%; 15. 8.80%;
17.0.2857; 19.0.0668; 21.0.3869; 23.0.6920; 25.0.3085; 27.60.06%; 29. a) 39.44%, b) 10.56%,
c) 3.36%; 31. a) 46.41 %, b) 3.59%, c) 81.85%, d) 27.42%; 33. a) 0.82%, b) 45.99%, c) 3.07%.
1. 3999, 4904, 2090, 4878, 3415, 0943, 6116, 3071, 5704, 2997, 0563, 2657, 3462, 5380, 3998;
3. No se dárespuesta; 5. No se dá respuesta; 0831, 0088, 5265, 2824, 5554, 4732, 5968, 3232,
5104,5147,2130,6111,2412,0852,6549,0984,3097,5998, 1652,7416; 9.8, 16,24,32,40,48,
56, 64, 72,80, 88, 96, 104, 112, 120, 128, 136, 144, 152, 160, 168, 176, 184, 192, 200; No
es apropiado este método porque deja elementos que nunca serán seleccionados.
1. a) 75.67 < < 76.93, b) 75.50 < < 77.10, c) 75.70 < < 76.89; 3. a) 18.89 < < 22.90,
b) 19.29 < < 22.50, c) 18.62 < < 23.17; 5. a) 6 898.66 < < 7661.33, b) 6 839.85 < < 7 720.15,
c) 6 578.71 < < 7 801.29; 7. a) 14.01 < < 14.59, b) 13.89 < < 14.71, c)14.05 < < 14.55;
9. a) 110.7 < < 114.1, b) 110.17 < < 114.63; 11. arO.167, b) 5.858 < < 6.542;
13. 23.355 < < 25.245.
1.0.2284 < p < 0.3316; el intervalo de confianza está entre el 22.84% y el 33.16%; 3.0.2413 < 0.2986,
el intervalo de confianza de la verdadera proporción poblacional, está entre el 24.13% y el 29.86%;
5.0.3527 < p < 0.5473; 7. a) 0.0138, b) 0.0179 < p < 0.0821; 9. a) 0.0124, b) 0.6119 < p < 0.6627;
11. a) 0.0089, b) 0.5848 < p <0.6152; 13.0.4503 <p < 0.7497.
1. a) Error tipo 1, b) Error tipo TI, c) Error tipo 1, d) Error tipo ll; 3. a) Rechazar Ho, b) No rechazar Ho.;
5. Rechazar Ho. En un nivel de significancia del 2% probablemente la impresión del gerente del
servicio de paquetería, el peso de los envíos es inferior al que tenía en el pasado; 7. Rechazar Ho. Si
difiere de la media; 9. Rechazar Ho. En un nivel de significancia del 10%, probablemente las
comisiones de sus clientes son superiores a L. 144.00; 11. No rechazar Ho. En un nivel de
significancia del 1%, probablemente no se puede rechazar la garantía que da el fabricante con respecto
al diámetro exterior medio de 0.75 pulgadas; 13. Rechazar Ho. En un nivel de significancia del 5%,
probablemente la máquina está llenando los vasos más de lo debido.
1. No rechazar Ho. En un nivel de significancia del 5% no se tiene suficiente evidencia para rechazar
de que los estudiantes de medicina realizan su práctica privada después de graduarse; 3. Rechazar Ho.
En un nivel de significancia del 1% probablemente el removedor de mancha elimina menos del 90% de
las mismas; 5. Rechazar Ho. En un nivel de significancia del 5% probablemente mas del 6% del
equipaje extraviado nunca se recupera; 7. No rechazar Ho. En un nivel de significancia del 1%
probablemente el 30% de los conductores de automóviles cometen error de meterse en el carril
equivocado.
-.Horado
- ---- --
¡¡¡¡.Jili'" . .:
Página 197
l. a) 2, 3. a)
b) 12,
c) 12,
d) 3; ... _
2
1
. i.l :1.1 . :..lj.. =
.I ..
i·.i . :
_
·I:. .. 1.:.
··.:
•.••..
5 8
.Ho. Las ventas de pastillas de silicio son independientes del punto donde está el ciclo económico de un
país; Ha. Las ventas de pastillas de silicio no son independientes del punto donde está el ciclo
económico de un país. Rechazar Ho. si Xz* >10.6; se rechaza Ho. puesto que 34.594 > 10.6.
Conclusión: La venta de las pastillas de silicio depende del nivel económico en que se encuentra un
país; 5. Ho. La frecuencia de lectores de periódicos en la comunidad difiere según el grado de
escolaridad. Decisión: Rechazar Ho. porque Xz* > XZ, es decir 30.69> 14.7. La lectura
de periódicos difiere en la comunidad según el grado de escolaridad; 7. Ho. parece existir una relación
entre el entorno y la reacción de una persona. Decisión: Rechazar Ho, Z > XZ es decir, 22.56> 6;.
Conclusión: Existe una relación entre el entorno y la reacción de una persona; 9. Xz* = 28.196.
Decisión: Rechazar Ho, no existe relación; 11. Xz* = 10.33. Decisión: No rechazar Ho, no existe
relación; 13. Xz* = 17.7. Decisión: Rechazar Ho, no existe relación..
ggPágina 215
l. a) r =+ 0.9544; este tipo de relación es fuerte, puesto que se acerca a 1, c) r =0.3439; existe muy poca
relación entre X e Y puesto que r está alejado de 1; 3. b) = -5.126 + 3.10 X, c) se = 0.303 (volumen de la
pecera), d) r = + 0.9909; Interpretación: La correlación es bastante fuerte porque 0.9909 está próximo a 1;
5. b) = -27.4 + l.1X, c) se = 3.706 (distancia en pies), d) r = + 0.9834, Interpretación: La correlación
entre la velocidad y la distancia que necesitan ciertos vehículos para detenerse, es bastante fuerte, puesto
que + 0.9834 está próximo a 1; 7. r =- 0.9984; existe mucha correlación en los precios
entre las ventas BTQ, y CRV, la correlación es negativa. El valor de r, está muy próximo a -1, lo que
implica una relación muy fuerte en sentido negativo.
.
I
PROYECTO BAHíA DE TELA.
un costo de 477 millones de dólares, millones de Inversión y 450privados, se realizará en la Bahla de Tela,
en el puerto de Tela, en el litoral atlántico del pals.
Las nuevas políticas buscarán generar una mayor y mejordemanda turistlca, promover la inversión públíca y privada
para la construcción de una oferta de servicios yfortalecer y modernizar la lobor institucional del Estado en el turismo.
Honduras uno de los pocos paises de Centroamérica que cuenta con todos los productos quefavorecen el turismo:
arqueologla, arrecifes y playas, la naturaleza y la aventura, las ciudades 'colonlales y las culturas vivas.
Además, una estructura de cuatro aeropuertos Internacionales, una red de carreteras asfaltadas y cuatro puertos en el
Atlántico y el Pacifico con capacidad de recibir cruceros.
En esa reunión también se planteó la necesidad de una legislación quefavorezca el Incremento la oferta turlstica y
garantice la Inversión nacional y extranjera. Propusieron un examen jurldlco sobre la tenencia de la tierra por
extranjeros en las zonas costeras Insulares y fronterizas, y revisión de leyes vinculadas al turismo, como la de
Pensionados y Rentistas, Casinos y de Ordenamiento Territorial. I
Asimismo, propusieron la aplicación de la Ley del Ambiente y el sometimiento de todos los proyectos turistlcos al
sistema de de Impacto ambiental en la medida en que estas normasjurldlcas promuevan el uso racional del
patrimonio natural y culturaL
DETALLES DEL PROYECTO
habitaciones de hotel
clubes de playa
7centrohlpico
Mejoramiento de la calídad de vida de la población de la Bahla de Tela en aspectos tales como saneamiento, salud y
educación.
CONCLUSIONES YRECOMENDACIONES
Los pobladores de la Bahia de Tela todavio guardan la esperanza que este Proyecto se va a realizar, pero necesitan
que los mayores beneficios no solo sean para los Inversionistas, sino que también se les tome en cuenta a ellos que son
los Protagonistas principales de esta parte del Territorio NacionaL
El mayor que troerá consigo este proyecto es la generadón de ingresos a del empleo y la Proyección I
de la Cultura Garlfuna, pero en contraparte el mayor daño que ocasionara La Dellcuenda que se ya que I
este Proyecto es para atraer turistas extranjeros.
Pero vemos que no es solo la Delincuencia la que generará el hechor a andar este Proyecto, también hay otras
consecuencias a tomar en cuenta como la Prostitución y La Drogadicción que es un mal que abate a muchas
sociedades.
Tomado de http://www.laprensahn.comleconoarc/9605/e06001.hlm
•••••••••••••• ~
. .'
'
J
México 2004
México 2003
México 2003
Economía
México 2003
Ciencias de la Salud