Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
A LA EDUCACION
ELABORADO POR:
INGENIERA: JESSICA LISET MARTÍNEZ
AGOSTO DE 2014
SANTA ANA, EL SALVADOR, CENTROAMÉRICA
INDICE
INTRODUCCION.................................................................................................1
UNIDAD 1:........................................................................................................1
“NOCIONES PRELIMINARES”............................................................................1
1.1 RELACIÓN DE LA ESTADÍSTICA Y EL MÉTODO CIENTÍFICO.......................2
1.1.1 Definición y Objeto de la Estadística...............................................................2
1.1.2 Para qué sirve la Estadística..........................................................................3
1.1.3 El método científico....................................................................................3
1.1.4 El proceso experimental...............................................................................5
1.2 CONCEPTOS BÁSICOS.............................................................................7
1.3 ESTADÍSTICA DESCRIPTIVA E INFERENCIAL.............................................8
1.3.1 Tipos de Estadística....................................................................................8
1.3.2 Universo, Población y Variable......................................................................9
UNIDAD 2:......................................................................................................13
“ORGANIZACIÓN DE LOS DATOS”..................................................................13
2.1 FUENTES Y MÉTODOS DE RECOLECCIÓN DE DATOS...............................14
2.2 NOCIÓN DE VARIABLE. CLASIFICACIÓN................................................20
2.3 ESCALAS ESTADÍSTICAS.......................................................................21
2.4 DISTRIBUCIÓN DE FRECUENCIAS..........................................................23
2.5 PRESENTACIÓN, TABULAR Y GRAFICAR................................................32
UNIDAD 3:......................................................................................................39
“ANÁLISIS ESTADÍSTICO”................................................................................39
3.1 MEDIDAS DE TENDENCIA CENTRAL......................................................40
3.1.1 La Media Aritmética.................................................................................42
3.1.2 La Mediana............................................................................................45
3.1.3 La Moda................................................................................................47
3.1.4 La Media Armónica..................................................................................47
3.1.5 La Media Geométrica................................................................................48
3.2 MEDIDAS DE VARIABILIDA O DISPERSION.............................................51
3.2.1 El Recorrido...........................................................................................52
INTRODUCCION
Autor Definición
La estadística es una técnica especial apta para el estudio
cuantitativo de los fenómenos de masa o colectivo, cuya
Gini, 1953 mediación requiere una masa de observaciones de otros
fenómenos más simples llamados individuales o
particulares
La estadística es la ciencia que trata de la recolección,
clasificación y presentación de los hechos sujetos a una
Yale y Kendal, 1954
apreciación numérica como base a la explicación,
descripción y comparación de los fenómenos
Un valor resumido, calculado, como base en una muestra
de observaciones que generalmente, aunque no por
Kendall y Buckland ,1980 necesidad, se considera como una estimación de parámetro
de determinada población; es decir, una función de valores
de muestra.
La estadística estudia los métodos científicos para recoger,
organizar, resumir y analizar datos, así como para sacar
Murria R. Spiegel, 1991
conclusiones válidas y tomar decisiones razonables basadas
en tal análisis
La ciencia de reunir, organizar, presentar, analizar e
Lind, Mason y Marchal,
interpretar datos para ayudar a tomar las mejores
2001
decisiones
Ya hemos visto que la Estadística se encuentra ligada a nuestras actividades cotidianas. Sirve
tanto para pronosticar el resultado de unas elecciones, como para determinar el número de ballenas que
viven en nuestros océanos, para descubrir leyes fundamentales de la Física o para estudiar cómo ganar
la ruleta. La Estadística resuelve multitud de problemas que se plantean en ciencia:
Análisis de muestras. Se elige una muestra de una población para hacer inferencias respecto a
esa población a partir de lo observado en la muestra (sondeos de opinión, control de calidad,
etc.).
Descripción de datos. Procedimientos para resumir la información contenida en un conjunto
(amplio) de datos.
Contraste de hipótesis. Metodología estadística para diseñar experimentos que garanticen que
las conclusiones que se extraigan sean válidas. Sirve para comparar las predicciones resultantes
de las hipótesis con los datos observados (medicina eficaz, diferencias entre poblaciones, etc.).
Medición de relaciones entre variables estadísticas (contenido de gas hidrogeno neutro en
galaxias y la tasa de formación de estrellas, etc.)
Predicción. Prever la evolución de una variable estudiando su historia y/o relación con otras
variables.
Citando a Martin Gardner: “La ciencia es una búsqueda de conocimientos fidedignos acerca del
mundo: como se estructura y cómo funciona el universo (incluyendo los seres vivos)”. La información
que maneja la ciencia es amplia, al ser amplio su ámbito. Pero se suele reunir en tres apartados: los
hechos, las leyes y las teorías. No es una partición estancada, aunque podemos entender aquí nos
referimos con algún ejemplo. Los hechos se refieren a casos específicos y únicos. Por ejemplo la Tierra
tiene una luna (satélite natural).
2 Tomado del libro “Estadıstica Basica para Estudiantes de Ciencias”. Febrero 2009
Ingeniera Jessica Liset Martínez 4
Hace algunos cientos de años se estableció un método para encontrar respuestas a
los interrogantes que nos planteamos al contemplar la naturaleza. Este método, conocido
como método científico, se basa en tres pilares fundamentales: observación, razonamiento y
experimentación.
El método científico no es una simple receta, sino que es un proceso exigente que
requiere, entre otros ingredientes, juicio crıtico.
De forma resumida, el método científico incorpora las siguientes facetas:
Observación: aplicación atenta de los sentidos a un objeto o a un fenómeno, para
estudiarlos tal como se presentan en realidad.
Descripción: las mediciones deben ser fiables, es decir, deben poder repetirse. Las
observaciones únicas e irrepetibles no permiten predecir futuros resultados. En este sentido
la Cosmología se enfrenta, a priori, a un grave problema. El Universo es único y no podemos
volver a repetirlo modificándolas condiciones iniciales.
Predicción: las predicciones de cualquier fenómeno deben ser válidas tanto para
observaciones pasadas, como presentes y futuras.
Control: capacidad de modificar las condiciones del experimento para estudiar el impacto de
los diferentes parámetros participantes. Esto se opone a la aceptación pasiva de datos, que
puede conducir a un importante sesgo (vías) empírico.
Falsabilidad o eliminación de alternativas plausibles: Este es un proceso gradual que
requiérela repetición de los experimentos (preferiblemente por investigadores
independientes, quienes deben ser capaces de replicar los resultados iniciales con la
intención de corroborarlos). Todas las hipótesis y teorías deben estar sujetas a la posibilidad
de ser refutadas. En este sentido, a medida que un área de conocimiento crece y las hipótesis
o teorías sobre la que se sustenta van realizando predicciones comprobables, aumenta la
confianza en dichas hipótesis o teorías (uno de los defensores fundamentales del criterio de
falsabilidad es Karl Popper (1902–1994); ver, por ejemplo, La lógica de la investigación
científica en Popper (1935).
Explicación causal: los siguientes requisitos son normalmente exigibles para admitir una
explicación como científica:
Variables:
Una variable es la característica de un objeto, persona o situación que es capaz de
modificarse en extensión y naturaleza, es decir, es una característica que varía de un objeto a otro
que no permanece constante y como consecuencia sirve para singularizar un objeto o grupo de ellos.
Debemos tener claro que a variable no es el objeto de estudio en sí, sino sus características, por
ejemplo si estuviéramos analizando un local para alquilar el local no es variable, variables son sus
atributos: ubicación, tamaño, iluminación, ventilación, etc. Podemos encontrar dos tipos de datos:
Cualitativos y cuantitativos.
Variable Discreta:
Es aquella que solo puede asumir ciertos valores, y ente éstos suele haber huecos,
generalmente se expresan en números enteros, por ejemplo, cantidad de miembros de una
cooperativa, podemos decir que está conformada por doce, trece personas, pero nunca podremos
decir que nuestra cooperativa está conformada por 20.5 personas. Apreciemos el siguiente ejemplo:
Una variable discreta puede ser la cantidad de lapiceros que tenemos disponibles en
nuestro inventario, si contamos podemos decir que tenemos 96 bolígrafos, el dato en este
caso se expresa evitando los rangos entre los valores, es decir, no podíamos decir que
tenemos 95,2 lapiceros o 96,1. En este tipo de casos se expresa el dato en un número entero.
Variables Continuas:
Es aquella que puede adoptar cualquier valor dentro de un rango específico, por ejemplo, la
duración de un viaje en carro de Caracas a Maracay, algunas veces puede durar una hora y cuarenta
Una variable continua es nuestra temperatura corporal, cuando tenemos fiebre nos tomamos la
temperatura, la medida puede ir desde los 36 grados hasta los 41, pero incluyendo los números
decimales, por ejemplo 36; 36,1; 36,2;…37; 37,1…38; 38,1…39,9; 40…; 40,5 etc.
El peso de las verduras que compramos periódicamente es una variable continua, pues puede
variar de forma ascendente o descendente incluyendo los decimales, no hay vacíos entre los rangos,
todos son continuos, de allí el nombre de la variable.
Dos corrientes de influencia han conducido al desarrollo de los métodos estadísticos. Una de
ellas, tenía por objeto mantener en orden registros del gobierno (de hecho, estado y estadística vienen
de la misma raíz latina, status). De ella evolucionaron las actividades de conteo, medición, descripción,
tabulación, ordenamiento y levantamiento censal, que conforman lo que hoy conocemos como
estadística descriptiva. La segunda corriente de influencia se originó en las matemáticas de los juegos
de azar y condujo al desarrollo de la estadística inferencial o inductiva, basada fundamentalmente en
el concepto de probabilidad matemática.
Estadística Descriptiva:
Estadística Descriptiva:
Métodos Jessica
Ingeniera para organizar,
Lisetresumir y presentar
Martínez 8 datos de manera informativa
Estadística Inductiva o Inferencial:
Está fundamentada en los resultados obtenidos del análisis de una muestra de población, con
el fin de inducir o inferir el comportamiento o característica de la población, de donde procede, por
lo que recibe también el nombre de Inferencia estadística. En resumen, son procedimientos
estadísticos que se utilizan para deducir o inferir algo acerca de un conjunto de datos numéricos
(población), seleccionando un grupo menor de ellos (muestra).
El objetivo de la inferencia en investigación científica y tecnológica radica en conocer clases
numerosas de objetos, personas o eventos a partir de otras relativamente pequeñas compuestas por
los mismos elementos. La Estadística inferencial permite, mediante la utilización de métodos
estadísticos basados en la teoría de las probabilidades, generalizar las conclusiones obtenidas a partir de
una muestra a la población de la que ha sido extraída. Es importante destacar que para que las
conclusiones sean válidas, se debe tratar que la muestra sea representativa de la población.
Estadística Inferencial:
Métodos usados para determinar algo acerca de la población basándose en una muestra.
La estadística está compuesta por métodos científicos mediante los cuales podemos recolectar,
organizar, resumir, presentar y analizar datos relativos a un conjunto de individuos u observaciones que
nos permiten extraer conclusiones válidas y efectuar decisiones lógicas basadas en dichos análisis.
En cualquier trabajo en el que se aplique, la estadística debe hacer referencia a un conjunto de
sujetos u objetos de análisis, conocido como población.
Una población se precisa como un conjunto finito o infinito de personas que presentan
características comunes, por lo que debe estar perfectamente definida en el tiempo y en el espacio, de
modo que ante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no
de la población bajo estudio. Por lo tanto, al definir una población, se debe cuidar que el conjunto de
elementos que la integran quede perfectamente delimitado. Si, por ejemplo, estamos analizando las
escuelas primarias, debemos especificar cuáles y cuándo, por ejemplo: Escuelas primarias de Caracas,
año 1995.
El tamaño de una población viene dado por la cantidad de elementos que la componen.
Generalmente se simboliza esta información con la letra N, en el caso en que sea una población finita,
es decir, que podemos contabilizar y establecer un límite de existencia.
Población:
Es la recolección completa de todas las observaciones de interés para el investigador.
Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la población que
se defina tenga tamaño infinito (incontable), y en consecuencia, no fuera posible observar a todos sus
elementos. En otras ocasiones, el costo de la observación exhaustiva puede ser muy elevado, el extenso
tiempo de recolección de la información, o más aún, la observación de los elementos puede ser
destructiva. En todos estos casos, la única manera de estudiar la población es obteniendo muestras de
ella. El tamaño de la muestra queda determinado por el número de elementos que la forman y se
simboliza con la letra n.
Muestra:
Es una parte representativa de la población que se estudia y se toma cuando la población es
demasiado grande como para estudiarla completa.
Ejemplo:
Si necesitamos conocer la cantidad de personas entre 20 y 30 años que pertenecen a cooperativas en
Venezuela, todas las personas que posean estas características (tener entre 20 y 30 años y trabajar en
una cooperativa) serán nuestra población, seguramente va a ser difícil buscar todas las cooperativas
de todo el país para conocer este dato, una forma de hacer la investigación es seleccionando un
Teoría de decisión.
La gran mayoría de los métodos que serán usados para plantear y resolver estos problemas
pertenecen al enfoque clásico, ya que no toman en cuenta los varios factores subjetivos
mencionados antes. Algunas otras aplicaciones pertenecen al enfoque Bayesiano, que consideran,
informalmente al menos, algunos de estos factores subjetivos. La subjetividad influye mucho en la
elección de los métodos estadísticos o fórmulas empleadas en una situación específica.
Un Parámetro: Es una medida de resumen que se calcula para describir una característica de toda
una población.
Un Estadístico: Es una medida de resumen que se calcula para describir una característica de una
sola muestra de la población.
Muestra aleatoria: Es una muestra elegida independientemente de todas las demás, con la misma
probabilidad que cualquier otra y cuyos elementos están elegidos independientemente unos de otros
y con la misma probabilidad.
UNIDAD 2:
“ORGANIZACIÓN DE LOS
DATOS”
Fuentes de Datos
El lugar del cual obtenemos los datos para realizar nuestros análisis estadísticos se denomina
fuente. Los datos que requerimos para realizar una evaluación estadística de los procesos
administrativos los podemos encontrar por medio de diversas fuentes las cuales pueden ser;
primarias o secundarias, u oficiales o privadas. Llamamos fuentes primarias la persona o institución
que ha recolectado los datos, y secundaria si la persona o institución que ha publicado los datos no
fue la que efectuó la investigación.
Existen diversas técnicas de recolección de datos, aquí mencionaremos las más comunes o
las más empleadas.
La Observación
Consiste en el uso sistemático de nuestros sentidos para captar la realidad que queremos
estudiar.
Es una técnica antigua, a través de sus sentidos, el hombre capta la realidad que lo rodea, que luego
organiza intelectualmente. El uso de nuestros sentidos es una fuente inagotable de datos que, tanto
para la actividad científica como para la vida práctica resulta de inestimable valor.
La principal ventaja de esta técnica es que los hechos son percibidos directamente, sin
ninguna clase de intermediación, colocándonos ante una situación tal como ésta se da naturalmente.
De este modo, nunca obtendremos distorsiones de la realidad, las cuales solemos tener al emplear
una entrevista, ya que en ellas los entrevistados colocan su toque personal al brindar la información.
Otra ventaja es que la conducta se describe en el momento exacto en que está ocurriendo.
Además, las observaciones se pueden realizar independientemente de que las personas estén
dispuestas a cooperar o no, a diferencia de otros métodos en los que sí necesitamos de la
cooperación de las personas para obtener la información deseada.
Su principal desventaja reside en que la presencia del observador puede generar una
alteración o modificación en la conducta de los objetos observados, destruyendo la espontaneidad y
por tanto alterando la confiabilidad de los datos.
La Entrevista.
La entrevista es una técnica en la cual es investigador, de acuerdo a la
información que necesita recolectar elabora una serie de preguntas que más tarde
realiza a la persona que se convertirá en su fuente. Las entrevistas la mayoría de
las veces se realizan en persona, es decir, visitando al entrevistado y registrando la información
ofrecida, ya sea con un grabador o por escrito.
Como técnica de recolección de datos la entrevista tiene muchas ventajas; es aplicable a toda
persona, siendo muy útil con los analfabetos, los niños o con aquellos que tienen limitación física u
orgánica que les dificulte proporcionar una respuesta escrita. Se le puede explicar al entrevistado
con qué propósito estamos recogiendo los datos y esta ayuda a que éste dirija mejor sus respuestas.
El Cuestionario
Es el método que utiliza un instrumento impreso. Como en el caso de la
entrevista, hay preguntas pero todas están formuladas en un papel, ellas están
destinadas a obtener repuestas sobre el problema en estudio y son dadas por
consultado a través de un proceso de escritura, sin embargo, el cuestionario puede ser llenado por el
encuestado o con ayuda de un empadronador.
Una vez recogidos los datos pasamos a su preparación para iniciar el estudio, para poder
lograr el análisis estadístico es necesario ordenar los datos y clasificarlos, lo primero que hacemos es
revisar los instrumentos de recolección de información aplicados, sobre todos si son cuestionarios
llenados por el informante ya que en una entrevista el entrevistador es el que registra las respuestas.
Algunos autores proponen que cuando quedan cuestionarios con preguntas sin contestar las
llenemos con la respuesta que la mayoría colocó, sin embargo esto se podría considerar poco ético,
pues no es la respuesta del encuestado, en ese caso la sugerencia es eliminar ese cuestionario de la
muestra. Terminado este proceso pasamos al agrupamiento.
En el caso de las entrevistas y cuestionarios con preguntas abiertas debemos crear categorías
de acuerdo con los puntos expresados por los entrevistados de tal forma que ninguna opinión o
planteamiento se queden sin categoría, pero también de forma que ninguna opinión pueda incluirse
en dos categorías, es decir, deben ser mutuamente excluyentes. Una vez bien estructuradas las
categorías contamos la frecuencia de aparición de cada categoría en las respuestas dadas.
Razones
La razón (R) es el valor que indica la relación cuantitativa existente entre dos cantidades, por
ejemplo:
En una ciudad existen 54.000 empleados y 36.000 desempleados, la razón de empleado a
desempleado se expresa así:
Siendo
A= Nro. De individuos con cierta característica
a= Nro. De individuos que no poseen cierta característica
La interpretación del ejemplo anterior es que por cada 4 empleados hay 1 desempleado.
Al ser la razón un valor relativo no depende de los valores absolutos de los individuos que la
forman, ya que por ejemplo en una zona donde hay 90.000 empleados y 10.000 desempleados la
razón sigue siendo de 9.
Proporción
La proporción es una razón, pero su diferencia con las razones anteriores, es que el
denominador del cociente es el número total de unidades enunciadas. La proporción se representa
con la siguiente fórmula:
siendo N= (A)+(a)
La proporción contraria sería
Porcentajes
Como vimos en el apartado anterior las proporciones vienen expresadas en valores
decimales, esto no es ningún inconveniente, pero cuando se quiere presentar al público los datos
utilizar decimales es confuso, por ello se acostumbra a multiplicar las proporciones por 100, para
convertir los valores decimales en enteros, es decir, para convertirlos en porcentajes.
Siendo
Pa= Porcentaje de aumento
Pd= Porcentaje de descenso o disminución
Medición:
Medición es la cuantificación del atributo de una variable, ¿Qué quiere decir esto? Cuando
medimos hacemos una estimación numérica de un objeto, pero no del objeto en sí, medimos los
indicadores de sus atributos, para ello contamos con cuatro niveles de medición
Los datos se pueden clasificar de acuerdo a cuatro niveles de medición. Los niveles de
medición indican que tipo de operación se puede hacer con los datos para resumirlos, presentarlos y
determinar que pruebas estadísticas pueden llevarse a cabo con ellos. Existen cuatro niveles de
medición: Nominal, ordinal, de intervalo y de razón, estos niveles tienen un orden ascendente el más
bajo de la escala es el nominal y el más alto el de razón.
Escala Nominal
En el este tipo de medición los objetos sólo pueden ser nombrados o contados. No hay un
orden, consiste simplemente en clasificar observaciones dentro de ciertas categorías, las cuales
deben ser mutuamente excluyentes y colectivamente exhaustivas. Mutuamente excluyentes significa
que un individuo, objeto o medición pertenece únicamente a una categoría, y exhaustiva significa
que ningún individuo, objeto o medición puede quedar sin categorías por ejemplo:
En la medición nominal un mismo objeto de análisis no pueden estar en dos categorías, pero
todos tienen que estar en una, no puede haber observación fuera de una categoría. Para que no se nos
olvide esta propiedad de la medición nominal atendamos el siguiente ejemplo:
En un aula de clases vamos a clasificar las personas por lugar de nacimiento, una misma
persona no puede haber nacido en dos lugares, pero tampoco se puede decir que no nació en ningún
lado, por lo tanto, todos tenemos que estar en una sola categoría.
Escala de Intervalo
La medición de intervalo posee las características de la ordinal con la salvedad que aquí la
distancia entre los rangos son equivalentes, esto quiere decir que los intervalos pueden ser sumados
y restados. Por ejemplo, supongamos que hemos medido cuatro calificaciones con una escala de
intervalo las cuales son 10, 8, 7 y 5. Con estos datos podemos afirmar que la diferencia entre el
primero y el tercero es equivalente a la diferencia entre el segundo y el cuarto, observemos: 10-7=3,
8-5=3, sin embargo no podemos decir que el que sacó 8 tuvo el doble del que sacó cinco, a pesar que
la diferencia entre los que sacaron 10 y 7, es igual a la diferencia de los que sacaron 8 y 5
Otra característica resaltante de la medición por intervalos es que este tipo de variables no
tiene cero absoluto, esto significa que el atributo que medimos no tiene ausencia. Retomemos el
ejemplo de la medición de la temperatura corporal, si empleamos un termómetro y nos tomamos la
temperatura podemos decir que tenemos fiebre o no pero, pero el hecho de no tener fiebre no
significa que tengamos cero temperatura, por lo tanto aquí el cero (0) es relativo. Otro caso en el que
el cero es relativo es el número de calzado, no hay calzado número 0. Si medimos el calzado en
medición de intervalo diríamos, en una casa hay cinco miembros familiares que calzan 15, 24, 25,
36 y 48.
25 28 31 37 43
a b c d e
Distribución de Frecuencias:
Es un agrupamiento de datos en categorías mutuamente excluyentes en el cual se registran la
cantidad de veces que se ha observado cada categoría.
Ahora te preguntarás ¿Cómo elaboro una distribución de frecuencias?, la forma más fácil de
aprenderlo es a través de un ejemplo:
Observemos el siguiente grupo de números y supongamos que son la cantidad de viajes que realiza
cada día durante un mes la aerolínea Conviasa
15 12 10 8 20
En esa tabla de datos buscamos el valor mayor y el menor, para determinar la cantidad de
clases, para ello utilizamos la fórmula 2k, empleándola de la siguiente manera, en los vuelos de
Conviasa n = 20, asignemos a k un valor arbitrario, por ejemplo 4, 24=16 si n = 20, 4 clases no
cubrirían todos los datos, probemos con k=5, 25=32, es mayor que 20, cubriríamos completamente a
n, por lo que deberíamos conformar 5 clases.
Ahora vamos a calcular la amplitud del intervalo, recordando que debe ser el mismo para
todas las clases, y que deben abarcar desde el dato menor hasta el mayor, lo calculamos a través de
la siguiente fórmula:
Redondeamos a 2 que será el tamaño de nuestros intervalos, recordemos que debemos tener
5 clases. Ahora organicemos nuestros datos:
Los datos ayudan a los encargados de la toma de decisiones a hacer conjeturas bien
fundamentadas acerca de las causas y, por lo tanto, sobre los efectos probables de ciertas
características de algunas situaciones. Por lo demás, el conocimiento de las tendencias adquirido con
la experiencia permite conocer los posibles resultados y planear con anticipación.
Algunas veces puede ser satisfactorio presentar los datos tal como se encuentran y obtener
información directamente de ellos; otras veces solo habrá que agruparlos y presentarlos en forma
gráfica o tabulada, aquí el uso de las tecnologías computacionales es mucha utilidad y rapidez.
DATOS AGRUPADOS
Cuando la muestra consta de más de 30 datos, lo aconsejable es agrupar los datos en clases y
a partir de estas determinar las características de la muestra y por consiguiente las de la población de
donde fue tomada.
Distribución de frecuencia
Una forma de sintetizar los datos consiste en valerse de una tabla o distribución de
frecuencia. Tomemos como ejemplo el inventario promedio en días de 20 tiendas de conveniencia.
En las siguientes tablas se han incluido datos idénticos referentes al inventario promedio y
se han dispuesto primero como un arreglo en orden ascendente y luego como una distribución de
frecuencia. Para obtener la tabla 2 se tuvo que dividir los datos en grupos de valores semejantes.
Después se registraron el número de puntos graficados (observaciones) de datos que caían dentro de
cada grupo.
2.0 3.4 3.8 4.1 4.1 4.3 4.7 4.9 5.5 5.5
3.4 3.8 4.0 4.1 4.2 4.7 4.8 4.9 5.5 5.5
TABLA 2: Distribución de frecuencia del inventario promedio (en días) de 20 tiendas de artículos
de conveniencia (6 clases)
La distribución de frecuencia es una tabla que organiza los datos en clases; es decir, en
grupos de valores que describen una característica de los datos. El inventario promedio es una
característica de las 20 tiendas de conveniencia.
Hasta ahora se ha expresado la frecuencia con que ocurren los valores en cada clase como el
número total de observaciones que caen en dicha clase. También se puede expresar la frecuencia de
cada valor como una fracción o porcentaje del número total de observaciones. La frecuencia de un
inventario promedio, digamos de 4.4 a 4.9, es 5 en la tabla 2 y de 0.25 en la tabla 3. Para obtener
este último valor, dividimos la frecuencia de esta clase (5) entre el número total de observaciones
en el conjunto de datos (20). La respuesta puede expresarse como una fracción ( ), un decimal
TABLA 3: Distribución de frecuencia relativa del inventario promedio (en días) de 20 tiendas de
artículos de conveniencia.
La suma de todas las frecuencias relativas es de 1.00 o 100 %. Esto sucede porque una
distribución de frecuencia relativa parea cada clase con su fracción o porcentaje correspondiente de
los datos totales. Por lo anterior, las clases en cualquier distribución de frecuencia simple o relativa
son exhaustivas. Todos los datos encajan en una u otra categoría. Observe también que las clases son
mutuamente excluyentes; es decir, ninguna observación cae dentro de más de una categoría.
Clases discretas.
Los esquemas de clasificación pueden ser cualitativos o cuantitativos y discretos o
continuos. Las clases discretas son entidades individuales que no pasan de una clase a la siguiente
sin una ruptura. Son discretas las siguientes clases: el número de hijos de las familias, el número de
camiones que poseen las compañías transportistas, las ocupaciones de los graduados universitarios.
Los datos continuos pueden pasar de una clase a la siguiente sin ruptura alguna. Contienen
una medida numérica como el peso de unas latas de tomates, los kilogramos de presión sobre el
concreto, o el promedio de calificaciones de los universitarios el último semestre.
Ahora que hemos aprendido a dividir una muestra en clases, ya se está en condiciones de
tomar datos brutos y construir una distribución de frecuencia. A continuación tomaremos el
siguiente ejemplo para el desarrollo de la distribución de frecuencia:
TABLA 4: Concentraciones de cloro en partes por millón (ppm) en 30 galones de agua tratada.
16.2 15.4 16.0 16.6 15.9 15.8 16.0 16.8 16.9 16.8
15.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.0
16.4 15.8 15.7 16.2 15.6 15.9 16.3 16.3 16.0 16.3
Para analizar los datos de esta tabla seguiremos los siguientes pasos:
Escoger el tipo y número de clases para dividir los datos. En este caso, ya se ha optado por
clasificar los datos según la medida cuantitativa del número de ppm del cloro en el agua tratada,
en vez de hacerlo a partir de un atributo cualitativo como color o el olor del agua.
Después necesitamos decidir cuántas clases utilizar y el intervalo (la distancia que debe
comprender cada clase).
El número de clases por utilizar depende principalmente del número de observaciones en los
datos. Esto es, un número mayor de observaciones requiere un mayor número de grupos de clase. En
general la distribución de frecuencia debe tener al menos cinco clases pero no más de 15. Si no hay
suficientes agrupamientos de clase o si hay demasiados, se obtendrá poca información.
A continuación se muestra una tabla que nos puede ser útil para seleccionar el número de
clases, aclarando que esta designación no es obligatoria y puede ser a decisión del analista...
Para designar el número de clases usaremos la letra K, para este ejemplo se usará K= 6
clases.
Es deseable que el ancho da cada agrupamiento de clase (intervalo del inicio de una clase al
inicio de la siguiente) sea igual. Para determinar el ancho de cada clase, el alcance de los datos de
divide entre el número de agrupamientos de clase deseado:
Clasificar los puntos de datos en clases y contar el número de puntos en cada clase: Esta
información aparece en la tabla 5. Toda observación de datos encaja por lo menos en una clase y
ninguna observación lo hace en más de una clase. Por lo que nuestras clases son exhaustivas y
mutuamente excluyentes. Observe que el límite inferior de la primera clase corresponde a la
menor observación de datos de la muestra, y que el límite superior de la última clase corresponde
a la observación mayor de los datos.
TABLA 5: Concentraciones de cloro en muestras de agua tratada con intervalos de clase de 0.3
ppm
FRECUENCI
CLASE
A
15.2 - 15.4 2
15.5 - 15.7 5
15.8 - 16.0 11
16.1 - 16.3 6
16.4 - 16.6 3
16.7 - 16.9 3
30
10
8
6
6
Frecuencia 5
4 3 3
2
2
0
15.2 - 15.4
15.5 - 15.7
15.8 - 16.0
16.1 - 16.3
16.4 - 16.6
16.7 - 16.9
2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21
3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37
4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79
4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31
8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83
9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67
11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28
12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58
13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07
15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47
16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60
16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74
17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78
Paso 6: Contar el número de valores que caen en cada intervalo utilizando una hoja de registro, de
esta manera se obtiene la frecuencia para cada intervalo.
A parte de la distribución de frecuencias los datos pueden también pueden ser presentados
en gráficos contentivos de los mismos datos que expresamos en la distribución de frecuencias.
Seguro te preguntarás ¿Y si tienen los mismos datos para que hacerlos? La respuesta es que el
gráfico permite apreciar de forma más rápida los datos obtenidos, ya lo comprobaremos más
adelante.
Existen una gran variedad de gráficos, primero conoceremos los dos más empleados en
administración, también mencionaremos otros tipos de gráficos de mucha utilidad, sin embargo te
invito a ampliar sobre este tema a través de un arqueo bibliográfico.
Histograma: Es uno de los gráficos utilizados mayormente empleado para representar una
distribución de frecuencias
Histograma:
Gráfica en la que las clases se indican en el eje y (horizontal) y las frecuencias de la clase
por eje x (vertical). Las frecuencias quedan representadas en el gráfico por la altura de las
barras, la que se trazan una al lado de la otra.
Seguramente te preguntarás ¿En qué se diferencian los histogramas del gráfico de barras? Se
diferencian en algo que podría parecer tonto, pero no, y es en la separación que existe entre las
barras. Los histogramas poseen sus barras continuas porque sus datos son de intervalo o de razón,
mientras que en los gráficos de barra al poder admitir cualquier nivel de medición cada barra
representa una variable que puede ser cualitativa o cuantitativa.
Diagrama Circular:
El diagrama circular, muy reconocido por gráfico de torta es especial para representar porcentajes.
El diagrama circular convierte los 360 grados del círculo en el 100% de la variable que estamos
representando. Este es un gráfico muy de muy fácil lectura, pues las líneas que cortan la
circunferencia permiten, rápidamente, ver qué clase de la variable tiene el mayor porcentaje.
10%
15% 35%
1 15%2 3 4 5
25%
TABLA 6: Concentraciones de cloro en muestras de agua tratada con intervalos de clase de 0.3
ppm usando la frecuencia relativa.
12
10
8
FRECUENCIA 6
4
2
0
15 15.3 15.6
16.200000000000003
15.9 16.799999999999986
16.5
17.100000000000001
Ojivas
Una distribución de frecuencia acumulativa nos permite ver cuántas observaciones se hallan
por arriba o por debajo de ciertos valores, en lugar de limitarnos a anotar los números de elementos
dentro de los intervalos. Por ejemplo, si queremos saber cuántos galones contienen menos de 17.0
ppm, podemos servirnos de una tabla que incluya frecuencias acumulativas “menores que” en
nuestra muestra como se observa en la tabla 8.
Se llama ojiva a la gráfica de una distribución de frecuencia acumulativa. La ojiva de una
distribución de este tipo se muestra en la figura 4. Los puntos graficados representan la cantidad de
galones que tienen menos cloro que las partes por millón indicadas sobre el eje horizontal.
TABLA 8: Distribución de frecuencia acumulativa “menor que” de las concentraciones de cloro en ppm
FIG. 4 Ojiva “menor que” de la distribución de las concentraciones de cloro en ppm para 30 galones de agua tratada.
Ingeniera Jessica Liset Martínez 40
No . Ac um ulati vo d e ga l. mu est read os
El alumnado deberá practicar tanto en forma manual como con el uso de la tecnología la
elaboración de gráficos estadísticos.
UNIDAD 3:
“ANÁLISIS ESTADÍSTICO”
Las medidas de tendencia central tienen como propósito hallar con toda precisión el centro de
un conjunto de observaciones
Mediana:
Observación de la mitad de los datos después de que se han
colocado de forma ordenada
Media Geométrica:
Es una medida que calcula los promedios de los porcentajes
Media Aritmética:
Es una medida de tendencia central que se obtiene
dividiendo la suma de los valores del conjunto de
datos entre el número total de éstos.
Media Ponderada:
Es un caso especial de media aritmética pero cuando todos los
datos tienen diferentes valores o ponderaciones que los
discrimina según su importancia
Moda:
Es el valor que más se repite dentro de su conjunto, es decir,
posee mayor frecuencia
Mediana y Moda
La mediana es el valor que está en la posición 4: 33, 36, 40, 45, 57,60 y 68.
Si el grupo de datos es par, aplicamos la misma ecuación promediando los dos valores
centrales, observemos el ejemplo:
Datos: 10, 15, 18, 25, 31, 36, 45, 60, 77, 80
El punto 5.5 estaría entre los valores de las posiciones 5 y 6, por lo buscamos ambos valores
y los promediamos 10, 15, 18, 25, 32, 36, 45, 60, 77, 80
La mediana es 43.
Moda: Es la medida de tendencia central más fácil de recordar ya verás por qué:
Antes de avanzar, es correcto aclarar que las definiciones de nuestras medidas de tendencia
central se mantienen, a continuación se te presentan una comparación de estas medidas.
En las distribuciones simétricas la media, la mediana y la moda coinciden en el valor, mientras que en un
En donde:
= media aritmética
X= valor o punto medio de cada clase
f= frecuencia de cada clase
fX= frecuencia en cada clase por el punto medio de la clase
= suma de estos productos
n= número total de frecuencias
Ejemplo: Calculemos la media del precio de venta de los vehículos del plan de una empresa X.
Precio de Venta de vehículos
Frecuencia
(millones de bolívares)
18 a 23 25
23 a 28 28
28 a 33 26
33 a 38 17
38 a 42 13
Total 109
Al precio de venta medio de los vehículos puede estimarse a partir de datos agrupados en
una distribución de frecuencias, lo primero que debemos calcular es el punto medio de cada clase,
para eso le calculamos el promedio: (18+23)/2=20.5 luego ese valor medio se multiplica por la
frecuencia, como se muestra en la siguiente tabla:
Decimos entonces que la media del precio de venta del plan de la empresa X es de 28,800,000.
Definición:
La media aritmética o media es la medida de tendencia central que frecuentemente llamamos
promedio, consiste en la suma de los valores del grupo de datos dividida entre la cantidad de
valores. La media aritmética de una población se representa con el símbolo (mu), y la media
aritmética de una muestra se representa con el símbolo (equis barra) y sus fórmulas son las
siguientes:
Siendo:
La sumatoria d todos los datos
N Población
n Muestra
Ambas fórmulas son idénticas, con la única diferencia que en el primer caso trabajamos con
la población entera y en el segundo con una muestra.
Ejemplo: Durante cada hora de trabajo de un día una cooperativa produce las siguientes cantidades
de artículos de limpieza: 14, 19, 20, 15, 12, 18, 16, 10. ¿Cuál es el número medio de unidades
producidas?
Ejemplo: La media de 3, 8 y 4 es 5
Media Ponderada
La media ponderada o promedio ponderado es una media aritmética en al que cada uno de
los valores se le pondera de acuerdo a su importancia con el grupo general. Las fórmulas de media
ponderada poblacional y muestral son idénticas:
ó
Dónde:
Media Ponderada
X Observación individual
W Peso o ponderación asignada a cada observación
Cuando calculamos la media aritmética no sale a discusión si cada uno de los datos tiene
igual importancia, sin embargo en ciertos casos puede ocurrir que determinados datos tengan más
valor que otro de su mismo conjunto, observemos el siguiente ejemplo:
Un estudiante obtuvo las siguientes calificaciones en su curso de estadística I: 19, 20, 18 y 16. Sin
embargo dentro de los porcentajes la tercera calificación es la que tiene mayor ponderación o mayor
valor, debido a que representaba el 30 % de la calificación final, a continuación se reflejan los datos
en la siguiente tabla:
Calificaciones Ponderación XW
19 1 19
20 1 20
18 3 54
16 1 16
6 109
3.1.2 La Mediana
La mediana es el valor por debajo del cual se encuentran una mitad de los valores y por
encima del cual se encuentra la otra mitad. Como los datos están organizados en una distribución de
frecuencias, se ha perdido algo de información. Así no podemos calcular la mediana exacta, sin
embargo, se puede estimar de la siguiente manera:
Dónde:
L= Límite inferior de la clase que contiene la mediana.
n= Número de frecuencias.
f= frecuencia en la clase mediana.
CF= número de las frecuencias acumuladas en las clases que preceden a la clase que contiene la
mediana.
i= amplitud de la clase en la que se encuentra la mediana.
Utilicemos los datos del ejemplo anterior, pero en esta oportunidad debemos calcular la
frecuencia acumulada, que no es más que la suma acumulada de las frecuencias de cada clase o
categoría, veámoslo en la siguiente tabla:
Podemos apreciar fácilmente que el tercer grupo de intervalos es el que posee al número en
la posición 54,5 debido a que el anterior sólo llega hasta el número 53, observemos este diagrama.
53 79
28.000.000 33.000.000
Mediana
Sustituyamos ahora los valores:
Si comparamos la mediana con la media aritmética se nos presenta una diferencia, pero
recordemos que…
3.1.3 La Moda
Siendo la moda el valor con más frecuencia, sólo debemos buscar dentro de nuestra
distribución de frecuencias los intervalos con mayor cantidad de frecuencia, revisemos la tabla de
precios de venta del Plan Empresa X.
Datos No Agrupados:
Ejemplo:
Si un vehículo se mueve de la ciudad A, a la B a 65 Km./hr y regresa de B a A, a 98 Km./Hr a qué
promedio se desplazó.
Datos Agrupados:
La respuesta es:
Verifiquemos: si el trabajador del que hablábamos gana Bs. 650,000 con los dos aumentos su sueldo
quedará:
650.000 * 0,05= 32.500
682.000 * 0,15= 102.370
Total con el aumento 784.870 bolívares
Ahora realicemos el cálculo con nuestra media geométrica
700.000*0,09886=64.259
714.259*0,09886=70.611,6
Total = Bs.784.870
Donde
X= punto medio de los intervalos
f = frecuencia
Recuerda
La media geométrica se calcula para promedios de porcentajes
Ejemplo: Si los precios de la acción “Anáhuac” en los últimos cuatro días fueron; 4.75, 5.23, 4.78 y
6.32 calculan el factor de crecimiento promedio y el crecimiento porcentual promedio.
Existen dos formas de resolverlo:
b) Otra forma es
Datos Agrupados:
Ejemplo: Supóngase que se cuenta con la información diaria de los incrementos porcentuales de
una acción y que se representan en la siguiente tabla:
Crecimiento porcentual (%) Frecuencias en días
10 14
20 15
30 48
Ejemplo: A continuación se muestra una distribución de frecuencias, calcula toda las medidas de
tendencia central sobre la tabla.
50-59 3
60-69 7
70-79 18
80-89 12
90-99 8
100-109 2
50
Las medidas de tendencia central por sí solas carecen de significado, pues de nada sirve saber
el promedio sin conocer la dispersión, qué significa esto, saber cuánto se alejan las observaciones de
su propio promedio, observemos el siguiente ejemplo:
Ambas tienen la misma media en ventas, pero si realizamos el análisis considerando cada una de las
ventas del mes podemos apreciar que la situación de la empresa “ZZZ” es muy delicada, debido a
que el último mes de facturación se aleja mucho de la media. Por esto la importancia de las medidas
de dispersión.
Medidas de Dispersión:
Miden que tanto se dispersan los datos recabados de
su media
Existen dos grupos de medidas de dispersión. El primer grupo es el de las medidas de
dispersión absolutas que vienen expresado por las mismas medidas que identifican a la serie de
datos; el segundo grupo es el de las medias de dispersión relativas que son relaciones entre las
medidas de dispersión y las medidas de tendencia central, expresado en valores abstractos
(porcentajes).
3.2.1 El Recorrido
Ejemplo: Horas diarias dedicadas al estudio por un grupo de estudiantes del plan de formación
Administración y Gestión:
1,5 2 3 2,5
2 3 3,5 4
2 2,5 1 1
El rango es 25 millones.
Desviación Media: La desviación media mide la cantidad media en que los valores de la
población, o de la muestra, varían de la media. Se define así:
Donde
Xes el valor de cada observación
= es la media aritmética de los valores
n= es el número de observaciones en la muestra
= indica el valor absoluto. En otras palabras se hace caso omiso de los signos de las desviaciones
medias, ¿Por qué? Porque si no lo hiciéramos así las desviaciones positivas y negativas se anularían,
y al desviación siempre sería cero, y una medida de dispersión cero sería completamente inútil.
Ejemplo:
1,5 2 3 2,5
2 3 3,5 4
2 2,5 1 1
Donde
=varianza poblacional
X= valor de una observación de la población
= media aritmética de la población
n= Número de observaciones de la población
Ejemplo: Un corredor de seguros vende tres pólizas por los siguientes precios en millones: 32, 23 y
26
Ejemplo: El director de Conviasa requiere conocer el número de pasajeros atendidos por día para
determinar si la variación de pasajeros es grande, ya que de ello depende la ampliación en la flota de
aviones, la distribución de frecuencias es la siguiente:
Por lo tanto
El director de Conviasa ya puede decidir si los aviones que utilizan actualmente pueden
acomodar fluctuaciones hasta de 12 pasajeros en los días de tránsito pesado.
3.2.4 APLICACIONES
VARIANZA:
PROPIEDADES:
1. La varianza nunca puede ser negativa, s2 >0.
2. Otra forma más sencilla de calcular la varianza es:
Demostración:
Ejemplo 1: Usando las siguiente tabla que muestra la cantidad de niños atendidos en una clínica del
país en una semana por edades en años
DESVIACIÓN TÍPICA (S). La desviación típica que se define como la raíz cuadrada positiva de la
varianza
PROPIEDAD: Se observa a partir de la definición que s 0
Realizar el cálculo y comprobar que: s = 1.12
CUASI-VARIANZA ( s*2 ) Se define de forma muy parecida a la varianza pero dividiendo por n-1.
D x =
Calcular e interpretar el coeficiente de variación: CV=
UNIDAD 4:
Ingeniera Jessica Liset Martínez 60
“ELEMENTOS DEL CÁLCULO
DE PROBABILIDADES”
Análisis Combinatorio:
Es la rama de la matemática que estudia los diversos arreglos o selecciones que podemos
formar con los elementos de un conjunto dado, los cuales nos permite resolver muchos problemas
prácticos. Por ejemplo podemos averiguar cuántos números diferentes de teléfonos, placas o loterías
se pueden formar utilizando un conjunto dado de letras y dígitos.
Además el estudio y comprensión del análisis combinatorio no va a servir de andamiaje para
poder resolver y comprender problemas sobre probabilidades
Principios fundamentales del Análisis Combinatorio:
En la mayoría de los problemas de análisis combinatorio se observa que una operación o
actividad aparece en forma repetitiva y es necesario conocer las formas o maneras que se puede
realizar dicha operación. Para dichos casos es útil conocer determinadas técnicas o estrategias de
conteo que facilitarán el cálculo señalado.
El análisis combinatorio también se define como una manera práctica y abreviada de contar;
las operaciones o actividades que se presentan son designadas como eventos o sucesos.
Ejemplo:
1. Señalar las maneras diferentes de vestir de una persona, utilizando un número determinado
de prendas de vestir
2. Ordenar 5 artículos en 7 casilleros
3. Contestar 7 preguntas de un examen de 10
4. Designar 5 personas de un total 50 para integrar una comisión
5. Sentarse en una fila de 5 asientos 4 personas
6. Escribir una palabra de 7 letras utilizando 4 consonantes y 3 vocales
I) Principio de multiplicación:
Si un evento o suceso “A” puede ocurrir, en forma independiente, de “m” maneras diferentes y otro
suceso de “n” maneras diferentes, entonces el número de maneras distintas en que pueden suceder
ambos sucesos es “m. n”
Ejemplo 1:
En la etapa final de fútbol profesional de primera, cuatro equipos: CRISTAL (C), BOYS (B),
ESTUDIANTES (E), UNIVERSITARIO (U), disputan el primer y segundo lugar (campeón y
subcampeón). ¿De cuántas maneras diferentes estos equipos pueden ubicarse en dichos lugares?
Solución:
C B C
B E B E
U B U
C E C
E B E B
U E U
C U C
U B U B
E U
E
Existen 12 maneras diferentes en que estos equipos se pueden ubicarse en el primer y segundo
lugar
# maneras = 12
Ejemplo 2:
¿Cuántas placas para automóviles pueden hacerse si cada placa consta de dos letras diferentes
seguidas de tres dígitos diferentes? (considerar 26 letras del alfabeto)
Letras Dígitos
EXPLICACIÓN:
Ejemplo 2:
Se desea cruzar un río, para ello se dispone de 3 botes, 2 lanchas y 1 deslizador. ¿De cuantas formas
se puede cruzar el río utilizando los medios de transporte señalados?
Solución:
Aplicando el principio de adición se tiene:
En diferentes casos se tomará de algún conjunto parte de sus elementos o todos ellos, para
formar diferentes agrupaciones, que se van a distinguir por el orden de sus elementos o por la
naturaleza de algunos de ellos. Si los elementos que forman una agrupación son diferentes entre sí,
serán llamados agrupaciones sin repetición y si alguno de ellos es igual se dirá que son agrupaciones
con repetición.
Entre los métodos de conteo más conocidos tenemos: Permutación, Variación y Combinación
PERMUTACIÓN
Es un arreglo de todos o parte de un conjunto de objetos considerando el orden en su
ubicación; cuando en el arreglo solo entran parte de los elementos del conjunto se llama variación.
Es importante resaltar que el orden es una característica importante en la permutación, cuando
variamos el orden de los elementos se dice que permutamos dichos elementos.
Ejemplo:
Determinar los diferentes arreglos o permutaciones que se pueden hacer con las letras a, b y c
tomadas de dos en dos
Solución:
Método 1:
Sea el conjunto: {a, b, c} , entonces los arreglos pueden ser: ab, va. ac, ca, bc, cb
Número de arreglos = 6
Estas permutaciones son llamados lineales, porque los objetos son ordenados en una línea
recta de referencia
Ejemplo:
En una carrera de 400metros participan 12 atletas. ¿De cuantas formas distintas podrán ser
premiados los tres primeros lugares con medalla de oro, plata y bronce?
Solución:
Método 1: Empleando el principio de multiplicación
RECORDAR
1)n! = 1 x 2 x 3 x ................ x n
2)0! = 1
3)1! = 1
4) n! = (n – 1)! x n
Ejemplo:
¿De cuántas maneras distintas se podrán ordenar las siguientes figuras?
COMBINACIÓN
Es cada uno de los diferentes arreglos que se pueden hacer con parte o todos los elementos
de un conjunto dado sin considerar el orden en su ubicación
El número de combinaciones de “n” elementos diferentes tomados de “k” en “k”, con k n, está
dada por:
Ejemplo 1:
Si disponemos de 5 puntos no colineales, ¿cuál es el máximo número de triángulos que se podrán
formar?
Solución:
Para dibujar un triángulo solo es necesario 3 puntos en el plano, luego se escogerán 3 puntos
(k = 3) de un total de 8 puntos (n = 5). Además no importa el orden, ya que el triángulo ABC
es igual al CBA; por lo tanto se trata de una combinación.
OBSERVACIÓN
1) En las permutaciones interesa el orden, se buscan
ordenaciones
2) En las combinaciones no interesa el orden, se
busca agrupaciones
Ejemplo 2: Una señora tiene 3 frutas: manzana, fresa y piña. ¿Cuántos sabores diferentes de jugo
podrá preparar con estas frutas?
Solución:
Método 1: (en forma gráfica)
Cuando se escoge una fruta de las tres, los sabores son 3: F, P ,M
Cuando se escoge 2 de las tres frutas, los sabores son 3: FP, FM, PM
Cuando se escoge las 3 frutas los sabores son 1: FPM
Total de sabores diferentes: 3 + 3 + 1 = 7
Método 2: (Empleando combinaciones)
Se puede escoger una fruta de las tres ó 2 frutas de las tres o las tres frutas de las tres, además en
este caso no importa el orden; por lo tanto usamos el principio de adición aplicado a la
combinación:
# maneras diferentes =
# maneras diferentes =
Total de sabores diferentes: 3 + 3 + 1 = 7
Ejemplo 3:
Se desea formar un comité de 7 seleccionando 4 físicos y 3 matemáticos de un grupo de 8 físicos y 6
matemáticos. ¿De cuantas maneras podrá seleccionarse?
Solución: PROPIEDADES DE
1 Seleccionamos 4 físicos entre 8 en formas 1) , ,
2)
3)
2o Seleccionamos 3 matemáticos entre 6 en
4)
x = 70 x 20 = 1400 6)
OBSERVACIÓN:
En la práctica se presentan diferentes combinaciones que no resultan sencillas, estas son las
combinaciones con repetición. Para obtener las diferentes combinaciones con repetición de
“n” elementos en el cual hay repetición de los elementos (CR) agrupados de k en k, se utiliza
Ingeniera Jessica Liset Martínez 68
la siguiente fórmula:
PROBLEMAS RESUELTOS
1. ¿Cuántos numerales de 2 cifras se pueden formar con los dígitos 1, 3, 5 y 7?
A) 16 B) 12 C) 10 D) 14 e)8
Solución:
OBSERVACIÓN
En estos casos el orden es importante, además los
elementos del conjunto pueden repetirse, como
por ejemplo : 11 , 33, 55, 77
OBSERVACIÓN
1) a toma 4 valores
2) b toma 4 valores
3) Para formar el numeral primero escribo las cifras
de las decenas(4 posibilidades) y luego la cifra de las
unidades (4 posibilidades), luego por el principio de
multiplicación, la cantidad de numerales será : 4 x 4 =
16
Cantidad de números = 4 x 4 = 16
Solución:
La forma general del numeral es , hallaremos las posibilidades que pueden tomar a, b y c
en base seis y luego multiplicamos el número de las posibilidades
OBSERVACIÓN:
A b c
1) En base seis solo se dispone de los dígitos : 0,1,2,3,4 y
5
2) La primera cifra a no puede ser cero, solo puede tomar
las cifras : 1,2,3,4 y 5; es decir 5 posibilidades
3) Las cifras b y c, como no dicen que son diferentes,
pueden tomar 6 valores o posibilidades
5 x 6 x 6 = 180 numeral
Respuesta: se pueden formar 180 numerales
# numerales = 9 x 9 x 8 = 648
Respuesta: se pueden formar 648 numerales
OBSERVACIÓN
1) por ser primera cifra no puede ser cero
2) A las posibilidades de y se les aplica
el principio de multiplicación
cantidad de # = 3 x 3 = 9 números
Respuesta: se pueden formar 9 números
x = -y ............ (1)
a b c
EXPLICACIÓN:
1) “a” puede tomar los valores del “1” al 9, es decir hay 9
posibilidades para las centenas
2) para “b” y “c” hay 10 posibilidades, ya que b y c
pueden tomar los valores del “0” al 9
3) Para hallar la cantidad de números de 3 cifras
aplicamos el principio de multiplicación.
cantidad de #s = 9 x 10 x 10 = 900
d) Cálculo del número de 3 cifras que no usan cifra “6”
EXPLICACIÓN:
a b c 1) “a” puede tomar los valores del “1” al “9”; sin
considerar el “7” es decir hay posibilidades para las
centenas
2) para “b” y “c” hay 9 posibilidades, ya que b y c
pueden tomar los valores del “0” al “9”, exceptuando a
“7”
3) Para hallar la cantidad de números de 3 cifras
aplicamos el principio de multiplicación
cantidad de #s = 8 x 9 x 9 = 648
e) Remplazando los valores obtenidos en los pasos “c” y “d” en la ecuación (1) de l paso (b), se
tiene:
X = 900 – 648 = 252
Respuesta: se pueden formar 252 números
7) De un grupo de 5 estudiantes, cuantos grupos diferentes de tres alumnos podrían formarse.
A) 56 B) 35 C) 42 D) 64 e) 70
Solución:
En la suma no importa el orden que se dispongan los sumandos, por lo tanto se trata de una
combinación; además para cada suma se escogen grupos de 4 sumandos de los siete de que se
disponen.
9) ¿De cuántas formas se pueden ubicar en una fila de 7 asientos 3 hombres y 4 mujeres, si
estas deben ocupar los lugares impares?
Posibilidades
4 3 3 2 2 1 1
# de formas = 4 x 3 x 3 x 2 x 2 x 1 x1 =144
Respuesta: se pueden ubicar de144 formar diferentes
A) 52 B) 48 C) 27 D) 96 e) 49
Solución:
Sea : el número, entonces se tiene:
EXPLICACIÓN:
“a” puede ser “6” o “9”, es decir tiene 2
a b c d posibilidades ; “b”, tiene (5 - 1) posibilidades;
“c” tiene (5 – 2) posibilidades y “d” tiene (5 –
3) posibilidades ya que las cifras deben ser
diferentes
# de números = 2 x 4 x 3 x 2 = 48
11) Un grupo de 16 personas desean escoger entre sus miembros un comité de 3 personas que los
represente. ¿De cuantas formas distintas se puede seleccionar dicho comité?
A B C
# maneras de llegar de A a C = 3 x 3 =9
pasando por B
Pero también hay dos caminos directos para llegar a C (x, y); por lo tanto el número total de
caminos para llegar de A a C es : 9 + 2 = 11 formas; y de C a D hay 3 formas (7,8,9)
Finalmente se tiene:
De A a C y de C a D A aD
14) En un examen de matemáticas, un estudiante debe responder siete preguntas de las diez
dadas. ¿De cuántas formas diferentes debe seleccionar, si él debe responder por lo menos,
tres de las cinco primeras preguntas?
A) 64 B) 55 C) 50 D) 110 e) 120
Solución:
El estudiante puede responder tres de las cinco primeras preguntas y 4 de las últimas 5
preguntas; o cuatro de las primeras cinco preguntas y 3 de las últimas; o cinco de las primeras
cinco y dos de las últimas. Como no interesa el orden se trata de una combinación, por lo tanto
tenemos:
15) El servicio de inteligencia de cierto país, desea enviar mensajes a sus agentes secretos. Solo
quiere utilizar las siguientes letras: V, A, M, P, I, R, O. ¿Cuántas palabras claves de cinco
letras pueden formarse, si ninguna letra puede repetirse?
A) 2520 B) 1550 C) 1850 D) 1100 e) 1200
Solución:
Método 1:(usando el principio de multiplicación)
#maneras = 7 x 6 x 5x 4 x 3 = 2 520
Método 2:(usando permutación)
16) Un hombre tiene 9 bonos financieros de 9 compañías distintas, y piensa regalarlos a sus 3
hijos de la siguiente manera: a su hijo mayor, 4; a su segundo hijo, 3; y al menor 2. ¿De
cuantas formas puede repartir los bonos?
A) 1640 B) 1360 C) 680 D) 1100 e) 1120
Solución:
17) La selección peruana de voleibol está conformado por 12 chicas. ¿De cuántas formas se
puede conformar un equipo de 6 si se sabe que 2 chicas se niegan a jugar en el mismo
equipo?
A) B) C) D) e)
Solución:
La delegación de 6 chicas se puede presentar en los siguientes casos:
1er caso: Si no figura ninguna de las dos chicas que se niegan a jugar juntas, las seis chicas
deben escogerse de entre10
OBSERVACIÓN:
Hemos aplicado la
propiedad:
# de equipos =
2do caso: Si figura una de las dos chicas que se niegan a jugar juntas, las otras cinco chicas
deben escogerse de entre las10 restantes
# de equipos =
# total de equipos =
19) La tripulación de un bote es de 10 hombres, cuatro solamente pueden remar a babor y tres a
estribor. ¿De cuántas formas se pueden distribuirse para remar, sabiendo que cinco hombres
deben ubicarse a cada lado para mantener el equilibrio del bote?
PROA
Babor Estribor
POPA
2 2
A) 3x (5!) B) 6x (4!) C) 3! x (5!)2 D) 12 x (3!)2 e) 6x (5!) x (4!)
Solución:
Sean {a, b, c, d, e, f, g, h, i, j} los tripulantes del bote de los cuales: a, b, c y d pueden remar sólo
a babor y h, i, y j pueden remar sólo a estribor. Además cinco hombres están ubicados a cada
lado del bote.
maneras diferentes.
20) Señale cuántos productos diferentes, cada uno de tres factores primos, podrá obtenerse con
los cinco factores primos : a, b, c, d, e ( a b c de)
A) 40 B) 35 C) 30 D) 24 e) 56
Solución:
Método 1: (Por conteo directo)
Se deben formar números de la forma P = x. y. z; donde x, y, z son números primos
CASO 1: Losa tres factores son iguales; es decir: x = y = z, los productos serán:
P1 = a a a ; P2 = b b b ; P3 = c c c ; P4 = d d d ; P5 = e e e
Con n = 5 y k = 3 , es decir:
4.2.1 Probabilidad
2. Basándose en la experimentación.
Hay casos en los que después de repetir un número muy grande de veces un experimento, es
posible determinar las probabilidades de ocurrencia de algunos eventos, tales como: La probabilidad
de que aparezca águila al lanzar una moneda equilibrada, la probabilidad de que aparezca el número
3 en un dado, etc., etc.
Probabilidad Compuesta
Es la probabilidad compuesta por dos eventos simples relacionados entre sí. En la
composición existen dos posibilidades: Unión y de Intersección .
Unión de A y B
Si A y B son eventos en un espacio muestral S, la unión de A y B contiene todos
los elementos del evento A o B o ambos.
Intersección de A y B
Si A y B son eventos en un espacio muestral S, la intersección de A y B está
compuesta por todos los elementos que se encuentran en A y B.
Relaciones entre eventos
Existen tres tipos de relaciones para encontrar la probabilidad de un evento:
complementarios, condicionales y mutuamente excluyentes.
1. Eventos complementarios: El complemento de un evento A son todos los elementos en un
espacio muestral S que no se encuentran en A. El complemento de A es: A C =1−P( A)
Ejemplo 2: En el evento A (día nublado), P(A) = 0.3, la probabilidad de tener un día despejado será
1 – P(A) = 0.7
Gráficamente:
P(A)=0.3
2. Probabilidad condicional: Para que se lleve a cabo un evento A se debe haber realizado el
evento B. La probabilidad condicional de un evento A dado que ha ocurrido el evento B es:
, si
B A
P(B/A)=0.97
P(A)=0.9
8
Ejemplo 3:
Si el evento P(A y B) = (llueva y este nublado) = 0.2 y el evento B (nublado) = 0.3, cual es
la probabilidad de que llueva en un día nublado? Nota: no puede llover si no hay nubes.
A B
P(A/B)=0.67
=
Ejemplo 4:
Las razones de queja en productos se muestran a continuación:
RAZÓN DE LA QUEJA
Si A es el evento de que la queja es por apariencia y que B representa que la queja ocurrió en
el periodo de garantía. Se puede calcular P(A/B) = P(A y B)/P(B)
P(A/B) = 0.32 / 0.63 = 0.51
Si C es el evento fuera de garantía y D falla mecánica:
P(C/D) = P(C y D) / P(D) = 0.22 / 0.35 = 0.628
A B
Cuando un evento A no contiene elementos en común con un evento B, se dice que estos son
mutuamente excluyentes.
Ejemplo 5. Al lanzar un dado:
a) Cuál es la probabilidad de que salga 2 o 3?
b) Calcule
a)
b) = 0,
Ya que al ser conjuntos mutuamente excluyentes la intersección no existe, es imposible que
salga 2 y 3 al mismo tiempo.
Ley aditiva:
A B
=
b) Si la muestra se toma “sin reemplazo” de modo que el primer artículo no se regresa antes de
seleccionar el segundo entonces:
=
Se observa que los eventos son dependientes ya que para que para obtener el evento B, se
tiene que haber cumplido antes el evento A.
P(A) =.98
4.2.2 Experimento.
Es toda acción bien definida que conlleva a un resultado único bien definido como el
lanzamiento de un dado. Es el proceso que produce un evento. Es el proceso a través del cual se
obtienen observaciones.
Ejemplo 2.1.Considere el experimento siguiente:
En una empresa existe una grúa que tiene un sistema de cables, las cuales requieren ser
reemplazadas cada cierto tiempo de uso. Para probar si se debe cambiar, se somete el sistema a una
tensión exagerada, si se rompen 2 o más hilos, se dice que el cable no sobrevive y por lo tanto debe
ser reemplazada. Se sabe por experiencia, que en cada tensión exagerada, se rompe a lo más un hilo
y que la probabilidad de que se rompan más de uno es despreciable.
Evento:
Es cualquier colección de resultados contenidos en el espacio muestral. Es simple si sólo
tiene un resultado y compuesto si tiene varios resultados.
P { E1 ó E2 }=P { E1 ∪ E2 }=P { E 1 }+ P { E 2 }
EVENTOS SOLAPADOS:
Dos eventos E1 y E2, son solapados si tienen puntos muestrales comunes, los puntos
muestrales comunes a E1 y E2, forman un subconjunto llamado intersección de E1 y E2, y se
representa por E1 ∩ E2.
La fórmula para calcular la probabilidad de dos eventos solapados es:
P { E1 ∪ E 2} =P { E1 ó E2 }=P { E 1 }+ { E2 }−P { E1 ∩ E2 }
Dónde: P { E1 ∩ E 2 }=P { E1 } ∙ P [ E2 ]
P { E1 ∪ E 2 ∪ E3 } =P { E 1 }+ { E2 } + P { E3 } =P { E 1 } + P { E 2 } + P { E3 }−P { E1 ∩ E2 } −{ E1 ∩ E3 }−P { E 2 ∩ E3 } + P { E1 ∩ E2 ∩ E
EVENTOS COMPLEMENTARIOS:
Dos eventos E1 y E2, son complementarios si el segundo es un subconjunto que contiene todos
los puntos muestrales del espacio muestral que no están en el primero. Los eventos
complementarios, son a su vez mutuamente excluyentes: E1 ∪ E 2=S y E 1 ∩ E2 =∅
S, representa el espacio muestral
^
E , es el complementario de E, es decir, ^
E es lo que le falta a E, para se igual a S.
^
E , se lee complementario de E ó “No E”
La probabilidad del espacio muestral es 1; P { S }=1, por loque se tiene :
^ }=1
P { S }=P { E } + P { E
P {^
E }=P { S }−P { E } = 1−P { E }
EVENTOS INDEPENDIENTES:
P { E1 ∩ E2 } = p { E1 y E2 } =P { E 1 . E2 } =P { E 1 } . P { E2 }
EJEMPLO:
I. Se lanzan dos dados simultáneamente. Uno verde y uno rojo. ¿Cuál es la probabilidad de que
V ≥ 4 y R ≤ 2?
Procedimiento:
1. Se construye el espacio muestral (en un diagrama cartesiano), señalando los puntos
muestrales para cada dado.
2. Para el dado rojo existen 12 puntos muestrales, que resultan de la combinación (1 y 2) con
los puntos (1, 2, 3, 4, 5,6) del dado verde.
3. Para el dado verde existen 18 puntos muestrales al combinar los puntos (4, 5 y 6), con los
(1, 2, 3, 4, 5, 6) del dado rojo.
4. Se calcula la probabilidad para cada evento:
18 1 12 1
P { E1 }=P { V ≥ 4 } = = ; P { E2 } =P { R ≤ 2 }= =
36 2 36 3
5. Se sustituye en la fórmula para eventos independientes:
1 1 1
P { E1 y E2 } =P {V ≥ 4 y R ≤2 }=P { E 1 } . P { E2 }= ∙ =
2 3 6
6. También se obtiene el mismo resultado dividiendo los puntos muestrales de la intersección
de los dos eventos, por la cantidad de puntos muestrales del espacio muestral.
7. Interpretación: Si se lanzan dos dados simultáneamente, uno rojo y otro verde, la
probabilidad de que el verde muestre una cara con números mayores o iguales a 4 y el rojo,
menores o iguales a dos, es de 1/6.
hombre?. Evidentemente la probabilidad pedida es: pues hay 196 varones de los cuales 145 son
de derechas.
Esta probabilidad es la que llamamos Probabilidad condicionada del suceso B respecto al
suceso A. Dicho de otro modo, la probabilidad condicionada de un suceso B respecto de otro A es la
probabilidad del suceso B sabiendo que previamente ha ocurrido el suceso A.
si
Análogamente se define .
De lo anterior se deducen claramente las relaciones siguientes:
Ejemplo: De una urna que contiene 9 bolas rojas y 5 negras, se extraen sucesivamente 2 bolas.
Calcular la probabilidad de los siguientes sucesos:
a) Que las dos sean negras
b) Que las dos sean rojas
c) Que la segunda sea roja sabiendo que la primera fue negra.
Solución:
quedando: =
Como hemos visto, en el caso de sucesos dependientes teníamos la expresión:
ellos es distinta de cero, y sea B un suceso para el que se conocen las probabilidades ,
entonces la probabilidad del suceso B viene dada por:
Demostración:
entonces :
Teorema de Bayes
ellos es distinta de cero, y sea B un suceso para el que se conocen las probabilidades ,
entonces:
Demostración:
Ejemplo:
Se tiene dos urnas, la primera tiene 3 bolas blancas y 2 negras, la segunda tiene 2 bolas blancas y 3
negras. Se elige al azar una urna y de ella se extrae una bola. Calcular la probabilidad de que sea
blanca.
Supongamos ahora que realizada la extracción, la bola resulta ser blanca y queremos saber
qué probabilidad hay de que la bola proceda de la urna nº1.
● Una variable aleatoria es una variable que toma valores numéricos determinados por el
resultado de un experimento aleatorio. No hay que confundir la variable aleatoria con sus
posibles valores. Ejemplos:
- nº de caras al lanzar 6 veces una moneda (valores: 0, 1, 2…)
- nº de llamadas que recibe un teléfono en una hora
- tiempo que esperan los clientes para pagar en un supermercado…
En la práctica se consideran discretas aquellas variables para las que merece la pena asignar
probabilidades a todos los posibles sucesos elementales.
● Sea x una variable aleatoria discreta. Su distribución viene dada por los valores que puede
tomar, x1, x2, x3, …, xk, y las probabilidades de que aparezcan p1, p2, p3, …, pk. Estas cantidades
0.35
0.30
0.25
0.20
0.15
0.10
0 1 2 3
¿y la
probabilidad de que el número de caras esté entre 1 y 2?
● La probabilidad de que una variable aleatoria x tome un valor entre dos cantidades a y b será:
Función de distribución de x
1.0
0.8
0.6
0.4
0.2
0.0
0 1 2 3
Ejemplo:
x=resultado de lanzar un dado
La distribución de probabilidad de x será:
………………
● La idea de media o esperanza de una variable aleatoria continua es equivalente pero su cálculo
es algo más complicado porque requiere emplear el concepto de integral.
● La media de una variable aleatoria puede interpretarse como el valor esperado o medio que
toma dicha variable o como el valor central de dicha distribución.
● Propiedades:
- si x e y son dos variables aleatorias se cumple que:
a) Hallar la probabilidad de que todos los viajeros que van al aeropuerto tengan plaza.
b) Obtener la probabilidad de que se quede sin plaza alguno de los viajeros que va al
aeropuerto.
y su varianza será:
● Propiedades:
- si a y b son constantes se cumple que:
Ejercicio:
Se lanza tres veces una moneda. Sea x la variable aleatoria que expresa el nº de caras en los tres
lanzamientos.
a) Hallar y representar la función de probabilidad de x. (ver Ejemplo pag. 3)
Se lanza 3 veces una moneda:
E={CCC,CCX,CXC,XCC,XXC,XCX,CXX,XXX}
x=0 →{XXX}
x=1 →{XXC,XCX,CXX}
x=2 →{CCX,CXC,XCC}
x=3 →{CCC}
Sí, ya que en cada lanzamiento P(C)=1/2 y al lanzar tres veces se tiene que .
c) Hallar la desviación típica de x
● La desviación típica es una medida de dispersión que depende de las unidades de medida de la
variable. Para evitar este inconveniente podemos emplear el coeficiente de variación. El
coeficiente de variación de una variable aleatoria x será:
Ejercicio:
Sea x una variable aleatoria que expresa el nº de personas que habitan en una vivienda elegida al
azar. La distribución de probabilidad de x es la siguiente:
xi 1 2 3 4 5 6 7 8ó+
pi 0,230 0,322 0,177 0,155 0,067 0,024 0,015 0,010
b) Hallar la probabilidad de que el nº de personas que viven en un hogar sea menor o igual que
cuatro.
()
P(A ocurra m veces) = n [ P( A) ] [ P( A c ) ]
m n−m
m
Donde
n es el número de veces que se repite el experimento.
m es el número de veces que debe ocurrir A.
P(A) es la probabilidad que ocurra A al efectuar el experimento una sola vez.
P(Ac) es la probabilidad que no ocurra A al realizar el experimento una sola vez.
Ejemplo 1: Una marca de tabacos ha calculado que el número de fumadores en una ciudad es del
35%. Se escoge al azar una muestra formada por 10 personas. Comprueba si la variable que expresa
el número de fumadores dentro de la muestra sigue una distribución Binomial. En caso afirmativo
señala los parámetros de la distribución
Solución:
En cada prueba solo son posibles dos resultados:
A = individuo fumador
Ac = individuo no fumador
3 Todos los ejercicios son tomados del documento de Peña y Romo.
Ingeniera Jessica Liset Martínez 101
El resultado obtenido de la pregunta Fuma o no fuma en cada individuo de la muestra es
independiente de los otros.
La probabilidad del suceso A es P(A) = 0.35 constante.
Así pues la variable que representa el número de individuos fumadores en la muestra es una
variable aleatoria que sigue una distribución Binomial cuyos parámetros son n = 10 y p = 0.35.
A continuación le pasamos a explicar otra forma de la función de probabilidad de la
distribución Binomial, la media y varianza y pondremos algunos ejemplos que aclaren todos estos
conceptos.
La función de probabilidad de la distribución Binomial viene dada por la siguiente expresión
en otra forma:
()
P(Obtener x éxitos) = P(X=x)= n p x (1− p)n−x
x
Cómo el cálculo de estas probabilidades puede resultar algo trabajoso se han construido
tablas que nos proporcionan para los distintos valores de n y de x, la probabilidad de que la variable
X tome los distintos valores de 0 a n.
Parámetros de la distribución
Si tenemos una distribución Binomial de parámetro n y p se verifica que
Media o esperanza: μ=np
Varianza: σ 2=np(1− p)
Desviación típica: σ =√ np(1− p)
Se estudiaran algunos ejemplos que aclaren estos conceptos:
Ejemplo 2: Una prueba de inteligencia está compuesta por 10 preguntas, cada una de las cuales
tiene 4 respuestas y solo una de ellas correcta. Un alumno tiene prisa por acabar la prueba y decide
contestar aleatoriamente. Se pide
1. Probabilidad de acertar exactamente 4 preguntas
2. Probabilidad de no acertar alguna
3. Probabilidad de acertar todas
4. Probabilidad de acertar al menos 8
5. Probabilidad de acertar a los sumo 6
6. Media y varianza
Solución:
Consideremos los sucesos
A = Contestar bien P(A) = 0.25
Ac = No contestar bien P (Ac) = 0.75
Se trata de una distribución Binomial de parámetros B (10,0.25)
Sea X la variable aleatoria que representa el número de preguntas contestadas correctamente:
1. ( )
P ( de acertar 4 )=P ( X=4 ) = 10 (0.25)4 ( 0.75 ) =0.1460
4
10−4
3. ( )
P ( acertar todas )=P ( X =10 )= 10 (0.25)10 ( 0.75 ) =0
10
0
( )8 ( )
P ( acertar al menos 8 )= 10 (0.25)8 ( 0.75 ) + 10 (0.25)9 ( 0.75 ) + 0=0.005
2
9
1
( )
0 ( )
1
9
( ) 2 ( )
¿ 10 (0.25)0 ( 0.75 ) + 10 (0.25)1 ( 0.75 ) + 10 (0.25)2 ( 0.75 ) + 10 (0.25)3 ( 0.75 ) =0.7759
10 8
3
7
6. Media y Varianza
A continuación se proponen estos ejercicios para que los realicen los alumnos
Ejercicio 1:
La probabilidad de que un estudiante obtenga el título de licenciado en Geografía e Historia
es de 0.3. Halla la probabilidad de que de un grupo de siete estudiantes matriculados en primer curso
1. Ninguno de los 7 finalice la carrera
2. Finalicen todos la carrera
3. Al menos 2 acaben la carrera
4. Halla la media y la desviación típica
Solución:
Consideremos los sucesos:
A = Finalizar la carrera P(A) = 0.3
= No finalizar la carrera P ( ) = 0.7
Por tanto se trata de una distribución Binomial de parámetros B (7,0.3)
Sea X la variable aleatoria que representa el número de estudiantes que obtienen el título de
licenciado en Geografía e Historia
a)
Media y varianza
figura 2.5.2
Una característica muy importante de la curva normal es que a partir de su eje de simetría se
puede dividir como lo muestra la figura 2.5.3, de tal manera que el valor igual a cero de la gráfica
corresponda siempre a la media aritmética de la distribución normal de datos, y luego los datos
nominales se pueden transformar a uno equivalente de la escala de – 3 a +3 de la figura 2.5.3.
Por eso, a los datos comprendidos en la escala de - 3 a + 3 se les llama dato estándar.
figura 2.5.3
En esa escala estandarizada, el 1 representa una desviación estándar, el 2 representa dos
desviaciones estándares, y así sucesivamente. El signo positivo solamente indica que está a la
Ingeniera Jessica Liset Martínez 105
derecha del cero y el signo negativo significa que está a la izquierda. Con los ejemplos venideros se
aclararán esos significados.
ESTANDARIZACIÓN DE DATOS
Por lo dicho en el párrafo anterior, los datos pertenecientes a una distribución normal se
pueden estandarizar o normalizar, lo cual se consigue utilizando la fórmula:
x−x́
z=
s
En donde:
z = dato estandarizado o normalizado z
x = valor nominal del dato a estandarizar x
x́ = media aritmética del conjunto de datos x
s = desviación estándar. s
Ejemplo 1: Convertir cada uno de los datos nominales de la siguiente tabla a datos estandarizados.
Solución:
Para transformar un dato nominal en dato estándar, también llamado dato z, se requiere
calcular la media de todo el conjunto. Para este caso ya se da por hecho que se sabe calcular la
media y la desviación estándar, por lo que se omiten sus cálculos. La media es y la desviación x́
= 12 estándar es s = 0.2994
Se tienen ya todos los datos para utilizar la fórmula del dato:
x−x́
x f xf z= Dato z
s
6 1 6
7 2 14
8 3 24
9 5 45
10 9 90
11 15 165
12 18 216
13 15 195
14 9 126
15 5 75
16 3 48
17 2 34
18 1 18
88
En una curva normal, el área bajo la curva desde el extremo izquierdo hasta la media, es
decir, hasta el eje de simetría, es del 50% y, obviamente, el otro 50% está en la parte derecha.
Una característica importante de la curva normal y de los datos normalizados es que el área
bajo la curva desde la media hasta una desviación estándar, es decir desde z = 0 hasta z = 1, ya sea a
la izquierda o a la derecha, siempre es del 34.13% respecto del área total que puede haber bajo la
curva.
De la misma forma, el área bajo la curva desde la media hasta dos desviaciones estándar, es
decir desde z = 0 hasta z = 2, ya sea a la izquierda o a la derecha, es del 47.72%.
Como la curva normal sale de graficar los datos recolectados, es obvio que esos porcentajes
de áreas bajo la curva también lo son para dichos datos, es decir, para una desviación estándar, el
porcentaje de datos entre la media y z = 1 es de 34.13% aproximadamente; para dos desviaciones
estándar el porcentaje de datos entre la media y z = 2 es también aproximadamente de 47.72%.
Por lo tanto, es posible obtener el porcentaje de área bajo la curva entre la media y cualquier
valor estandarizado z, lo cual se ha concentrado en una tabla. La tabla de áreas bajo la curva, de los
valores de z normalizados, en anexo 1.
Esto último es muy importante: Debe tomarse en cuenta que los valores mostrados en la
tabla son siempre desde la media hasta el valor estandarizado z.
Ejemplo 2: Al recolectar 250 datos, se obtuvo que la media es x́ = 7.65 y la desviación estándar
s = 2.24. Calcular el número de datos aproximados que hay entre la media y el dato nominal x = 8.1
Solución:
Ingeniera Jessica Liset Martínez 107
En este caso el enunciado proporciona los valores de la media y de la desviación están-dar.
Entonces, hay que estandarizar el valor nominal x = 8.1 con la fórmula de z.
x−x́ 8.1−7.65
z= = =0.20
s 2.24
Se toman solamente dos decimales porque así vienen en las tablas. A continuación, se busca
en la tabla el valor de z = 0.20, para lo cual se localiza en la columna de la izquierda el valor z = 0.2
y en la primera fila de la tabla el 0. La celda intersección de la columna con la fila es el valor del
área bajo la curva que se busca.
El valor que le corresponde de 7.93% es el porcentaje de área bajo la curva entre la media y
el dato z = 0.20, pero como ese porcentaje también corresponde a los datos recolectados, entonces
puede obtenerse por una simple regla de tres el número de datos nominales comprendidos en esa
región:
250 nd
=
100 7.93
de donde el número de datos es nd.
250 ×7.93
nd= =19.82
100
El número datos en forma calculada es nd = = 19.82, pero ese valor carece de sentido ya que
los datos recolectados siempre son números enteros, porque se recolectan 200 datos, o 220 datos, o
300 datos, pero jamás 291.8. Entonces entre la media aritmética y el dato z = 0.20 no pueden haber
19.82 datos nominales, o hay 19 o hay 20, pero no una fracción de ellos. De manera que lo correcto
es redondear y expresarlo no como que “es igual”, sino como “aproximadamente”. La solución
entonces se expresa así: Hay aproximadamente 20 datos entre la media de 7.65 y el dato nominal de
8.1.
Ejemplo 3: Al recolectar 850 datos con una distribución normal, se obtuvo una media de x́ =
27 y una desviación estándar s=5.34. Calcular el número de datos aproximados que hay entre la
media y el dato nominal x= 20.
Solución:
En este caso el enunciado proporciona los valores de la media y de la desviación están-dar.
Hay que convertir el valor nominal x= 20, con la fórmula:
x−x́ 20−27
z= = =−1.31
s 5.34
850 nd
=
100 40.49
de donde el número de datos es nd.
850 × 40.49
nd= =344.16
100
Hay aproximadamente 344 datos entre la media y el dato nominal.
Otro problema que puede presentarse es cómo obtener el porcentaje de área bajo la curva ya
no a partir de la media, sino entre dos datos nominales.
Hay dos opciones: La primera es que los datos estandarizados z 1 y z2 se localicen uno a la
izquierda y el otro a la derecha de la media. La solución a éste nuevo problema es muy simple, pues
por una lógica muy elemental se puede deducir que el área total es igual a la suma del área 1 más el
área 2, como se ve en la figura, en donde A 1 es el área desde la media hasta el dato estandarizado z 1,
la cual se obtiene de la tabla. Mientras que A2 es el área desde la media hasta el dato estandarizado
z2.
Otra opción que puede presentarse es la que se muestra a continuación, consistente en que
ambos valores estandarizados, se encuentren del mismo lado respecto de la media, en la que también
por una lógica muy elemental puede deducirse que el área total es simplemente la resta del área 1
menos el área 2. De tal manera que el porcentaje de datos entre z1 y z2 es la resta de porcentajes
bajo la curva de cada uno. Como se muestra en la figura.
Ejemplo 5: De un conjunto de datos con una distribución normal, se obtuvo una media de x́ =
43.2 y una desviación estándar s = 8.9. Calcular el porcentaje de área bajo la curva que hay entre el
dato nominal x1 = 53 y el dato nominal x2 = 68.
Solución: Estandarizando ambos datos nominales y localizando en las tablas el porcentaje de área
bajo la curva que a cada uno le corresponde se obtiene que:
x− x́ x− x́
z 1= z 2=
s s
53−43.2 68−43.2
z 1= =1.10 z 2= =2.78
8.9 8.9
A1 = 36.43% A2 = 49.73%
El porcentaje total de área bajo la curva es la resta de ambas:
figura 1
Supongamos que queremos calcular P{ Z ≤-1.53}. Dicha probabilidad está representada por
el área sombreada en la figura 3.
figura 3
El número – 1.53 no figura en la tabla, pero eso no nos impide calcular la probabilidad en
cuestión. Simplemente hay que tener en cuenta que, por la simetría de la campana de Gauss se tiene:
P{Z -1,53}= P{Z >1,53}
La probabilidad que figura en el segundo miembro de la ecuación está representada en el
área sombreada en la figura 4:
figura 4
Dicha probabilidad es la complementaria de la probabilidad P{Z ≤ 1.53}, representada en la figura 5
figura 5
Es decir: P{Z ≤1,53}+ P{Z >1,53}=1. Para hallar P{Z≤1,53} simplemente vamos a la tabla
y procedemos como en el caso 1:
figura 7
Dicha probabilidad se puede calcular como
P{ 0,41 < Z ≤ 1,62}.= P{ Z ≤ 1,62}- P{Z ≤ 0,41}.
El minuendo y el sustraendo están representados por las áreas sombreadas en las figuras 8 y
9, respectivamente.
figura 8
figura 9
4) Cálculo de la probabilidad de que un normal con parámetros cualesquiera caiga entre dos
valores dados.
Supongamos que queremos calcular P{2,3 < X ≤ 3,7}. Donde X es una variable aleatoria
normal con parámetros µ=1,5 y =2 Esta probabilidad está representada por el área sombreada en
la figura 10.
.
figura 10
Para calcular esta probabilidad, llevamos la variable X a una normal típica, restando µ y
dividiendo entre σ :
P{2,3 < X ≤ 3,7} = P{(2,3 - µ) / σ < (X-µ) / σ ≤ (3,7-µ) / σ } =
la variable Z= (X-µ) σ tiene distribución normal típica. La probabilidad que se quiere calcular es
igual al área sombreada en la figura 11:
La resolución del problema se reduce
entonces a lo explicado en la parte 3.
P{2,3 < X ≤ 3,7}
= P{0,4< Z ≤ 1,1 }
= P{ Z ≤ 1,1 } – P{ Z ≤ 0,4 }
= 0,8643 - 0,6554
= 0,2089
figura 11
TABLA I (A)
DISTRIBUCIÓN NORMAL TIPIFICADA N(0 , 1)
La tabla proporciona, para cada valor de z, el área que queda a su izquierda.
TABLA I (B)
DISTRIBUCIÓN NORMAL TIPIFICADA N(0 , 1)
La tabla proporciona, para cada valor de z, el área que queda a su izquierda.
TABLA II
DISTRIBUCIÓN NORMAL TIPIFICADA N(0 , 1)
La tabla proporciona el área que queda comprendida entre 0y z.
BIBLIOGRAFÍA
Sitios Web:
http://www.itch.edu.mx/academic/industrial/estadistica1/toc.html
http://es.scribd.com/doc/37268578/Distribucion-muestral-3#download
http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un3/cont_305_83.html
http://matematica1.com/category/distribucion-normal/
Documentos:
Probabilidad y Distribuciones de Probabilidad. Héctor Hernández Primitivo Reyes Aguilar.
Enero 2009.
http://cms.dm.uba.ar/academico/materias/verano2014/probabilidades_y_estadistica_C/tabla_
tstudent.pdf
http://juancarlosvergara.50webs.org/Apuntes/Ejercicios%20Parte%20II.pdf
Libros:
ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA. ANDERSON -SWEENEY-
WILLIAMS. 10ª EDICION
INTRODUCCION A LA ESTADÍSTICA. LINCOLN L. CHAO.
Estadística para Ciencias del Comportamiento. Elorza, Haroldo.
Estadística Psicoeducativa Trillas. Escotet, Miguel.
Estadística en Psicología y Educación. Garret, Henry H.
Estadística General. Haber y Rynion.
Métodos Estadísticos aplicados a las Ciencias Sociales. Stanley/Glass.
Estadística. Teoría y Problemas. Spiegel, Murria
Otros materiales entregados por la maestra.
Estadística. Serie Schaum Spiegel M. R.
Carrasco Arroyo, S (2005): Aproximación a la Estadística desde las Ciencias Sociales.
Valencia, España.http://www.uv.es/carrascs/PDF/aproximacion%20estadistica.pdf
Zavrostsky, A: Varias definiciones de la Estadística. Revista de Economía. Facultad de
Ingeniería. Universidad de Los Andes, Venezuela.
http://iies.faces.ula.ve/Revista/Articulos/Revista_02/Pdf/Rev02Zavrotsky.pdf
1. OBJETIVOS
Reforzar los conceptos básicos de estadística descriptiva.
Elaborar distribuciones de frecuencias según los pasos discutidos en clases.
Utilizar los distintos tipos de gráficos para presentar la información en estudio.
2. METODOLOGÍA
Los estudiantes, después de haber discutido y estudiado los temas de estadística descriptiva,
con ayuda de la docente; procederán a la lectura de la guía propuesta, desarrollándola de forma
grupal e individual, durante el tiempo determinado y asignado al desarrollo de las horas prácticas
dentro y fuera del aula, asistidos por la docente responsable de dicha práctica.
3. EJERCICIOS
I PARTE:
A. En este módulo es importante entender algunos conceptos básicos antes de seguir adelante.
Responde las preguntas y realiza las actividades siguientes, que sintetizan los principales
aspectos del módulo.
1. ¿Cuál es la diferencia entre Estadística y Estadísticos?
2. Piensa ejemplos de Estadísticos que puedan resultar útiles para aplicar en el campo de las
relaciones laborales.
3. Explica la diferencia entre Estadística Descriptiva y Estadística Inferencial.
4. Distingue entre población y muestra. Cita ejemplos de estudios para los cuales sea factible
trabajar con toda la población (censo) o con muestras. Fundamenta.
5. ¿Qué relación hay entre las unidades de análisis y la población?
6. Piensa ejemplos de variables con sus sistemas de categorías. Identifica el nivel de medición.
B. Se quiere realizar un estudio para conocer el perfil que los docentes, deben cumplir para ser
elegidos en el sistema público, y su tipo de contratación.
Imagina qué características podrían ser de interés estudiar. Identifica las variables que se
corresponden con esas características y el sistema de categorías que les asignarías. Menciona el
nivel de medición de cada variable. Construye la estructura de la matriz de datos en la cual se
volcaría la información recogida.
C. Identifica las escalas de medición de las siguientes variables, de acuerdo al sistema de
categorías que se les ha asignado.
Variable Categorías Escala de
medición
Nivel Ninguno
educativo Primaria
Secundaria
Terciaria
Nivel 0 año aprobado
educativo 1 año aprobado
2 años aprobados
Categoría de Patrón
ocupación Empleado público
Empleado privado
Cooperativista
Trabajador por cuenta propia
Trabajador familiar no remunerado
I PARTE:
1. Identifique el Tipo de Variables en Cualitativas ( nominal – ordinal ) – Cuantitativas. (discretas y
continuas )
a) Genero ( sexo ) de la persona .
b) Color de ojos de la persona.
c) Tiempo transcurrido desde el nacimiento hasta el momento de la toma del dato.
d) Número de hijos en la familia.
e) Percepción que tiene el médico del mejoramiento de un paciente.
f) Longitud del cuerpo humano, sin usar zapato.
g) Tipo de cáncer que se diagnostica..
h) Nombre del periódico matutino que se lee.
i) Temperatura medida a las 6.00 a.m.
j) Volumen de llenado de la botella de leche.
k) Número de piezas defectuosas por hora.
l) Grado de interés del entrevistado en asuntos políticos.
m) Longitud recorrida desde la casa.
2. Para cada una de las siguientes variables determine los valores, si la variable es Cualitativa o si
es Cuantitativa en ( discreta – continua)
a.- Estado de salud de una persona.
b.- Precio de una calculadora científica.
c.- Número de llamadas que recibe un conmutador.
d.- Monto de una compra al contado que se hace en una tienda.
e.- Temperatura corporal de una persona con gripe.
f.- Analgésico que toma una persona para aliviar un dolor de cabeza.
g.-Número de transacciones realizadas al día en cierto cajero automático
h.- Tipo de cirugía a la que es sometido un paciente en cierto hospital.
i.- Tiempo de préstamo de cierto libro otorgado a un estudiante.
j.- Nivel de ansiedad de una persona medido por una prueba estandarizada.
k.- Severidad de las quemaduras en una persona rescatada de un incendio.
l.- Consumo diario de agua que hace una persona.
ll.- Posible presencia de parásitos en un paciente que presenta problemas digestivos.
m.- Tipo de complicación que padeció un bebé al momento de nacer.
n.- Posible causa de alta temperatura en una persona.
ñ.- grado de toxicidad del veneno de una araña.
o.-Fecha de nacimiento de una persona.
p- Intensidad con que siente una persona un dolor de cabeza.
Tamaño Nº de animales
Pequeño 4
Mediano 6
Grande 10
4. En una empresa ganadera se han pesado los animales y se han obtenido los siguientes datos.
Peso (Kgs ) Nº de animales
300 - 400 1
a) ¿Qué porcentaje de 400 - 500 2 los animales pesa entre 500
y 600? 500 - 600 10
b) ¿Qué porcentaje de 600 - 700 2 los animales pesa más de
400?
c) ¿Qué porcentaje de los animales pesa como mínimo 600 kilos?
d) Construya un histograma con la información de la tabla.
5. Los siguientes datos corresponden a los lugares favoritos de vacaciones de los empleados de un
empresa.
6. Considere la siguiente situación. En una gran compañía, se está desarrollando un programa para
ofrecer a los trabajadores una prestación que les permita adquirir un automóvil nuevo a un costo
moderado tanto para el trabajador como para la empresa. Sin embargo, el contrato de
arrendamiento implica decidir qué tipo de automóvil prefieren los trabajadores, pues en función
de esto se podrá seleccionar la mejor empresa arrendadora. El gerente de recursos humanos
realiza un muestreo aleatorio simple en la nómina de la empresa: selecciona 60 trabajadores sin
importar los niveles, y les aplica una encuesta en la cual les pregunta cuál sería la marca de su
preferencia. A continuación se presentan los resultados.
FORD = F CHEVROLET = CH MAZDA = M VOLKSWAGEN = V
NISSAN = N OTROS = O.
F CH CH F M CH F CH CH O
V F N CH CH CH F CH V V
N CH CH N M M O V F F
CH CH N F CH V V V CH V
M V CH CH V N O V F M
CH V V M CH CH CH O V M
a.- Construya una tabla de Distribución de Frecuencia para dichos datos.
b.- Construya un gráfico para este tipo de tabla.
c.- De la tabla saque tres conclusiones.
5 6 6 6 3 4 7 5 5 9
6 6 6 4 5 5 5 5 5 4
7 4 4 5 3 4 6 4 7 5
5 7 6 5 7 7 4 5 8 6
8. Construya una tabla de distribución de frecuencias , con los puntajes obtenidos en la Prueba
de ingreso Universitario, en una muestra de 50 estudiantes.
331 625 450 519 730 427 640 619 690 409
535 573 370 760 328 612 569 592 674 438
526 715 430 372 333 405 710 777 381 461
462 539 581 468 755 440 629 810 670 570
675 489 460 613 789 390 544 632 487 465
a.- ¿Cuántos estudiantes obtuvieron entre 504 y menos de 548 puntos?
b.- ¿Qué porcentaje de los estudiantes obtuvo entre 680 y menos 724 puntos?
c.- ¿Cuántos estudiantes obtuvieron menos de 680 puntos?
d.- ¿Qué porcentaje de los estudiantes obtuvo menos de 504 puntos?
e.- ¿Cuántos estudiantes obtuvieron 636 puntos y más?
f.- Construya un gráfico para este tipo de tabla.
10. Las notas del examen parcial de matemática dieron la siguiente distribución de frecuencias.
a) Completar la distribución de frecuencias.
b) Graficar el histograma de porcentajes.
Intervalos Marca Clase Frecuencia Relativa Frec. Relat. Acumulada
3 - 0.15
6 - 0.45
0.70
13.5
0.10
11. Señala 4 áreas distintas en las cuales se utilice la estadística como herramienta de
investigación.
12. Se desea saber si los dueños de automóviles catalíticos están dispuestos a pagar la conversión
de sus motores a gas natural. Para ello se decide realizar una encuesta.
a) Determina cuál de las siguientes es la mejor muestra:
Escoger al azar a adultos que caminan por el centro de las principales ciudades del país.
Escoger al azar a conductores de automóviles en las intersecciones más concurridas.
Escoger al azar del registro de vehículos motorizados a dueños de automóviles catalíticos y
enviarles un encuestador.
b) Explica la razón de tu elección, señala las ventajas y desventajas de cada alternativa.
c) ¿cuáles son las variables en la encuesta? ¿A qué tipo de variables corresponden?
13. A continuación aparece una distribución de frecuencias de los niveles de zinc en la sangre en
hombres entre las edades de 15 y 17 años de edad.
VARONES ESTADOUNIDENSES, DE 15 A 17 AÑOS DE EDAD.
Nivel de zinc en la sangre (Ug/dl) Cantidad de Varones
50 - 19 6
60 - 69 35
70 - 79 110
80 - 89 116
90 - 99 91
100 - 109 63
110 - 119 30
120 . 129 5
130 - 139 2
140 - 149 2
150 - 159 2
a) Calcule la frecuencia relativa asociado a cada intervalo de la tabla. ¿Qué concluye usted
acerca de la distribución de niveles de zinc en la sangre?
b) Diseñe un histograma de los datos. 4
1. OBJETIVOS
Practicar el uso de las distintas fórmulas de las medidas de tendencia central y dispersión.
Realizar el análisis y comparación de los distintos cálculos de medidas.
Fomentar el uso de medidas de tendencia central y dispersión en el análisis de información.
2. METODOLOGÍA
Los estudiantes, después de haber discutido y estudiado los temas de estadística descriptiva,
con ayuda de la docente; procederán a la lectura de la guía propuesta, desarrollándola de forma
grupal e individual, durante el tiempo determinado y asignado al desarrollo de las horas prácticas
dentro y fuera del aula, asistidos por la docente responsable de dicha práctica.
3. EJERCICIOS
I PARTE: Tendencia Central
1. En una calle de la ciudad se midieron con radar las velocidades de 55 automóviles:
27 23 22 38 43 24 35 26 28 18 20
25 23 22 52 31 30 41 45 29 27 43
29 28 27 25 29 28 24 37 28 29 18
26 33 25 27 25 34 32 36 22 32 33
21 23 24 18 48 23 16 38 26 21 23
a. Clasifique estos datos en una distribución de frecuencias agrupada utilizando las clases 15-20,
20-25 ..., 50-55.
b. Encuentre el ancho de clase.
c. Obtenga las distintas medidas de tendencia centra: Media mediana moda
d. Obtenga el primer y tercer cuartil
e. Obtenga las distintas medidas de variabilidad: La varianza el desvío estándar de la muestra
f. Elabore un pequeño informe con los resultados obtenidos.
2.En mayo pasado se aplicó una encuesta a 32 estudiantes de UTN. A cada estudiante se le preguntó
:"¿cuántas horas de televisión vio ayer?". Los resultados son los siguientes:
0 0 1/2 1 2 0 3 2 .5
0 0 1 1.5 5 2.5 0 2
2.5 1 0 2 0 2.5 4 0
6 2.5 0 0.5 1 1.5 0 2
2) Calcular todas las medidas de dispersión para los datos de la siguiente distribución
x 0– 100– 200– 300-
100 200 300 800
n 90 140 150 120
6) Tenemos una variable X de la que sabemos que: CV = 0,5 y que Sx = 3. ¿Cuál es el valor de la
media de X?.
7) El coeficiente de variación de la variable X sabemos que es 1 ¿Qué podemos decir sobre su media
y su varianza?
8) Tenemos dos variables X e Y con el mismo recorrido y media, siendo sus varianzas 4 y 9
respectivamente. ¿Para cuál de las dos variables el valor de la media es más representativo?
9) Sea una variable con media 8 y desviación típica 0. ¿Qué se puede afirmar sobre el
comportamiento de esta variable?.
10) La distribución de edades del Censo Electoral de Residentes a 1 de enero de 1.999 para las
comunidades autónomas de Aragón y Canarias, en tantos por cien es la siguiente:
a) Representa sobre los mismos ejes de coordenadas los histogramas de la distribución de la edad
para las dos CC.AA. (emplea distinto trazo o distintos colores). ¿Qué conclusiones obtienes a la
vista de los histogramas?
b) Calcula la edad mediana para las dos comunidades. Compáralas. ¿Qué indican estos
resultados?
c) Qué comunidad tiene mayor variabilidad en la distribución de su edad?
11).En el siguiente histograma se representa la distribución de los salarios (variable X), en miles de
pesetas de una industria del sector cerámico:
Fre cuen cias r elativas
13) En un taller de reparación de automóviles recojo datos sobre los días de permanencia de los
vehículos a reparar en él, y obtengo:
Días de estancia 1 2 3 4 5 8 15
Nº de coches 23 12 7 10 3 2 1
a) Calcula el número medio de días de permanencia y una medida de su representatividad
b) ¿Cuantos días como máximo permanecen en el taller el 75% de los automóviles, que menos
permanecen en el taller?
c) Calcula la mediana y la moda
Calcula:
a) El C.I. medio de los niños estudiados
b) Su desviación típica.
c) Si una madre afirma que exactamente la mitad de los niños del colegio tienen un C.I. superior
al de su hijo, ¿qué C.I. tiene el niño?
d) Supongamos que se quieren hacer estudios sobre el proceso de aprendizaje de los niños con
mayor C.I., pero que el psicólogo solo puede atender al 15% de los niños del centro. ¿Qué C.I.
deberá tener un niño como mínimo para ser considerado dentro de ese grupo de elegidos?
e) Se van a preparar unas clases de apoyo, para un 25% de los niños del centro, precisamente para
aquellos que tengan menor C.I. ¿Hasta qué niños de qué C.I. deberemos considerar en estas
clases?
18) La tabla siguiente recoge la distribución (en porcentajes) de volúmenes de ventas anuales en las
empresas cerámicas de la provincia durante el año pasado:
b) Estime el porcentaje de viviendas con rentas superiores o iguales a 26 000 soles pero menores
que 32 000 soles.
c) Si las rentas menores que 28 300 soles se incrementaron en 2 500 soles y las rentas mayores o
iguales que 28 300 soles se redujeron en un 30%. Calcule la nueva renta promedio.
Prueba
1 2 3 4 5 6 7
Puntaje obtenido por A 57 55 54 52 62 55 59
Puntaje obtenido por B 80 40 62 72 46 80 40
3) Se toman las medidas de 80 personas las que tienen estatura media de 1.70 m y desviación
estándar de 3.4 cm. Posteriormente se verificó que la media usada tenía 4 cm de menos.
Rectifique los estadígrafos mencionados.
4) Una asistencia social desea saber cuál es el índice de natalidad en 2 distritos de Lima para lo que
encuestó a 10 familias de cada distrito con los siguientes resultados
A 0 6 1 2 3 1 4 3 6 4
B 3 4 1 4 2 3 1 5 4 3
5) La producción de papa en Tn. fue de 4000 Tn. con variancia de 3600 para el departamento de
Cuzco, mientras que para el departamento de Puno fue de 10 000 Tn. con 1440000 de variancia,
en qué departamento se puede decir que la producción de papa es más homogénea
6) El salario promedio en una ciudad es de 11 000 u.m. con una variancia de 2 000 u.m. ¿Cuáles
serán la nueva media y la nueva variancia si se efectúan los siguientes cambios:
a) Se aumenta 810 u.m a todos
b) Se aumenta el 15 % de su salario a cada trabajador
c) Si se duplican los sueldos
7) En un examen 20 alumnos del curso A obtienen una media de 60 puntos. y desviación estándar
de 20 puntos
En el curso B los alumnos obtienen una media de 80 y desviación estándar de 16. Ante un
reclamo se decide subir en 5% más 5 puntos adicionales a todos los alumnos del curso A, en
cambio como hubo muchas copias en el curso B se decidió disminuir la quinta parte de la
calificación.
Después de los mencionados ajustes ¿Cuál es el puntaje medio de los 50 alumnos?
8) Los siguientes datos pertenecen a la distribución de la producción de papas (en Tn.) en 40 zonas
del país
Y1´=20 f2-f5=2 Y5´= 100 f1=4 f3=20
Si se sabe que la distribución es simétrica y presenta 5 intervalos de clase.
a) Reconstruya los intervalos de clase y obtenga las frecuencias absolutas
b) Calcule la media, la mediana y moda e interprételos
c) Calcule la variancia, desviación estándar y coeficiente de variabilidad
UNIVERSIDAD DE EL SALVADOR
FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE
DEPARTAMENTO DE MATEMATICA
ESTADÍSTICA APLICADA A LA EDUCACION
GUÍA DE PRÁCTICA Nº 3
TEMA: TECNICAS DE CONTEO
1. OBJETIVOS
Utilizar las distintas técnicas de conteo vistas en clase.
Determinar los distintos ejemplos de combinación y permutación.
Fomentar el uso de técnicas de conteo y su aplicación en el medio.
2. METODOLOGÍA
Los estudiantes, después de haber discutido y estudiado los temas de estadística descriptiva,
con ayuda de la docente; procederán a la lectura de la guía propuesta, desarrollándola de forma
grupal e individual, durante el tiempo determinado y asignado al desarrollo de las horas prácticas
dentro y fuera del aula, asistidos por la docente responsable de dicha práctica.
3. EJERCICIOS
Técnicas de Conteo
1. En un sistema de comunicación digital, cada mensaje se clasifica según llega o no dentro del
tiempo establecido por el diseño del sistema. Si se clasifican tres mensajes, utilice un
diagrama de árbol para representar el espacio muestral de los posibles resultados.
2. La orden de pedido de un automóvil puede especificar transmisión automática o estándar,
con o sin aire acondicionado, y uno de cuatro colores: rojo, azul, negro o blanco. Utilizando
la regla de la multiplicación y el diagrama de árbol, describa el conjunto de todos los pedidos
posibles para este experimento.
3. En el diseño de la cubierta de un tren de engranes pueden emplearse cuatro tipos diferentes
de sujetadores, tres longitudes distintas de tornillo y tres posiciones diferentes de éstos.
Utilice la regla de la multiplicación para conocer el espacio muestral formado por el
experimento.
4. Una persona acomoda en un estante de una librería seis libros de filosofía, cuatro de química
y ocho de historia. De cuántas formas se pueden acomodar los libros si:
a) los de historia siempre deben de ir juntos
b) los libros deben de ir separados por materias
5. Un examen de métodos numéricos está formado por tres temas. EL tema A contiene seis
preguntas, el tema B cuatro y el tema C ocho preguntas y se tienen que contestar mínimo tres
preguntas de cada tema, calcula de cuántas maneras diferentes un estudiante puede elegir sus
preguntas.
6. Se quieren formar arreglos de cuatro cifras con los números 0 a 9.
a) ¿cuántos números diferentes de cuatro cifras se pueden formar con los números 0 a 9 si no
se permite la repetición y el cero no puede ir al principio y los números formas pueden ser
cualesquiera?
b) Los números formados del inciso a) deben ser pares.
8
9
Figura 1.1
R A G B
R A G B
R A B
Figura 1.2
8. Se tienen 7 personas para sentar en una mesa circular. De cuántas formas puedo sentarlas:
a. Sin restricciones. (6!)
b. Si dos de las personas insisten en sentarse juntas. (5!*2)
9. En un computador los nombres de los archivos son palabras que tienen de uno a cinco
caracteres, cada carácter puede ser alguno de los 36 alfanuméricos (26 letras y 10 dígitos) o
cualquiera de otros 15 símbolos determinados. El computador no distingue mayúsculas de
minúsculas. También es posible añadir al nombre del archivo una extensión de archivo
opcional, la cual es de tres caracteres alfanuméricos, esta extensión se obtiene al escribir un
punto y tres caracteres alfanuméricos.
a. Sin restricciones.
b. ¿Cuántos nombres de archivo utilizan solamente los 36 caracteres alfanuméricos, sin
extensión?
c. ¿Cuántos de los nombres de archivo de la parte (b) comienzan con una A?
d. ¿Cuántos nombres de archivo utilizan extensiones?
Combinaciones
1. Responda:
a. ¿Cuántas permutaciones de tamaño dos pueden producirse con las letras m, p, i y a?
Enumérelas. (12)
b. Enumere todas las combinaciones de tamaño dos pueden producirse con las letras m,
p, i y a. (6)
2. Calcule C(6,2) y verifique su respuesta enumerando todas las selecciones de tamaño dos que
se pueden hacer con las letras a, b, c, d, e y f. (15)
3. Diana debe hacer un viaje de cuatro horas en autobús de regreso a su escuela, decide llevar
consigo 5 revistas de las 12 de su hermana. ¿De cuántas formas puede Diana hacer su
selección? (C(12,5))
4. La directora de un coro debe elegir 6 himnos para el acto cívico de su escuela. Ella tiene tres
libros de himnos, cada uno de los cuales contiene 10 himnos (en total hay 30 himnos
distintos). De cuántas formas puede elegir los himnos si desea elegir:
a. Sin restricciones. (C(30,6))
b. Dos himnos de cada libro. (C(10,2) * C(10,2) * C(10,2))
c. Al menos un himno de cada libro. (C(10,1) * C(10,1) * C(10,1) * C(27,3))
5. De la siguiente lista se eligen 4 números: -5, -4, -3, -2, -1, 1, 2, 3, 4.
a. ¿De cuántas formas se puede hacer la selección de modo que el producto de los
cuatro números sea positivo y los números sean distintos? (C(5,4) + C(5,2) * C(4,2)
+ C(4,4))
b. ¿De cuántas formas se puede hacer la selección de modo que el producto de los
cuatro números sea negativo y los números sean distintos? (C(5,1) * C(4,3) + C(5,3)
* C(4,1))
6. Se tiene un plano de 15 puntos, de los cuales no hay tres alineados, o sea, no hay tres en la
misma recta.
a. ¿Cuántas rectas determinan? (C(15,2))
b. ¿Cuántos triángulos determinan estos puntos? (C(15,3))
7. Se tiene un alfabeto con los símbolos 0, 1 y 2. Se quieren obtener cadenas de longitud 10.
Cuántas de estas tienen:
a. Cuatro 0, tres 1 y tres 2. (C(10,4) * C(6,3) * C(3,3))
b. Al menos ocho 1. (C(10,8) * 22 + C(10,9) * 21 + C(10,10) * 20)
c. Peso 4, sumando sus dígitos de 4. (C(10,4) * 16 + C(10,2) * 18 + C(10,1) * C(9,2) *
17)
8. En el sistema Braille, un símbolo, como una letra minúscula, un signo de puntuación, un
sufijo, etc., se escribe resaltando al menos uno de los puntos de los 6 puntos que aparecen en
la parte (a) de la figura 1.3.
a. ¿Cuántos símbolos diferentes podemos representar en el sistema Braille? (C(6,1) +
C(6,2) + C(6,3) + C(6,4) + C(6,5) + C(6,6))
b. ¿Cuántos símbolos tienen exactamente tres puntos en relieve? (C(6,3))
c. ¿Cuántos símbolos tienen un número par de puntos relieve? (C(6,2) + C(6,4) +
C(6,6))
d. ¿Cuántos símbolos tienen al menos cuatro puntos relieve? (C(6,4) + C(6,5) + C(6,6))
1 4
2 5
3 6
1. OBJETIVOS
Practicar el uso de las distintas fórmulas de las medidas de tendencia central y dispersión.
Realizar el análisis y comparación de los distintos cálculos de medidas.
Fomentar el uso de medidas de tendencia central y dispersión en el análisis de información.
2. METODOLOGÍA
Los estudiantes, después de haber discutido y estudiado los temas de estadística descriptiva,
con ayuda de la docente; procederán a la lectura de la guía propuesta, desarrollándola de forma
grupal e individual, durante el tiempo determinado y asignado al desarrollo de las horas prácticas
dentro y fuera del aula, asistidos por la docente responsable de dicha práctica.
3. EJERCICIOS
EJERCICIOS DE PROBABILIDAD
1.- Lanzamos una moneda 5 veces. ¿Cuántos resultados distintos se pueden dar?.
¿Cuál es la probabilidad de no obtener 5 caras?.
2.- Tenemos que guardar 5 folios en 7 sobres. ¿De cuántas formas distintas lo podemos hacer?
a Si en cada sobre no puede ir más de un folio.
b Si en cada sobre pueden ir hasta cinco folios.
3.- En una urna opaca tenemos 12 bolas del mismo peso y forma. Cinco de ellas son Blancas, tres
son Negras y cuatro son Rojas. Extraemos dos bolas al azar, una detrás de otra y sin
devolverlas a la urna.
Hallar la probabilidad de que las dos sean Negras.
Hallar la probabilidad de que la primera sea Negra y la segunda Roja.
4.- En una urna opaca tenemos 12 bolas del mismo peso y forma. Cinco de ellas son Blancas, tres
son Negras y cuatro son Rojas. Extraemos una bola, anotamos su color, la devolvemos a la urna
y extraemos otra bola.
Hallar la probabilidad de que las dos sean Negras.
Hallar la probabilidad de que la primera sea Negra y la segunda Roja.
5.- Dos futbolistas se juegan el campeonato en un penalti. La probabilidad de que lo meta el
primero es ½, y de que lo meta el segundo, si el primero lo hace antes, es ¼. ¿Cuál es la
probabilidad de que los dos metan el penalti?.
6.- La probabilidad de que un alumno apruebe Matemáticas es de 0,6 y la de aprobar Física es de
0,7.¿Cuál es la probabilidad de aprobar ambas asignaturas? ¿Y de no aprobar ninguna?.¿Y de
aprobar una de ellas?.
7.- La probabilidad de que Andrés haga la comida es de 2 / 9. La probabilidad de que la haga su
mujer es de 3 / 5. ¿Cuál es la probabilidad de que la comida esté hecha?.
8.- En un cruce nos encontramos dos semáforos. La probabilidad de que el primero esté en rojo es
1 / 3 y la probabilidad de que, si el primero está en rojo, el segundo esté en ámbar, es de 1 / 5.
¿Cuál es la probabilidad de que el primero esté en rojo y el segundo en ámbar?.
9.- Miriam espera la llamada de Carlos y de Guillermo. La probabilidad de que la llame Carlos es
de 0,7 y de que la llame Guillermo es de 0,5. Calcula:
a) La probabilidad de que llamen los dos.
b) La probabilidad de que llame alguno de ellos.
c) La probabilidad de que no llame ninguno.
10.- En un dado se pintan cuatro caras de Rojo y las otras dos de Azul. Se lanza el dado dos veces.
Calcula:
a) La probabilidad de que las dos veces salga azul.
b) La probabilidad de que la primera sea azul y la segunda rojo.
c) La probabilidad de que las dos veces sea rojo.
1. OBJETIVOS
Practicar el uso de las distintas fórmulas de las medidas de tendencia central y dispersión.
Realizar el análisis y comparación de los distintos cálculos de medidas.
Fomentar el uso de medidas de tendencia central y dispersión en el análisis de información.
2. METODOLOGÍA
Los estudiantes, después de haber discutido y estudiado los temas de estadística descriptiva,
con ayuda de la docente; procederán a la lectura de la guía propuesta, desarrollándola de forma
grupal e individual, durante el tiempo determinado y asignado al desarrollo de las horas prácticas
dentro y fuera del aula, asistidos por la docente responsable de dicha práctica.
3. EJERCICIOS
1. Una máquina fabrica una determinada pieza y se sabe que produce un 7 por 1000 de piezas
defectuosas. Hallar la probabilidad de que al examinar 50 piezas sólo haya una defectuosa.
2. La probabilidad de éxito de una determinada vacuna es 0,72. Calcula la probabilidad de que una
vez administrada a 15 pacientes:
3. La probabilidad de que el carburador de un coche salga de fábrica defectuoso es del 4 por 100.
Hallar:
4. La probabilidad de que un paciente se recupere de una extraña enfermedad es 0.4 . Si se sabe que
15 personas contraen esa enfermedad,
a) ¿Cuál es la probabilidad de que sobrevivan al menos 10?
5. En ciudad la necesidad de dinero para comprar drogas se establece como la razón del 75% de los
robos. Encuentre la probabilidad de que entre los siguientes cinco casos de robo:
probabilida
k 5 -k
n 0,75 0,25 d
0,0009765
0 1 1 6 0,00097656
0,0039062
1 5 0,75 5 0,01464844
2 10 0,5625 0,015625 0,08789063
3 10 0,421875 0,0625 0,26367188
0,3164062
4 5 5 0,25 0,39550781
0,2373046
5 1 9 1 0,23730469
d) Calcule la media y la varianza de esta distribución binomial.
6. Un prominente médico afirma que 70% de las personas con cáncer de pulmón son fumadores
empedernidos. Si su aseveración es correcta:
b) encuentre la probabilidad de que de 10 de los pacientes con cáncer de pulmón ninguno sea
fumador empedernido.
b) al menos cinco comenzaron a consumir Valium por problemas que no fueron psicológicos.
b) a lo más cinco.
c) no memos de ocho.
9. Un estudio examinó las actitudes hacia los antidepresivos. El estudio reveló que
aproximadamente el 70% cree que “los antidepresivos en realidad no curan nada, sólo encubren
el problema real”. De acuerdo con este estudio
a) ¿cuál es la probabilidad de que al menos tres de las siguientes cinco personas seleccionadas al
azar sean de esta opinión?
a) Si una persona no pudo identificar su cereal favorito y supuso que estaba en el tazón C. ¿Cuál
es la probabilidad de que la persona haya adivinado correctamente?
d) Suponga que a las ocho personas les fue imposible identificar su cereal favorito y trataron de
adivinar en cual tazón estaba. ¿Cuál es la probabilidad de que ninguno de los ocho haya
adivinado correctamente?
h) Suponga que siete de las ocho personas identifican el cereal que más les gusta. ¿Es razonable
decir que ellos adivinaron? Explique. ¿Cuál es tu conclusión?
8. Se lanza una moneda 90 veces. Calcular: B (90 ; 0' 5)→ N ( 45 ; 4 ' 74)
a. Probabilidad de obtener más de 50 caras P ( x >50 ) =¿ 0’15
b. Probabilidad de que el número de caras esté comprendido entre 40 y 50
P ( 40< x <50 )=0' 7062
9. El departamento de control de calidad de una fábrica de aparatos de televisión realiza cuatro
controles. De 420 televisores se han obtenido los siguientes datos:
Nº DE FALLOS 0 1 2 3 4
Nº DE TELEVISORES 316 219 58 6 1
Ajustar a esta distribución empírica una distribución binomial y hallar las frecuencias teóricas
0 ' 56
esperadas. x́=0 ' 56 p= =0 ' 15 B(4;0’15)
4
xi 0 1 2 3 4
10. En una ciudad se ha hecho un estudio sobre 1000 familias con cinco hijos para averiguar el
nº de hijas que tienen y se ha obtenido la siguiente tabla:
Nº DE CHICAS 0 1 2 3 4 5
Nº DE FAMILIAS 54 202 334 279 115 16
Ajusta esta distribución empírica a una distribución binomial y hallar las frecuencias teóricas
esperadas.
2' 25
x́=2 ' 25 p= =0 ' 45 B(5,0’45)
5
xi 0 1 2 3 4 5