Sei sulla pagina 1di 73

PROBABILIDAD Y

ESTADISTICA
MC Aída Salazar Compañ
aida.sc@itesm.mx
Estadística
Estadística inferencial

Recopilación de
datos

PRESENTACION ANALISIS

Toma de decisiones

Estimaciones

Estadística Diseño y Desarrollo de


descriptiva productos o procesos

PROBABILIDAD Y ESTADISTICA. 2
Razones para estudiar
ESTADÍSTICA
 Se emplean técnicas estadísticas en casi todas las fases de la vida.
La información está por todas partes.
 Sin importar cuál sea su profesión, tomará decisiones más
profesionales que comprenden información.
 Se diseñan encuestas para recabar los primeros informes en día de
elecciones y pronosticar el resultado de una elección .
 Se hacen muestreos de consumidores para obtener información
para predecir preferencias de productos.
 Médicos investigadores realizan experimentos para determinar el
efecto de diversos medicamentos y condiciones ambientales
controladas en seres humanos para inferir el tratamiento adecuado
para varias enfermedades.

PROBABILIDAD Y ESTADISTICA. 3
 Los ingenieros muestrean la característica de calidad de un producto
y diversas variables de procesos controlables para identificar
variables clave relacionadas con la calidad de un producto .
 Aparatos electrónicos recién manufacturados se muestrean antes de
enviarlos para decidir si se embarcan o se mantienen lotes
individuales.
 Los economistas observan varios índices del estado de la economía
en un periodo y usan la información para pronosticar las
condiciones de la economía en el futuro.
 Las empresas de contadores públicos al realizar auditorías para sus
clientes emplean procedimientos de muestreo estadístico.
 Los analistas financieros emplean una diversidad de información
estadística, en caso de acciones, el analista revisa diferentes datos
financieros como la relación precio/ ganancia y el rendimiento de los
dividendos.
 Marketing-proveedores de datos, compran datos a tiendas de
abarrotes, los procesan y luego venden los resúmenes estadísticos a
los fabricantes.

PROBABILIDAD Y ESTADISTICA. 4
Aplicaciones de la Estadística
La tabla siguiente posee el resumen de una población.
¿Qué podría decir acerca de los datos, son simétricos o sesgados?

Media 5.676
Error estándar 1.4956
Mediana 3.4
Moda 2
Desviación Estándar 7.47
Varianza Muestral 55.92
Curtosis 16.13
Sesgo 3.806
Amplitud de la variación 36.5
Mínimo 1.8
Máximo 38.3
Suma 141.9
Conteo 25
 La señora Katy Ball de AutoUSA quería desarrollar algunas tablas y gráficas para
mostrar el precio de venta típico en diversas distribuidoras. La siguiente tabla
reporta sólo el precio de los 80 vehículos vendidos el mes pasado en Whitner
Autoplex.
a. ¿Cuál es el precio de venta típico?

b. ¿Cuál es el precio de venta más alto ?


c. ¿Cuál es el precio de venta más bajo?
d. ¿Alrededor de qué valor tienden a agruparse los precios de venta?

$23 197 23 372 20 454 23 591 26 651 27 453 17 266


18 021 28 683 30 872 19 587 23 169 35 851 19 251
20 047 24 285 24 324 24 609 28 670 15 546 15 935
19 873 25 251 25 277 28 034 24 533 27 443 19 889
20 004 17 357 20 155 19 688 23 657 26 613 20 895
20 203 23 765 25 783 26 661 32 277 20 642 21 981
24 052 25 799 15 794 18 263 35 925 17 399 17 968
20 356 21 442 21 722 19 331 22 817 19 766 20 633
20 962 22 845 26 285 27 896 29 076 32 492 18 890
21 740 22 374 24 571 25 449 28 337 20 642 23 613
24 220 30 655 22 442 17 891 20 818 26 237 20 445
21 556 21 639 24 296
 Se lanzan dos dados al aire y se anota la
suma de los puntos obtenidos. Se pide:
a. La probabilidad de que salga el 7.
b. La probabilidad de que el número
obtenido sea par.
c. La probabilidad de que el número
obtenido sea múltiplo de tres.

PROBABILIDAD Y ESTADISTICA. 8
 Si se contesta sin pensar un test de 10 preguntas en las que
hay que contestar si es cierto o falso.
a. ¿Cuál es la probabilidad de acertar el 70 % o más de las
preguntas?,
b. ¿y exactamente 7 de las 10 respuestas?

 El tiempo de reparación de unas máquinas de escribir tiene


una distribución aproximadamente exponencial, con media
22 minutos.
a. Hallar la probabilidad de que el tiempo de reparación sea
menor que diez minutos.
b. El costo de reparación es de 2000 pts. por cada media hora o
fracción. ¿Cuál es la probabilidad de que una reparación
cueste 4000 pts?

PROBABILIDAD Y ESTADISTICA. 9
 Una empresa de material eléctrico fabrica bombillas de luz que
tienen una duración aproximadamente distribuida de forma
normal, con una desviación estándar de 40 horas. Si una muestra
de 30 bombillas tiene una duración promedio de 780 horas,
encuentre un intervalo de confianza de 96% para la media de la
población de todas las bombillas que produce esta empresa.

Se comparan las resistencias de dos clases de hilo.


Cincuenta piezas de cada clase de hilo se prueban bajo
condiciones similares. La marca A tiene una resistencia a la
tensión promedio de 78.3 kilogramos con una desviación
estándar de 5.6 kilogramos; en tanto que la marca B tiene
una resistencia a la tensión promedio de 87.2 kilogramos con
una desviación estándar de 6.3 kilogramos. Construye un
intervalo de confianza de 95% para la diferencia de las
medias poblacionales.

PROBABILIDAD Y ESTADISTICA. 10
ESTADÍSTICA. La ciencia de recopilar, organizar, presentar,
analizar e interpretar información para ayudar a tomar
decisiones más efectivas.

Estadística

Estadística Descriptiva Estadística Inferencial


Se refiere a aquella parte Es una técnica mediante la
del estudio que incluye la cual se obtienen
obtención, organización, generalizaciones o se
presentación y descripción toman decisiones en base a
de información numérica. una información parcial o
incompleta obtenida
mediante técnicas
descriptivas.

ESTADÍSTICAS. Un conjunto de información numérica.


EJEMPLOS
Estadística descriptiva.
a) Hay un total de 42 796 millas de carreteras interestatales en Estados
Unidos. El sistema interestatal representará sólo 1 % del total de carreteras
en el país. La más larga es la I-90, que va desde Boston hasta Seattle, una
distancia de 3 081 millas. La más corta es la I-878 en la ciudad de Nueva
York, que tiene una longitud de 0.7 millas.

b) Según el Buró de Estadística Laboral, el sueldo promedio por hora de los


obreros era de $ 15.16 en marzo de 2003
Estadística descriptiva
Conjuntos de métodos para organizar, resumir y presentar
los datos de manera informativa.

Ejemplo:
El gobierno de Estados Unidos reporta que la población de EU era de
179 323 000 en 1970, 203 302 000 en 1980, 226 542 000 en 1990,
248 709 000 en 2000 y 265 000 000 en 2010.
Esta información es resultado de la Estadística descriptiva.
Se trata de estadística descriptiva si calculamos el crecimiento porcentual
de una década a otra. Sin embargo, no lo sería si la utilizáramos para
calcular la población de EU en el año 2020 o el crecimiento porcentual de
2010 a 2020.
Estadística inferencial
Conjunto de métodos utilizados para determinar algún
atributo medible acerca de una población con base en
una muestra.

Ejemplo: Una encuesta reciente demostró que sólo 46 %


de los alumnos de último año de secundaria pueden
solucionar problemas que comprenden fracciones,
decimales y porcentajes. Y sólo 77 % de los alumnos de
último año de secundaria sumó correctamente el costo
de una sopa, una hamburguesa, papas fritas y un
refresco en el menú de un restaurante.

Como estas son inferencias acerca de una población,


basadas en datos de una muestra, se les conoce como
estadísticas inferenciales.
Relación entre una muestra y la población
Población

Muestra
EJERCICIO
Market Facts con sede en Nueva York pidió a una
muestra de 1960 consumidores que probarán un
platillo de pollo recién desarrollado por Boston
Market. De las 1960 personas que participaron en
la muestra, 1176 dijeron que comprarían el platillo
si se vendiera en el mercado.
a) ¿ Qué reportará Market Facts a Boston Market en cuanto a
la aceptación del platillo de pollo entre la población?

b) ¿ Éste es un ejemplo de estadística descriptiva o


inferencial? Explique su respuesta.
Tipos de variables
Cualitativas o Atributo.- La
característica que se estudia es no
numérica.
Cuantitativas.- Cuando la variable
estudiada se puede reportar en forma
numérica.
Ejemplos de variable cualitativa
Género
Afiliación religiosa
Tipo de automóvil
Color de ojos.
Cuando los datos son cualitativos casi siempre nos interesa saber
cuántos o qué proporción pertenece a cada categoría.
Ejemplos:
¿ Qué porcentaje de la población tiene ojos azules?
¿ Cuántos católicos y cuántos protestantes hay en EU?
¿ Qué porcentaje del número total de autos vendidos el mes pasado eran
FORD?
A menudo la información cualitativa se resume en tablas o gráficas de
barras.
Ejemplos de variable cuantitativas
El saldo de una cuenta de cheques.
Las edades de los presidentes de empresas.
La duración de la batería de un auto.
El número de hijos de una familia.
Las variables cuantitativas pueden ser DISCRETAS o
CONTINUAS.
VARIABLES DISCRETAS - Sólo asume ciertos valores y casi
siempre existen “brechas” entre los valores.
EJEMPLOS:
1. La cantidad de habitaciones en una casa. ( 1, 2, 3,...)
2. El número de estudiantes en cada sección de un curso de estadística.
(25 en la sección A, 42 en la sección B, 18 en la sección C)

POR LO GENERAL LAS VARIABLES DISCRETAS SON EL RESULTADO DE


UN CONTEO
VARIABLES CONTINUAS. Las observaciones de una variable continua
pueden asumir cualquier valor con un rango específico.
EJEMPLOS:
1. La presión del aire en una llanta.
2. El peso de un cargamento de papas.
3. La cantidad de cereal con pasas en una caja.
4. La duración de los vuelos del DF a Cancún.

POR LO GENERAL LAS VARIABLES CONTINUAS RESULTAN DE LA


MEDICION
Tipos de variables
Tipos de variables

Cualitativas Cuantitativas

• Marca de PC Discretas Continuas


• Estado Civil
• Color de cabello

• Hijos en la familia • Cantidad de impuesto


• Golpes en un hoyo sobre el ingreso
de golf pagado.
• Televisores que • Peso de un estudiante.
• Precipitación pluvial
tiene anual en Puebla
ESTADISTICA. 22
Dentro de las variables cualitativas podemos encontrar dos tipos: nominales y
ordinales. El primer tipo hace referencia a aquellas variables que carecen de un
criterio de orden, mientras que el segundo tipo obedece a las variables que
siguen un patrón de orden o pertenecen a una escala de valor.

Variables Cualitativas
Las variables cualitativas incluyen todas las cualidades o características
observables de un grupo o población que no pueden ser medidas de forma
numérica. Generalmente se asocian con un atributo físico (cualidad) de un
grupo de individuos.

Estas variables pueden ser divididas en dos tipos: nominales (carecen de un


criterio de orden) y ordinales (poseen un criterio de orden)

ESTADISTICA. 23
Variable cualitativas nominales
Las variables cualitativas nominales son aquellas que carecer de o no admiten
un criterio de orden y no cuentan con un valor numérico asignado. Un ejemplo
de este tipo de variables puede ser el estado civil (casado, soltero, divorciado,
viudo).

Variable cualitativas ordinales


A las variables cualitativas ordinales se les conoce como variables semi-
cuantitativas. A pesar de que aluden a atributos o cualidades que carecen de
un valor numérico, se les clasifica dentro de una escala de valor. Un ejemplo de
este tipo de variables puede ser el resultado de una competencia deportiva
(primer, segundo o tercer lugar).

ESTADISTICA. 24
Ejemplos
– El miedo
Ésta es una variable cualitativa nominal, ya que no puede ser medida numéricamente. El
miedo es una variable que cambia de acuerdo a la persona que la siente y fluctúa
dependiendo de la situación en la que se sienta al reaccionar a un suceso o evento
determinado.

– El hambre
El hambre no puede ser medido numéricamente, por tanto, es considerado como una
variable cualitativa ordinal. Esta variable únicamente puede ser percibida por la persona que
la siente y se puede clasificar en mucha, poca o nada, según la situación o tiempo específico.

– La belleza
Esta variable es un concepto que únicamente puede ser medido por el individuo que la
interpreta. La belleza es una cualidad que carece de valor numérico y no puede ser
clasificada dentro de un escalafón. Por tanto, es una variable cualitativa nominal.

– Estado civil
El estado civil de una persona es una variable cualitativa nominal a la que no puede serle
asignada un valor numérico. Es un concepto que no tiene un orden específico establecido.

– La felicidad
Esta variable no puede ser medida de forma numérica pues depende del valor que cada
persona le asigne. La felicidad es una propiedad que cada individuo siente de manera
subjetiva y no existe ninguna herramienta para medir el grado de felicidad que puede llegar
a sentir una persona. ESTADISTICA. 25
– La ignorancia
Esta variable no puede ser medida de forma numérica y se expresa en actitudes y
momentos puntuales.

– La utilidad
La variable que determina qué tan útil es un objeto es netamente cualitativa. De esta
manera, la utilidad es percibida por cada individuo de acuerdo a una situación específica.

– El tipo de medalla
Ésta es una variable cualitativa ordinal, ya que existe una clasificación por categorías que
asigna un lugar dentro de una competencia. De esta manera las medallas de oro, plata y
bronce denotan el lugar ocupado en una competencia sin la necesidad de asignar un valor
numérico a los resultados.

– La creatividad
Esta variable es cualitativa ya que la creatividad no puede ser medida numéricamente. De
igual forma, es un factor que varía de persona a persona dependiendo del momento
específico en el que tenga lugar.

– La calificación de un examen
Cuando se califica un examen con los términos aprobado, sobresaliente, aceptable o
deficiente, se trata de una variable cualitativa ordinal, ya que no se le está asignando un
valor numérico al resultado, pero sí se le está dando un lugar dentro de una escala de valor.

ESTADISTICA. 26
1. Para cada una de las siguientes situaciones, indique si la variable
adecuada sería cualitativa o cuantitativa. Si la identifica como
cuantitativa, señale si sería discreta o continua.
a) Si usted posee o no un equipo de televisión Panasonic.
b) Usted es un estudiante de tiempo completo o de medio tiempo.
c) La cantidad de personas que asistieron a la graduación de su escuela el
año pasado.
d) El precio de su corte de cabello más reciente.
e) El tiempo de Samuel desde su dormitorio hasta la asociación estudiantil.
f) La cantidad de estudiantes en el recinto universitario que pertenecen a
una fraternidad o club social.
NIVELES DE MEDICION
Identifica las propiedades de medición de la variable y
determina el tipo de operaciones matemáticas que
puede usarse apropiadamente con dicho nivel.
Esto es:
Los datos se pueden clasificar de acuerdo con los niveles
de medición.
El nivel de medición de la información a menudo indica los
cálculos que se pueden realizar para resumir y presentar
los datos.
Asimismo determina las pruebas estadísticas que se
deben realizar.
Niveles de Medición

Nominal Ordinal De intervalo De razón

Los datos sólo se Los datos se Diferencia significativa Punto 0 significativo


clasifican ordenan Entre los valores Y razón entre valores

• Su número de lista • Números de pacientes


• Números en los pants en clase. • Temperatura vistos.
de los jugadores de • Posiciones de los • Talla • Número de llamadas
fútbol. equipos de fútbol en la •Medida de los zapatos de ventas realizadas
• Marca de auto lista de los 10 grandes • Niveles de coeficiente • Peso
•Género del mundo. intelectual •Ingresos
•Raza • Rango de clase social • Escalas de actitud • Edad
•Estado civil • Preguntas de actitud y y opinión • Tamaño de población
opinión
Medición Nominal
Para el nivel nominal de medición, las observaciones de una variable
cualitativa sólo se pueden clasificar y contar. No existe un orden
particular para las etiquetas. La única medición consiste en conteos.
Ejemplo:
Un análisis de las fuentes de abastecimiento de petróleo en el mundo.
La variable de interés es el país o la región. Ésta es una variable de
nivel nominal porque registramos la información por país o región, y
no hay un orden natural.
País o región Millones de barriles Porcentaje
Al día
Golfo Pérsico 18.84 25
Estados Unidos 9.05 12
OAPEP 19.50 26
OPEP 28.00 37

Total 75.39 100


Los datos de nivel nominal tienen las siguientes propiedades:
• Las categorías de datos son mutuamente excluyentes y
colectivamente exhaustivas.
• Las categorías de datos no tienen un orden lógico.

MUTUAMENTE EXCLUYENTES.- Propiedad de un grupo de categorías por


la que un individuo, medición u objeto se incluye en sólo una categoría.

EXHAUSTIVO.- Propiedad de un conjunto de categorías según la cual


cada uno de los individuos, mediciones u objetos debe aparecer por lo
menos en una categoría.
Medición Ordinal
El siguiente nivel más alto de datos es el
nivel ordinal.
Las propiedades de los datos de nivel
ordinal son:
Las clasificaciones de la información son mutuamente
excluyentes y colectivamente exhaustivas.
Las clasificaciones de la información están ordenadas
de acuerdo con el rasgo en particular que poseen.
Ejemplo
El Departamento de Seguridad de EU publica la información acerca del
riesgo de actividad terrorista para las autoridades federales,
estatales y locales, así como a toda la ciudadanía.
Los cinco niveles de riesgo, desde el más bajo hasta el más alto,
incluidos una descripción y códigos de colores son:

NIVEL DE RIESGO DESCRIPCION COLOR

BAJO Riesgo bajo de ataques terroristas verde

PROTEGIDO Riesgo general de ataques terroristas azul

ELEVADO Riesgo significativo de ataques terroristas amarillo

ALTO Riesgo alto de ataques terroristas naranja

SEVERO Riesgo severo de ataques terroristas rojo

Ésta es información de escala ordinal porque sabemos el orden o las clasificaciones de los niveles de riesgo,
es decir, el naranja es más alto que el amarillo, pero la cantidad de diferencia entre cada uno de los niveles
No necesariamente es la misma
DATOS DE NIVEL DE
INTERVALO
El nivel de intervalo de la medición es el siguiente nivel
más alto.
Incluye todas las características del nivel ordinal, pero
además la diferencia entre los valores es un tamaño
constante.
Las propiedades de los datos de nivel de intervalo
son:
Las clasificaciones de la información son mutuamente excluyentes
y colectivamente exhaustivas.
Las clasificaciones de la información están ordenadas de acuerdo
con la cantidad de la característica que poseen.
Las diferencias iguales en la característica están representadas por
diferencias iguales en las mediciones.
Ejemplo
Un ejemplo del nivel de intervalo de la medición es la temperatura.
Supongamos que las temperaturas mas elevadas en tres días invernales
consecutivos en Boston son 28, 31 y 20 grados Fahrenheit.
Estas temperaturas se pueden clasificar con facilidad, pero también podemos
determinar la diferencia entre ellas. Esto es posible gracias a que 1 grado
Fahrenheit representa una unidad constante. Las diferencias iguales entre
dos temperaturas son las mismas, sin importar su posición en la escala, es
decir, la diferencia entre 10 y 15 grados Fahrenheit es de 5, la diferencia
entre 50 y 55 grados también es de 5. Debemos hacer notar que 0 es sólo
un punto en la escala. No representa la ausencia de la condición. Una
temperatura de 0 grados Fahrenheit no representa la ausencia de calor,
¡ Sólo que hace frío!
De hecho, 0 grados Fahrenheit corresponden alrededor de -18 grados en la
escala Celsius.
DATOS DE NIVEL DE RAZON
Prácticamente todos los datos cuantitativos son el nivel de razón de la
medición.
El nivel de razón es el nivel de medición “más alto”. Tiene todas las
características del nivel de intervalo, pero además, el punto 0 es
significativo y la razón entre dos números también es significativa.
Las propiedades de los datos de nivel de intervalo
son:
Las clasificaciones de la información son mutuamente excluyentes
y colectivamente exhaustivas.
Las clasificaciones de la información están ordenadas de acuerdo
con la cantidad de la característica que poseen.
Las diferencias iguales en la característica están representadas por
diferencias iguales en los números asignados a las clasificaciones.
El punto cero es la ausencia de la característica.
Algunos ejemplos de la escala de razón de la medición incluyen:
Salarios, unidades de producción, peso, cambio en los precios
accionarios, distancia entre sucursales y altura.
El dinero es un buen ejemplo. Si usted tiene cero dólares, no tiene dinero.
El peso es otro ejemplo.
La siguiente tabla ilustra el uso de la escala de razón de la medición. Muestra los
ingresos de cuatro parejas de padre e hijo.

FAMILIA PADRE HIJO

Mendoza $ 80 000 $ 40 000


Olivares 90 000 30 000
Torres 60 000 120 000
Alvarado 75 000 130 000

Observamos que el señor MENDOZA gana el doble que su hijo. En la familia TORRES, el hijo gana el
doble que su padre.
Ejemplos:
1. ¿Cuál es el nivel de medición para cada una de las variables siguientes?
a) Niveles de IQ de los alumnos.
b) Distancias que los alumnos recorren para llegar a clases.
c) Calificaciones de los alumnos en el primer examen de estadística.
d) Una clasificación de los alumnos por estado de origen.
e) Una clasificación de los estudiantes según el grado que cursan.
f) Número de horas que los alumnos dedican a estudiar por semana.
g) Los departamentos, tales como editorial, publicidad, deportes, etc.

2. Determine si el grupo es una muestra o una población, en cada


ejemplo:
a) Los participantes en un estudio sobre un nuevo medicamento para el colesterol
b) Los conductores que recibieron una multa por exceso de velocidad en la ciudad
de Puebla el mes pasado.
c) Aquellos que pertenecen al programa de bienestar en Cook County (Chicago)
d) Las 30 acciones reportadas como una parte del Promedio Industrial Dow Jones
ACTIVIDAD I
1. Explique la diferencia entre variables cualitativas y cuantitativas. Dé un ejemplo de
variable cualitativa y cuantitativa.
2. Explique la diferencia entre una muestra y una población.
3. Mencione los cuatro niveles de medición y dé un ejemplo de cada uno (distinto a los ya
mencionados).
4. Defina el término mutuamente excluyente y el término colectivamente exhaustivo.
5. Utilizando información de periódicos locales, dé ejemplos de los niveles de medición
nominal, ordinal, de intervalo y de razón.
6. Explique la diferencia entre la variable discreta y una continua. Dé un ejemplo de cada
una de ellas distintos a los que se mencionaron.
La gráfica siguiente ilustra las ventas, en miles, de casas prefabricadas en Estados Unidos
de 1990 a 2001. Escriba un breve análisis de la información. ¿Las ventas aumentaron
durante el periodo? ¿Cuál fue la tendencia de ventas?

Year Sales

1990 188.2
Sales of Manufactured Homes from 1990 to
1991 170.7
2001
1992 210.8
2500
1993 254.3
2000
1994 303.9
Sales 1500
1995 339.6
1000
1996 363.4
500
1997 353.4
0
1998 372.8
1 2 3 4 5 6 7 8 9 10 11 12
1999 348.7
Year
2000 250.6

2001 193.2
DESCRIPCIÓN DE DATOS
DISTRIBUCIONES DE FRECUENCIAS
Y SU
PRESENTACIÓN GRAFICA

Objetivos
• Organizar la información en una distribución de frecuencia.
• Representar una distribución de frecuencia en un
histograma un polígono de frecuencia y un polígono de
frecuencias acumulada.
• Presentar la información utilizando técnicas de gráficas de
líneas, gráficas de barras y gráficas de pastel.
Creación de una distribución de frecuencias

La estadística descriptiva se utiliza para organizar la


información de diversas maneras, a fin de señalar el
lugar donde los valores de los datos tienden a
concentrarse y ayudar a distinguir los valores más altos
y más bajos.
El primer paso que seguimos para describir un conjunto de
datos es una distribución de frecuencias.
DISTRIBUCIÓN DE FRECUENCIAS.- Agrupación de los datos en
clases mutuamente excluyentes mostrando el número de
observaciones en cada una.
¿Cómo desarrollamos una distribución de frecuencias?
EJEMPLO:
La señora Kathryn Ball de AutoUSA quería desarrollar algunas tablas y gráficas para mostrar
el precio de venta típico en diversas distribuidoras. La siguiente tabla reporta sólo el precio
de los 80 vehículos vendidos el mes pasado en Whitner Autoplex. ¿Cuál es el precio de
venta típico? ¿Cuál es el precio de venta más alto ? ¿Cuál es el precio de venta más bajo?
¿Alrededor de qué valor tienden a agruparse los precios de venta?

$23 197 23 372 20 454 23 591 26 651 27 453 17 266

18 021 28 683 30 872 19 587 23 169 35 851 19 251

20 047 24 285 24 324 24 609 28 670 15 546 15 935

19 873 25 251 25 277 28 034 24 533 27 443 19 889

20 004 17 357 20 155 19 688 23 657 26 613 20 895

20 203 23 765 25 783 26 661 32 277 20 642 21 981

24 052 25 799 15 794 18 263 35 925 17 399 17 968

20 356 21 442 21 722 19 331 22 817 19 766 20 633

20 962 22 845 26 285 27 896 29 076 32 492 18 890

21 740 22 374 24 571 25 449 28 337 20 642 23 613

24 220 30 655 22 442 17 891 20 818 26 237 20 445

21 556 21 639 24 296 Más bajo


Más alto
A la información de la tabla sin organizar se la llama datos en bruto o datos no
agrupados.
PASOS PARA ORGANIZAR UNA DISTRIBUCION DE FRECUENCIA.
Paso 1. Decidir el número de clases. El objetivo es utilizar suficientes grupos o clases para
revelar la forma de la distribución.
√n=k
k – número de clases
n - número de observaciones
En nuestro ejemplo se vendieron 80 vehículos entonces n = 80, y hay que encontrar k
√80 = 8.9.
Por lo tanto el número recomendado de clases es 9.
PASO 2. Determinar el intervalo o ancho de clase . El intervalo o ancho de clase debe ser
el mismo para todas las clases. Se utilizará la siguiente fórmula.
i ≥ H-L
k

Donde i es el intervalo de clase, H es el valor observado más alto, L es el valor observado


más bajo y k es el número de clases.
Para nuestro ejemplo
H = $ 35 925. L = $ 15 546. k = 9
i ≥ ( 35 925 – 15 546) / 9 = $ 2 264.33
En la práctica un intervalo de este tamaño se redondea a cifras convenientes, como múltiplos
de 5 o 10 o 100. Por lo tanto podríamos utilizar el valor de $ 2 265.
PASO 3. ESTABLECER LOS LIMITES DE CADA CLASE.

15 546 A 17811
17811 A 20076
20076 A 22341
22341 A 24606
24606 A 26871
26871 A 29136
29136 A 31401
31401 A 33666
33666 A 35931
PASO 4. Contar el número de elementos de cada clase. El número de observaciones en cada
clase se conoce como frecuencia de clase.

Precios de venta FRECUENCIA


ABSOLUTA
15 546 A 17811 6
17811 A 20076 14
20076 A 22341 17
22341 A 24606 18
24606 A 26871 11
26871 A 29136 8
29136 A 31401 2
31401 A 33666 2
33666 A 35931 2
TOTAL 80
Distribución de frecuencia de los precios de venta en Whitner Autoplex el mes pasado.
Resumen del patrón en los precios de venta de los vehículos
para el lote AutoUSA de Whitner AutoPlex.
1. Los precios de venta van de aproximadamente $15 546 a alrededor
de $35 931.
2. Los precios de venta están concentrados entre $20 076 y 24 606. En
este rango se vendieron 35 vehículos en total o 43.75%.
3. La mayor concentración o la frecuencia más alta, se encuentra en la
clase de $22 341 a $24 606. El punto medio de esta clase es
$23 473.50 . Entonces decimos que $23 473.50 es el
precio de venta típico.
4. Dos de los vehículos se vendieron en $33 666.00 o más y 6 se
vendieron en menos de $17 811.00
Distribución de frecuencias relativas
Es conveniente convertir las frecuencias de clase en frecuencias de clase relativas para
mostrar la fracción del número total de observaciones o porcentaje en cada clase.
Para convertir una distribución de frecuencia en una distribución de frecuencia relativa,
cada una de las frecuencias de clase se divide entre el número total de observaciones.

PRECIOS DE VENTA FRECUENCIA FRECUENCIA OPERACION


ABSOLUTA RELATIVA

15 546 A 17 811 6 0.075 6/80

17 811 A 20 076 14 0.175 14/80

20 076 A 22 341 17 0.2125 17/80

22 341 A 24 606 18 0.225 18/80

24 606 A 26 871 11 0.1375 11/80

26 871 A 29 136 8 0.100 8/80

29 136 A 31 401 2 0.025 2/80


31 401 A 33 666 2 0.025 2/80
33 666 A 35 931 2 0.025 2/80
TOTAL 80 1.0000 80/80
FRECUENCIA
ABSOLUTA ACUMULADA

PRECIOS DE VENTA FRECUENCIA FRECUENCIA FRECUENCIA


ABSOLUTA RELATIVA ABSOLUTA ACUMULADA

15 546 A 17 811 6 0.075 6

17 811 A 20 076 14 0.175 20

20 076 A 22 341 17 0.2125 37

22 341 A 24 606 18 0.225 55

24 606 A 26 871 11 0.1375 66

26 871 A 29 136 8 0.100 74

29 136 A 31 401 2 0.025 76


31 401 A 33 666 2 0.025 78
33 666 A 35 931 2 0.025 80
TOTAL 80 1.0000
FRECUENCIA
RELATIVA ACUMULADA
PRECIOS DE VENTA FRECUENCIA FRECUENCIA FRECUENCIA
ABSOLUTA RELATIVA RELATIVA ACUMULADA

15 546 A 17 811 6 0.075 0.075

17 811 A 20 076 14 0.175 0.250

20 076 A 22 341 17 0.2125 0.4625

22 341 A 24 606 18 0.225 0.6875

24 606 A 26 871 11 0.1375 0.825

26 871 A 29 136 8 0.100 0.925

29 136 A 31 401 2 0.025 0.950


31 401 A 33 666 2 0.025 0.975
33 666 A 35 931 2 0.025 1.000
TOTAL 80 1.0000

50
EJERCICIO:
Las comisiones ganadas durante el primer trimestre del último año por
parte de los 11 miembros del personal de ventas de Master Chemical
Company son:

$1650 $1475 $1510 $1670 $1595 $1760 $1540 $1495 $1590 $1625 $1510

a) Utilizando de $1400 a $1500 como la primera clase, $1500 a $1600 como la segunda,
etc., organizar las comisiones trimestrales en una distribución de frecuencia.

b) Con base en la distribución de frecuencia. ¿Cuál es la cantidad de comisión más alta


ganada? ¿Cuál es la más baja?
PROBABILIDAD Y
ESTADISTICA. 52
PROBABILIDAD Y
ESTADISTICA. 53
PROBABILIDAD Y
ESTADISTICA. 54
PROBABILIDAD Y
ESTADISTICA. 55
PROBABILIDAD Y
ESTADISTICA. 56
PROBABILIDAD Y
ESTADISTICA. 57
PROBABILIDAD Y
ESTADISTICA. 58
PROBABILIDAD Y
ESTADISTICA. 59
PROBABILIDAD Y
ESTADISTICA. 60
PROBABILIDAD Y
ESTADISTICA. 61
HISTOGRAMA
Una de las formas más comunes de representar una distribución de frecuencias
es un HISTOGRAMA.
HISTOGRAMA. Gráfica en la que las clases se marcan en el eje horizontal y las
frecuencias de clases en el eje vertical. Las frecuencias de clases se
representan mediante la altura de las barras y estas últimas se dibujan una
junto a otra.

Distribución de Frecuencia

25 23
Frecuencia de clase

20 18
17
15

10 8 8

5 4
2

0
15 18 21 24 27 30 33 36
Precios de venta
POLIGONOS DE FRECUENCIAS
Un polígono de frecuencias es similar a un histograma. Consiste en segmentos de línea que
conectan los puntos formados por las intersecciones de los puntos medios de clase y las
frecuencias de clase.

Polígono de frecuencia de los precios de venta de


los 80 vehículos vendidos en Whitner Autoplex

40
Frecuencias

30
Precio ($000)
20
Frecuencia
10

0
1 2 3 4 5 6 7
Precio de venta ($000)
Tanto el Histograma como el polígono de frecuencia nos permiten tener un panorama
rápido de las principales características de la información (altas, bajas, puntos de
concentración, etc.)
El polígono de frecuencias tiene una ventaja sobre el histograma, nos permite comparar
directamente dos o más distribuciones de la frecuencia.

OJIVA representa en forma gráfica a las frecuencias acumuladas.


PROBABILIDAD Y ESTADISTICA. 65
EJERCICIO.
En la siguiente distribución de frecuencias se muestran las importaciones anuales de un
grupo seleccionado de proveedores de aparatos electrónicos.

Importaciones Número de
(millones de $) proveedores
2 A 5 6
5 A 8 13
8 A 11 20
11 A 14 10
14 A 17 1
a) Represente las importaciones en forma de histograma.
b) Represente las importaciones como un polígono de frecuencias relativas.
c) Resuma las facetas importantes de la distribución (como las clases con las frecuencias
más alta y más baja).
Para trazar una distribución de frecuencias acumuladas, coloque el límite superior de cada
clase a lo largo del eje X y las frecuencias acumuladas correspondientes a lo largo del eje Y

Distribución de frecuencias acumuladas para el


precio de venta de los vehículos

Número de vehículos

Porcentaje de vehículos vendidos


100
100
80 74 78 80
vendidos 87
66
60
48 50
40
31 25
20
8
0 0
15 18 21 24 27 30 33 36
Precio de venta ($ 000)
Ejercicio.

En la tabla siguiente se organizó una muestra del salario por hora de 15


empleados de Home Depot en Los Ángeles California.

Salarios por hora Número de empleados

$8 a $10 3
10 a 12 7
12 a 14 4
14 a 16 1

a) Desarrolle una tabla de distribución de frecuencia acumulada y una


ojiva de frecuencia acumulada.
Ejercicio 2. Se registran las siguientes mediciones para el tiempo de
secado (en horas) de cierta marca de pintura esmaltada.
3.4, 2.5, 4.8, 2.9, 3.6
2.8, 3.3, 5.6, 3.7, 2.8
4.4, 4.0, 5.2, 3.0, 4.8

Construya:
1. Una tabla de frecuencias agrupando los datos, comenzando la
primera clase en 2.0 y terminando la última en 6.0.
2. Incluir en la tabla: las frecuencias relativas, frecuencias absolutas
acumuladas, frecuencias relativas acumuladas.

PROBABILIDAD Y
ESTADISTICA. 69
Ejercicio 3. La siguiente muestra tiene los ingresos ganados cierto sábado
por los estudiantes universitarios que trabajan. Las datos están en
dólares.
30, 11, 42, 8, 30, 18, 25, 25, 17, 30, 39, 21, 23, 25, 15, 35,
26,13, 21, 26.
Si las marcas de clase son 10, 15, 20, 25, 30, 35 y 40, representa los datos
en una Tabla de Distribución de Frecuencias.

Ejercicio 4. La división de servicios alimenticios de Cedar River Amusement


Park, Inc. Estudia la cantidad que gastan al día en alimento y bebida las
familias que visitan el parque de diversiones. Una muestra de 40 familias
que visitó el parque ayer revela que éstas gastan las siguientes
cantidades:

$77, 18, 63, 84, 38, 54, 50, 59, 54, 56, 36, 26, 50, 34, 44, 41, 58, 58, 53, 51,
62, 43, 52, 53, 63, 62, 62, 65, 61, 52, 60, 60, 45, 66, 83, 71, 63, 58, 61,
71.
a) Organice los datos en una distribución de frecuencia utilizando 7 clases y
el 15 como límite inferior de la primera clase.
b) Describa la distribución.
PROBABILIDAD Y
ESTADISTICA. 70
Gráficas de barras. Una gráfica de barras se puede utilizar para representar
cualquiera de los niveles de medición: nominal, ordinal, de intervalo o de razón.

Gráficas circulares o de pastel: Una gráfica circular o de pastel es muy útil sobre
todo para ilustrar datos de nivel nominal.

EJEMPLO. La siguiente tabla muestra un análisis de los gastos de la Lotería del


Estado de Ohio durante 2002.
Uso de las ventas Cantidad Porcentaje de
(millones $) participación
Premios 1148.1 57

Pagos para la 635.2 32


educación
Bonos 126.6 6
/Comisiones
Gastos 103.3 5
operativos
Total 2013.2 100
Gastos de la Lotería del Estado de Ohio
durante 2002

Gastos
Bonos

Educación Premios

Como el área del pastel representa la participación relativa de cada componente, podemos compararlos
con facilidad:
• El gasto más elevado de la Lotería de Ohio es en premios.
• Alrededor de una tercera parte de las ganancias se transfieren a la educación.
• Los gastos operativos representan sólo 5 % de las ganancias.
EJERCICIO.
Los Clayton County Commissioners quieren mostrar a los contribuyentes que
asistan a la próxima reunión lo que sucede con el dinero que pagan en impuestos.
La cantidad total de impuestos que se cobró es de 2 millones de dólares. Los
gastos son: $440 000 para escuelas, $1 160 000 para carreteras, $320 000 para
administración y $80 000 para provisiones. Una gráfica de pastel es ideal para
mostrar la cantidad destinada a escuelas, carreteras, gastos administrativos y
provisiones. Convierta las cantidades de dólares en porcentajes del total y
represente estos porcentajes en forma de gráfica de pastel.

Potrebbero piacerti anche