Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADISTICA
MC Aída Salazar Compañ
aida.sc@itesm.mx
Estadística
Estadística inferencial
Recopilación de
datos
PRESENTACION ANALISIS
Toma de decisiones
Estimaciones
PROBABILIDAD Y ESTADISTICA. 2
Razones para estudiar
ESTADÍSTICA
Se emplean técnicas estadísticas en casi todas las fases de la vida.
La información está por todas partes.
Sin importar cuál sea su profesión, tomará decisiones más
profesionales que comprenden información.
Se diseñan encuestas para recabar los primeros informes en día de
elecciones y pronosticar el resultado de una elección .
Se hacen muestreos de consumidores para obtener información
para predecir preferencias de productos.
Médicos investigadores realizan experimentos para determinar el
efecto de diversos medicamentos y condiciones ambientales
controladas en seres humanos para inferir el tratamiento adecuado
para varias enfermedades.
PROBABILIDAD Y ESTADISTICA. 3
Los ingenieros muestrean la característica de calidad de un producto
y diversas variables de procesos controlables para identificar
variables clave relacionadas con la calidad de un producto .
Aparatos electrónicos recién manufacturados se muestrean antes de
enviarlos para decidir si se embarcan o se mantienen lotes
individuales.
Los economistas observan varios índices del estado de la economía
en un periodo y usan la información para pronosticar las
condiciones de la economía en el futuro.
Las empresas de contadores públicos al realizar auditorías para sus
clientes emplean procedimientos de muestreo estadístico.
Los analistas financieros emplean una diversidad de información
estadística, en caso de acciones, el analista revisa diferentes datos
financieros como la relación precio/ ganancia y el rendimiento de los
dividendos.
Marketing-proveedores de datos, compran datos a tiendas de
abarrotes, los procesan y luego venden los resúmenes estadísticos a
los fabricantes.
PROBABILIDAD Y ESTADISTICA. 4
Aplicaciones de la Estadística
La tabla siguiente posee el resumen de una población.
¿Qué podría decir acerca de los datos, son simétricos o sesgados?
Media 5.676
Error estándar 1.4956
Mediana 3.4
Moda 2
Desviación Estándar 7.47
Varianza Muestral 55.92
Curtosis 16.13
Sesgo 3.806
Amplitud de la variación 36.5
Mínimo 1.8
Máximo 38.3
Suma 141.9
Conteo 25
La señora Katy Ball de AutoUSA quería desarrollar algunas tablas y gráficas para
mostrar el precio de venta típico en diversas distribuidoras. La siguiente tabla
reporta sólo el precio de los 80 vehículos vendidos el mes pasado en Whitner
Autoplex.
a. ¿Cuál es el precio de venta típico?
PROBABILIDAD Y ESTADISTICA. 8
Si se contesta sin pensar un test de 10 preguntas en las que
hay que contestar si es cierto o falso.
a. ¿Cuál es la probabilidad de acertar el 70 % o más de las
preguntas?,
b. ¿y exactamente 7 de las 10 respuestas?
PROBABILIDAD Y ESTADISTICA. 9
Una empresa de material eléctrico fabrica bombillas de luz que
tienen una duración aproximadamente distribuida de forma
normal, con una desviación estándar de 40 horas. Si una muestra
de 30 bombillas tiene una duración promedio de 780 horas,
encuentre un intervalo de confianza de 96% para la media de la
población de todas las bombillas que produce esta empresa.
PROBABILIDAD Y ESTADISTICA. 10
ESTADÍSTICA. La ciencia de recopilar, organizar, presentar,
analizar e interpretar información para ayudar a tomar
decisiones más efectivas.
Estadística
Ejemplo:
El gobierno de Estados Unidos reporta que la población de EU era de
179 323 000 en 1970, 203 302 000 en 1980, 226 542 000 en 1990,
248 709 000 en 2000 y 265 000 000 en 2010.
Esta información es resultado de la Estadística descriptiva.
Se trata de estadística descriptiva si calculamos el crecimiento porcentual
de una década a otra. Sin embargo, no lo sería si la utilizáramos para
calcular la población de EU en el año 2020 o el crecimiento porcentual de
2010 a 2020.
Estadística inferencial
Conjunto de métodos utilizados para determinar algún
atributo medible acerca de una población con base en
una muestra.
Muestra
EJERCICIO
Market Facts con sede en Nueva York pidió a una
muestra de 1960 consumidores que probarán un
platillo de pollo recién desarrollado por Boston
Market. De las 1960 personas que participaron en
la muestra, 1176 dijeron que comprarían el platillo
si se vendiera en el mercado.
a) ¿ Qué reportará Market Facts a Boston Market en cuanto a
la aceptación del platillo de pollo entre la población?
Cualitativas Cuantitativas
Variables Cualitativas
Las variables cualitativas incluyen todas las cualidades o características
observables de un grupo o población que no pueden ser medidas de forma
numérica. Generalmente se asocian con un atributo físico (cualidad) de un
grupo de individuos.
ESTADISTICA. 23
Variable cualitativas nominales
Las variables cualitativas nominales son aquellas que carecer de o no admiten
un criterio de orden y no cuentan con un valor numérico asignado. Un ejemplo
de este tipo de variables puede ser el estado civil (casado, soltero, divorciado,
viudo).
ESTADISTICA. 24
Ejemplos
– El miedo
Ésta es una variable cualitativa nominal, ya que no puede ser medida numéricamente. El
miedo es una variable que cambia de acuerdo a la persona que la siente y fluctúa
dependiendo de la situación en la que se sienta al reaccionar a un suceso o evento
determinado.
– El hambre
El hambre no puede ser medido numéricamente, por tanto, es considerado como una
variable cualitativa ordinal. Esta variable únicamente puede ser percibida por la persona que
la siente y se puede clasificar en mucha, poca o nada, según la situación o tiempo específico.
– La belleza
Esta variable es un concepto que únicamente puede ser medido por el individuo que la
interpreta. La belleza es una cualidad que carece de valor numérico y no puede ser
clasificada dentro de un escalafón. Por tanto, es una variable cualitativa nominal.
– Estado civil
El estado civil de una persona es una variable cualitativa nominal a la que no puede serle
asignada un valor numérico. Es un concepto que no tiene un orden específico establecido.
– La felicidad
Esta variable no puede ser medida de forma numérica pues depende del valor que cada
persona le asigne. La felicidad es una propiedad que cada individuo siente de manera
subjetiva y no existe ninguna herramienta para medir el grado de felicidad que puede llegar
a sentir una persona. ESTADISTICA. 25
– La ignorancia
Esta variable no puede ser medida de forma numérica y se expresa en actitudes y
momentos puntuales.
– La utilidad
La variable que determina qué tan útil es un objeto es netamente cualitativa. De esta
manera, la utilidad es percibida por cada individuo de acuerdo a una situación específica.
– El tipo de medalla
Ésta es una variable cualitativa ordinal, ya que existe una clasificación por categorías que
asigna un lugar dentro de una competencia. De esta manera las medallas de oro, plata y
bronce denotan el lugar ocupado en una competencia sin la necesidad de asignar un valor
numérico a los resultados.
– La creatividad
Esta variable es cualitativa ya que la creatividad no puede ser medida numéricamente. De
igual forma, es un factor que varía de persona a persona dependiendo del momento
específico en el que tenga lugar.
– La calificación de un examen
Cuando se califica un examen con los términos aprobado, sobresaliente, aceptable o
deficiente, se trata de una variable cualitativa ordinal, ya que no se le está asignando un
valor numérico al resultado, pero sí se le está dando un lugar dentro de una escala de valor.
ESTADISTICA. 26
1. Para cada una de las siguientes situaciones, indique si la variable
adecuada sería cualitativa o cuantitativa. Si la identifica como
cuantitativa, señale si sería discreta o continua.
a) Si usted posee o no un equipo de televisión Panasonic.
b) Usted es un estudiante de tiempo completo o de medio tiempo.
c) La cantidad de personas que asistieron a la graduación de su escuela el
año pasado.
d) El precio de su corte de cabello más reciente.
e) El tiempo de Samuel desde su dormitorio hasta la asociación estudiantil.
f) La cantidad de estudiantes en el recinto universitario que pertenecen a
una fraternidad o club social.
NIVELES DE MEDICION
Identifica las propiedades de medición de la variable y
determina el tipo de operaciones matemáticas que
puede usarse apropiadamente con dicho nivel.
Esto es:
Los datos se pueden clasificar de acuerdo con los niveles
de medición.
El nivel de medición de la información a menudo indica los
cálculos que se pueden realizar para resumir y presentar
los datos.
Asimismo determina las pruebas estadísticas que se
deben realizar.
Niveles de Medición
Ésta es información de escala ordinal porque sabemos el orden o las clasificaciones de los niveles de riesgo,
es decir, el naranja es más alto que el amarillo, pero la cantidad de diferencia entre cada uno de los niveles
No necesariamente es la misma
DATOS DE NIVEL DE
INTERVALO
El nivel de intervalo de la medición es el siguiente nivel
más alto.
Incluye todas las características del nivel ordinal, pero
además la diferencia entre los valores es un tamaño
constante.
Las propiedades de los datos de nivel de intervalo
son:
Las clasificaciones de la información son mutuamente excluyentes
y colectivamente exhaustivas.
Las clasificaciones de la información están ordenadas de acuerdo
con la cantidad de la característica que poseen.
Las diferencias iguales en la característica están representadas por
diferencias iguales en las mediciones.
Ejemplo
Un ejemplo del nivel de intervalo de la medición es la temperatura.
Supongamos que las temperaturas mas elevadas en tres días invernales
consecutivos en Boston son 28, 31 y 20 grados Fahrenheit.
Estas temperaturas se pueden clasificar con facilidad, pero también podemos
determinar la diferencia entre ellas. Esto es posible gracias a que 1 grado
Fahrenheit representa una unidad constante. Las diferencias iguales entre
dos temperaturas son las mismas, sin importar su posición en la escala, es
decir, la diferencia entre 10 y 15 grados Fahrenheit es de 5, la diferencia
entre 50 y 55 grados también es de 5. Debemos hacer notar que 0 es sólo
un punto en la escala. No representa la ausencia de la condición. Una
temperatura de 0 grados Fahrenheit no representa la ausencia de calor,
¡ Sólo que hace frío!
De hecho, 0 grados Fahrenheit corresponden alrededor de -18 grados en la
escala Celsius.
DATOS DE NIVEL DE RAZON
Prácticamente todos los datos cuantitativos son el nivel de razón de la
medición.
El nivel de razón es el nivel de medición “más alto”. Tiene todas las
características del nivel de intervalo, pero además, el punto 0 es
significativo y la razón entre dos números también es significativa.
Las propiedades de los datos de nivel de intervalo
son:
Las clasificaciones de la información son mutuamente excluyentes
y colectivamente exhaustivas.
Las clasificaciones de la información están ordenadas de acuerdo
con la cantidad de la característica que poseen.
Las diferencias iguales en la característica están representadas por
diferencias iguales en los números asignados a las clasificaciones.
El punto cero es la ausencia de la característica.
Algunos ejemplos de la escala de razón de la medición incluyen:
Salarios, unidades de producción, peso, cambio en los precios
accionarios, distancia entre sucursales y altura.
El dinero es un buen ejemplo. Si usted tiene cero dólares, no tiene dinero.
El peso es otro ejemplo.
La siguiente tabla ilustra el uso de la escala de razón de la medición. Muestra los
ingresos de cuatro parejas de padre e hijo.
Observamos que el señor MENDOZA gana el doble que su hijo. En la familia TORRES, el hijo gana el
doble que su padre.
Ejemplos:
1. ¿Cuál es el nivel de medición para cada una de las variables siguientes?
a) Niveles de IQ de los alumnos.
b) Distancias que los alumnos recorren para llegar a clases.
c) Calificaciones de los alumnos en el primer examen de estadística.
d) Una clasificación de los alumnos por estado de origen.
e) Una clasificación de los estudiantes según el grado que cursan.
f) Número de horas que los alumnos dedican a estudiar por semana.
g) Los departamentos, tales como editorial, publicidad, deportes, etc.
Year Sales
1990 188.2
Sales of Manufactured Homes from 1990 to
1991 170.7
2001
1992 210.8
2500
1993 254.3
2000
1994 303.9
Sales 1500
1995 339.6
1000
1996 363.4
500
1997 353.4
0
1998 372.8
1 2 3 4 5 6 7 8 9 10 11 12
1999 348.7
Year
2000 250.6
2001 193.2
DESCRIPCIÓN DE DATOS
DISTRIBUCIONES DE FRECUENCIAS
Y SU
PRESENTACIÓN GRAFICA
Objetivos
• Organizar la información en una distribución de frecuencia.
• Representar una distribución de frecuencia en un
histograma un polígono de frecuencia y un polígono de
frecuencias acumulada.
• Presentar la información utilizando técnicas de gráficas de
líneas, gráficas de barras y gráficas de pastel.
Creación de una distribución de frecuencias
15 546 A 17811
17811 A 20076
20076 A 22341
22341 A 24606
24606 A 26871
26871 A 29136
29136 A 31401
31401 A 33666
33666 A 35931
PASO 4. Contar el número de elementos de cada clase. El número de observaciones en cada
clase se conoce como frecuencia de clase.
50
EJERCICIO:
Las comisiones ganadas durante el primer trimestre del último año por
parte de los 11 miembros del personal de ventas de Master Chemical
Company son:
$1650 $1475 $1510 $1670 $1595 $1760 $1540 $1495 $1590 $1625 $1510
a) Utilizando de $1400 a $1500 como la primera clase, $1500 a $1600 como la segunda,
etc., organizar las comisiones trimestrales en una distribución de frecuencia.
Distribución de Frecuencia
25 23
Frecuencia de clase
20 18
17
15
10 8 8
5 4
2
0
15 18 21 24 27 30 33 36
Precios de venta
POLIGONOS DE FRECUENCIAS
Un polígono de frecuencias es similar a un histograma. Consiste en segmentos de línea que
conectan los puntos formados por las intersecciones de los puntos medios de clase y las
frecuencias de clase.
40
Frecuencias
30
Precio ($000)
20
Frecuencia
10
0
1 2 3 4 5 6 7
Precio de venta ($000)
Tanto el Histograma como el polígono de frecuencia nos permiten tener un panorama
rápido de las principales características de la información (altas, bajas, puntos de
concentración, etc.)
El polígono de frecuencias tiene una ventaja sobre el histograma, nos permite comparar
directamente dos o más distribuciones de la frecuencia.
Importaciones Número de
(millones de $) proveedores
2 A 5 6
5 A 8 13
8 A 11 20
11 A 14 10
14 A 17 1
a) Represente las importaciones en forma de histograma.
b) Represente las importaciones como un polígono de frecuencias relativas.
c) Resuma las facetas importantes de la distribución (como las clases con las frecuencias
más alta y más baja).
Para trazar una distribución de frecuencias acumuladas, coloque el límite superior de cada
clase a lo largo del eje X y las frecuencias acumuladas correspondientes a lo largo del eje Y
Número de vehículos
$8 a $10 3
10 a 12 7
12 a 14 4
14 a 16 1
Construya:
1. Una tabla de frecuencias agrupando los datos, comenzando la
primera clase en 2.0 y terminando la última en 6.0.
2. Incluir en la tabla: las frecuencias relativas, frecuencias absolutas
acumuladas, frecuencias relativas acumuladas.
PROBABILIDAD Y
ESTADISTICA. 69
Ejercicio 3. La siguiente muestra tiene los ingresos ganados cierto sábado
por los estudiantes universitarios que trabajan. Las datos están en
dólares.
30, 11, 42, 8, 30, 18, 25, 25, 17, 30, 39, 21, 23, 25, 15, 35,
26,13, 21, 26.
Si las marcas de clase son 10, 15, 20, 25, 30, 35 y 40, representa los datos
en una Tabla de Distribución de Frecuencias.
$77, 18, 63, 84, 38, 54, 50, 59, 54, 56, 36, 26, 50, 34, 44, 41, 58, 58, 53, 51,
62, 43, 52, 53, 63, 62, 62, 65, 61, 52, 60, 60, 45, 66, 83, 71, 63, 58, 61,
71.
a) Organice los datos en una distribución de frecuencia utilizando 7 clases y
el 15 como límite inferior de la primera clase.
b) Describa la distribución.
PROBABILIDAD Y
ESTADISTICA. 70
Gráficas de barras. Una gráfica de barras se puede utilizar para representar
cualquiera de los niveles de medición: nominal, ordinal, de intervalo o de razón.
Gráficas circulares o de pastel: Una gráfica circular o de pastel es muy útil sobre
todo para ilustrar datos de nivel nominal.
Gastos
Bonos
Educación Premios
Como el área del pastel representa la participación relativa de cada componente, podemos compararlos
con facilidad:
• El gasto más elevado de la Lotería de Ohio es en premios.
• Alrededor de una tercera parte de las ganancias se transfieren a la educación.
• Los gastos operativos representan sólo 5 % de las ganancias.
EJERCICIO.
Los Clayton County Commissioners quieren mostrar a los contribuyentes que
asistan a la próxima reunión lo que sucede con el dinero que pagan en impuestos.
La cantidad total de impuestos que se cobró es de 2 millones de dólares. Los
gastos son: $440 000 para escuelas, $1 160 000 para carreteras, $320 000 para
administración y $80 000 para provisiones. Una gráfica de pastel es ideal para
mostrar la cantidad destinada a escuelas, carreteras, gastos administrativos y
provisiones. Convierta las cantidades de dólares en porcentajes del total y
represente estos porcentajes en forma de gráfica de pastel.