Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Dra. MARLENE
INVESTIGACIÓN EMPRESARIAL ASTUDILLO VICENTE.
Estadística Descriptiva
MEDIDAS DE RESUMEN:
*MEDIDAS DE TENDENCIA CENTRAL
*MEDIDAS DE DISPERSIÓN
ESTADÍSTICA E INVESTIGACIÓN CIENTÍFICA.
MUESTRA
DESCRIPTIVA
POBLACIÓN
EJEMPLO:
En un estudio estadístico realizado en un instituto se intenta hacer ver a los alumnos que estudiar día a
día influye positivamente en las notas obtenidas.
Se considera como variable independiente (o explicativa) la variable “promedio de horas de estudio”
como variable dependiente las “notas obtenidas por cada alumno”.
Variables cualitativas - cuantitativas
•Sexo
Cualitativ as •Modelo de zapatillas deportivas
•Barrio de la localidad en que vive
(modalidad) •Deporte preferido
•Número de hermanos
•Núm.de aprobados en la 1ª evaluación
Variables Discretas •Núm de libros leídos trimestralmente
(Recuentos) •Num. de llamadas telefónicas diarias
Cuantitati vas
(números) •Tiempo diario delante del televisor
•Tiempo de estudio
Continuas •Altura
(Cualquier •Peso
cantidad en •Tiempo empleado en llamadas
un intervalo)
Escalas de Medición
• Escala Nominal
Escala Ordinal
Escala de Intervalo
Escala de Razón
• Escala Nominal: • Escala Ordinal:
Está asociada a variables Los valores de la variable que tienen un
cualitativitas y es denominada ORDEN con un nivel específico, pero no
de este modo si no se pueden se pueden hacer operaciones aritméticas
hacer operaciones aritméticas entre ellas.
entre sus valores, pues éstos son
únicamente ETIQUETAS.
Ejemplo:
Pésimo – Malo – Regular – Bueno –
Ejemplo: sexo, código postal, Excelente
estado civil, número telefónico,
número al correr en un maratón, Primaria – Secundaria – Bachiller -
deporte favorito, carrera a Licenciatura
estudiar, etc.
• Escala de Intervalo: • Escala de Razón:
En ella existe un orden entre los La magnitud tiene
valores de la variable y además una SENTIDO FÍSICO, existe el
NOCIÓN DE DISTANCIA aunque no cero absoluto, existe
se puedan realizar operaciones. orden, se puede
El cero o punto de inicio no es determinar cuántas veces
único, es más bien un punto de es mayor uno que otro.
referencia.
Xi Frecuencia f
Azul 4
Blanco 7
Café 3
Gris 4
Negro 2
Rosa 4
Verde 1
• Por lo regular, se agregan dos xi f h F
4/25
columnas: la de la frecuencia 0,16 4
Azul 4
relativa “h” y la de la
Blanc 7 0,28 11
frecuencia acumulada “H”.
o
• La frecuencia relativa se
obtiene mediante el cociente Café 3 0,12 14
de la frecuencia y el número Gris 4 0,16 18
total de datos, esto es h = f/n. 0,08 20
Siempre
Negro 2
• La frecuencia acumulada se
Rosa 4 0,16 24
es el
número
obtiene sumando las total
frecuencias anteriores a las Verde 1 0,04 25
frecuencias de un dato dado.
Siempre es 1
Total 25 1
xi f h F H %
Azul 4 0,16 4 0,16 16%
Verde 1 0,04 25 1 4%
Total 25 1 100%
PARA DATOS AGRUPADOS
• En ocasiones es conveniente acomodar los datos en
pequeños grupos de igual tamaño, llamados intervalos
de clase.
Límite inferior Límite superior
53 – 57 55
58 – 62 60
63 – 67 65
TAMAÑO DEL INTERVALO
El tamaño del intervalo se obtiene siguiendo el siguiente
procedimiento:
1.) Para el numero aproximado de clases ( K ), se utiliza las siguiente
fórmula:
K = 1 + 3.3 log (n)
Donde K = número aproximado de clases
n = número de datos.
2.) Para el Rango ( R ), se utiliza las siguiente fórmula:
R = diferencia entre el dato mayor y el dato menor.
3.) Amplitud de los intervalos ( A ), se utiliza las siguiente fórmula:
A=R/ K
EJEMPLO
Los puntajes de un examen de ingreso a la universidad realizado por
40 alumnos son los siguientes:
110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108,
109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108,
96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110.
El menor de
los datos
El mayor de
los datos
Paso 1. Determinamos el número de intervalos o clases k.
Una forma de hacerlo es con la Regla de Sturges, donde:
k = 1 + 3.3 log (n) ;
Para el ejemplo se tiene n = 40 datos, sustituyendo
k = 1 + 3.3 log (40) = 1 + 3.3 (1.602) =
= 1 + 5.28 = 6.28
la cual se redondea al entero siguiente, k = 7.
*Otra alternativa es usando la raíz cuadrada del total de datos n
para este ejemplo nos queda así:
k = raíz (n) = √40 = 6.32
que también se redondea al entero siguiente quedando k= 7.
Paso 2. Determinamos el rango (R) de variación de los datos que
se define como
R = Xmax – Xmin,
donde Xmax es el dato máximo y Xmin es el dato mínimo.
Para el ejemplo
Xmax = 140
Xmin = 90 entonces
R = 140 – 90 = 50
Paso 3. Calculamos la amplitud de clase (A), que
corresponde a la cantidad de datos que van en cada
clase, dividiendo el rango R entre el numero de clases k:
A=R/K
A = 50 / 7 = 7,14
se redondea al entero siguiente
A = 8.
Construimos los intervalos o clases, como la variable es
cuantitativa discreta los intervalos o clases son cerrados, es
decir de la forma [Li, Ls].
Para formar las clases comenzaremos con los limites
inferiores:
· En la primer clase tomamos Li1 = Xmin ( el dato mas
pequeño) en este caso 90. Ls1= li + K = 90 + 8 = 98
· Para los siguientes intervalos el limite inferior es igual al
limite superior anterior mas uno.
Paso 5: Construimos la tabla de distribución de frecuencias
INTERVALOS DE CLASE XI
[ 90 – 97]
[ 98 – 105]
[ 106 – 113 ]
[ 114– 121]
[ 122 – 129]
[ 130 – 137]
[ 138 – 145]
TOTAL
Paso 6: hallamos la Marca de clase (Xi): corresponde al punto
medio del intervalo, Para nuestro ejemplo obtendríamos las
siguientes marcas de clase:
INTERVALOS DE CLASE XI
[ 90 – 97] 93,5
[ 98 – 105] 101,5
[ 106 – 113 ] 109,5
[ 114– 121] 117,5
[ 122 – 129] 125,5
[ 130 – 137] 133,5
[ 138 – 145] 141,5
TOTAL
Paso 7: Se halla la frecuencia absoluta es decir se contabiliza
cuantos datos hay en cada intervalo este dato será f = frecuencia
absoluta
INTERVALOS DE XI f
CLASE
[ 90 – 97] 93,5 7
[ 98 – 105] 101,5 9
[ 106 – 113 ] 109,5 13
[ 114– 121] 117,5 3
[ 122 – 129] 125,5 4
[ 130 – 137] 133,5 3
[ 138 – 145] 141,5 1
TOTAL 40
Paso 8: Se halla la frecuencia relativa ( h ) es decir se divide la
frecuencia absoluta entre el total de datos
INTERVALOS DE XI f h
7/40
CLASE
[ 90 – 97] 93,5 7 0,175
9/40
[ 98 – 105] 101,5 9 0,225
[ 106 – 113 ] 109,5 13 0,325 13/40
[ 114– 121] 117,5 3 0,075
[ 122 – 129] 125,5 4 0,100
[ 130 – 137] 133,5 3 0,075
[ 138 – 145] 141,5 1 0,025
TOTAL 40 1
Paso 9: Se halla la frecuencia porcentual (% ) es decir se
multiplica la frecuencia relativa por 100
INTERVALOS DE XI f h %
0,175x100
CLASE
[ 90 – 97] 93,5 7 0,175 17,5
[ 98 – 105] 101,5 9 0,225 22,5
[ 106 – 113 ] 109,5 13 0,325 32,5
[ 114– 121] 117,5 3 0,075 7,5
[ 122 – 129] 125,5 4 0,100 10,0
[ 130 – 137] 133,5 3 0,075 7,5
[ 138 – 145] 141,5 1 0,025 2,5
TOTAL 40 1 100
: Paso 10: Se agregan las columnas
Frecuencia absoluta acumulada = F Frecuencia relativa acumulada = H
Frecuencia porcentual acumulada = %a
Intervalo de clase “xi” f F h H % %a
Total 40 1 100
Gráfica de Datos
Gris 4 8%
IIII
28%
Negro II 2 16%
Rosa IIII 4 12%
Verde I 1
GRÁFICO DE BARRAS
• La gráfica de barras se traza similar al Histograma,
sólo que las barras se dibujan separadas unas de
otras.
• La escala en el eje “x” es para mostrar categorías o
intervalos de números NO consecutivos.
60
Frecuencia absoluta
50
40
30
20
10
0
PERRO PAJARO
CONEJOS HAMSTER GATO
Pictograma
• Similar al de barras, sólo que se sustituyen por figuras,
generalmente relacionadas con la variable estudiada.
Histograma 14
12
• Es la representación gráfica de
10
6
los datos mediante una sucesión 4
de rectángulos. 0
0,95 2,95 4,95
9 38 – 42 40 2
8 43 – 47 45 4
7 48 – 52 50 8
6
53 – 57 55 5
5
f
4 58 – 62 60 3
3 63 - 68 65 3
2
Total 25
1
0
35 40 45 50 55 60 65
xi
Polígono de Frecuencias
53 – 57 55 5 2
1
58 – 62 60 3
0
63- 68 65 3 35 40 45 50 55 60 65 70
xi
Total 25
MEDIDAS DE RESUMEN.
MEDIDAS DE MEDIDAS DE
MEDIDAS DE
TENDENCIA POSICIÓN
DISPERSIÓN
CENTRAL RELATIVA
MODA
Agrupados cualitativa
Es el dato que se repite
con mas frecuencia.
No agrupados cuantitativa
2 modas = Bimodal
PARA DATOS AGRUPADOS
Para calcular la moda de n datos tabulados por intervalos,
primero se determina el intervalo que contiene a la moda,
esto es, el intervalo que tiene la mayor frecuencia (intervalo
modal). Luego se utiliza la fórmula:
d1
M o Li A
d1 d 2
donde:
Li es el límite inferior del intervalo modal.
d1= fi - fi-1
d2= fi - fi+1
A= amplitud del intervalo modal
Ejemplo: La siguiente tabla muestra la inversión anual de 40 empresas.
Entonces: Li = 22
d1= fi - fi-1 = 12 – 6 = 6
d2= fi - fi+1 = 12 – 11= 1
A=6
d1
Calculando la moda: M o Li A
d1 d 2
Mo= 22 + 5,85= 27,14
MEDIA
Agrupados
Es el promedio
cuantitativa
aritmético de los
valores de la variable.
No agrupados
x .
MUESTRA POBLACIÓN
MEDIA PARA DATOS NO AGRUPADOS
Sea x1, x2, .... ,xn los valores que toma una variable
cuantitativa X, entonces la media aritmética se
determina mediante:
x1 x 2 ....... x n
media
n
• Ejemplo: Si las notas en el curso de
introducción a la computación de 10 alumnos
son : 14, 18, 12, 16, 14, 15, 16, 18, 10, 12
14 18 12 16 14 15 16 18 10 12
x
10
x 14,5
Respuesta: La nota promedio es 14,5
MEDIA ARITMETICA PONDERADA
• La media aritmética de los valores x1, x2, x3, .........., xk ponderada por los
pesos
w1, w2, w3, ........ wk es el número.
w1x1 w 2 x 2 ......... w k x k
x
w1 w 2 .......... w k
Ejemplo: Si un alumno el semestre pasado obtuvo
11 en Física 2 y su peso es cinco, 13 en el curso
Lengua de peso cuatro y 16 en cálculo 2 de peso 3,
¿ cuál fue su promedio ?
f1 x 1 f 2 x 2 ......... f k x k
x
f1 f 2 .......... f k
• Ejemplo: En un estudio de edades de estudiantes de Derecho se
obtuvo la siguiente tabla de distribución:
• Edades Frecuencia
• 16 5
• 17 10
• 18 6
• 19 4
• 20 2
• Total 26
• Determina la edad promedio.
Solución
_
x = 18,23 años
MEDIANA
n
Li =Es el límite inferior del intervalo de la mediana
Fi1
Me Li 2
n = Número de datos observados
A
Fi-1= Frecuencia acumulada absoluta del intervalo
inmediatamente anterior al intervalo de la
mediana
fi = Frecuencia absoluta del intervalo de la mediana fi
A = Amplitud del intervalo de la mediana
Ejemplo: La siguiente tabla muestra la inversión anual de 44 empresas.
RANGO ( R )
VARIANZA (σ2 2
óS )
DESVIACIÓN TÍPICA (σ ó S)
EJEMPLO 10
13
La siguiente tabla representa la
22
pérdida de peso en libras, de
RANGO un grupo de personas que se
26
16
El Rango corresponde a la sometieron a un tratamiento 23
distancia entre el puntaje 35
mayor (llamado valor
durante el último año 53
máximo) y el puntaje Valor Máximo: 60 17
menor (llamado valor 32
mínimo) Valor Mínimo: 10 41
35
= 60 - 10 27
16
= 50 20
60
48
EJEMPLO 10
13
RANGO MEDIO La siguiente tabla representa la
22
pérdida de peso en libras, de 26
un grupo de personas que se 16
Es la media del mayor y menor sometieron a un tratamiento 23
valor, o la tercera parte del camino durante el último año 35
= (60 + 10 ) / 2 27
16
= 35 20
60
48
DESVIACION ESTANDAR Y VARIANZA DE UNA
POBLACIÓN
(X X ) 2
X 15
X X X
10 -5 25
12 -3 9
68
15
18
0
3
0
9
2
13,6
20 5 25 5
13,6 3,69
VARIANZA Y DESVIACIÓN ESTÁNDAR EN
MUESTRAS
s s 2
MEDIDAS DE POSICIÓN
RELATIVA
CUARTILES
DECILES
PERCENTILES
CUARTILES.
2, 3, 4, 5, 6, 7, 9
Q1 Q2 Q3
NÚMERO PAR DE DATOS.
1, 2, 3, 4, 5, 6, 7, 9
Q1 Q2 Q3
CALCULO DE LOS CUARTILES PARA DATOS
AGRUPADOS
[50, 60) 8 8
[60, 70) 10 18
Hallar el
cuartil 1 [70, 80) 16 34
Cuartil 2 [80, 90) 14 48
Cuartil 3 [90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
CALCULO DEL PRIMER CUARTIL
k.N = 1 x 65 = 16,25
4 4
Se busca en la tabla donde se
encuentra 16, 25.
Observamos que Li = 60
Fi-1 = 8 Q1 = 60 + 16.25 – 8 x 10 = 68.25
fi = 10
10
ai = 10
CALCULO DEL SEGUNDO CUARTIL
k.N = 2 x 65 = 32,5
4 4
Se busca en la tabla donde se
encuentra 32, 5.
Observamos que Li = 70
Fi-1 = 18 Q2 = 70 + 32.5 – 18 x 10 = 79.06
fi = 16
16
ai = 10
CALCULO DEL TERCER CUARTIL
k.N = 3 x 65 = 48,75
4 4
Se busca en la tabla donde se
encuentra 48, 75.
Observamos que Li = 90
Fi-1 = 48 Q3 = 90 + 48,75 – 48 x 10 = 90.75
fi = 10
10
ai = 10
PROBABILIDADES
Experimento Aleatorio E
Espacio Muestral Ω
Evento A
PROBABILIDADES
Probabilidad
= Número de afectados
Total • La probabilidad de
que en la tirada de
Ejemplo un dado resulte el
2 es 1/6.
Ejemplo