Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Prefacio:
2
Índice del Contenido
I. PREFACIO 02
3
Desarrollo de los Temas
UNIDAD DIDÁCTICA I: INTRODUCCIÓN A LA ESTADÍSTICA
CAPITULO 01: INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
Por tanto se podría definir la estadística como “la ciencia que permite estudiar
las regularidades o patrones en un conjunto de datos
para tomar decisiones racionales”.
Todo análisis estadístico requiere seguir una serie
de etapas:
1. Definición del problema de estudio y objetivos del
mismo.
2. Selección de la información necesaria para realizar el
estudio.
3. Recogida de la información que va a depender del
presupuesto con el que contemos y de la calidad de
los datos exigida.
4. Ordenación y clasificación de la información en tablas
y gráficos.
5. Resumen de los datos mediante medidas de posición,
dispersión, asimetría y concentración.
6. Análisis estadístico formal obteniendo hipótesis y contrastándolas.
7. Interpretación de resultados y extracción de conclusiones.
8. Extrapolación y predicción.
4
Muestra
Una muestra es un conjunto representativo de la población de referencia, el número de
individuos de una muestra es menos que el de la población.
Muestreo
El muestreo es la reunión de datos que se desea estudiar, obtenidos de una
proporción reducida y representativa de la población.
Valor
Un valor es cada uno de los distintos resultado que se pueden obtener en un estudio
estadístico. Si lanzamos una moneda al aire 5 veces
obtenemos dos valores: cara y cruz
Dato
Un dato es cada uno de los valores que se ha
obtenido al realizar un estudio estadístico. Si
lanzamos una moneda al aire 5 veces obtenemos 5
datos: cara, cara, cruz, cara, cruz.
Variable Estadística
Una Variable estadística es cada una de las
características o cualidades poseen los individuos de
una población.
TIPOS DE VARIABLES
Las variables que se observan y analizan pueden ser de dos tipos:
a) Variables cualitativas o atributos: no se pueden medir numéricamente,
representan características o atributos de las variables (por ejemplo:
nacionalidad, sexo, religión).
b) Variables cuantitativas: tienen valor numérico (edad, altura, precio de un
producto, ingresos anuales).
5
Según sea de un tipo u otro la variable podrá medirse de distinta manera, o lo
que es lo mismo en la terminología estadística, tendrán distintas escalas de
medida:
6
La información que se recoge de una o varias variables se presenta en tablas
que representan la distribución de dichas variables y también se pueden
clasificar en:
a) Distribuciones unidimensionales: sólo recogen información sobre una
característica (por ejemplo: edad de los alumnos/as de una clase).
b) Distribuciones bidimensionales: recogen información sobre dos características de
cada elemento de la población simultáneamente (por ejemplo: edad y altura de
los alumnos/as de una clase).
c) Distribuciones multidimensionales: recogen información sobre tres o más
características de cada elemento (por ejemplo: edad, altura y peso de los
alumnos/as de una clase).
Las primeras herramientas para conocer y por tanto describir el problema que
estamos analizando nos las proporciona la estadística descriptiva a través de las
siguientes maneras de clasificar la información:
CAPITULO 04: TABULACIÓN DE LA INFORMACIÓN
7
xi Valor de la variable
fi Frecuencia absoluta: Número de veces que aparece un
determinado valor de x
hi Frecuencia relativa: Número de veces que aparece un
determinado valor de x respecto al total
Hi Frecuencia absoluta acumulada: Suma de la frecuencia
absoluta correspondiente más todas las anteriores.
Fi Frecuencia relativa acumulada: Suma de la frecuencia
relativa correspondiente más todas las anteriores
n Tamaño de la muestra
Distribución Representa los valores de la variable y la
frecuencia con que aparecen dichos valores (xi , ni)
Recorrido Diferencia entre el máximo y el mínimo valor de la variable
Se utiliza este tipo de distribución cuando el número de valores diferentes que toma la
variable no es grande, generalmente menos de 15 ó 20 valores (por ejemplo número
de hijos).
8
CAPITULO 01: PROCEDIMIENTO PARA DETERMINAR
FRECUENCIAS DE DATOS NO AGRUPADOS:
Sea: “x”: número de hermanos:
TABLA N° 01
Clasificación de alumnos de la I.E. “san José” de san José 2010, según el
número de hermanos
f1 + f2 + f3 +… + fi = n
Ej.: 3 + 4 + 8 + 8 + 4 + 3 = 30 = n
Interpretación:
f3: 8 alumnos han declarado tener 2 hermanos.
f5: 4 alumnos han declarado tener 4 hermanos.
9
Frecuencia relativa simple: (hi)
Es el cociente que resulta de dividir la frecuencia absoluta entre el tamaño de la
muestra (n)
Interpretación:
h3 : El 0,2667 tanto por uno de 30 alumnos, han declarado tener 2 hermanos.
h3 x 100: El 26,67% de 30 alumnos han declarado tener 2 hermanos
10
Gráfico 1- Diagrama de barras
11
Representaciones gráficas para datos agrupados
Histograma: representa frecuencias sin acumular. Este gráfico es válido para datos
cuantitativos de tipo continuo o discreto si tiene un gran número de datos. El
histograma está formado por rectángulos de área igual o proporcional a la frecuencia
observada.
Área = base * altura ni = ci * altura
Altura = densidad de fr
Secuencia = ni/ci
a) Se halla el rango o amplitud total (R). Para lo cual se localizan primero los
puntajes máximos y mínimos de la muestra. Luego se resta el puntaje mínimo del
máximo, obteniéndose de esta manera el rango o amplitud.
12
b) Después se determina el número de intervalos (m). Consiste en dividir el rango
en un número conveniente de intervalos, llamados también “intervalos de clase”.
Estos intervalos son generalmente del mismo tamaño. Podemos aplicar las
siguientes alternativas:
Los dos métodos nos dan el posible número de intervalos, la elección es arbitraria.
Tomaremos en este caso m = 6 intervalos, por que el rango es R = 18 y nos daría una
cantidad exacta.
Luego, determinamos el tamaño de los intervalos (C), para lo cual dividimos el rango
(R) entre el número de intervalos (m). También se le denomina amplitud de clase.
C=R÷m
C = 18 ÷ 6
C=3
n = 40
13
UNIDAD DIDÁCTICA III: MEDIDAS RESUMEN DE LAS
DISTRIBUCIONES DE FRECUENCIAS
¿Qué es un promedio?
A menudo necesitamos un solo número para representar una serie de datos. Este
único número puede ser considerado como típico de todos
los datos. La palabra promedio es usada frecuentemente
en nuestro lenguaje diario, normalmente nos referimos a
la media aritmética, pero podría referirse a cualquiera de
los promedios. Un término más preciso que promedio es
una medida de tendencia central.
Notación matemática necesaria:
La sumatoria es un símbolo muy utilizado en matemáticas
que sirve para simplificar formulas estadísticas.Una
sumatoria nos permite representar sumas muy grandes,
de n sumandos o incluso sumas infinitas y se expresa con
la letra griega sigma ( Σ ).
14
Por lo general después de una sumatoria aparece una variable con un suscrito
representado por la letra i (ΣXi). Este suscrito indica qué valores de la variable se
deben sumar, Para determinar cuáles valores es necesario sustituir la i por los
valores que se indican arriba y debajo de la sumatoria
Por ejemplo si queremos expresar la suma de los diez primeros números naturales
podemos hacerlo así con una sumatoria:
Las sumatorias son útiles para expresar sumas arbitrarias de números, por ejemplo en
fórmulas: así, si queremos representar la «fórmula» para hallar la media aritmética de
n números:
REGLAS DE LA SUMATORIA
Propiedad distributiva de la suma
La propiedad distributiva de la suma indica que cuando se multiplica cada uno de los
términos que componen una suma por la misma constante, es posible primero efectuar
la suma de los términos y luego multiplicar el resultado por la constante.
Ejemplo:
9(2+7+4+6) = (9)2 + (9)7 + (9)4 + (9)6
= 18 + 63 + 36 + 54
= 171, ó lo mismo
9(2+7+4+6) = (9)19 = 171
15
Utilizando la sumatoria esta situación se representa de la siguiente manera:
Como la suma del mismo número repetidas veces se puede representar por medio de
la operación de multiplicación es posible indicar que si C es una constante entonces
i X Y
1 2 5
2 3 -2
3 -1 0
4 1 1
16
La sumatoria es igual a:
(X1+Y1)+(X2+Y2)+(X3+Y3)+(X4+Y4) = X1+X2+X3+X4+Y1+Y2+Y3+Y4
(2+5)+[3+(-2)]+[(-1)+0]+(1+1) = 2+3+(-1)+1+5+(-2)+0+1
7+1-1+2 = 9
-------------------------- = ---------
n n
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de 1er año, a saber: 18,23,
27,34 y 25., para calcular la media aritmética (promedio de las edades, se tiene que:
28+23+27+34+25 127
17
Si en una tabla de distribución de frecuencia, con r clases, los puntos medio son: X 1,
X2, X3,…,Xn; y las respectivas frecuencias son f1, f2, f3, … , fn, la media aritmética se
calcula de la siguiente manera:
Ejemplo:
Si se toman los datos del ejemplo resuelto al construir la tabla de distribución de
frecuencia de las cuentas por cobrar de Cabrera’s y Asociados que fueron los
siguientes:
Clases 1 2 3 4 5 6
Puntos Medios (Xi) 14,628 29,043 43.458 57,873 72.288 86.703
Frecuencias (fi) 10 4 5 3 3 5
Al calcular la cuenta promedio por cobrar (media aritmética) de estos datos se tiene lo
siguiente:
------------------------------------------------------------------------------------------------
10 +4 + 5 + 3 + 3 + 5
n = Σfi = 30
146,28 + 116.172 + 217.29 + 173.619 + 216.864 + 433.515
-------------------------------------------------------------------------------
30
1303.74
------------------- = 43.458
30
18
Propiedades de la media aritmética
Puede ser calculada en distribuciones con escala relativa y de intervalos
Todos los valores son incluidos en el cómputo de la media.
Una serie de datos solo tiene una media.
Es una medida muy útil para comparar dos o más poblaciones
Es la única medida de tendencia central donde la suma de las desviaciones de
cada valor respecto a la media es igual a cero.
Por lo tanto podemos considerar a la media como el punto de balance de una
serie de datos.
Desventajas de la media aritmética
• Si alguno de los valores es extremadamente grande o extremadamente pequeño,
la media no es el promedio apropiado para representar la serie de datos.
• No se puede determinar si en una distribución de frecuencias hay intervalos de
clase abiertos.
La Mediana (Me):
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeños,
la media aritmética no es representativa. El valor central en tales problemas puede ser
mejor descrito usando una medida de tendencia central llamada mediana., y denotada
por Me. La mediana es una medida de posición y se define como la posición central
en el arreglo ordenado de la siguiente manera:
Dado un conjunto de números agrupados en orden creciente de magnitud, la mediana
es el número colocado en el centro del arreglo, de tal forma que una mitad de las
observaciones está por encima y la otra por debajo de dicho valor. Si el número de
observaciones es par, la mediana es la media de los dos valores que se hallan en el
medio del arreglo, de donde se concluye en la siguiente definición:
Mediana. Es el punto medio de los valores de una serie de datos después de haber
sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana
como posteriores en el arreglo de datos
19
Nota: El resultado obtenido en la formula corresponde al número de la
observación en el arreglo, por tanto debe reemplazarse por el valor de dicha
variable en el arreglo.
Ejemplo: (n es impar)
Se tienen las edades de cinco estudiantes universitarios de I año, a saber: 18,
23,25.27 y 35. Obsérvese que los datos deben estar ordenados en un arreglo
ascendente o descendente.
Por cuanto que el número de datos es cinco (n=5) y es impar, entonces:
Me = Xn+1/2 = X(5+1)/2 = X6/2 = X3 = 25 años
Nota: obsérvese que se obtuvo el número de la variable mediana (X3) que en el
arreglo de edades ordenado en forma ascendente corresponde a 25 años (X3=25).
Continuación del ejemplo… (n es par)
Si el número de estudiantes hubiere sido par, suponga que se adiciona un estudiante
con 31 años, entonces el arreglo ascendente consecuente sería 18, 23, 25, 27, 31 y
35, entonces la mediana se calcula así:
Xn/2 + X(n/2)+1 X6/2 + X(6/2)+1 X3 + X4 25 + 27 52
Me= ------------------ =------------------- = -------------- = ------------- = -------- = 26 años
2 2 2 2 2
Donde:
L = límite inferior de la clase mediana.
N = frecuencia total o Σfi.
Fi = frecuencia absoluta acumulada hasta la clase
premediana
fi = frecuencia absoluta de la clase mediana
C = amplitud de la clase mediana.
20
Ejemplo:
Si se toman los datos obtenidos del ejemplo resuelto al construir la tabla de
distribución de frecuencias de las cuentas por cobrar de la tienda Cabrera’s y
Asociados que fueron las siguientes:
21
Propiedades de la mediana
Hay solo una mediana en una serie de datos.
No es afectada por los valores extremos ( altos o bajos )
Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no
se encuentra en el intervalo abierto.
Puede ser calculada en distribuciones con escala relativa, de intervalos, y
ordinal.
La Moda (Mo.):
A veces es importante conocer cuál es el valor que
más prevalece en el conjunto de datos. El valor que
ocurre con más frecuencia se le conoce como moda.
La moda es la medida de tendencia central
especialmente útil para describir mediciones de tipo
ordinal, de intervalos y nominal.
En un conjunto de números la moda se define como
el valor ó número que ocurre con más frecuencia
Ejemplo:
En el siguiente conjunto de números 1, 5, 5, 9, 12,
12, 12, 14. La moda es igual a 12, por cuanto que es
el número que más se repite (tres veces)
Mo. = Li + [ ( ∆1 / ∆1+∆2 ) ] C
Donde;
- Li = límite inferior de la clase modal (clase de mayor frecuencia absoluta (fa)
- ∆1 = diferencia de las frecuencias absolutas de la clase modal y premodal.
- ∆2 = diferencia de las frecuencias absolutas de la clase modal y postmodal
- C = amplitud de la clase modal.
22
Ejemplo:
Para encontrar la moda es necesario, en primer lugar, identificar la clase modal; que
será aquella que posea la mayor frecuencia absoluta. En el ejemplo de cuentas por
cobrar de Cabrera`s y Asociados la clase modal será la primera, por cuanto que tiene
la mayor frecuencia absoluta.
A partir de esto se puede reemplazar en la formula anterior los datos, a saber
Li =7.42 C=14.415 f1 = 10 (frecuencia absoluta de la clase modal)
f0 = 0 (frecuencia absoluta de la clase premodal)
f2 = 4 (frecuencia absoluta de la clase postmodal)
∆1 = 10–0 = 10 ∆2 = 10-4 = 6
Mo. = 7.42 + [(10/10+6) 14.415] = 7.42 + [ (10/16) 14.415] =
= 7.42 + [0.625 (14.415)] = 7.42 + 9.01 = 16.53
Propiedades de la moda
La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal,
de intervalos, y relativa).
La moda tiene la ventaja de no ser afectada por valores extremos.
Al igual que la mediana, puede ser calculada en distribuciones con intervalos
abiertos.
Desventajas de la moda
En muchas series de datos no hay moda porque ningún valor aparece más de
una vez.
En algunas series de datos hay más de una moda, en este caso uno podría
preguntarse ¿cuál es el valor representativo de la serie de datos?
23
CAPÍTULO 02: MEDIDAS DE DISPERSIÓN
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la
media de una distribución estadística.
24
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes
expresiones que son equivalentes a las anteriores.
Ejercicios de varianza
Calcular la varianza de la distribución:
9 , 3 , 8 , 8 , 9 , 8, 9 , 1 8
xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5 0 00
[ 3 0 ,4 0 ) 35 10 350 1 2 25 0
[40, 50) 45 9 405 1 8 22 5
[50, 60 55 8 440 2 4 20 0
[ 6 0 ,7 0 ) 65 4 260 1 6 90 0
[70, 80) 75 2 150 1 1 25 0
42 1 8 20 8 8 05 0
25
Propiedades de la varianza
1. La varianza será siempre un valor positivo o cero, en el caso de que las
puntuaciones sean iguales.
2. Si a todos los valores de la variable se les
suma un número la varianza no varía.
3. Si todos los valores de la variable se
multiplican por un número la varianza queda
multiplicada por el cuadrado de dicho número.
4. Si tenemos varias distribuciones con la misma
media y conocemos sus respectivas varianzas
se puede calcular la varianza total.
26
Desviación Standard
La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de
desviación.
La desviación típica se representa p o r σ.
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.
27
Ejercicios de desviación típica:
9 , 3 , 8 , 8 , 9 , 8, 9 , 1 8
xi fi xi · fi xi2 · fi
[ 3 0 ,4 0 ) 35 10 350 1 2 25 0
[ 6 0 ,7 0 ) 65 4 260 1 6 90 0
42 1 8 20 8 8 05 0
28
Propiedades de la desviación Standard
1. La desviación típica será siempre un valor
positivo o cero, en el caso de que las
puntuaciones sean iguales.
2. Si a todos los valores de la variable se les
suma un número la desviación típica no
varía.
3. Si todos los valores de la variable se
multiplican por un número la desviación
típica queda multiplicada por dicho número.
4. Si tenemos varias distribuciones con la
misma media y conocemos sus respectivas
desviaciones típicas se puede calcular la desviación típica total.
29
CAPÍTULO 03: MEDIDAS DE POSICIÓN NO CENTRAL
Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Q 1 , Q 2 y Q 3 determinan los valores correspondientes al 25%, al 50% y al 75% de
los datos.
2 , 5 , 3 , 6 , 7 , 4, 9
Núme ro pa r de datos
2 , 5 , 3 , 4 , 6 , 7, 1 , 9
30
CÁLCULO DE LOS CUARTILES PARA DATOS AGRUPADOS:
Ejercicio de cuartiles
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[ 9 0 , 1 00 ) 10 58
[ 1 0 0, 11 0 ) 5 63
[ 1 1 0, 12 0 ) 2 65
65
31
Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.
Ejercicio de deciles
Calcular los deciles de la distribución de la tabla:
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[ 9 0 , 1 00 ) 10 58
[ 1 0 0, 11 0 ) 5 63
[ 1 1 0, 12 0 ) 2 65
65
32
Cá l c ul o del pri mer de c i l
Cá l c ul o del s e gundo de c i l
Cá l c ul o del te rce r de c i l
Cá l c ul o del c ua rto de c i l
Cá l c ul o del s ex to de c i l
Cá l c ul o del s é ptimo de c i l
Cá l c ul o del oc ta vo de c i l
Cá l c ul o del nove no de c i l
33
Percentiles
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P50 coincide con la mediana.
Cálculo de los percentiles
E je rc i c i o de pe rce nti l e s
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
P e rce nti l 35
P e rce nti l 60
34
Tr a b a jo Pr á c t ico de Est a díst ic a Gener a l
4) Las puntuaciones obtenidas por un grupo en una prueba han sido: 15, 20, 15, 18,
22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13. Construir la tabla de
distribución de frecuencias
5) El número de estrellas de los hoteles de una ciudad viene dado por la siguiente
serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2,
1, 1, 1, 2, 2, 4, 1. Construir la tabla de distribución de frecuencias
7) Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:
[110,
[50, [60, [70, [90, [100,
Peso [ 8 0 , 9 0) 12
60) 70) 80) 100) 110)
0)
fi 8 10 16 14 10 5 2
35
8 ) Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50,
en un examen de Física.3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7,
34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15,
32, 13.
Construir la tabla de frecuencias.
9 ) Sea una distribución estadística que viene dada por la siguiente tabla:
xi 61 64 67 70 73
fi 5 18 42 27 8
Calcular:
1. La moda, mediana y media.
2. El rango, varianza y desviación Standard
[38, 44) 7
[44, 50) 8
[50, 56) 15
[56, 62) 25
[62, 68) 18
[68, 74) 9
[74, 80) 6
36
16) Una distribución estadística viene dada por la siguiente tabla:
[10, 15) [15, 20) [20, 25) [25, 30) [30, 35)
fi 3 5 7 4 2
Hallar:
La moda, mediana y media.
El rango, desviación media y varianza.
fi 3 5 7 8 2 6
Calcular:
La mediana y moda.
Cuartil 2º y 3º.
Media.
37