Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Según Allen (1996), Chao (1996), Yule y Kendal (1986) y Rivas González (1993) la
estadística es una ciencia (otros investigadores la consideran como un conjunto de
métodos) que se encarga de la recolección, clasificación, presentación,
organización, análisis e interpretación de un conjunto de fenómenos, (naturales,
económicos, políticos o sociales) de manera metódica y numérica, que permitan
extraer conclusiones de un hecho, en un momento determinado y así poder tomar
decisiones valederas. De acuerdo con la definición anterior la estadística se encarga
de la recolección, clasificación, análisis e interpretación de un conjunto de datos en
una investigación determinada. Según, algunos investigadores la estadística, es
una rama de las matemáticas que se ocupa de reunir, organizar y analizar datos
numéricos y que ayuda a resolver problemas como el diseño de experimentos y la
toma de decisiones. También, se puede decir que es una rama de las matemáticas
que utilizando un conjunto de métodos y técnicas se encarga de la recolección,
organizar, presentación, analizar e interpretación de datos naturales, económicos,
políticas, sociales, etc, para presentar los resultados obtenidos y sacar conclusiones
válidas basadas en dicho análisis y así poder tomar una decisión. La función
principal de la estadística es elaborar principios y métodos que ayuden a tomar
decisiones frente a la incertidumbre. En realidad, muchos autores definen la
estadística actualmente como un método de toma de decisiones frente a la
incertidumbre. La estadística puede presentar conclusiones referentes únicamente
al grupo estudiado, o puede generalizarlas para grupos mayores.
http://www.estadisticacondago.com/index.php/aplicaciones-excel-mainmenu-101
Clasificación de la Estadística
Variables: Las variables son magnitudes que pueden tener un valor cualquiera de
los comprendidos en un conjunto de valores de un estudio o investigación
determinada. Son todos aquellos datos u observaciones que pueden ser
expresados mediante números, es decir, son características de una población
determinada, susceptible de medición.
El fin que persigue todo gráfico es el de dar una idea rápida de la situación que en
ese momento se está investigando. Por tal motivo, la presentación de los datos por
medio de gráficos debe ser de una forma simple y de una compresión fácil. Es
preferible construir un conjunto de gráficos en donde cada uno de ellos presente un
aspecto sencillo de una situación determinada, que presentar un solo gráfico en el
cual se observen demasiadas relaciones que se haga difícil estudiar de una forma
efectiva. Por lo tanto, no debe sobrecargarse un gráfico para tratar de mostrar
demasiadas categorías, ya que, la simplicidad es una de la característica básica de
estos.
• Numeración.
• Título: Aquí se señala la población en estudio y la variable de interés.
• Diagrama: está dado por el propio dibujo, el cual representa el
comportamiento de los datos.
• Escalas y/o leyendas: Son indicadores donde se precisa la correspondencia
entre los elementos del gráfico y la naturaleza de las medidas representadas.
• Fuente: Aquí se señala el cuadro de frecuencias que permitió obtener el
respectivo gráfico.
Existe una gran variedad de tipos de gráficos entre los que se pueden mencionar
los pictogramas, cartogramas, de cuadrados, de triángulos y círculos
proporcionales, de sectores circulares, de barras, lineales, estereogramas, polares,
etc., pero los más utilizados y de interpretación sencilla son los: Los gráficos de
barras, los de sectores circulares y los lineales. Solo se estudiarán las siguientes
gráficas:
Cabe aclarar que tanto las tablas como los gráficos deben acatar las órdenes según
el tipo de norma con las que se trabaje, ya sea Icontec, Apa, Vancouver, etc.
Los procedimientos fueron realizados utilizando Microsoft Excel 2016, aunque son
Muy parecidos a los de otras versiones de esta hoja de cálculo de Microsoft Office.
Cabe precisar que esta tabla como su nombre lo indica queda de forma dinámica,
de tal manera que seleccionando la pestaña al lado derecho de la palaba ESTADO,
podemos escoger las categorías que deseemos. Ahora si se quiere a partir de ella
generar una tabla más completa con sus respectivas frecuencias relativas, la
copiamos y la pegamos en otro especio cualquiera de la hoja de cálculo, y se
procede a generar los porcentajes de la siguiente forma:
Seleccionamos la tabla dinámica y la pegamos más abajo (en nuestro ejemplo a
partir de la celda M18). Figura 5, en las celdas N18 y O18, escribimos
respectivamente ni (frecuencia absoluta) y hi% (frecuencia relativa). Ahora en la
celda O19 escribimos la siguiente formula: =N19/$N$24, y la copiamos para las
demás celdas hasta la O24.
ESTADO ni hi%
Casado 95 19%
Separado 104 21%
Soltero 105 21%
Unión Libre 93 19%
Viudo 103 21%
Total general 500 100%
160
156
Interpretación:
Cuenta de EDUCACION
EDUCACION Total
8 54
12 201
14 6
15 125
16 63
17 11
18 9
19 28
20 2
21 1
Total general 500
• Esta variable nos puede informar por ejemplo que el 40.2%, correspondiente
a 201 empleados han tenido 12 años de educación, y tan solo el 6.2% (31
empleados), han estudiado entre 19 y 21 años.
• En cuanto a las frecuencias acumuladas, por ejemplo, el 93.8% (469
empleados), tienen máximo 18 años de educación.
1.- Rango o Amplitud total (recorrido): Es el límite dentro del cual están
comprendidos todos los valores de la serie de datos, en otras palabras, es el número
de diferentes valores que toma la variable en un estudio o investigación dada. Es la
diferencia entre el valor máximo de una variable y el valor mínimo que ésta toma en
una investigación cualquiera. El rango es el tamaño del intervalo en el cual se ubican
todos los valores que pueden tomar los diferentes datos de la serie de valores,
desde el menor de ellos hasta el valor mayor estando incluidos ambos extremos. El
rango de una distribución de frecuencia se designa con la letra R.
Para obtener el rango, se tienen que identificar los extremos del conjunto de datos,
o sea, sus valores máximo y mínimo. Se iniciará por el mínimo. Seleccione una
celda donde desea que el resultado sea colocado: por ejemplo, la celda L2.
Seleccione esta celda con el cursor. Observe que en la barra de herramientas de
Excel hay un botón llamado Insertar función , vea la Figura 8.
EDAD
Mínimo 29.83836
Máximo 71.86575
Rango 42.0274
Figura 12. Rango de la variable EDAD
R” = A x m = 4,21 x 10 = 42,1
Esta diferencia la dividimos en dos números los más equitativos, pero con dos decimales,
para mantener el formato, es decir 0,03 y 0,04, uno de estos números lo restamos del
mínimo y el otro se lo sumamos al máximo, lo cual quedaría:
Para la frecuencia absoluta (ni), se selecciona el rango desde la celda N14 a N23,
se presiona y surgirá la pantalla vista en la Figura 12. Escogemos la función
frecuencias, y damos aceptar. Aparece el cuadro de la figura 13 “Argumentos de
función”.
Li Ls Yi ni hi% Ni Hi%
29.81 34.02 31.92 83 16.6% 83 16.6%
34.02 38.23 36.13 142 28.4% 225 45.0%
38.23 42.44 40.34 87 17.4% 312 62.4%
42.44 46.65 44.55 21 4.2% 333 66.6%
46.65 50.86 48.76 27 5.4% 360 72.0%
50.86 55.07 52.97 33 6.6% 393 78.6%
55.07 59.28 57.18 29 5.8% 422 84.4%
59.28 63.49 61.39 29 5.8% 451 90.2%
63.49 67.7 65.60 26 5.2% 477 95.4%
67.7 71.91 69.81 23 4.6% 500 100.0%
TOTAL 500 100.0%
Intervalos ni
29.81 - 34.02 83
34.02 - 38.23 142
38.23 - 42.44 87
42.44 - 46.65 21
46.65 - 50.86 27
50.86 - 55.07 33
55.07 - 59.28 29
59.28 - 63.49 29
63.49 - 67.70 26
67.70 - 71.91 23
Ahora con la tabla que se muestra en la Figura 17, se puede construir la ojiva.
Seleccionando los intervalos de la tabla, pero cada intervalo en una sola celda, la
frecuencia absoluta acumulada (Ni), escogiendo el gráfico de líneas con
marcadores, y realizando los ajustes necesarios.
Algunas interpretaciones:
ESTADO
FUNCION Casado Separado Soltero Unión Libre Viudo Total general
Gerencia 1.8% 4.8% 3.6% 4.0% 3.4% 17.6%
Oficina 15.8% 14.6% 16.0% 13.8% 16.8% 77.0%
Servicios Generales 1.4% 1.4% 1.4% 0.8% 0.4% 5.4%
Total general 19.0% 20.8% 21.0% 18.6% 20.6% 100%
2.4. Ejercicios
10.5 11.2 9.9 15.0 11.4 12.7 16.5 10.1 12.7 11.4
11.6 6.2 7.9 8.3 10.9 8.1 3.8 10.5 11.7 8.4
12.5 11.2 9.1 10.4 9.1 13.4 12.3 5.9 11.4 8.8
7.4 8.6 13.6 14.7 11.5 11.5 10.9 9.8 12.9 9.9
700 300 500 400 500 700 400 750 800 500
500 750 300 700 1000 1500 500 750 1200 800
400 500 300 500 1000 300 400 500 700 500
300 400 700 400 700 500 400 700 1000 750
700 800 750 700 750 800 700 700 1200 800
Determínese:
a) La distribución de frecuencias de los precios.
b) Porcentaje de hoteles con un precio superior a 750.
c) Cuántos hoteles tienen un precio mayor o igual que 500 pero menor o igual
a 1000.
d) Representar gráficamente dichas distribuciones.
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
3.2 3.7 4.2 4.6 3.7 3.0 2.9 3.1 3.0 4.5
4.1 3.8 3.9 3.6 3.2 3.5 3.0 2.5 2.7 2.8
3.0 4.0 4.5 3.5 3.5 3.6 2.9 3.2 4.2 4.3
4.1 4.6 4.2 4.5 4.3 3.2 3.7 2.9 3.1 3.5
Se pide:
Son medidas de resumen que se calculan dentro de las muestras. Se clasifican en:
a) Medidas de posición
b) Medidas de dispersión
c) Medidas de forma
d) Medidas de concentración
X
n
X i 1
.
N
Desviaciones o desvíos. - Son diferencias algebraicas entre cada valor de la serie
o cada punto medio y la media aritmética de dicha serie, o un valor cualquiera
tomado arbitrariamente. Los desvíos o desviación se designan con la letra di.
Dado una serie de valores X1, X2, X3, .......Xn, se llama desvío a la diferencia entre
un valor cualquiera Xi de la serie y un valor indicado k de esa misma serie. Si el
valor indicado k de la serie corresponde precisamente a la media aritmética de esos
valores dados, se dice entonces que los desvíos son con respecto a la media
aritmética. En símbolo: d i ( X i X ).
4. La media del producto de una constante por una variable, es igual al producto
de la constante por la media de la variable.
X
KXi K Xi
KX.
N N
1. El valor de la media depende de cada una de las medidas que forman la serie
de datos, y se halla afectada excesivamente por los valores extremos de la serie
de datos.
3. La media es una medida de posición que se calcula con todos los datos de la
serie de valores y es susceptible de operaciones algebraicas.
X
Xi
. En donde N es el número total de datos y X i son los valores de
N
la variable.
X
f i X i f X i ...Donde..N es igual al número total de datos. fi representa
fi N N
la frecuencia absoluta, que en el capítulo de distribuciones de frecuencias se ha
denotado como ni.
CLASES fi
75-------79 20
80-------84 40
85-------89 60
90-------94 100
95 ------99 140
f i N =360
X
f i X i 32820 91.17. Kg
N 360
N
2 Faa
Ahora se aplica la fórmula: Md Li Ic
fm
N 132
N = 132, 66, luego la mediana se encuentra en la clase 70----74, por
2 2
lo tanto el limite real inferior de esa clase es 69.5 = Li. La frecuencia fi de esa clase
es 50 = fm , Faa = 44 y el
Ic = 5. Aplicando la formula se tiene:
66 44 22
Md 69.5 5 69.5 .5 69.5 2.2 71.70.
50 50
Luego la mediana de esa distribución es 71.70. Esto quiere decir que un 50 % de
los obreros trabajaron horas extras por debajo de 71.70 horas y el otro 50 %
trabajaron horas extras por encima de 71.70 horas.
Características de la mediana
3.3.2. La moda: La moda es la medida de posición que indica la magnitud del valor
que se presenta con más frecuencia en una serie de datos; es pues, el valor de la
variable que más se repite en un conjunto de datos. De las medias de posición la
moda es la que se determina con mayor facilidad, ya que se puede obtener por una
simple observación de los datos en estudio, puesto que la moda es el dato que se
observa con mayor frecuencia. La moda se designa con las letras Mo.
CLASES fi
30-----39 2
40-----49 2
50-----59 7
60-----69 11
70-----79 12
80-----89 16
90-----99 2
TOTAL
Características de la moda
aN
4 Faa
Qa Li .Ic. En esta fórmula, Qa = El cuartil solicitado, en esta a
fm
corresponde al número del cuartil solicitado; Li = Limite real inferior de la clase
donde se encuentra ubicado el cuartil; Faa = Frecuencia acumulada anterior a la
clase donde se encuentra el cuartil; fm = Frecuencia fi que posee el intervalo de
Cálculo de los deciles: El cálculo de los deciles es similar al cálculo de los cuartiles,
solo que en estos varía la posición, la misma se calcula con la fórmula:
aN
PDa , en esta a corresponde al número del decil que se desea calcular, N
10
equivale al número de datos de la distribución y 10 corresponde a las diez partes en
la que se divide la serie de valores de la distribución.
aN
10 Faa
La fórmula para su cálculo es: Da Li .Ic . En este caso se aplica la
fm
fórmula de la misma manera que se hizo para calcular los cuartiles, solo que en esta
fórmula varia la posición de ubicación de la clase donde se encuentra ubicado el
decil.
Cálculo de los percentiles: es similar al cálculo de los cuartiles y los deciles con
una variante en la posición de ubicación de estos, que viene expresada por la
siguiente formula:
aN
aN 100 Faa
PPa . Con esta posición se aplica la fórmula: Pa Li .Ic .
100 fm
SALARIO EN $ fi Fa
200-----299 85 85
300-----399 90 175
400-----499 120 295
500-----599 70 365
600-----699 62 427
700-----799 36 463
Totales = N 463
115.75 85 3075
Q1 299.5 .100 299.5 299.5 34.17 333.67.
90 90
f ( P Li 100
p faa i , donde:
Ic N
p porcentajeque se quiere buscar.
P Valor dado en el eje de las X (valor que se ubica en las clases).
faa Frecuencia acumulada de la clase anterior a la clase donde se encuentra
ubicado P.
f i Frecuencia de la clase donde se encuentra ubicada P.
Li Límite inferior de la clase donde se encuentra ubicada P.
I c Intervalo de clase.
N = Número total de datos o total de frecuencias.
Solución:
Datos:
p?
P 450
faa 175
Li 400
I c 100
N = 463
Ahora se aplica la fórmula:
f ( P Li 100
p faa i , Sustituyendo valores se tiene:
Ic N
3.2. Medidas de dispersión: Las medidas de posición central son los valores que
de una manera condensada representan una serie de datos, pero realmente no son
suficientes para caracterizar una distribución de frecuencia. Para describir una
distribución de frecuencia o serie de datos es necesario, por lo menos otra medida
que indique la dispersión o variabilidad de los datos, es decir, su alejamiento de las
medidas de posición central. Estas medidas de posición central no tienen ningún
valor si no se conoce como se acercan o se alejan esos valores con respecto al
promedio, en otras palabras, es conocer cómo se dispersan o varían esos valores
con respecto al promedio de una distribución de frecuencia.
Se llama Variación o Dispersión de los datos, el grado en que los valores de una
distribución o serie numérica tiende a acercarse o alejarse alrededor de un
promedio. Cuando la dispersión es baja indica que la serie de valores es
relativamente homogénea mientras que una variabilidad alta indica una serie de
valores heterogénea.
Cuando los valores observados de una serie están muy concentrados alrededor del
promedio, se dice que ese promedio es o será muy representativo; pero si están
muy dispersos con relación al promedio, es decir muy esparcidos con respecto al
promedio, entonces ese promedio es poco representativo de la serie o distribución,
puesto que no representan adecuadamente los datos individuales de esa
distribución. Es importante obtener una medida que indique hasta qué punto las
observaciones de una serie de valores están variando en relación con el valor típico
de la serie.
N N
X i X d i
DM i 1
i 1
N N
Esta fórmula es para datos no agrupados. Se toma el valor absoluto en la ecuación,
debido a que la primera propiedad de la media aritmética establece que los desvíos
(di) de una serie con respecto a la media aritmética siempre son iguales a cero, es
decir: di = 0.
Cuando los datos están en una distribución de clases o agrupados se aplica la
siguiente formula:
f
N N
X f
X di
i i i
DM i 1
i 1
N N
• La desviación típica se calcula con cada uno de los valores de una serie de
datos.
• La desviación típica se calcula con respecto a la media aritmética de las
observaciones de una serie de datos, y mide la variación alrededor de la
media.
• La desviación típica es susceptible de operaciones algebraicas, puesto que
para su cálculo se utilizan los signos positivos y negativos de los desvíos de
todas las observaciones de una serie de valores, por lo tanto, es una medida
completamente matemática.
• Es una medida de bastante precisión, que se encarga de medir el promedio
de la dispersión de las observaciones de una muestra estadística. Las
influencias de las fluctuaciones del azar, al momento de seleccionar la
muestra la afectan muy poco. Le da gran significación a la media aritmética
de la serie de valores.
• Es siempre una cantidad positiva.
68,27%
95,45%
99,73%
Media
(X X )2 d
2
1. .S
i i
n 1 n 1
( X i ) 2
X i
2
n N X i2 ( X i ) 2
3. .S
n 1 n(n 1)
4. .
(X i X )2
d i
2
N N
X i X
2
2
X 2
5. . i
i
X2
N
N N
• Se calculan los desvíos (di) de la serie de valores Xi, con respecto a la media
aritmética.
X
X i
25
5
n 5
Xi (X i X) d i d i2
3 3–5 =-2 4
4 4–5 =-1 1
5 5–5 = 0 0
6 6–5 = 1 1
7 7–5 = 2 4
X i 25 d i 0 d i 10
1. .S
d i
2
10
2.5 1.58
n 1 4
n X i2 X
2
5(135 625 50
3. .S 1.58
i
n(n 1) 5(4) 20
10
2 1.41.
N 5
X i
2
2
X 135 625
5. . i
27 25 2 1.41.
N N 5 5
1. .S
( X i X )2 fi
d i
2
fi
n 1 n 1
X i
2
fi
i
n
i
2. .S
n 1
f (X
2
f K 2
Xa )
f K
2 i i
X )2
f i (X
i i
i i
i a
n n
3. .S n 1
n 1
calculos posteriores.
El término Ki , en esta formula, viene a ser un desvío arbitrario con respecto a una
X ) . Este método para calcular S en datos
mdia arbitraria X a .Entonces, K i (X a
4. . f ( X
i i X )2
fd i i
2
N N
5. .
f Xi i
2
X2
N
f f i X i
2
X i2
6. .
i
N N
f K
2 i i
2
X )2
f i (X fiX
i
i i
7. .
i a
N
N N N
• Se calcula la X
• Se calcula el X i de cada una de las clases que integran la distribución de
frecuencia, se determinan los desvíos di de los X con respecto a la X , i
Ejemplo: Los siguientes datos corresponden a las horas extras trabajadas por los
obreros de la empresa FATEXTOL, en un mes (se resolverá considerando los datos
como de una S y ).
CLASES
fi
X i f i X di = X i X f i d i2 f i
X
i
2
135
f Xi i =7730 d i 1.82 f d i
2
i =3065.92 f Xi
2
i =445680
Ahora se calculan los diferentes, para determinar los otros parámetros necesarios
(es recomendable que se realice todos los cálculos) para resolver el problema
planteado, en el cuadro de arriba se colocaron los cálculos realizados que son
necesarios para resolver el mismo; este se resolverá aplicando las formulas 1, 2, y
3 de la S, considerando los datos como los de una muestra.
1. S
fd i i
2
3065.92
3065.92
22.88 4.78
n 1 135 1 134
fX
2
7730 2
2 445680
i i
fi X i
n 135 3065.93
2. .S 22.88 4.78.
n 1 135 1 134
Para aplicar la fórmula 3 se toma una media arbitraria X a que en este caso la más
céntrica es 57, luego se calculan los desvíos de los puntos medios con respecto
a la X a así:
1 42 - 15 - 15 225
6 47 - 10 - 60 600
21 52 - 5 - 105 525
75 57 0 0 0
23 62 5 115 575
7 67 10 70 700
2 72 15 30 450
fK i i
2
i i
3075
3. . N 135
N 135
1225
3075
135 3075 9.07 3065.93 22.71 4.76.
135 135 135
Interpretación: Los resultados obtenidos con las formulas 1, 2, y 3, indican que los
promedios de las horas extras laboradas por los trabajadores se desvían o varían
con respecto a su media aritmética en una cantidad igual a 4.78 y 4.76
respectivamente. La misma interpretación se obtiene con los resultados obtenidos
con las formulas 4, 5 y 6.
4. .
fd i i
2
3065.92
22.71 4.76
N 135
5. .
f Xi i
2
X2
445680
3278.62 22,71 4.76.
N 135
f f i X i
2
X i2 445680 7730
2
6. . 4.76.
i
N N 135 135
(X i K ) (Xi )
vendrá disminuida en el valor de dicha constante.
• Si a cada uno de los términos de la serie de valores se le multiplica por una
constante K, la desviación típica de la serie quedará multiplicada por K, y la
nueva desviación típica será igual a la constante K tomada en valor absoluto
por la desviación típica original. Esta propiedad se apoya en la propiedad del
producto de la media aritmética
(X i .K ) . K .. ( X i ) .
n1 S12 n2 S 22
S
2
n1 n2
T
1. . 2
(X i )2
.., para.datos.no.agrupados.
N
2. . 2
f i ( X i ) 2
..,. para.datos.agrupados.
N
3. .S 2
(X i X )2
..,. para.datos.no.agrupados.
n 1
4. .S 2
f i ( X i X )
..,. para.datos.agrupados.
n 1
CV x100.
X
Producto X S Unidades CV
1 45 5 Bs. 11.11 %
2 450 40 Bs. 8.87 %
3 4500 350 Bs. 7.78 %
CV = Sx100/ X
3( X Md )
SK 2
S
Q1 Q3 2Q2
SK q
Q3 Q1
m3
SK m 3
S
la fórmula
CLASES 1 f1 CLASES f2
2
3—5 5 3—5 8
6—8 10 6—8 12
9—11 25 9—11 20
12—14 40 12—14 40
15—17 20 15—17 25
18—20 12 18—20 10
21—23 8 21—23 5
TOTAL 120 TOTAL 120
CLASES 3 f3 CLASES 4 f4
3—5 15 3—5 5
6—8 25 6—8 10
9—11 40 9—11 15
12—14 60 12—14 60
15—17 15 15—17 40
18—20 10 18—20 25
21—23 5 21—23 15
TOTAL 170 TOTAL 170
1° PLATIKURTICA
2° MESOKURTICA
3° LEPTOKURTICA
CLASES fi
10—12 1
13—15 5
16—18 15
19—21 40
22—24 15
25—27 10
28---30 9
95
Solución: Para resolver el problema lo primero que hay que hacer es calcular la X
y determinar los desvíos di con respecto a la media, luego se elabora un cuadro
estadístico con el resumen de los cálculos necesarios para determinar la asimetría
Se recomienda realizar los cálculos de los parámetros, ya que solo aparecen sus
resultados
m3
fd i i
3
1945.76
20.48
n 95
m 3 20.48
SK m 0.32
S 3 63.40
m4
fd i i
4
68649.77
722.63
n 95
m4 722.63
K4 4
2.86.
S 252.8
50
40
30
20
10
0
11 14 17 20 23 26 29
1d ASIMETRÍA + 1 5 15 40 15 9 10
CURVA NORMAL 1 5 15 50 15 5 1
CLASES fi
10—12 9
13—15 10
16—18 15
19—21 40
22—24 15
25—27 5
28—30 1
95
Solución.- Para resolver este problema se debe calcular la X y los desvíos di con
respecto a esta, también es necesario calcular la Md, el Mo, el Q1, el Q3, la S, el m3,
el m4, elaborar un cuadro estadístico y finalmente aplicar las formulas respectivas.
m3 20.48
SK m 0.32
S3 63.40
frecuencias fueron cambiadas de la parte alta de las variables hacia la parte baja de
Q1 Q3 2Q2 16.45 21.29 2(19.51) 1.28
SK q 0.26
Q3 Q1 21.29 16.45 4.84
las mismas, por tal razón todos sus cálculos son idénticos en valor absoluto al
m4 722.63
K4 2.86.
S 4 252.80
Curva de Lorenz: gráfico, por tanto, será una representación en ejes coordenados.
Sea una distribución (xi, ni) de la que formaremos una tabla con las siguientes
columnas:
• Los productos xi ni, que nos indicarán la totalidad percibida por los ni
frecuencias de valores individuales xi.
• Las frecuencias absolutas acumuladas Ni.
• Los totales acumulados ui que se calculan de la siguiente forma:
u2 = x1 n1 + x2 n2
u3 = x1 n1 + x2 n2 + x3 n3
u4 = x1 n1 + x2 n2 + x3 n3 + x4 n4
un = x1 n1 + x2 n2 + x3 n3 + x4 n4 + …………. + xn nn
n
Por tanto podemos decir que u n x i n i
i 1
Ni
pi 100
n
• La renta total de todos los rentistas que será un y que, dada en tanto por
ciento, la cual representaremos como qi y que responderá a la siguiente
notación:
ui
qi 100
un
x1 n1 x1 n1 N1 u1 p1 q1 p1 - q1
x2 n2 x2 n2 N2 u2 p2 q2 p2 - q2
L i-1 - L i xi ni Ni
0 - 50 25 23 23 575 575 8,85 1,48 7,37
50 - 100 75 72 95 5400 5975 36,54 15,38 21,16
100 - 150 125 62 157 7750 13725 60,38 35,33 25,06
150 - 200 175 48 205 8400 22125 78,85 56,95 21,90
200 - 250 225 19 224 4275 26400 86,15 67,95 18,20
250 - 300 275 8 232 2200 28600 89,23 73,62 15,61
300 - 350 325 14 246 4550 33150 94,62 85,33 9,29
350 - 400 375 7 253 2625 35775 97,31 92,08 5,22
400 - 450 425 5 258 2125 37900 99,23 97,55 1,68
450 - 500 475 2 260 950 38850 100,00 100,00 0,00
k 1
p i q i 125 ,48
i 1
IG k 1
0,193
651,15
pi
,
i 1
b) Curva de Lorenz
3.5. Ejercicios
a) Complete la información.
b) Calcule el promedio bajo la transformación lineal y 3x 7 .
Total 50
Sueldo (UF) nA nB
10.5 – 15.5 4 5
15.5 – 20.5 9 8
20.5 – 25.5 12 7
25.5 – 30.5 15 12
30.5 – 35.5 20 18
35.5 – 40.5 17 23
40.5 – 45.5 10 18
45.5 – 50.5 8 17
50.5 – 55.5 5 12
8. Los siguientes datos corresponden a los tiempos (en minutos) que duran 40
llamadas telefónicas recibidas por una central:
2.2 0.8 1.5 1.9 1.3 2.3 2.3 0.9 0.5 1.3 2.0 1.7
1.1 1.1 1.3 1.7 1.1 1.0 2.1 0.7 1.9 2.6 1.7 2.3
1.4 2.4 2.1 1.7 1.2 1.6 1.5 1.4 2.1 2.0 1.0 2.8
1.3 1.1 1.5 1.4
10. Una compañía produce lotes de tubos para gas con un diámetro promedio de
14 milímetros y una desviación de 0,1 milímetros. El gerente de control de
calidad de la compañía piensa que los tubos que no tengan diámetros entre
13,8 y 14,2 milímetros no deben ser puestos a la venta. Usando la regla
empírica, ¿aproximadamente qué porcentaje de tubos se encuentra apto
para la venta?
11. Para cada uno de los ejercicios siguientes, determine: la desviación estándar,
la varianza, el coeficiente de variación y el coeficiente de asimetría.
Establezca, así mismo, al menos una conclusión acerca de la dispersión y
otra acerca de la asimetría.
Planta “A”
49 51 50 48 49 50 50 51 52
12. En un barrio de una gran ciudad se ha constatado que las familias residentes
se han distribuido, según su composición, de la siguiente forma:
Agencia A Agencia B
Valor crédito Nº créditos Nº créditos
0 - 0,5 3 10
0,5 - 1 4 12
1- 2 6 8
2-4 58 30
4-7 78 12
7 - 12 90 15
12 - 14 20 5
14 - 18 6 6
18 - 20 4 16
Aunque podríamos utilizar fórmulas de Excel para obtener información como el valor
máximo, el mínimo, la media, la suma, etc., podremos obtener toda esa información
con solo utilizar la herramienta Estadística descriptiva.
Al pulsar el botón Aceptar se mostrará un nuevo cuadro de diálogo que nos permitirá
hacer las configuraciones necesarias para obtener los datos estadísticos de nuestra
información.
Las opciones dentro de este cuadro de diálogo a las que se debe prestar especial
atención son las siguientes:
Media 44.0760219
Error típico 0.5228584
Mediana 38.8465753
Moda 38.4109589
Desviación estándar 11.6914691
Varianza de la muestra 136.690451
Curtosis -0.53532468
Coeficiente de asimetría 0.87473403
Rango 42.0273973
Mínimo 29.8383562
Máximo 71.8657534
Suma 22038.011
Cuenta 500
Cuartíl 1 35.54452
Cuartíl 2 38.84658
Cuartíl 3 52.49726
Decil 7 48.97973
Percentil 89 62.81882
Ejercicio:
1. Calcule e interprete las diferentes medidas de resumen para las siguientes
variables de la plantilla “base de datos”
EDUCACION = años de educación
SALARIO = salario anual (miles de pesos)
SERVICIO = años de servicio
EXPERIENCIA = experiencia (años)
• Cada tallo define una clase, y se escribe sólo una vez. El número de hojas
representa la frecuencia de dicha clase.
Ejemplo:
decenas unidades
5 2 6
6 0 0 0 0 0 0 4 4 4 4 4 4 8 8 8 8 8 888
7 2 2 2 2 2 2 2 2 6 6 6 6 6
8 0 0 4 4 8 8
9 2
• Podemos obtener más detalle subdividiendo cada tallo en dos partes iguales:
en una colocaremos las hojas 0 a 4 y lo representamos por ( * ) y en la otra las
hojas de 5 a 9 y lo representaremos por ( . ), obteniendo el diagrama:
5 * 2
. 6
6 * 0 0 0 0 0 0 4 4 4 4 4 4
. 8 8 8 8 8 8 8 8
7 * 2 2 2 2 2 2 2 2
. 6 6 6 6 6
8 * 0 0 4 4
. 8 8
9 * 2
.
Observemos que todos los datos son múltiplos de 4, lo que hace sospechar que
se han obtenido midiendo las pulsaciones cada 15 segundos y multiplicando por
cuatro.
Donde:
1: Q1 – 3xRq
2: Q1 – 1.5xRq
3: Q3 + 1.5xRq
4: Q3 + 3.xRq
Seleccione el rango de celda M20 a N24 y luego usando el botón derecho del ratón
seleccione la alternativa Copiar. Manteniendo el rango seleccionado M20 a N24
diríjase al menú principal y elija Edición/Pegado especial. En el cuadro de diálogo
que aparece seleccione la opción valores, como se muestra en la figura 34.
Seleccione el rango M20 a N24 y luego del menú principal elija Insertar/Gráfico. En
tipo de gráfico seleccione Líneas y en subtipo de gráfico Línea con marcadores en
cada valor, generándose el grafico de la figura 34. Se puede agregarle un título al
gráfico
50 Mínimo
40
Mediana
30
20 Máximo
10 Tercer cuartil
0
1
El resultado obtenido se muestra en la Figura 54, en una hoja nueva del libro Excel,
llamada “Output”.
a) Se repiten los incisos del a) al d), de la sección 6.5, teniendo en cuenta que
las categorías que deben ir en el área en blanco de la base de datos son los
números: 8-12-14-15-16-17-18-19-20-21. Estos números deben de ir en
Teniendo en cuenta los incisos del 1 al 3 del apartado 2.3.4.1., para el cálculo de la
amplitud (4,21) y el mínimo redefinido (29,81), se realizan los siguientes pasos:
a) Se elige la ruta: “Complementos – Megastat – Freqency Distributions –
Quantitative…”, como la indica la Figura 55.
El resultado obtenido se muestra en la Figura 57, en una hoja nueva del libro Excel,
llamada “Output”.
c) Por último, se edita la tabla y las gráficas con las convenciones como en el
apartado 2.3.4.