Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADSTICA DESCRIPTIVA
LUGAR DE NACIMIENTO
Riobamba Ecuador
ESTUDIOS REALIZADOS:
SECUNDARIA:
SUPERIOR:
PRCTICA DOCENTE:
DATOS DE CONTACTO:
Celular: 0999775143
Telfono: 2962018
Mail: wavo_33@yahoo.com.mx
Pgina web: www.wavo.galeon.com
Publicaciones: www.slisdeshare.net/wilsonvelas
1. Introduccin Histrica
2. Concepto de Estadstica Descriptiva
3. Clasificacin de la Estadstica
3.1. Estadstica Descriptiva (Deductiva)
3.2. Estadstica Inferencial (Inductiva)
3.3. Esquema de Estadstica Inductiva
4. Organizacin de Datos
5. Variables Estadsticas
5.1. Variables Discretas
5.2. Variables Continuas
Actividad de Aprendizaje No.1
Auto evaluacin No. 1
1. Descripcin de Datos
2. Procedimiento para agrupar los datos.
3. Distribucin de Frecuencias, intervalos y marcas de clase.
4. Representacin grficas de los datos
4.1 Histograma
4.2 Polgono de frecuencia
4.3 Diagrama de distribucin u ojiva
4.4 Diagrama de pastel o ciclograma
4.5 Diagrama de barras
Actividad de Aprendizaje No. 2
Auto evaluacin N.2
Xi X
i 1
1 + X2 + X3 =
7. (3 5) (9 / 2 2/( 12 3) /(5 / 2) ?
n xy ( x )( y )
11. Si B1 n x 2 ( x ) 2 , donde
n 10, xy 3995; x460; y 82; x 2 22420. Halle B1
Y = 9, 10, 8, 9, 8, 7, 7 Halle Y =
14. Si tengo los siguientes nmeros: 48.5 y 20.2. Cul es el mayor valor y cul es el menor
valor? y cul es su diferencia?
15. Usted como estudiante considere ser una variable Y quin financia sus estudios sea
una variable X Cul es la variable dependiente y cul la variable independiente?
xy
16. Si r , despeje ( ( x)2
( x) 2 ( y 2 )
OBJETIVOS:
DESARROLLO DE CONTENIDOS
a.- Las antiguas civilizaciones, como por ejemplo la de Egipto realizaban relevantamientos
estadsticos (captacin de datos), debido a las inundaciones del ro Nilo, efectuaban censos
anuales, los mismos que permitan conocer como distribuir los bienes y reparto de
propiedades para que fueran restituidos.
Tambin., se sabe que los griegos levantaban censos demogrficos (nacimientos, muertes,
casamientos, etc.) y de propiedad.
b.- En la poca del Imperio Romano se aplicaba censos poblacionales y de bienes a los
pueblos sometidos al imperio con objeto de aplicar el rgimen de impuestos.
3.2.- Estadstica Inductiva:- Es el proceso para lograr generalizaciones acerca del todo
(llamado la poblacin) examinando una parte de ella (llamada la muestra). Para que esto
INDUCCION Poblacin
Muestra
Encuesta
Los datos sin organizar carecen de sentido, es decir los datos brutos no permiten interpretar
nada acerca de la informacin obtenida. Por esta razn es necesario organizar los datos, lo
cual se realiza dependiendo del tipo de variable con la que se esta trabajando. Veamos que
significa variable.
Variable:- Es la que asume distintos valores en un evento o proceso, y pueden ser nmeros
o cantidades/ Ejemplo: salarios, precios, edades, peso, estatura, etc.
Son aquellas que asumen valores determinados en un rango, pueden ser enteros o
fraccionarios y sirven para medir.
2.- Describa en forma general desde cuando usted conoci la ciudad de Riobamba.
3.- De los siguientes tems compare y diga cual es poblacin y cual es muestra
7.- Luego de haber ledo cualquier peridico o revista relacionado a la economa. Haga un
resumen y diga que tipo de variable o variables intervienen en la misma.
8.- Describa con sus propias palabras cmo se puede utilizar la estadstica para resolver
problemas en diversas disciplinas y puestos de trabajo
9.- El presidente de una asociacin de estudiantes quiere tomar una muestra de las
opiniones de los 150 miembros en relacin con las actividades de recreacin para el perodo
acadmico que empezar en el mes octubre.
a) Los estudiantes califican a su profesor de estadstica en una escala de: Horrible, no tan
OBJETIVOS:
DESARROLLO DE CONTENIDOS
Al nmero de datos u observaciones se lo representan con n. Para describir los dates puede
presentar dos casos:
Ejemplo. Un estudiante durante un semestre dio diez exmenes parciales calificados sobre
diez (10 puntos), obteniendo los siguientes resultados:
Para este tipo de conjunto (o estadstica) primero se hace un cuadro o una tabla, luego en la
primera columna del cuadro se ordenan los datos o valores ya sea en forma ascendente o
descendente (creciente o decreciente) en la segunda columna se ponen el nmero de los
valores que se repiten, al nmero que se repite se llama frecuencia (f).
* Si existe una cantidad elevada de datos, el nmero de clases debe encontrarse entre ocho
(8) y doce (12) clases
Para saber en cuantos grupos o clases agrupamos estos datos, se utiliza la formula
de Sturges K= 1+3,322 Log (n), donde K. es el numero de clases y n es el nmero
de dates u observaciones. Esto se clarifica mediante el siguiente ejemplo:
105 106 105 107 109 111 110 110 107 107 104 99 103 99 103
91 82 91 85 90 86 87 89 87 89
K = 1+3,322 (1.60205)
K = 1+5,322
Clases
2.- Encontramos el dato mayor y el dato menor, llamado tambin observacin mayor (OM) y
observacin menor (om). Con estos datos encontramos el rango o recorrido, en formula es:
Rango = R = OM om
3.- Determinamos el numero de clases o grupos (K), utilizando la frmula de Sturges, (en
nuestro ejemplo anterior K=6).
4.- Hallamos o determinamos la longitud o amplitud del intervalo de la clase, que se designa
con la letra C, en formula es:
Rango R
C , C= es la amplitud de la clase
Nmero..de..clases K
5.- Preparamos un cuadro con 3 columnas, para las clases, limite de clases y en frecuencia,
esto es
7.- Finalmente contamos cuantos datos estn incluidos en cada clase y lo ponemos en la
columna de las frecuencias (f)
Ejemplo. Dado conjunto anterior aplique los pasos y agrupe este conjunto de datos
105 106 105 107 109 111 110 110 107 107 104 99 103 99 103
91 82 91 85 90 86 87 89 87 89
1.- Ordenamos los dates del ejemplo que estamos tratando en forma ascendente
82 85 86 87 87 89 89 90 91 91 92 93 94 95 95 95 95 95 97 98
99 99 100 100 101 101 103 103 103 104 105 105 106 107 107
R = OM om
R = 111 82 = 29
C=5
38 35 76 58 48 59 67 63 33 69 53 51 28 25 36 32 61 57 49
78 48 42 72 52 47 66 58 44 44 56. Agrupe este conjunto de datos
25 28 32 33 35 35 38 42 44 44
47 48 48 49 51 52 53 56 57 58
58 59 61 63 66 67 69 72 76 78
2.- R = 78 - 25 = 53
3.- K = 1+ 3,3221og(30)
K = 1+ 4.9 = 5.90 = 6
4.- C = R / K = 53 / 6 = 8.833 = 9
CLASE Li Ls F
1 25 33 4
2 34 42 4
3 43 51 7
4 52 60 7
5 61 69 5
6 70 78 3
TOTAL n = 30
NOTA:- Para ordenar los datos es conveniente saber si los datos se trata de atributos o
variables
Atributo:- Son los que expresan cualidades. Eje: bueno, malo, masculino femenino
Para ordenar datos que son atributos es conveniente clasificar de acuerdo con las
categoras, el atributo puede dividirse. Por Ejemplo: si queremos ordenar datos
correspondientes a calificaciones de exmenes sern, sobresaliente, muy buena, buena,
regular, insuficiente.
Pero, si queremos ordenar datos correspondientes a variables, hay que ordenar los valores
en forma creciente o decreciente (ascendente o descender, (e)
Para hacer la descripcin grfica de los datos es necesario conocer algunos elementos de la
estadstica
Todo grupo, intervalo o clases tiene dos lmites: Lmite inferior (Li) y lmite superior (Ls)
Cuando estamos trabajando con datos agrupados es conveniente buscar para cada
intervalo un valor que lo represente. Este valor se llama punto medio o marca de clase, que
se representa con Xc, en formula es:
Li Ls
Xc
2
25 33, Li 25, Ls 33
Por ejemplo: en el intervalo Xc 252 33 58 / 2
Xc 29
Es el nmero de veces que se repite un dato, o el nmero de datos que sc encuentre dentro
de un intervalo o clase, se lo representa con la letra "F minscula, es decir a este tipo de
frecuencia se llama Frecuencia Absoluta.
3.4.-FRECUENCIA RELATIVA
Nmero..de..datos..de..clase f
fr
Nmero..total..de..datos n
Se obtiene de forma similar que la frecuencia acumulada, pero sumando las frecuencias
relativas correspondientes. La suma de todas las frecuencias relativas es igual a 1en
formula es:
K
f r f1 f 2 ..... f k 1
I 1
3.7.- PORCENTAJE
P = (%) f r f
N x100
Para construir un histograma se traza primero en el primer cuadrando positivo del plano
cartesiano, luego en el ej. X se anotan los limites inferiores; y superiores de las clases,
procurando que haya una continuidad o coincidencia, Esto es que, el lmite superior de una
clase se constituye en lmite inferior do In siguiente clase
NOTA:- Para esto es necesario hallar los limites reales (L-R) de la clase. En el eje Y que
corresponden a sus alturas se ponen sus respectivas (frecuencias.
29 38 47 56 65 74
Ejemplo: dado los siguientes datos de la tabla construya la curva de distribucin u (OJIVA)
Clase Li Ls f Fa L R
1 25 33 4 4 24,5 33,5
2 34 42 4 8 33,5 42,5
3 43 51 8 16 42,5 51,5
4 52 60 7 23 51,5 60,5
5 61 69 5 28 60,5 69,5
6 70 78 3 31 69,5 78,5
35
30
25
20
Serie1
15
10
5
0
24.5 33.5 42.5 51.5 60.5 78.5
Los grficos en sectores o diagramas de pastel se utilizan para representar los datos cuyo
conjunto forman un todo.
Pertenecen a este grupo los CIRCUNGRAMAS O CICLOGRAMAS, que son crculos que
representan al nmero total de datos (n) divididos en tantos sectores circulares como
categoras tiene el grupo.
Para encontrar el nmero de grados de cada clase o categora se utiliza la siguiente formula.
GRADO = (fx360)/n
1
2
3
4
5
6
Campos Petroleros f
1 Yana yacu 20
2 Coca 57
3 Durano Guanto 100
4 Yana Yacu sur 8
5 Lago Agrio 16
6 Shushufindy 14
7 Yana yacu norte 12
8 Sachas 1 28
9 Sachas 2 56
total n= 311
120
100
80
60 Series1
40
20
0
1 2 3 4 5 6 7 8
77 18 63 84 38 54 50 59 54 56 36 26 50 34 44
41 58 58 53 51 62 43 52 53 63 62 62 65 61 52
60 60 45 66 83 71 63 58 61 71
distribucin u ojiva
Li Ls f
19,2 19,4 1
19,5 19,7 2
19,8 20,0 8
20,1 20,3 4
20,4 20,6 3
20,7 20,9 2
TOTAL n = 20
3) Dada la siguiente tabla que representa el nmero de carros vendidos en una feria
internacional. Grafique el diagrama de barras
MARCA DE f
CARROS
Datsun 40
Ford 45
Toyota 32
Vitara 44
Montero 38
San Remo 46
TOTAL n = 204
27 27 27 28 27 25 25 28
26 28 26 28 31 30 26 26
x F
120 125 5
114 119 6
108 113 10
102 107 9
96 101 15
90 95 2
Total N=47
Seale con una (X) la alternativa o alternativas verdaderas que corresponda a cada
pregunta.
1.- En el siguiente redondeo de datos seale las aproximaciones que son correctas de
acuerdo al Sistema Internacional
a) Continua b) Discreta
4.- Seale con una (x) las proposiciones que son correctas.
a) C = Ls Li +1 b) xc = Ls+Li/2 c) xc = (Ls+Li)/2
6.- Un colegio tiene 3 200 estudiantes. Si los alumnos matriculados en el primer curso
son 400, el porcentaje que le corresponde a este curso es de:
a) C = 5 b) C = 6
a) 4 b) 5
fx100 f
a) r n
b) f r f .n c) f r d) Ninguna de las soluciones anteriores
n
f
a) p f .100
N b) p f .,N
100 c) p d) Ninguna de las anteriores
n
a) De superficie b) Lineal
17.- Para trazar un diagrama de barras horizontales en el eje de las abscisas se localizan las
frecuencias y en el eje de las ordenadas.
18.- En un diagrama de sectores los 360 grados del ngulo central de un crculo se
distribuyen utilizando la frmula
d) Nmero de asignaturas en que los estudiantes del ISTRA se han matriculado este
semestre
OBJETIVOS:
Definir los conceptos de las medidas de tendencia central como: promedio, mediana,
moda, media geomtrica y media armnica.
Determinar la media aritmtica, mediana y moda de datos no agrupados y agrupados
DESARROLLO DE CONTENIDOS
Existen dos tipos de medias aritmticas: La media poblacional que se representa por u (miu)
y la media muestral que se representa por ( X ) (equis barra).
n
Xi
x x 2 x3 ..... x n
X i 1 1
n n
n
Donde X i a la suma de cada uno de los valores del conjunto de datos y (n) es el
i 1
nmero total de elementos del conjunto.
38 35 76 58 48 59 67 63 33 69 53 51 28 25 36 32 61 57 49
78 48 42 72 52 47 66 58 44 44 56 45
n
Xi
38 35 76 58 48 ..... 44 44 56 45 1590
X i 1 51,29
n 31 31
La mediana est justamente en el 50% de los datos (en la mitad). Para hallar la mediana,
puede presentar dos casos.
1er. CASO.- Cuando el nmero de datos es impar.- En este caso la mediana se encuentra
en la mitad de la serie ordenada de los datos, se puede encontrar utilizando la siguiente
frmula
n 1
Mdn
2
El resultado de esta operacin nos indica la posicin o el lugar donde est la mediana (este
valor no es la respuesta).
38 35 76 58 45 28 32 33 35 36
28 25 36 32 61 51 51 52 53 56 57 58 58
49 78 48 42 72 57 59 61 63 66 67 69 72 76 78
47 66 58 44 44 52 56
n 1 31 1
Mdn 16
2 2
Mdn = 51
2do. CASO.- Cuando el nmero de datos es par.- En este caso se utiliza el mismo
procedimiento que el 1er. Caso, y se obtiene un nmero entero con decimales, en este caso
la median se encuentra hallando la media aritmtica de los dos valores medios
38 35 76 58 45 28 32 33 35 36
67 63 33 69 53 59 42 44 44 45 47 48 48
28 25 36 32 61 51 51 52 53 56 57 58 58
49 78 48 42 72 57 59 61 63 66 67 69 72 76 78
47 66 58 44 44 52 56
n 1 30 1 31
Posicin Mdn 15,5
2 2 2
El nmero 15, 5 no es la mediana, este valor nos dice que la mediana est entre el elemento
15 y el elemento 16 de los datos ordenados, esto es: El puesto 15 est ocupado por el
nmero 51 y el puesto 16 por el nmero 52.
51 52 103
Mdn 51,5
2 2
Ing. Wilson A. Velastegui. Ojeda. Msc
33
Estadstica Descriptiva
NOTA.- Si existe un solo valor que se repite, el conjunto tiene una sola moda y se llama
UNIMODAL
19 1 3 4 2 5
7 6 6 6 6 6
20 17 8 18 9 10
1 2 3 3 3 3
4 5 6 7 8 9
10 11 11 11 11 12
En este conjunto los nmeros que se repiten son el 3 y el 11, por tanto la moda es
Mo = 3
Si existen dos valores que se repiten, el conjunto tiene dos modas, es BIMODAL.
Si existen ms de dos valores que se repiten, se dice que el conjunto tiene varias modas, en
este caso se llama MULTIMODAL
k
fi X C
f X f X ..... f k X Ck
X i 1 1 C1 2 C 2
n n
k
Donde f i Xc = a la suma del producto de las frecuencias por el punto medio o marca de
i 1
clase.
Para hallar la media de datos agrupados, primero encontramos los puntos medios o marca
de clase XC, luego multiplicamos la frecuencia cada clase por el punto medio de la misma
Finalmente sumamos la columna de los productos y su resultado dividimos para el nmero
total de datos.
Li Ls f Xc f. Xc
25 33 4 29 4x29=116
34 42 4 38 4x38=152
43 51 8 47 8x47=376
52 60 7 56 7x56=392
61 69 5 65 5x65=325
70 78 3 74 3x74=222
n = 31 6
f . X C 1583
i 1
6
F.X C
X I 1
n
1583
31
51,06
PROCEDIMIENTO
n
2.- Dividimos el nmero total de datos para dos utilizando la expresin
2
4.- Aplicamos la frmula de la mediana para datos agrupados que esta dado por:
n n
2 ( f a ) i 2 ( f a ) s
Mdn Li fm
C , o tambin Mdn Ls
C donde;
fm
n
= es el nmero de datos del conjunto dividido para dos.
2
Li Ls f Fa
25 33 4 4
34 42 4 8
43 51 8 16
52 60 7 23
61 69 5 28
70 78 3 31
n = 31
NOTA: La clave primero esta en dividir el nmero total de datos para dos, esto es:
Mdn 42,5
15,58 (9) 42,5 7,5 (9) 42,5 67,5 42,5 8,4375 = 50,9375
8 8 8
Para hallar la moda para datos agrupados, primeramente se observa en columna da las
frecuencias, el valor ms alto (clase con la mayor frecuencia.) Luego se halla la moda
utilizando la siguiente frmula
d1
Mo Li d C donde;
1 d2
Li Ls f
25 33 4
34 42 4
43 51 8
52 60 7
61 69 5
70 78 3
n = 31
d1 36
Mo Li d C = 42,5 4 4 5 (9) 42,5 42,5 4 = 46,5
1 d2 9
EJEMPLO DE RECAPITULACIN:
Dado la siguiente tabla de datos agrupados halle la media aritmtica, mediana y la moda
Clase Li Ls fi Xc f. Xc Fa
1 1.00 1.04 4 1.02 4.08 4
2 1.05 1.09 6 1.07 6.42 10
3 1.10 1.14 10 1.12 11.20 20
4 1.15 1.19 15 1.17 17.55 35
5 1.20 1.24 8 1.22 9.76 43
6 1.25 1.29 5 1.27 6.35 48
Total n = 48 6
f .X C 55,36
i 1
k
f .X C
55,36
X i 1 = 1.1533333 = 1.15
n 48
Para la mediana primero dividimos el nmero total de datos para dos, esto es:
n 48
= 24 este valor se encuentra en la 4 clase o el intervalo 1.15 1.19
2 2
.Li = 1.15 f a i = 20 C = 1.15 1.10 = 0.05 f m = 15
n
2 ( f a ) i
Mdn Li fm
C
Mdn 1.15
2420 (0.05) 1.15 4 / 15(0.05) 1.15 0.0133 = 1.1633 = 1.163
15
Li = 1.15 d1 = 15 10 = 5 d 2 = 15 8 = 7
d1
Mo Li d C
1 d2
d1 0.25
Mo Li d C = 1.15 55 7 (0.05) 1.15 1.15 0.020833333 = 1.17083
1 d2 12
1.- Los siguientes datos representan las latas de frutas de una muestra de 20 unidades que
contienen pesos netos que oscilan entre 19.3 onzas y 20.9 onzas.
19.7 - 19.9 - 20.2 - 19.9 - 20.0 - 20.6 - 19.3 - 20.4 - 19.9 - 20.3 - 20.1 - 19.5 - 20.9 - 20.3 -
20.8 - 19.9 - 20.0 - 20.6 - 19.9 - 19.8
Hallar: el peso promedio, la mediana y la moda, para este conjunto de datos no agrupados
2.- La agencia de viajes Ecuador, ofrece tarifas especiales en ciertas travesas por las Islas
Galpagos a ciudadanos de la tercera edad. El presidente de la agencia quiere informacin
adicional sobre las edades de las personas que viajan, una muestra aleatoria de 40 clientes
que hicieron la travesa el ao pasado dio a conocer las siguientes edades.
77 18 63 84 38 54 50 59 54 56 36 26 50 34 44
41 58 58 53 51 62 43 52 53 63 62 62 65 61 52
60 60 45 66 83 71 63 58 61 71
Hallar: la edad promedio, la mediana y la moda, para este conjunto de datos no agrupados
27 27 27 28 27 25 25 28
26 28 26 28 31 30 26 26
2 3 3 3 3 3 4 4 4 4 4 5 5 5
5 5 6 6 6 6 6 6 6 6 7 7 7 7
Ing. Wilson A. Velastegui. Ojeda. Msc
40
Estadstica Descriptiva
7 7 8 8 8 8 9 9 9 9 10 10
4
b) Demuestre que ( x x) 0
i 1
7.- Determine el salario medio por hora pagado a carpinteros que obtuvieron los siguientes
pagos por hora: $ 15.40, $ 20.10, $ 18.75, $ 22.76, $ 30.67, $ 18.00
8.- Cual sera el valor modal que reportara para un conjunto de observaciones si hay un
total de:
9.- Los siguientes datos representa el nmero de cambios de aceite para los ltimos siete
das en el taller denominado Auto car, localizado en la esquina de la calle Alvarado y Luz
E. Borja
41 15 39 54 31 15 33
10.- Los siguientes datos muestrales representan el cambio en porcentaje para el ingreso
neto del 2002 al 2003, en el caso de 12 compaas de construccin
5 1 - 10 -6 5 12 7 8 2 5 -1 11
12 8 17 6 11 14 8 17 10 8
OBJETIVOS:
DESARROLLO DE CONTENIDOS
La dispersin se refiere a la variabilidad o amplitud los datos dentro de un conjunto del cual
se este investigando.
i 1
2
xx
x1 x x 2 x ..... x n x
2 2 2
S
2
n 1 n 1
n 2
x nx
2
i 1
S2 (Mtodo abreviado)
n 1
82 85 86 87 87 89 89 90 91 91
92 93 94 95 95 95 95 95 97 98
105 105 106 107 107 107 109 110 110 111
40
( x x) (82 97.9) (86 97.9) ......... (111 97.9) = 2379, 61
2 2 2 2
i 1
Li Ls Punto Medio fi X c xc x
f i xc x 2
xc f
TOTAL n = 40 3910 6
f i xc x
i 1
2 2387.5
K
f i Xc
x i 1
n
3910
40
97.75 luego la varianza es:
6
fi x x 2
S 2
i 1
n1
2387 .5
39 = 61.2179
S=
k
fi ( Xc X )
i 1
2
f1 x c x 2 f 2 xc x2 ... f k xc x2
n1 n 1
Del ejemplo anterior la varianza es: S2 = 61.2179 por consiguiente la desviacin estndar es
S 61.2179
S = 7.824
n
xi x
Dm = i 1
n
Dm = Desviacin media
n = Nmero de datos.
82 85 86 87 87 89 89 90 91 91
92 93 94 95 95 95 95 95 97 98
105 105 106 107 107 107 109 110 110 111
n
xi x 82 97.9 85 97.9 86 97.9 ..... 110 97.9 111 97.9
i 1
n
xi x 15.9 12.9 11.9 ..... 12.1 13.1
i 1
n
xi x = 15.9 + 12.9 + 11.9 + ..+ 12.1 + 13.1 = 264.2
i 1
n
xi x
i 1 264.2
Dm= = = 6. 605 = 6.61
n 40
n
xi Mdn
i 1 x1 Mdn x 2 Mdn ..... x n Mdn
D Mdn=
n n
n 1 40 1 41
La posicin: Mdn = = = 20,5 esta entre el elemento 20 y 21
2 2 2
98 99
D Mdn = = 98.5 hallamos el valor de la desviacin mediana
2
n
xi Mdn
D Mdn= i 1
82 98.5 85 98.5 .... 110 98.5 111 98.5 = 5.92
n 40
La desviacin media para datos agrupados esta dado por la siguiente frmula:
f i xc x
f1 x c x ..... f k x c x
Dm=
n n
Li Ls Punto Medio fi X c xc x
f i xc x Fa
xc f *
82 86 84 3 252 13.75 3(13.75) = 41.25 3
87 91 89 7 623 8.75 7(8.75) = 61.25 10
92 96 94 8 752 3.75 8 ( 3.75) = 30.00 18
97 101 99 8 792 1.25 8 (1.25) = 10.00 26
102 106 104 7 728 6.25 7 ( 6.25) = 43.75 33
107 111 109 7 763 11.25 7 (11.25) = 78.75 40
TOTAL n = 40 3910 6
f i xc x 265
i 1
K
f i Xc
f i xc x 265
x i 1
N
3910
40
97.75 la desviacin media es D m = = = 6.625
n 40
La frmula de la desviacin mediana para datos no agrupados en frmula esta dado por
k
f i x c Mdn
i 1 f ( x Mdn) f 2 ( x c Mdn) ..... f k ( x c Mdn)
D Mdn = 1 c
n n
NOTA: La clave primero esta en dividir el nmero total de datos para dos, esto es:
n 40
= 20 este valor se encuentra en la clase 3 o el intervalo 97 101
2 2
.Li = 96,5 f a i = 18 C = 106 101 = 5 fm = 8
Mdn 96,5
2018 (5) 96,5 2 (5) 96,5 10 96,5 1,25 = 97.75
8 8 8
Aqu la mediana es igual a la media aritmtica por lo que la desviacin media es tambin
igual a la desviacin mediana esto es:
k
f i xc Mdn
i 1 265
D Mdn = = = 6.625
n 40
1.- Una muestra de archivos personales de 10 empleadas del Hospital General indic que,
durante un perodo de de seis meses, no asistieron el siguiente nmero de das por
enfermedad: 6, 3, 0, 2 10, 2, 1, 4, 12, 7
2.- Cinco representantes de servicio al cliente de la empresa Electro Sony, que trabajaron el
ltimo viernes, vendieron respectivamente 10, 8, 4, 3, 5, 6, 8 y 2 videograbadoras (VCR)
3.- El departamento de Estadstica del INEC de la ciudad de Riobamba ofrece ocho cursos
de Estadstica Bsica. Los siguientes datos son el nmero de estudiantes inscritos en tales
cursos: 46, 52, 34, 28, 29, 41, 38 y 36
4.- Los siguientes datos representan las calificaciones obtenidas en la clase de Estadstica
5.- El nmero de horas trabajadas por Anglica en los ltimos meses fueron
Para los problemas del 1 al 2 que representan datos agrupados calcule: a) la varianza, b) la
desviacin tpica o estndar, c) la desviacin media, y la desviacin mediana, todos
representan datos muestrales.
1.- La siguiente tabla representa el nmero de das al ao en que los empleados de una
empresa manufacturera estuvieron ausentes del trabajo debido a una enfermedad. Adems
responda a las siguientes preguntas:
2.- El contador en jefe de la empresa XX quiere preparar un informe acerca de las cuentas
por cobrar de la compaa. A continuacin se presenta una distribucin de frecuencias que
muestra la cantidad sobresaliente.
Cantidad f
0 a 2 000 4
2 000 a 4 000 15
4 000 a 6 000 18
6 000 a 8 000 10
8 000 a 10000 4
10 000 a 12 000 3
Total n = 54
Mientras la mediana divide un conjunto de datos en dos mitades, los cuartiles la dividen en 4
partes, los deciles la dividen en 10 partes y los percentiles la dividen en 100 partes.
Para los datos no agrupados, las frmulas que se emplean son las siguientes:
CUARTILES:
DECILES
PERCENTILES
Ejemplo: Del siguiente conjunto de datos hallar, los cuartiles, el decil segundo y decil
noveno, adems hallar los percentiles dcimo, veinticinco avo, setenta y cinco avo (75) y
noventa avo.
82 85 86 87 87 89 89 90 91 91
92 93 94 95 95 95 95 95 97 98
105 105 106 107 107 107 109 110 110 111
CUARTILES
91 92 183
Q1 = (n/4) +(1/2) = (40/4) + (1/2) = 10 +0.5; Q1 = = 91.5
2 2
98 99 197
Q2= (2(40)/4) +(1/2) = 20+ 0.5 = 20.5 Q2 = = 98.5
2 2
DECILES
90 91 181
D1 = (2(40)/10) +(1/2) = 8+0.5 = 8.5 D1 = = 90.5
2 2
PERCENTILES
87 87 174
P10= (10(40)/100) +(1/2) = 4+0.5 = 4.5 P10 = = 74
2 2
Del ejemplo anterior tenemos: Recorrido intercuantil = P75 P25 = 104.5 91.5 = 13
Para hallar los cuartiles, deciles y percentiles de datos agrupados, basta recordar la frmula
de la mediana para datos agrupados.
Por lo tanto las formulas para los Cuartiles, deciles y percentiles son:
CUARTILES:
Q1 Li N / 4f cuartil
( f ) i
.C Q2 Li 2 N /f4cuartil
( f ) i
.C Q3 Li 3 N /f4cuartil
( f ) i
.C
DECILES
D1 Li N / 10f decil
( f ) i
.C D5 Li 5 N / 10f decil
( f ) i
.C D8 Li 8 N / 10f decil
( f ) i
.C
PERCENTILES
P10 Li N / 10 ( f ) i
f percentil .C P25 Li 25N f/percentil
10( f ) i
.C P75 Li 75N f/percentil
10( f ) i
.C
As tenemos lo siguiente:
1 82 86 3 3
2 87 91 7 110
3 92 96 8 18
4 97 101 8 26
5 102 106 7 33
6 107 111 7 40
Total n =40
P 10 = 87 + (4-3/7) 5 P 25 = 87 + (10-3/7) 5
100 100
40.2 29.3 35.6 88.2 42.9 25.1 29.3 35.6 40.2 50.6
26.9 28.7 99.8 35.6 37.8 25.4 31.7 36.8 42.9 55.2
44.2 32.3 55.2 50.6 25.4 26.9 32.3 37.8 44.2 88.2
31.7 36.8 45.2 25.1 39.7 28.7 35.6 39.7 45.2 99.8
P10= [10(20)/100 + 0.5 = 2 + 0.5 = 2.5; est entre el elemento 2 y 5 de los datos ordenados
EJERCICIO 2: Los siguientes datos agrupados representan los pagos por almacenamiento
para los 50 ms grandes detallistas durante el ao 2003. Hallar, la media, mediana, moda,
la varianza y la desviacin tpica
8
FI Xc
X I 1
n
16750.99 3.36 n/2 = 50/2= 25 est en la tercera clase
8
Li = 2.635 ( f )i 18;
i 1
fm=11
8
N / 2i f ) y
Mdn Li
fm
1
Mdn= = 2.635 + (25 18)/11 (0.77) = 2.635 + (0.636)(0.77) = 2.635 + 0.49 = 3.125
La moda Mo Li d1d1d 2 C
d1 = 14 4 = 10 d2 = 14 11 = 3 Li = 1.865
10 7.7
Mdn 1.865 (0.77) 1.865 1.865 0.5923 = 2.4573 = 2.46
10 3 13
la desviacin media
8
f1 ( Xc x)
Dm i 1
n
5350.54 = 1.0708
* La varianza
8 2
f1 ( Xc x )
S
2 i 1
n 1
8849
.577 = 1, 80769 = 1.81
8
fi ( Xc X )
2
S i 1
n1
1.808 = 1.344 = 1.34
OBSERVACIN: Otros autores al lmite inferior pueden tomar el mismo valor es decir Li =
2.64 y no restar 0.001, en nuestro caso: Li = 2.64 0.001 =2.635
La forma de la distribucin sobre conjuntos que tienen una sola moda (unimodales) se
refiere a: Su simetra o falta de ella (asimetra)
SIMETRIA.- Una distribucin se dice que es simtrica cuando la media, mediana y la moda
son iguales, es decir
X = Mdn = Mo
Se dice que una distribucin esta sesgada positivamente, si la cola derecha es ms larga
que la cola izquierda
Se dice que una distribucin esta sesgada negativamente si la cola izquierda es ms larga
que la cola derecha
SP
La asimetra puede medirse tambin por el tercer momento respecto a la media y se puede
hallar tambin mediante las siguientes frmulas:
k
ni ( x )3
Sk i 1
3
para poblaciones
k
fii ( x x )3
Sk i 1
s3
para muestras.
Una curva que se encuentra entre la leptocrtica y platicrtica se llama mesocrita (ver fig.)
La curtosis puede medirse por el cuarto momento respecto a la media dividido por la
desviacin estndar elevada a la cuarta potencia. Es frmula es:
k
ni ( x )4
Sk i 1
4 para poblaciones
k
fii ( x x )4
Sk i 1
s4 para muestras.
CV 5x (100)
POS - TEST
INSTRUCCIN: Seale con una (x) la(s) alternativa(s) verdadera(s) que correspondan a
cada pregunta.
c) Hacia los cuales tienden a acercase o alejarse los dems valores de la serie.
fX c
3.- La frmula X N
se la utiliza para hallar la media aritmtica de:
4.- La mediana de la siguiente serie de datos: 19, 15, 18, 16, 17 es:
a) 18 b) 17
X f
145 12
144 10
143 15
142 14
141 9
Total n = 46
variable
PRUEBA DE ENSAYO
INSTRUCCIONES: Esta prueba consta de seis problemas en las cuales es preciso que
escriba todo el procedimiento
X f
66 70 16
61 65 20
56 60 12
51 55 22
46 50 10
Total n = 80
2.- Si la edad de los profesores de un colegio es la que est en la siguiente tabla: Calcular la
mediana:
X f
26 30 25
31 35 32
36 40 24
41 45 15
46 50 10
51 55 9
Total n = 115
Peso en KG. f
60 5
61 8
62 12
63 25
64 16
65 4
Total n = 70
EDADES f EDADES f
51 57 12 16 22 10
44 50 21 23 29 14
37 43 35 30 36 26
30 36 26 37 43 35
23 29 14 44 50 21
16 25 10 51 57 12
Total n=118 Total n = 118
5.- En la siguiente serie estadstica de intervalos: Determine. El promedio, la mediana y la
moda, para este conjunto de datos agrupados
x F
120 125 5
114 119 7
108 113 10
102 107 9
96 101 15
90 95 4
Total n = 50
6.- De Ia tabla siguiente: Determine. El promedio, la mediana y la moda, para este conjunto
de datos agrupados.
Li Ls f
19,2 19,4 1
19,5 19,7 2
19,8 20,0 8
20,1 20,3 4
20,4 20,6 3
20,7 20,9 2
TOTAL n = 20
7.- Si la media aritmtica es 7 y la varianza es 20, de los datos, X1, X2, X3,..,Xn. Calcular la
media aritmtica de las X 12 , X 22 , X 32 ,..........., X n2 . Rpta. 69
n
Xi
x x 2 x3 ..... x n
n
2
xx
x1 x x 2 x ..... x n x
2 2 2
X i 1 1 S
2 i 1
n n n n
8.- Dos marcas competidoras de calzado para corredores se sometieron a una prueba para
comprobar el desgaste del calzado. Cada una de ellas indic el siguiente nmero de horas
de uso necesarios para que se detecte un desgaste significativo.
Marca A Marca B
97 78
83 56
75 87
82 54
98 89
65 65
75
n=7 n=6
BURSTEIN, H. 1971: Ttribute Sampling: Tables and Ex Planations o Tubles for Determinig
confidence limits and smple sizes based on close aproximations of the binomial distribution.
KENNETH D. HOPKINS y B.R. HOPKINS: Estadstica Bsica. Mxico 1997
Ingramex.