Sei sulla pagina 1di 64

Estadstica Descriptiva

WILSON ANTONIO VELASTEGUI OJEDA

ESTADSTICA DESCRIPTIVA

Las cosas complejas y estadsticamente


improbables, son por naturaleza ms
difciles de explicar que las cosas simples y
estadsticamente probables. Richard
Dawkins

Ing. Wilson A. Velastegui. Ojeda. Msc


1
Estadstica Descriptiva

WILSON ANTONIO VELASTEGUI OJEDA

LUGAR DE NACIMIENTO
Riobamba Ecuador

ESTUDIOS REALIZADOS:

SECUNDARIA:

Colegio Nacional de Comercio y Ttulo: Bachiller en Ciencias de


Administracin Juan de Velasco Administracin y Contabilidad
(Riobamba)

SUPERIOR:

Escuela Superior Politcnica de


Chimborazo (ESPOCH), Riobamba Ttulo: Ingeniero en Empresas
Ecuador

Universidad Regional Autnoma de los Ttulo: Diplomado Superior en Investigacin


Andes (UNIANDES), Ambato Ecuador de la Educacin a Distancia y Abierta

Universidad Regional Autnoma de los Ttulo: Especialista en Diseo Curricular y


Andes (UNIANDES), Ambato Ecuador Material Educativo para la Educacin a
Distancia

Universidad Regional Autnoma de los


Ttulo: Magister en Educacin a Distancia y
Andes (UNIANDES), Ambato Ecuador
Abierta

PRCTICA DOCENTE:

Catedrtico universitario de la Escuela Superior Politcnica de Chimborazo Facultad


de Administracin de Empresas, Escuela: Ingeniera en Contabilidad y Auditora
por cinco aos en las asignaturas de Contabilidad General, Contabilidad Comercial,
Contabilidad de Sociedades, Paquetes Contables, Proyecto Integrador, Control de

Ing. Wilson A. Velastegui. Ojeda. Msc


2
Estadstica Descriptiva
Costos y Presupuestos por ordenador, Auditora Interna, Informtica Aplicada y
Matemticas para los Negocios

Catedrtico universitario de la Escuela Superior Politcnica de Chimborazo


Facultad de Administracin de Empresas en la Unidad de Educacin a Distancia de
la FADE, por cuatro aos en las asignaturas de Contabilidad General, Paquetes
Contables, Presupuestos, Contabilidad Superior, Contabilidad Financiera,
Contabilidad de Costos, Contabilidad del Sector Financiero y Auditoria Financiera.

Docente del Instituto Tecnolgico Repblica Federal de Alemania (Riobamba


Ecuador), por cinco aos en las asignaturas de Contabilidad General, Contabilidad
Comercial, Contabilidad de Costos, Presupuestos, Auditoria Financiera, Auditoria
Administrativa, Mnica 8.0, Tmax 2000, Planificacin Estratgica, Administracin
General, Administracin de Recursos Humanos y Matemtica Financiera

DATOS DE CONTACTO:
Celular: 0999775143
Telfono: 2962018
Mail: wavo_33@yahoo.com.mx
Pgina web: www.wavo.galeon.com
Publicaciones: www.slisdeshare.net/wilsonvelas

Ing. Wilson A. Velastegui. Ojeda. Msc


3
Estadstica Descriptiva

CONTENIDOS DEL MDULO

PRIMERA UNIDAD: CONCEPTOS BSICOS


Objetivos
Contenidos

1. Introduccin Histrica
2. Concepto de Estadstica Descriptiva
3. Clasificacin de la Estadstica
3.1. Estadstica Descriptiva (Deductiva)
3.2. Estadstica Inferencial (Inductiva)
3.3. Esquema de Estadstica Inductiva
4. Organizacin de Datos
5. Variables Estadsticas
5.1. Variables Discretas
5.2. Variables Continuas
Actividad de Aprendizaje No.1
Auto evaluacin No. 1

SEGUNDA UNIDAD: DESCRIPCION DE UN CONJUNTOS DE DATOS


Objetivos
Contenidos

1. Descripcin de Datos
2. Procedimiento para agrupar los datos.
3. Distribucin de Frecuencias, intervalos y marcas de clase.
4. Representacin grficas de los datos
4.1 Histograma
4.2 Polgono de frecuencia
4.3 Diagrama de distribucin u ojiva
4.4 Diagrama de pastel o ciclograma
4.5 Diagrama de barras
Actividad de Aprendizaje No. 2
Auto evaluacin N.2

TERCERA UNIDAD: MEDIDAS DE TENDENCIA CENTRAL


Objetivos
Contenidos
1. Introduccin Histrica
2. Medida Aritmtica o promedio para datos no agrupados
3. Mediana para datos no agrupados
4. Moda para datos agrupados
5. Media aritmtica para datos agrupados
6. Mediana para datos agrupados
7. Moda para datos agrupados
Actividad de Aprendizaje No. 3
Auto evaluacin No.3

Ing. Wilson A. Velastegui. Ojeda. Msc


4
Estadstica Descriptiva

CUARTA UNIDAD: MEDIDAS DE DISPERSION


Objetivos
Contenidos

1. Cuartiles, Deciles, y Percentiles para datos no agrupados.


2. Cuartiles, Deciles, y Percentiles para datos agrupados.
3. Medidas de dispersin para datos no agrupados y agrupados.
4. Desviacin Media para datos no agrupados y agrupados.
5. Varianza y desviacin tpica para datos agrupados y no agrupados
6. Forma de Distribucin de frecuencias
7. Curtosis
Actividad de Aprendizaje No. 4
Auto evaluacin No.4

Ing. Wilson A. Velastegui. Ojeda. Msc


5
Estadstica Descriptiva

PRE TEST O PRUEBA DE DIAGNOSIS

1. Escriba los diez primeros mltiplos del nmero 7


2. Halle el divisor de los nmeros: 12, 15, 30, 39?
3. Si hay 15 mujeres en un grupo de 65 estudiantes. Qu porcentaje del grupo
representan las mujeres? y Qu proporcin de grupo representan los varones?

4. Suponga que: X1 = 4, X2 = 8, X3 = 8, X4 = 6, Halle el resultado de:


4

Xi X
i 1
1 + X2 + X3 =

5. Redondee los siguientes nmeros decimales:

a) 1,0519 a tres dgitos


b) 125,84 a tres cifras enteras
c) 425,45 a una cifra decimal
d) 1 25,0126 a tres dgitos

6. Si n1 = 7; n2 = 9; y n3 = -6. Cunto vale n = ?

7. (3 5) (9 / 2 2/( 12 3) /(5 / 2) ?

8. D los valores absolutos de 1.96 y 1.96

9. Si X1 = 25 y X = 29, y si K = X1 X, Cul es el valor absoluto de (K)?

10. Si x 2 y 2 ny 2 , si y 2 45000, n 10; y 20, cuntovale x 2 ?

n xy ( x )( y )
11. Si B1 n x 2 ( x ) 2 , donde
n 10, xy 3995; x460; y 82; x 2 22420. Halle B1

12. Dado los siete valores de X y de Y aqu indicados:

X = 8, 12, 10, 11, 8, 7, 6 Halle X =

Y = 9, 10, 8, 9, 8, 7, 7 Halle Y =

13. Dado el siguiente conjunto de datos: 2, 1, 8, 5, -1, 3, 9. Ordene en forma ascendente y


en forma descendente.
Ing. Wilson A. Velastegui. Ojeda. Msc
6
Estadstica Descriptiva

14. Si tengo los siguientes nmeros: 48.5 y 20.2. Cul es el mayor valor y cul es el menor
valor? y cul es su diferencia?

15. Usted como estudiante considere ser una variable Y quin financia sus estudios sea
una variable X Cul es la variable dependiente y cul la variable independiente?

xy
16. Si r , despeje ( ( x)2
( x) 2 ( y 2 )

Ing. Wilson A. Velastegui. Ojeda. Msc


7
Estadstica Descriptiva

PRIMERA UNIDAD: CONCEPTOS


BSICOS
No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer
(Autor Desconocido)

OBJETIVOS:

Al trmino de esta unidad el estudiante estar en capacidad de:

Dar el concepto de estadstica.


Diferenciar entre una poblacin y muestra
Distinguir entre variable continua y una variable discreta

DESARROLLO DE CONTENIDOS

1.- INTRODUCCION HISTORICA.

La Estadstica se estructur como disciplina cientfica, en el siglo pasado pero ya se conoca


y se utilizaba en la antigedad. La misma puede catalogarse en orden cronolgico en los
siguientes antecedentes:

a.- Las antiguas civilizaciones, como por ejemplo la de Egipto realizaban relevantamientos
estadsticos (captacin de datos), debido a las inundaciones del ro Nilo, efectuaban censos
anuales, los mismos que permitan conocer como distribuir los bienes y reparto de
propiedades para que fueran restituidos.

Tambin., se sabe que los griegos levantaban censos demogrficos (nacimientos, muertes,
casamientos, etc.) y de propiedad.

b.- En la poca del Imperio Romano se aplicaba censos poblacionales y de bienes a los
pueblos sometidos al imperio con objeto de aplicar el rgimen de impuestos.

En la poca moderna, la tcnica censal adquiri un gran desarrollo llegando constituirse un


eficaz auxiliar de las tareas gubernamentales.

2.- CONCEPTO DE ESTADISTICAS DESCRIPTIVA

La Estadstica es la ciencia de recolectar, organizar, representar, analizar e interpretar datos


para ayudar en una toma de decisiones ms efectiva.

Dicho de otro modo la Estadstica se refiere a la coleccin, representacin y utilizacin de


datos numricos para realizar inferencias y alcanzar decisiones ante la incertidumbre que
plantean muchas disciplinas que van desde las ciencias, la ingeniera, las leyes, la medicina, la
economa, la administracin y otras ciencias, sociales y fsicas.
Ing. Wilson A. Velastegui. Ojeda. Msc
8
Estadstica Descriptiva
El aspecto ms importante de la estadstica es la obtencin de conclusiones basadas en los
datos experimentales.

3.- CLASIFICACIN DE LA ESTADSTICA

La Estadstica se subdivide en: Descriptiva e Inductiva.

3.1.- Estadstica Descriptiva:- Se refiere a la recopilacin y descripcin de un grupo de datos.


Es aquella que estudia toda la poblacin.

3.2.- Estadstica Inductiva:- Es el proceso para lograr generalizaciones acerca del todo

(llamado la poblacin) examinando una parte de ella (llamada la muestra). Para que esto

sea valido, la muestra debe ser representativa de la poblacin.

3.3.- Esquema de Estadstica Inductiva

INDUCCION Poblacin
Muestra

Encuesta

Veamos que significa poblacin y muestra

Poblacin:- Es la coleccin de toda la posible informacin que caracteriza a un fenmeno.


La poblacin- o Universo puede ser tan grande o pequea.

Muestra:- Es mi subconjunto representativo seleccionado de una poblacin.

4.- ORGANIZACION DE DATOS

Los datos sin organizar carecen de sentido, es decir los datos brutos no permiten interpretar
nada acerca de la informacin obtenida. Por esta razn es necesario organizar los datos, lo
cual se realiza dependiendo del tipo de variable con la que se esta trabajando. Veamos que
significa variable.

Variable:- Es la que asume distintos valores en un evento o proceso, y pueden ser nmeros
o cantidades/ Ejemplo: salarios, precios, edades, peso, estatura, etc.

5.- VARIABLES ESTADISTICAS

Las variables estadsticas pueden ser de dos clases: discretas y continuas.

Ing. Wilson A. Velastegui. Ojeda. Msc


9
Estadstica Descriptiva

5.1.- VARIABLES DISCRETAS.- Son aquellas que asumen valores especficos o


determinados, en general son nmeros enteros y sirve para contar o enumerar. Eje: El
nmero de trabajadores de una empresa, el nmero de habitantes de un pas, el numero de
alumnos del ISTRA, etc. La variable discreta no tiene un lmite determinado.

5.2.- VARIABLES CONTINUAS

Son aquellas que asumen valores determinados en un rango, pueden ser enteros o
fraccionarios y sirven para medir.

Ejemplo: La temperatura, el peso, la estatura, la edad, etc.

Ing. Wilson A. Velastegui. Ojeda. Msc


10
Estadstica Descriptiva

ACTIVIDAD DE APRENDIZAJE No. 1

1.- Narre de dos a cinco Historias de la humanidad, o de su pas, provincia, cantn,


parroquia, o comunidad, donde se haya aplicado el concepto de Estadstica de forma
emprica. Es decir sin que haya sido considerada como ciencia.

2.- Describa en forma general desde cuando usted conoci la ciudad de Riobamba.

3.- De los siguientes tems compare y diga cual es poblacin y cual es muestra

a) Nmero de peridicos vendidos a la semana en el mundo

b) Nmero de peridicos vendidos a la semana en Ecuador

c) Nmero de peridicos vendidos a la semana en la ciudad de Riobamba

d) Estudiantes de todas las universidades del mundo

e) Estudiantes de todas las universidades europeas

f) Estudiantes de todas las universidades espaolas

g) Estudiantes de todas las universidades americanas

h) Estudiantes de todas las universidades ecuatorianas

i) Estudiantes de todas las universidades de la ciudad de Riobamba

4.- Escriba 10 ejemplos de Poblacin y 10 de muestra

5.- A que tipo de variable corresponde las siguientes expresiones?:

a) Promedio de calificacin de los estudiantes

b) Distancia que los estudiantes recorren para llegar a clases

c) Calificaciones de estudiantes en el primer examen parcial de Estadstica

d) Clasificacin de alumnos de acuerdo a la provincia que nacieron

e) Nmero de horas de estudio de los estudiantes del ISTRA

f) Edad de los estudiantes del Unidad Educativa Sultana de los Andes

Ing. Wilson A. Velastegui. Ojeda. Msc


11
Estadstica Descriptiva
g) Peso de todos los que integran el Instituto Repblica de Alemania ISTRA

6.- Escriba 10 ejemplos de variable discreta y 10 ejemplos de variable continua

7.- Luego de haber ledo cualquier peridico o revista relacionado a la economa. Haga un
resumen y diga que tipo de variable o variables intervienen en la misma.

8.- Describa con sus propias palabras cmo se puede utilizar la estadstica para resolver
problemas en diversas disciplinas y puestos de trabajo

9.- El presidente de una asociacin de estudiantes quiere tomar una muestra de las
opiniones de los 150 miembros en relacin con las actividades de recreacin para el perodo
acadmico que empezar en el mes octubre.

a) Cul es la poblacin? b) Cul sera la mejor manera de tomar la muestra?

10.- Qu tipo de variable representan las siguientes designaciones?

a) Los estudiantes califican a su profesor de estadstica en una escala de: Horrible, no tan

malo, bueno, magnfico. serio, estricto.

Ing. Wilson A. Velastegui. Ojeda. Msc


12
Estadstica Descriptiva

SEGUNDA UNIDAD: CONCEPTOS


BSICOS
No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer
(Autor Desconocido)

OBJETIVOS:

Al trmino de esta unidad el estudiante estar en capacidad de:

Diferenciar entre un conjunto de datos no agrupados y agrupados.


Agrupar un conjunto de datos
Determinar la marca de clase y distribuciones de frecuencias
Realizar representaciones grficas de los datos de un conjunto.

DESARROLLO DE CONTENIDOS

1. DESCRIPCION DE DATOS U OBSERVACIONES

Al nmero de datos u observaciones se lo representan con n. Para describir los dates puede
presentar dos casos:

1er CASO:- Cuando el conjunto de observacin tiene pocos datos o valores

Ejemplo. Un estudiante durante un semestre dio diez exmenes parciales calificados sobre
diez (10 puntos), obteniendo los siguientes resultados:

6 7 6 8 5 7 6 9 10 y 6. En este ejemplo, n = 10 (nmero de datos).

Para este tipo de conjunto (o estadstica) primero se hace un cuadro o una tabla, luego en la
primera columna del cuadro se ordenan los datos o valores ya sea en forma ascendente o
descendente (creciente o decreciente) en la segunda columna se ponen el nmero de los
valores que se repiten, al nmero que se repite se llama frecuencia (f).

Esto lo visualizamos mediante el siguiente cuadro.

Ing. Wilson A. Velastegui. Ojeda. Msc


13
Estadstica Descriptiva

Notas Frecuencia (f)


Absoluta
5 1
6 4
7 2
8 1
9 1
10 1
TOTAL n = 10

2do. CASO. - Cuando el conjunto de observacin tiene muchos valores diferentes

Para este caso se emplea un procedimiento llamado Agrupamiento de datos". Esto es


posible cuando el numero do datos es mayor que 30 (n >30)

OBSERVACIN:- El nmero de clases que se emplea para agrupar los datos en un


conjunto depende del nmero de datos.

* Si el numero de datos es pequeo, el numero de clases a emplear ser cercano a cinco


(5), pero generalmente nunca menos que cinco (5)

* Si existe una cantidad elevada de datos, el nmero de clases debe encontrarse entre ocho
(8) y doce (12) clases

* En general el nmero de clases puede encontrarse entre 5 a 15 clases, el nmero de


clases se puede elegir uno mismo (entre 5 a 15)

Para saber en cuantos grupos o clases agrupamos estos datos, se utiliza la formula
de Sturges K= 1+3,322 Log (n), donde K. es el numero de clases y n es el nmero
de dates u observaciones. Esto se clarifica mediante el siguiente ejemplo:

La demanda diaria, en unidades de un producto, durante 30 das de trabajo es:

105 106 105 107 109 111 110 110 107 107 104 99 103 99 103

101 100 101 100 103 98 92 97 94 95 95 93 95 95 95

91 82 91 85 90 86 87 89 87 89

Ing. Wilson A. Velastegui. Ojeda. Msc


14
Estadstica Descriptiva
El nmero de datos u observaciones es n = 40. Como el nmero de datos es mayor que 30,
agrupamos los datos utilizando la frmula de Sturges:

K = 1+3,322 log (n)

K = 1+3.322 log (40)

K = 1+3,322 (1.60205)

K = 1+5,322

K = 6,32 = 6 Por tanto los 40 datos podernos agrupar en 6 grupos intervalos o

Clases

2. - PROCEDIMIENTO PARA AGRUPAR LOS DATOS

1.- Ordenamos los datos en forma creciente o decreciente (ascendente o descendente)

2.- Encontramos el dato mayor y el dato menor, llamado tambin observacin mayor (OM) y
observacin menor (om). Con estos datos encontramos el rango o recorrido, en formula es:

Rango = R = OM om

3.- Determinamos el numero de clases o grupos (K), utilizando la frmula de Sturges, (en
nuestro ejemplo anterior K=6).

4.- Hallamos o determinamos la longitud o amplitud del intervalo de la clase, que se designa
con la letra C, en formula es:

Rango R
C , C= es la amplitud de la clase
Nmero..de..clases K

5.- Preparamos un cuadro con 3 columnas, para las clases, limite de clases y en frecuencia,
esto es

CLASE LIMITE DE CLASE FI

Ing. Wilson A. Velastegui. Ojeda. Msc


15
Estadstica Descriptiva
6.- En la columna de lmites de clase anotamos como lmite inferior (Li) de la clase a la
observacin menor. Luego de acuerdo a la amplitud del intervalo de la clase (C), incluimos
tantos datos hasta el lmite superior (Ls), as sucesivamente iremos anotando en clase,
hasta llegar a la ltima clase en la que debe escribir incluido el dato mayor

7.- Finalmente contamos cuantos datos estn incluidos en cada clase y lo ponemos en la
columna de las frecuencias (f)

Ejemplo. Dado conjunto anterior aplique los pasos y agrupe este conjunto de datos

105 106 105 107 109 111 110 110 107 107 104 99 103 99 103

101 100 101 100 103 98 92 97 94 95 95 93 95 95 95

91 82 91 85 90 86 87 89 87 89

1.- Ordenamos los dates del ejemplo que estamos tratando en forma ascendente

82 85 86 87 87 89 89 90 91 91 92 93 94 95 95 95 95 95 97 98

99 99 100 100 101 101 103 103 103 104 105 105 106 107 107

107 109 110 110 111

2.- Hallamos el Rango

R = OM om

R = 111 82 = 29

3.- Determinamos el nmero de clases. K = 1+3,322 log(40) = 6, (K=6)

4.- Determinamos la amplitud del intervalo de la clase.

C = R/K 29/6 = 4.83

C=5

5.- Preparamos una tabla con 3 columnas

Ing. Wilson A. Velastegui. Ojeda. Msc


16
Estadstica Descriptiva

Clases Lmites de Clases Frecuencia fi


1 82 86 3
2 87 91 7
3 92 96 8
4 97 101 8
5 102 106 7
6 107 111 7
TOTAL n = 40

EJEMPLO.- En un centro distribuidor de electrodomsticos, la demanda diaria de televisores


de 14 pulgadas durante 31 das de trabajo es:

38 35 76 58 48 59 67 63 33 69 53 51 28 25 36 32 61 57 49
78 48 42 72 52 47 66 58 44 44 56. Agrupe este conjunto de datos

1.- Ordenamos los datos en forma ascendente

25 28 32 33 35 35 38 42 44 44
47 48 48 49 51 52 53 56 57 58
58 59 61 63 66 67 69 72 76 78

2.- R = 78 - 25 = 53

3.- K = 1+ 3,3221og(30)

K = 1+ 4.9 = 5.90 = 6

4.- C = R / K = 53 / 6 = 8.833 = 9

5.- Presentamos los datos en columnas

CLASE Li Ls F
1 25 33 4
2 34 42 4
3 43 51 7
4 52 60 7
5 61 69 5
6 70 78 3
TOTAL n = 30

Ing. Wilson A. Velastegui. Ojeda. Msc


17
Estadstica Descriptiva

NOTA:- Para ordenar los datos es conveniente saber si los datos se trata de atributos o

variables

Atributo:- Son los que expresan cualidades. Eje: bueno, malo, masculino femenino

Variable:- Es la que asume distintos valores en un evento, generalmente son nmeros.

Para ordenar datos que son atributos es conveniente clasificar de acuerdo con las
categoras, el atributo puede dividirse. Por Ejemplo: si queremos ordenar datos
correspondientes a calificaciones de exmenes sern, sobresaliente, muy buena, buena,
regular, insuficiente.

Pero, si queremos ordenar datos correspondientes a variables, hay que ordenar los valores
en forma creciente o decreciente (ascendente o descender, (e)

3.- DISTRIBUCIONES DE FRECUENCIAS, INTERVALOS Y MARCA DE CLASE.

Para hacer la descripcin grfica de los datos es necesario conocer algunos elementos de la
estadstica

3.1.- LIMITES DE INTERVALOS DE CLASE

Todo grupo, intervalo o clases tiene dos lmites: Lmite inferior (Li) y lmite superior (Ls)

3.2.- PUNTOS MEDIOS 0 MARCAS DE CLASES (Xc)

Cuando estamos trabajando con datos agrupados es conveniente buscar para cada
intervalo un valor que lo represente. Este valor se llama punto medio o marca de clase, que
se representa con Xc, en formula es:

Li Ls
Xc
2

25 33, Li 25, Ls 33
Por ejemplo: en el intervalo Xc 252 33 58 / 2
Xc 29

Xc = 29 es el punto medio o marca de clase

Ing. Wilson A. Velastegui. Ojeda. Msc


18
Estadstica Descriptiva

3.3.- FRECUENCIA ABSOLUTA

Es el nmero de veces que se repite un dato, o el nmero de datos que sc encuentre dentro
de un intervalo o clase, se lo representa con la letra "F minscula, es decir a este tipo de
frecuencia se llama Frecuencia Absoluta.

3.4.-FRECUENCIA RELATIVA

Se obtiene dividiendo el nmero de datos u observaciones de la clase o grupo para el


nmero total de datos u observaciones:

se representa con la letra (fr), en frmula es:

Nmero..de..datos..de..clase f
fr
Nmero..total..de..datos n

3.5. FRECUENCIA ACUMULADA ( Fa )

Se obtiene de la siguiente forma: En la primera clase se pone la frecuencia absoluta del


mismo, en la segunda clase se pone la suma de la frecuencia de la primera clase con la
segunda clase, y as sucesivamente hasta la suma con la frecuencia de la ltima clase.

3.6.- FRECUENCIA RELATIVA ACUMULADA

Se obtiene de forma similar que la frecuencia acumulada, pero sumando las frecuencias
relativas correspondientes. La suma de todas las frecuencias relativas es igual a 1en
formula es:

K
f r f1 f 2 ..... f k 1
I 1

3.7.- PORCENTAJE

El porcentaje se obtiene multiplicando la frecuencia relativa por 100, en formula es:

P = (%) f r f
N x100

Ing. Wilson A. Velastegui. Ojeda. Msc


19
Estadstica Descriptiva
Aplicando esta formula se obtiene el porcentaje, cuyo resultado debe expresarse con %
(tanto por ciento). La suma de todos los porcentajes es igual a 100%

Ejemplo: Dada la siguiente tabla hallar:

a) El punto medio, b) Frecuencia acumulada, c) frecuencia relativa, d) frecuencia relativa


acumulada y e) el porcentaje.

Clase Lmite de clase Frecuencia Punto Medio Fa fr fra Porcentaje %


f Xc
1 Li Ls
25 33 4 29 4 0.13 0.13 P
0.13X100=13
2 34 42 4 38 8 0.13 0.26 0.13X100=13
3 43 51 8 47 16 0.26 '0.52 0.26X100=26
4 52 60 7 56 23 0.23 0.75 0.23X100=23
5 61- 69 5 65 28 0.16 0.91 0.16X100=16
6 70 78 3 74 31 0.09 1.00 0.09X100=9
TOTAL n = 31 1.00 100%

4.- REPRESENTACION GRAFICA DE LOS DATOS

La representacin grfica de los datos es un medio eficaz para el anlisis de las


estadsticas, que nos permiten ver el comportamiento de los datos en mi conjunto del cual
se este investigando. Para luego sacar sus conclusiones.

La representacin grfica de los datos constituye mi medio auxiliar de la investigacin


estadstica pues esta se fluidamente en la descripcin.

SISTEMAS DE REPRESENTACION.- El sistema de representacin mas usual es el


PLANO CARTESIANO, en el eje X se ponen los valores distintos de la variable para dates
no agrupados y los lmites de clases para los datos agrupados, en el eje Y se ponen las
frecuencias absolutas (o frecuencias relativas), Veamos las representaciones grficas mas
usuales en la estadstica

4.1.- HISTOGRAMA.- El histograma es un grfico que tiene un conjunto de rectngulos de


igual base y de altura igual a su respectiva frecuencia absoluta o frecuencias relativas.

Para construir un histograma se traza primero en el primer cuadrando positivo del plano
cartesiano, luego en el ej. X se anotan los limites inferiores; y superiores de las clases,
procurando que haya una continuidad o coincidencia, Esto es que, el lmite superior de una
clase se constituye en lmite inferior do In siguiente clase

NOTA:- Para esto es necesario hallar los limites reales (L-R) de la clase. En el eje Y que
corresponden a sus alturas se ponen sus respectivas (frecuencias.

Ing. Wilson A. Velastegui. Ojeda. Msc


20
Estadstica Descriptiva

Ejemplo: dado los siguientes datos de la siguiente tabla grafique el histograma

Clase Lmites de clase f LR


1 25 33 4 24,5 33,5
2 34 42 4 33,5 42,5
3 43 51 8 42,5 51,5
4 52 60 7 51,5 60,5
5 61 69 5 60,5 69,5
6 70 78 3 69,5 78,5
Total N = 31

Histograma: de la demanda diaria de la venta de televisores

24.5 33.5 42.5 51.5 60.5 69.5 78.5

4.2.- POLGONO DE FRECUENCIA.- Es un grfico lineal, su construccin es similar al


histograma; para su construccin se unen los puntos medios de cada clase, con sus
respectivas frecuencias; de tal manera que al unir sus puntos medios por segmentos forman
un polgono

Ejemplo: dado los siguientes datos de la tabla construya el polgono de frecuencia

Clase Limites de Clase f L.R Xc


1 25 33 4 24.5 - 33.5 29
2 34 42 4 33.5 42.5 38
3 43 51 8 42.5 - 51.5
42.5 47
4 52 60 7 51.5 - 60.5 56
5 61 69 5 60.5 - 69.5 65
6 70 78 3 69.5 - 78.5 74

Polgono de Frecuencia: de la demanda diaria

Ing. Wilson A. Velastegui. Ojeda. Msc


21
Estadstica Descriptiva

29 38 47 56 65 74

4.3.- DIAGRAMA DE DISTRIBUCIN U OJIVA (CURVAS DE FRECUENCIAS


ACUMULADAS)

El grfico de una distribucin de frecuencias acumuladas (se llaman OJIVA) o curva de


distribucin de frecuencias acumuladas

Para su construccin se procede de la siguiente manera. Se considera el plano cartesiano, en el


eje X se anotan los limites reales (L R) de la clase, en el eje Y se anotan las frecuencias
acumuladas (desde la menor hasta la mayor)

Ejemplo: dado los siguientes datos de la tabla construya la curva de distribucin u (OJIVA)

Clase Li Ls f Fa L R
1 25 33 4 4 24,5 33,5
2 34 42 4 8 33,5 42,5
3 43 51 8 16 42,5 51,5
4 52 60 7 23 51,5 60,5
5 61 69 5 28 60,5 69,5
6 70 78 3 31 69,5 78,5

Ing. Wilson A. Velastegui. Ojeda. Msc


22
Estadstica Descriptiva

Grfico de la curva de distribucin (OJIVA)

35
30
25
20
Serie1
15
10
5
0
24.5 33.5 42.5 51.5 60.5 78.5

4.4.- DIAGRAMA DE PASTEL O CICLOGRAMAS

Los grficos en sectores o diagramas de pastel se utilizan para representar los datos cuyo
conjunto forman un todo.

Pertenecen a este grupo los CIRCUNGRAMAS O CICLOGRAMAS, que son crculos que
representan al nmero total de datos (n) divididos en tantos sectores circulares como
categoras tiene el grupo.

Cada sector circular es proporcional a la frecuencia de su clase o categora.

Para encontrar el nmero de grados de cada clase o categora se utiliza la siguiente formula.

GRADO = (fx360)/n

Donde f es la frecuencia de la clase y n el nmero total de dates

Ejemplo: dado los siguientes datos de la tabla construya el diagrama de pastel

CLASE LIMITE DE CLASE FRECUENCIA GRADOS PORCENTAJE


O serie F (fx360)/n Fr x 100
Serie 1 25 33 4 46.5 0.13x100=13
Serie 2 34 42 4 46.5 0.13x100=13
Serie 3 43 51 8 93 0.26x100=26
Serie 4 52 60 7 81 0.23x100=23
Serie 5 61 69 5 58 0.16 x100=16
Serie 6 70 78 3 35 0.09X100=9
TOTAL n = 31 360 100%

Ing. Wilson A. Velastegui. Ojeda. Msc


23
Estadstica Descriptiva

1
2
3
4
5
6

4.5.- DIAGRAMA DE BARRAS O GRFICO DE BARRAS.

El diagrama de barras es un grfico que se representa por medio de rectngulos que se


levantan desde el eje X, hasta una altura que corresponde aI eje Y y que es igual a las
frecuencias de las diferentes categoras de los datos.

La diferencia entre el diagrama de barras y el histograma esta en que el histograma se


refiere a una distribucin de frecuencias y los diagramas de barras se utilizan para cualquier
tipo de atributos cualidades o categoras.

Ejemplo: Los siguientes datos corresponden a los campos petroleros existentes en el


Oriente Ecuatoriano.

Campos Petroleros f
1 Yana yacu 20
2 Coca 57
3 Durano Guanto 100
4 Yana Yacu sur 8
5 Lago Agrio 16
6 Shushufindy 14
7 Yana yacu norte 12
8 Sachas 1 28
9 Sachas 2 56
total n= 311

DIAGRAMA DE BARRAS DE CAMPOS PETROLEROS

120
100
80
60 Series1
40
20
0
1 2 3 4 5 6 7 8

Ing. Wilson A. Velastegui. Ojeda. Msc


24
Estadstica Descriptiva

ACTIVIDAD DE APRENDIZAJE No. 2


1.- La agencia de viajes Ecuador, ofrece tarifas especiales en ciertas travesas por las Islas
Galpagos a ciudadanos de la tercera edad. El presidente de la agencia quiere informacin
adicional sobre las edades de las personas que viajan, una muestra aleatoria de 40 clientes
que hicieron la travesa el ao pasado dio a conocer las siguientes edades.

77 18 63 84 38 54 50 59 54 56 36 26 50 34 44
41 58 58 53 51 62 43 52 53 63 62 62 65 61 52
60 60 45 66 83 71 63 58 61 71

a) Organice los datos en una distribucin de frecuencias


b) En cuntas clases, grupos o intervalos se puede agrupar este conjunto de datos?
c) Cul es lmite inferior que usted recomendara para la primera clase?
d) Comente sobre la distribucin de frecuencias

2.- De Ia tabla siguiente: Construya el Histograma, el polgono de frecuencia y la curva de

distribucin u ojiva

Li Ls f
19,2 19,4 1
19,5 19,7 2
19,8 20,0 8
20,1 20,3 4
20,4 20,6 3
20,7 20,9 2
TOTAL n = 20

3) Dada la siguiente tabla que representa el nmero de carros vendidos en una feria
internacional. Grafique el diagrama de barras

MARCA DE f
CARROS
Datsun 40
Ford 45
Toyota 32
Vitara 44
Montero 38
San Remo 46

TOTAL n = 204

4.- El director del programa de investigaciones cientficas de la Universidad Estatal tiene 16


solicitudes para su admisin en el prximo ao. Las calificaciones de la prueba de los
solicitantes es:

Ing. Wilson A. Velastegui. Ojeda. Msc


25
Estadstica Descriptiva

27 27 27 28 27 25 25 28
26 28 26 28 31 30 26 26

Tales calificaciones deben organizarse en una distribucin de frecuencias.

a) Cuntas clases grupos o intervalos recomendara?


b) Qu intervalo de clase sugerira?
c) Cul es el lmite inferior que recomendara para la primera clase?

5.- En la siguiente serie estadstica de intervalos: Determine:

x F

120 125 5

114 119 6

108 113 10

102 107 9

96 101 15

90 95 2

Total N=47

a) La marca de clase. e) El histograma

b) La frecuencia relativa f) El polgono de frecuencia

c) La frecuencia acumulada g) La curva de distribucin (OJIVA)

d) El porcentaje de la frecuencia relativa h) El diagrama de pastel

Ing. Wilson A. Velastegui. Ojeda. Msc


26
Estadstica Descriptiva

AUTO EVALUACIN No.1 y 2

PARTE A: APLICACIN DE LOS CONCEPTOS Y DEFINICIONES

Seale con una (X) la alternativa o alternativas verdaderas que corresponda a cada
pregunta.

1.- En el siguiente redondeo de datos seale las aproximaciones que son correctas de
acuerdo al Sistema Internacional

a) 125,85 aproximado a tres cifras enteras es 126

b) 235,135 aproximado a dos cifras decimales es 235,14

c) 425,45 aproximado a una cifra decimal es 425,5

d) 1 250,1245 aproximado a una cifra decimal es 1250,2.

2.- Seale con una (x) las variables continuas.

a) Provincias del Ecuador b) Habitantes del Ecuador

c) La estatura de los alumnos de un colegio. d) La edad de los alumnos de la

Modalidad Abierta y a distancia

3.- La variable familias del Ecuador es:

a) Continua b) Discreta

c) Cualitativa d) Ninguna de las anteriores

4.- Seale con una (x) las proposiciones que son correctas.

a) C = Ls Li +1 b) xc = Ls+Li/2 c) xc = (Ls+Li)/2

d) La marca de clase es el valor medio de cada intervalo.

5.- determine los lmites reales que le corresponden al siguiente intervalo: 46 50

a) 46,5 - 50,5 b) 45,5 - 49,5

c) 45,5 - 50,5 d) Ninguna de las soluciones anteriores.

Ing. Wilson A. Velastegui. Ojeda. Msc


27
Estadstica Descriptiva

6.- Un colegio tiene 3 200 estudiantes. Si los alumnos matriculados en el primer curso
son 400, el porcentaje que le corresponde a este curso es de:

a) 8,5% b) 12,5% c) 80%

d) Ninguna de las soluciones anteriores

7.- El ancho del intervalo 51 57 es:

a) C = 5 b) C = 6

c) C = 7 d) Ninguna de las anteriores

8.- La marca de clase del intervalo 30 35 es:

a) 4 b) 5

c) 32 d) Ninguna de las soluciones anteriores

9.- Para el clculo de la frecuencia relativa debemos utilizar la frmula

fx100 f
a) r n
b) f r f .n c) f r d) Ninguna de las soluciones anteriores
n

10) La frmula para calcular el porcentaje de la frecuencia es:

f
a) p f .100
N b) p f .,N
100 c) p d) Ninguna de las anteriores
n

11.- Cul de las siguientes es una grfica de superficie?

a) Curva de magnitud b) Polgono de frecuencia

c) Barras compuestas d) Pictograma

12.- En un polgono de frecuencias, los valores representados en el eje vertical


corresponden

a) Los intervalos de clase b) Las frecuencias acumuladas

c) Los puntos medios d) las frecuencias

Ing. Wilson A. Velastegui. Ojeda. Msc


28
Estadstica Descriptiva

13.- En un histograma, las frecuencias se ubican en el eje vertical y en el eje horizontal

a) Los limites reales de clase b) La variable

c) Los porcentajes de las frecuencias d) las frecuencias relativas

14.- Cuando en el polgono de frecuencia los puntajes se distribuyen en forma uniforme, la


prueba aplicada ha sido:

a) Con un alto grado de dificultad b) Con cierto grado de dificultad.

c) Normal d) Ninguna de las soluciones anteriores

15.- El grfico que se obtiene al representar la variable y la frecuencia acumulada

a) Pictograma b) Ojiva o curva de magnitud

c) Polgono de Frecuencia d) Diagrama de frecuencias

16.- El polgono de frecuencia es un grfico

a) De superficie b) Lineal

c) Libre d) Ninguno de los anteriores

17.- Para trazar un diagrama de barras horizontales en el eje de las abscisas se localizan las
frecuencias y en el eje de las ordenadas.

a) la amplitud de la variable b) Los limites reales de clase

c) Los datos de la variable d) Las frecuencias acumuladas

18.- En un diagrama de sectores los 360 grados del ngulo central de un crculo se
distribuyen utilizando la frmula

f .100 f .360 N .100 f .360


a) A = N
b) A = f
c) A = f
d) A = N

19.- El diagrama espiral se utiliza para representar:

Ing. Wilson A. Velastegui. Ojeda. Msc


29
Estadstica Descriptiva
a) Solo series con datos geogrficos b) Dos series de datos

c) Una variacin expansiva de un fenmeno d) Los porcentajes de la variable

20.- Diga si es variable cuantitativa o variable cualitativa los siguientes tems

a) Numero de libros que ha ledo usted en este ao

b) Peso del contenido en kilogramos de varias cajas de cereales

c) Nmero de pases de semestres otorgados a los estudiantes del ISTRA

d) Nmero de asignaturas en que los estudiantes del ISTRA se han matriculado este

semestre

Ing. Wilson A. Velastegui. Ojeda. Msc


30
Estadstica Descriptiva

TERCERA UNIDAD: MEDIDAS


DE TENDENCIA CENTRAL
No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer
(Autor Desconocido)

OBJETIVOS:

Al trmino de esta unidad el estudiante estar en capacidad de:

Definir los conceptos de las medidas de tendencia central como: promedio, mediana,
moda, media geomtrica y media armnica.
Determinar la media aritmtica, mediana y moda de datos no agrupados y agrupados

DESARROLLO DE CONTENIDOS

1.- INTRODUCCION.- En las unidades anteriores se plantearon los conceptos y las


tcnicas grficas para describir las distribuciones ocultas en un conjunto de datos. En esta
unidad se definen algunas medidas numricas que se emplean para describir un
conjunto de datos. Estas medidas son: Medidas de tendencia central o de centralizacin

Estudiaremos tanto para datos no agrupados y agrupados. Las medidas de tendencia


central se refieren a la localizacin de una distribucin. La ms importantes medidas de
tendencia central son: la media ( X ), la mediana (Mdn), la moda (Mo), media geomtrica
(MG) y la mediana armnica(MA)

2.- MEDIA ARITMETICA O PROMEDIO PARA DATOS NO AGRUPADOS

DEFINICION.- La media se define como la suma de los valores de un conjunto de datos


dividido para el nmero total de datos.

Existen dos tipos de medias aritmticas: La media poblacional que se representa por u (miu)
y la media muestral que se representa por ( X ) (equis barra).

La media para datos no agrupados est dada por la siguiente frmula:

n
Xi
x x 2 x3 ..... x n
X i 1 1
n n

Ing. Wilson A. Velastegui. Ojeda. Msc


31
Estadstica Descriptiva

n
Donde X i a la suma de cada uno de los valores del conjunto de datos y (n) es el
i 1
nmero total de elementos del conjunto.

Ejemplo: Dado el siguiente conjunto de datos hallas su media.

38 35 76 58 48 59 67 63 33 69 53 51 28 25 36 32 61 57 49
78 48 42 72 52 47 66 58 44 44 56 45

Aqu es este conjunto n = 30

n
Xi
38 35 76 58 48 ..... 44 44 56 45 1590
X i 1 51,29
n 31 31

3. MEDIANA PARA DATOS NO AGRUPADOS

DEFINICIN.- La mediana es una coleccin de datos debidamente ordenados en forma


ascendente o descendente (creciente o decreciente). Es el valor medio o la media aritmtica
de los dos valores medios.

La mediana est justamente en el 50% de los datos (en la mitad). Para hallar la mediana,
puede presentar dos casos.

1er. CASO.- Cuando el nmero de datos es impar.- En este caso la mediana se encuentra
en la mitad de la serie ordenada de los datos, se puede encontrar utilizando la siguiente
frmula

n 1
Mdn
2

El resultado de esta operacin nos indica la posicin o el lugar donde est la mediana (este
valor no es la respuesta).

DATOS SIN ORDENAR DATOS ORDENADOS

38 35 76 58 45 28 32 33 35 36

Ing. Wilson A. Velastegui. Ojeda. Msc


32
Estadstica Descriptiva
67 63 33 69 53 59 42 44 44 45 47 48 48

28 25 36 32 61 51 51 52 53 56 57 58 58

49 78 48 42 72 57 59 61 63 66 67 69 72 76 78

47 66 58 44 44 52 56

n = 31 (NMERO DE DATOS IMPAR)

n 1 31 1
Mdn 16
2 2

El 16 no es la mediana, el 16 nos indica la posicin o el lugar donde se encuentra ubicado la


mediana en el ordenamiento de los datos, en nuestro ejemplo el puesto 16 ocupa el nmero
51. Por lo tanto la mediana es:

Mdn = 51

2do. CASO.- Cuando el nmero de datos es par.- En este caso se utiliza el mismo
procedimiento que el 1er. Caso, y se obtiene un nmero entero con decimales, en este caso
la median se encuentra hallando la media aritmtica de los dos valores medios

DATOS SIN ORDENAR DATOS ORDENADOS

38 35 76 58 45 28 32 33 35 36

67 63 33 69 53 59 42 44 44 45 47 48 48

28 25 36 32 61 51 51 52 53 56 57 58 58

49 78 48 42 72 57 59 61 63 66 67 69 72 76 78

47 66 58 44 44 52 56

n 1 30 1 31
Posicin Mdn 15,5
2 2 2

El nmero 15, 5 no es la mediana, este valor nos dice que la mediana est entre el elemento
15 y el elemento 16 de los datos ordenados, esto es: El puesto 15 est ocupado por el
nmero 51 y el puesto 16 por el nmero 52.

Por lo tanto la mediana es:

51 52 103
Mdn 51,5
2 2
Ing. Wilson A. Velastegui. Ojeda. Msc
33
Estadstica Descriptiva

4.- MODA PARA DATOS NO AGRUPADOS

DEFINICIN.- La moda en un conjunto de datos u observaciones es el valor que se repite


con mayor frecuencia. A la moda o modo se lo representa con Mo.

NOTA.- Si existe un solo valor que se repite, el conjunto tiene una sola moda y se llama
UNIMODAL

Ejemplo 1: Hallar la moda del siguiente conjunto de datos.

19 1 3 4 2 5

7 6 6 6 6 6

20 17 8 18 9 10

En este conjunto el nmero que se repite es el 6, por tanto la moda es Mo = 6

Ejemplo 2: Hallar la moda del siguiente conjunto de datos.

1 2 3 3 3 3

4 5 6 7 8 9

10 11 11 11 11 12

En este conjunto los nmeros que se repiten son el 3 y el 11, por tanto la moda es

Mo = 3

Mo = 11 por lo tanto es bimodal (tiene dos modas)

Si existen dos valores que se repiten, el conjunto tiene dos modas, es BIMODAL.

Si existen ms de dos valores que se repiten, se dice que el conjunto tiene varias modas, en
este caso se llama MULTIMODAL

Ing. Wilson A. Velastegui. Ojeda. Msc


34
Estadstica Descriptiva

5.- MEDIA ARITMTICA PARA DATOS AGRUPADOS

La media para datos agrupados se calcula por la siguiente frmula:

k
fi X C
f X f X ..... f k X Ck
X i 1 1 C1 2 C 2
n n

k
Donde f i Xc = a la suma del producto de las frecuencias por el punto medio o marca de
i 1
clase.

n = nmero total de datos u observaciones

K = nmero de intervalos grupos o clases

Para hallar la media de datos agrupados, primero encontramos los puntos medios o marca
de clase XC, luego multiplicamos la frecuencia cada clase por el punto medio de la misma
Finalmente sumamos la columna de los productos y su resultado dividimos para el nmero
total de datos.

Ejemplo: Dado la siguiente tabla de frecuencias halle la media aritmtica.

Li Ls f Xc f. Xc

25 33 4 29 4x29=116

34 42 4 38 4x38=152

43 51 8 47 8x47=376

52 60 7 56 7x56=392

61 69 5 65 5x65=325

70 78 3 74 3x74=222

n = 31 6
f . X C 1583
i 1

6
F.X C
X I 1
n
1583
31
51,06

Ing. Wilson A. Velastegui. Ojeda. Msc


35
Estadstica Descriptiva
6.- MEDIANA PARA DATOS AGRUPADOS

PROCEDIMIENTO

1.- De la tabla hallamos las frecuencias acumuladas lmites de clases

n
2.- Dividimos el nmero total de datos para dos utilizando la expresin
2

3.- El resultado encontrado en 2) localizamos en la columna de frecuencias acumuladas

4.- Aplicamos la frmula de la mediana para datos agrupados que esta dado por:

n n
2 ( f a ) i 2 ( f a ) s

Mdn Li fm
C , o tambin Mdn Ls
C donde;
fm

.Li = significa lmite real inferior de la calase mediana.

n
= es el nmero de datos del conjunto dividido para dos.
2

f a i = suma de las frecuencias acumuladas inferiores a la clase mediana

C = amplitud del intervalo o ancho del intervalo

f m = frecuencia de la clase mediana

Ejemplo: Dado la siguiente tabla de frecuencias halle la mediana

Li Ls f Fa

25 33 4 4

34 42 4 8

43 51 8 16

52 60 7 23

61 69 5 28

70 78 3 31

n = 31

NOTA: La clave primero esta en dividir el nmero total de datos para dos, esto es:

Ing. Wilson A. Velastegui. Ojeda. Msc


36
Estadstica Descriptiva
n 31
= 15,5 este valor se encuentra en la clase 3 o el intervalo 43 51
2 2
.Li = 42,5 f a i = 8 C = 43 34 = 9 fm = 8

Reemplazando estos valores en la frmula de la mediana tenemos su resultado

Mdn 42,5
15,58 (9) 42,5 7,5 (9) 42,5 67,5 42,5 8,4375 = 50,9375
8 8 8

7.- MODA PARA DATOS AGRUPADOS

Para hallar la moda para datos agrupados, primeramente se observa en columna da las
frecuencias, el valor ms alto (clase con la mayor frecuencia.) Luego se halla la moda
utilizando la siguiente frmula

d1
Mo Li d C donde;
1 d2

Li = Lmite inferior de la calase modal (clase con la mayor frecuencia).

d1 = Frecuencia de la clase modal menos la frecuencia de la clase anterior

d 2 = Frecuencia de la clase modal menos la frecuencia de la siguiente clase.

C = Amplitud o longitud del intervalo de clase

Ejemplo: Dado la siguiente tabla de frecuencias halle la moda

Li Ls f

25 33 4

34 42 4

43 51 8

52 60 7

61 69 5

70 78 3

n = 31

NOTA: La frecuencia mas alta 8 y esta en el intervalo 43 51 o tercera clase, donde:

Ing. Wilson A. Velastegui. Ojeda. Msc


37
Estadstica Descriptiva
f = 8 frecuencia ms alta

Li = 42,5 = Lmite inferior de la calase modal (clase con la mayor frecuencia)

d1 = 8 4 = 4 = frecuencia de la clase modal menos la frecuencia de la clase anterior

d 2 = 8 7 = 1 = frecuencia de la clase modal menos la frecuencia de la siguiente


clase.

C = 70 61 = 9 = Amplitud o longitud del intervalo de clase

Estos valores reemplazamos en la frmula de la moda y su valor es:

d1 36
Mo Li d C = 42,5 4 4 5 (9) 42,5 42,5 4 = 46,5
1 d2 9

EJEMPLO DE RECAPITULACIN:

Dado la siguiente tabla de datos agrupados halle la media aritmtica, mediana y la moda

Clase Li Ls fi Xc f. Xc Fa
1 1.00 1.04 4 1.02 4.08 4
2 1.05 1.09 6 1.07 6.42 10
3 1.10 1.14 10 1.12 11.20 20
4 1.15 1.19 15 1.17 17.55 35
5 1.20 1.24 8 1.22 9.76 43
6 1.25 1.29 5 1.27 6.35 48
Total n = 48 6
f .X C 55,36
i 1

k
f .X C
55,36
X i 1 = 1.1533333 = 1.15
n 48

Para la mediana primero dividimos el nmero total de datos para dos, esto es:
n 48
= 24 este valor se encuentra en la 4 clase o el intervalo 1.15 1.19
2 2
.Li = 1.15 f a i = 20 C = 1.15 1.10 = 0.05 f m = 15

Reemplazando estos valores en la frmula de la mediana tenemos su resultado

Ing. Wilson A. Velastegui. Ojeda. Msc


38
Estadstica Descriptiva

n
2 ( f a ) i

Mdn Li fm
C

Mdn 1.15
2420 (0.05) 1.15 4 / 15(0.05) 1.15 0.0133 = 1.1633 = 1.163
15

Para hallar la moda observamos cual es la frecuencia ms alta, en este caso es 15 y


est en la cuarta clase, donde se tiene:

Li = 1.15 d1 = 15 10 = 5 d 2 = 15 8 = 7

C = 1.20 1.15 = 0,05

Estos valores reemplazamos en la frmula de la moda y su valor es:

d1
Mo Li d C
1 d2

d1 0.25
Mo Li d C = 1.15 55 7 (0.05) 1.15 1.15 0.020833333 = 1.17083
1 d2 12

Mo= 1.170 1.2

Ing. Wilson A. Velastegui. Ojeda. Msc


39
Estadstica Descriptiva

ACTIVIDAD DE APRENDIZAJE No. 3

1.- Los siguientes datos representan las latas de frutas de una muestra de 20 unidades que
contienen pesos netos que oscilan entre 19.3 onzas y 20.9 onzas.

19.7 - 19.9 - 20.2 - 19.9 - 20.0 - 20.6 - 19.3 - 20.4 - 19.9 - 20.3 - 20.1 - 19.5 - 20.9 - 20.3 -
20.8 - 19.9 - 20.0 - 20.6 - 19.9 - 19.8

Hallar: el peso promedio, la mediana y la moda, para este conjunto de datos no agrupados

2.- La agencia de viajes Ecuador, ofrece tarifas especiales en ciertas travesas por las Islas
Galpagos a ciudadanos de la tercera edad. El presidente de la agencia quiere informacin
adicional sobre las edades de las personas que viajan, una muestra aleatoria de 40 clientes
que hicieron la travesa el ao pasado dio a conocer las siguientes edades.

77 18 63 84 38 54 50 59 54 56 36 26 50 34 44
41 58 58 53 51 62 43 52 53 63 62 62 65 61 52
60 60 45 66 83 71 63 58 61 71

Hallar: la edad promedio, la mediana y la moda, para este conjunto de datos no agrupados

4.- El director del programa de investigaciones cientficas de la Universidad Estatal tiene 16


solicitudes para su admisin en el prximo ao. Las calificaciones de la prueba de los
solicitantes es:

27 27 27 28 27 25 25 28
26 28 26 28 31 30 26 26

Halle: la calificacin promedio, la mediana y la moda, para este conjunto de datos no


agrupados

5.- Los siguientes datos representan las calificaciones obtenidas en un examen de


estadstica en una clase de 40 estudiantes. Halle: la calificacin promedio, la mediana y la
moda, para este conjunto de datos no agrupados

2 3 3 3 3 3 4 4 4 4 4 5 5 5
5 5 6 6 6 6 6 6 6 6 7 7 7 7
Ing. Wilson A. Velastegui. Ojeda. Msc
40
Estadstica Descriptiva
7 7 8 8 8 8 9 9 9 9 10 10

6.- a) Determine la media aritmtica de los siguientes valores muestrales 5, 9, 4, 10

4
b) Demuestre que ( x x) 0
i 1

7.- Determine el salario medio por hora pagado a carpinteros que obtuvieron los siguientes
pagos por hora: $ 15.40, $ 20.10, $ 18.75, $ 22.76, $ 30.67, $ 18.00

8.- Cual sera el valor modal que reportara para un conjunto de observaciones si hay un
total de:

a) 10 observaciones y no hay dos valores iguales

b) 6 observaciones y todos son iguales

c) 6 observaciones y los valores son 1, 2, 3, 3, 4 y 4

Para los ejercicios 9 al 11, a) determine la mediana, y b) la moda

9.- Los siguientes datos representa el nmero de cambios de aceite para los ltimos siete
das en el taller denominado Auto car, localizado en la esquina de la calle Alvarado y Luz
E. Borja

41 15 39 54 31 15 33

10.- Los siguientes datos muestrales representan el cambio en porcentaje para el ingreso
neto del 2002 al 2003, en el caso de 12 compaas de construccin

5 1 - 10 -6 5 12 7 8 2 5 -1 11

11.- A continuacin se presentan la edad de 10 personas en la tienda de videos en el centro


de la ciudad de Riobamba

12 8 17 6 11 14 8 17 10 8

Ing. Wilson A. Velastegui. Ojeda. Msc


41
Estadstica Descriptiva

CUARTA UNIDAD: MEDIDAS DE


DISPERSIN
No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer
(Autor Desconocido)

OBJETIVOS:

Al trmino de esta unidad el estudiante estar en capacidad de:

Determinar la varianza, la desviacin tpica o estndar, la desviacin media y la


desviacin mediana de datos no agrupados y agrupados.
Determinar la asimetra, el sesgo de la curva de distribucin curtosis.

DESARROLLO DE CONTENIDOS

1.- MEDIDAS DE DISPERSIN PARA DATOS NO AGRUPADOS Y AGRUPADOS

La dispersin se refiere a la variabilidad o amplitud los datos dentro de un conjunto del cual
se este investigando.

Las medidas de dispersin o variabilidad se refieren a la dispersin o distanciamiento de los


datos con respecto a su media. Las ms importantes son: varianza (S2), la desviacin tpica
o estndar (S), La desviacin media (Dm), la desviacin mediana (DMdn), los cuartiles,
deciles y percentiles

2.- VARIANZA Y DESVIACIN ESTNDAR PARA DATOS NO AGRUPADOS

2.1.- VARIANZA PARA DATOS NO AGRUPADOS

La varianza para datos no agrupados est dada por la siguiente frmula:

i 1
2
xx
x1 x x 2 x ..... x n x
2 2 2
S
2

n 1 n 1

n 2
x nx
2
i 1
S2 (Mtodo abreviado)
n 1

Ing. Wilson A. Velastegui. Ojeda. Msc


42
Estadstica Descriptiva
n
xx
i 1
2
= Suma de la diferencia de cada valor del conjunto de datos menos la media

aritmtica elevado al cuadrado.

n 1 = nmero de datos de la observacin menos uno.

Ejemplo: Dado el siguiente conjunto de datos no agrupados halle la varianza

82 85 86 87 87 89 89 90 91 91

92 93 94 95 95 95 95 95 97 98

99 99 100 100 101 101 103 103 103 104

105 105 106 107 107 107 109 110 110 111

La media aritmtica es: x 97.9 donde

40
( x x) (82 97.9) (86 97.9) ......... (111 97.9) = 2379, 61
2 2 2 2
i 1

Por lo tanto la varianza es


40
( x x)
2
2370,61
S 2 i 1
401
= 61. 015
39

2.2.- DESVIACIN ESTNDAR PARA DATOS NO AGRUPADOS

DEFINICIN.- La raz cuadrada ms la varianza recibe el nombre de Desviacin estndar

Del ejemplo anterior tenemos que la varianza es: S2 = 61.015

Desviacin Estndar: S = 61.015 7.81 = 7.81

3.- VARIANZA Y DESVIACIN ESTNDAR PARA DATOS AGRUPADOS

3.1.- VARIANZA PARA DATOS AGRUPADOS.- en frmula esta dado por:

Ing. Wilson A. Velastegui. Ojeda. Msc


43
Estadstica Descriptiva
k
f xc x
i 1

2

f1 x c x 2 f 2 xc x2 ..... f k xc x2
S2 =
n 1 n 1

Ejemplo: Dado el siguiente conjunto de datos agrupados halle la varianza

Li Ls Punto Medio fi X c xc x
f i xc x 2
xc f

82 86 84 3 252 13.75 567.1875

87 91 89 7 623 8,75 535.9375

92 96 94 8 752 3.75 112.5000

97 101 99 8 792 1.25 12.5000

102 106 104 7 728 6.25 273.4375

107 111 109 7 763 11.25 885.9375

TOTAL n = 40 3910 6

f i xc x
i 1
2 2387.5

K
f i Xc
x i 1
n
3910
40
97.75 luego la varianza es:

6
fi x x 2

S 2
i 1
n1
2387 .5
39 = 61.2179

3.2.- DESVIACIN ESTNDAR PARA DATOS AGRUPADOS.- La raz cuadrada de


la varianza recibe el nombre de Desviacin estndar, en frmula esta dado por:

S=
k
fi ( Xc X )
i 1
2



f1 x c x 2 f 2 xc x2 ... f k xc x2
n1 n 1

Del ejemplo anterior la varianza es: S2 = 61.2179 por consiguiente la desviacin estndar es

S 61.2179

S = 7.824

Ing. Wilson A. Velastegui. Ojeda. Msc


44
Estadstica Descriptiva
4.- DESVIACIN MEDIA PARA DATOS NO AGRUPADOS

La desviacin media para datos no agrupados est dada por:

n
xi x
Dm = i 1
n

Dm = Desviacin media

x i x = valor absoluto de la diferencia entre cada dato de la muestra y la media.

n = Nmero de datos.

Ejemplo: Del siguiente conjunto da datos: Hallar la desviacin media (D.m)

82 85 86 87 87 89 89 90 91 91

92 93 94 95 95 95 95 95 97 98

99 99 100 100 101 101 103 103 103 104

105 105 106 107 107 107 109 110 110 111

82 85 86 ..... 110 111


x 97.9
40

n
xi x 82 97.9 85 97.9 86 97.9 ..... 110 97.9 111 97.9
i 1
n
xi x 15.9 12.9 11.9 ..... 12.1 13.1
i 1

n
xi x = 15.9 + 12.9 + 11.9 + ..+ 12.1 + 13.1 = 264.2
i 1

Por lo tanto: la desviacin media es:

n
xi x
i 1 264.2
Dm= = = 6. 605 = 6.61
n 40

5.- DESVIACIN MEDIANA PARA DATOS NO AGRUPADOS

Ing. Wilson A. Velastegui. Ojeda. Msc


45
Estadstica Descriptiva
La frmula de la desviacin mediana para datos no agrupados en frmula esta dado por

n
xi Mdn
i 1 x1 Mdn x 2 Mdn ..... x n Mdn
D Mdn=
n n

Ejemplo: Del mismo conjunto anterior hallamos la desviacin mediana, Donde

n 1 40 1 41
La posicin: Mdn = = = 20,5 esta entre el elemento 20 y 21
2 2 2

El elemento 20 es 98 y el elemento 21 es 99, el verdadero valor de la mediana es:

98 99
D Mdn = = 98.5 hallamos el valor de la desviacin mediana
2

n
xi Mdn
D Mdn= i 1

82 98.5 85 98.5 .... 110 98.5 111 98.5 = 5.92
n 40

6.- DESVIACION MEDIA PARA DATOS AGRUPADOS

La desviacin media para datos agrupados esta dado por la siguiente frmula:


f i xc x
f1 x c x ..... f k x c x
Dm=
n n

Donde fi = es la frecuencia de cada clase

xc x = es la diferencia entre la marca de clase (punto medio) y la media.

Ejemplo: De la siguiente tabla de datos agrupados calcular la desviacin media.

Li Ls Punto Medio fi X c xc x
f i xc x Fa
xc f *
82 86 84 3 252 13.75 3(13.75) = 41.25 3
87 91 89 7 623 8.75 7(8.75) = 61.25 10
92 96 94 8 752 3.75 8 ( 3.75) = 30.00 18
97 101 99 8 792 1.25 8 (1.25) = 10.00 26
102 106 104 7 728 6.25 7 ( 6.25) = 43.75 33
107 111 109 7 763 11.25 7 (11.25) = 78.75 40
TOTAL n = 40 3910 6

f i xc x 265
i 1

Ing. Wilson A. Velastegui. Ojeda. Msc


46
Estadstica Descriptiva

K
f i Xc

f i xc x 265
x i 1
N
3910
40
97.75 la desviacin media es D m = = = 6.625
n 40

6.- DESVIACIN MEDIANA PARA DATOS AGRUPADOS

La frmula de la desviacin mediana para datos no agrupados en frmula esta dado por

k
f i x c Mdn
i 1 f ( x Mdn) f 2 ( x c Mdn) ..... f k ( x c Mdn)
D Mdn = 1 c
n n

Ejemplo: De la tabla anterior de datos agrupados calcular la desviacin mediana.

NOTA: La clave primero esta en dividir el nmero total de datos para dos, esto es:

n 40
= 20 este valor se encuentra en la clase 3 o el intervalo 97 101
2 2
.Li = 96,5 f a i = 18 C = 106 101 = 5 fm = 8

Con estos datos hallamos la mediana

Mdn 96,5
2018 (5) 96,5 2 (5) 96,5 10 96,5 1,25 = 97.75
8 8 8

Aqu la mediana es igual a la media aritmtica por lo que la desviacin media es tambin
igual a la desviacin mediana esto es:

k
f i xc Mdn
i 1 265
D Mdn = = = 6.625
n 40

OSERVACIN: No siempre va a ser igual la desviacin media con la desviacin


mediana en los dems problemas.

Ing. Wilson A. Velastegui. Ojeda. Msc


47
Estadstica Descriptiva

ACTIVIDAD DE APRENDIZAJE No. 4

Para los problemas del 1 al 5 calcule: a) la varianza, b) la desviacin tpica o estndar, c) la


desviacin media y la desviacin mediana, todos representan datos muestrales.

1.- Una muestra de archivos personales de 10 empleadas del Hospital General indic que,
durante un perodo de de seis meses, no asistieron el siguiente nmero de das por
enfermedad: 6, 3, 0, 2 10, 2, 1, 4, 12, 7

2.- Cinco representantes de servicio al cliente de la empresa Electro Sony, que trabajaron el
ltimo viernes, vendieron respectivamente 10, 8, 4, 3, 5, 6, 8 y 2 videograbadoras (VCR)

3.- El departamento de Estadstica del INEC de la ciudad de Riobamba ofrece ocho cursos
de Estadstica Bsica. Los siguientes datos son el nmero de estudiantes inscritos en tales
cursos: 46, 52, 34, 28, 29, 41, 38 y 36

4.- Los siguientes datos representan las calificaciones obtenidas en la clase de Estadstica

80, 83, 87, 85, 90, 86, 84, 82, 88

5.- El nmero de horas trabajadas por Anglica en los ltimos meses fueron

52, 48, 37, 54, 48, 15, 42, 12

Para los problemas del 1 al 2 que representan datos agrupados calcule: a) la varianza, b) la
desviacin tpica o estndar, c) la desviacin media, y la desviacin mediana, todos
representan datos muestrales.

1.- La siguiente tabla representa el nmero de das al ao en que los empleados de una
empresa manufacturera estuvieron ausentes del trabajo debido a una enfermedad. Adems
responda a las siguientes preguntas:

a) Cuntos empleados estuvieron ausentes menos de tres das al ao?

b) Cuntos lo estuvieron ausentes menos de seis das debido a la enfermedad?

Ing. Wilson A. Velastegui. Ojeda. Msc


48
Estadstica Descriptiva
Nmero de f
inasistentes
0 a 3 5
3 a 6 12
6 a 9 23
9 a 12 8
12 a 15 8
Total n = 50

2.- El contador en jefe de la empresa XX quiere preparar un informe acerca de las cuentas
por cobrar de la compaa. A continuacin se presenta una distribucin de frecuencias que
muestra la cantidad sobresaliente.

Cantidad f
0 a 2 000 4
2 000 a 4 000 15
4 000 a 6 000 18
6 000 a 8 000 10
8 000 a 10000 4
10 000 a 12 000 3
Total n = 54

5.- CUARTILES, DECILES Y PERCENTILES, PARA DATOS NO AGRUPADOS

Los cuartiles, deciles y percentiles se asemejan mucho a la mediana porque tambin


subdividen una distribucin de mediciones de acuerdo con la proporcin de frecuencias
observadas.

Mientras la mediana divide un conjunto de datos en dos mitades, los cuartiles la dividen en 4
partes, los deciles la dividen en 10 partes y los percentiles la dividen en 100 partes.

Para los datos no agrupados, las frmulas que se emplean son las siguientes:

CUARTILES:

Primero: Q1 = (N/4) + (1/2) Segundo: Q2 = (2N/4) +(172) Tercer: Q3 = (3N/4) + (1/2).

DECILES

Primero: (N/10) + (1/2) = D1 Segundo: (2N/10) + (1/2) = D2

Tercero: (3N/10) + (1/2) = D3 Cuarto: (4N/10) + (1/2) = D4

Quinto: (5N/10) + (1/2) = D5 Sexto: (6N/10) + (1/2) = D6

Ing. Wilson A. Velastegui. Ojeda. Msc


49
Estadstica Descriptiva
Sptima: (7N/10) + (1/2) = D7 Octavo: (8N/10) + (1/2) = D8

Noveno: (9N/10) + (1/2) = D9

PERCENTILES

Primero: P1 = (N/100) + (1/2) Segundo: P2 = ( 2N/100) +(1/2)

Diez P10 = ( 10N/100) +(1/2) Setenta = P70 = ( 70N/100) +(1/2)

Ochenta = P80 = ( 80N/100) +(1/2) Noventa = P90 = ( 90N/100) +(1/2)

Ejemplo: Del siguiente conjunto de datos hallar, los cuartiles, el decil segundo y decil
noveno, adems hallar los percentiles dcimo, veinticinco avo, setenta y cinco avo (75) y
noventa avo.

82 85 86 87 87 89 89 90 91 91

92 93 94 95 95 95 95 95 97 98

99 99 100 100 101 101 103 103 103 104

105 105 106 107 107 107 109 110 110 111

En este problema el nmero de datos es n = 40

CUARTILES

91 92 183
Q1 = (n/4) +(1/2) = (40/4) + (1/2) = 10 +0.5; Q1 = = 91.5
2 2

98 99 197
Q2= (2(40)/4) +(1/2) = 20+ 0.5 = 20.5 Q2 = = 98.5
2 2

104 105 209


Q3 = (3(40)/4) +(1/2) = 30+0.5 = 30.5 Q3 = = 104.5
2 2

DECILES

90 91 181
D1 = (2(40)/10) +(1/2) = 8+0.5 = 8.5 D1 = = 90.5
2 2

107 109 206


D9 = (9(40)/10) +(1/2) = 36+0.5 = 36.5 D9 = = 108.5
2 2

PERCENTILES

87 87 174
P10= (10(40)/100) +(1/2) = 4+0.5 = 4.5 P10 = = 74
2 2

Ing. Wilson A. Velastegui. Ojeda. Msc


50
Estadstica Descriptiva
91 92 183
P25 = (25(40)/100) +(1/2) = 10+0.5 = 10.5 P25 = = 91.5
2 2

104 105 209


P75 = (75(40)/100) +(1/2) = 30 + 0.5 = 30.5 P75 = = 104.5
2 2

107 109 216


P90 = (90(40)/100) +(1/2) = 36+0.5 = 36.5 P90 = = 108
2 2

De todas estas medidas los ms utilizados son los Percentiles:

DEFINICIN: Se llama recorrido intercuantil a la diferencia entre los percentiles 75 avo. Y


25 avo. En formula es: Recorrido intercuantil = P75 P25

Del ejemplo anterior tenemos: Recorrido intercuantil = P75 P25 = 104.5 91.5 = 13

DEFINCIN: Se llama recorrido interdecil a la diferencia entre los percentiles 90avo. Y 10


avo. En frmula es: Recorrido interdecil = P90 P10.

Del ejemplo anterior tenemos: Recorrido interdecil = P90 - P10 = 108 87 = 21

6.- CUARTILES, DECILES Y PERCENTILES PARA DATOS AGRUPADOS

Para hallar los cuartiles, deciles y percentiles de datos agrupados, basta recordar la frmula
de la mediana para datos agrupados.

Esto Es: Mdn Li [ N / 2f(m f )i ] C

Por lo tanto las formulas para los Cuartiles, deciles y percentiles son:

CUARTILES:

Q1 Li N / 4f cuartil
( f ) i
.C Q2 Li 2 N /f4cuartil
( f ) i
.C Q3 Li 3 N /f4cuartil
( f ) i
.C

DECILES

D1 Li N / 10f decil
( f ) i
.C D5 Li 5 N / 10f decil
( f ) i
.C D8 Li 8 N / 10f decil
( f ) i
.C

Ing. Wilson A. Velastegui. Ojeda. Msc


51
Estadstica Descriptiva
9 N / 10( f ) i
D9 Li f decil .C

PERCENTILES

Dentro de los percentiles los ms utilizados son:

P10 Li N / 10 ( f ) i
f percentil .C P25 Li 25N f/percentil
10( f ) i
.C P75 Li 75N f/percentil
10( f ) i
.C

P90 Li 90N f/percentil


10( f ) i
.C

As tenemos lo siguiente:

Recorrido intercuantil = P75 P25

Recorrido interdecil = P90 P10.

Ejemplo: De la siguiente tabla determinar, el recorrido intercuantil y el recorrido interdecil

clase LIMITE DE CLASE FRECDUENCIA FRECUENCIA


ACUMULADA
fi

1 82 86 3 3

2 87 91 7 110

3 92 96 8 18

4 97 101 8 26

5 102 106 7 33

6 107 111 7 40

Total n =40

P10 Li 10N F/ 100 ( f ) i


percentil
.C P25 Li 25N F/ 100 ( f ) i
percentil
.C

Ing. Wilson A. Velastegui. Ojeda. Msc


52
Estadstica Descriptiva
10n 10(40) 400 25n 25(40) 1000
4 (2da clase) 10 (2da clase)
100 100 100 100 100 100

Li= 87; ( f)i = 3; f= 7; C=5 Li= 87; ( f)i = 3; f= 7; C=5

P 10 = 87 + (4-3/7) 5 P 25 = 87 + (10-3/7) 5

P10 = 87 + (1/7) 5= 87+0.71 P25 = 87 + (7/7) 5 = 87+5

P10 = 87.71 P25 = 92

P90 Li 90N F/ 100 ( f ) i


percentil
.C P10 Li 10N F/ 100 ( f ) i
percentil
.C

90N = 3600=36 (6ta clase). 75N = 3000=30 (5ta clase).

100 100

Li= 107; ( f)i = 33; f= 7. Li= 102; ( f)i = 26; f= 7.

P 90 = 107+ (36-33/7) 5 P 75 = 102+ (30-26/7) 5

P90 = 107 + (3/7) 5= 107+2.14 P75 = 102+ (4/7) 5= 102+2.85

P90 = 109.14 P75 = 104.86

Recorrido intercuantil = P75 P25 = 104.86 92 = 12.86 13

Recorrido interdecil = P90 P10 = 109.14 87.71 = 21.43

EJERCICIO1: Dado el siguiente conjunto de datos no agrupados (20 datos)

Datos no ordenados Datos ordenados

40.2 29.3 35.6 88.2 42.9 25.1 29.3 35.6 40.2 50.6

26.9 28.7 99.8 35.6 37.8 25.4 31.7 36.8 42.9 55.2

44.2 32.3 55.2 50.6 25.4 26.9 32.3 37.8 44.2 88.2

31.7 36.8 45.2 25.1 39.7 28.7 35.6 39.7 45.2 99.8

Ing. Wilson A. Velastegui. Ojeda. Msc


53
Estadstica Descriptiva
Calcular: el recorrido intercuantil y recorrido interdecil

P10= [10(20)/100 + 0.5 = 2 + 0.5 = 2.5; est entre el elemento 2 y 5 de los datos ordenados

P10= (25.4 + 26.9)/2 = 52.3/2 = 26.15

P25 = (29.3 + 31.7)/ 2 = 61/ 2 = 30.5

P75 = [75(20)/100) + 0.5 = 15 + 0.5 = 15.5; est entre el elemento 15 y 16

P75 = (44.2 + 45.2 / 2 = 89.4 /2 = 44.7

P90 = [90(20)/100) + 0.5 = 18+0.5 = 18.5; est entre el elemento 18 y 19

P90 = (88.2 + 55.2)/ 2 = 134.4/2 = 71.7

Recorrido intercuantil = P75 P25 = 44.7 30.5 = 14.2

Recorrido interdecil = P90 P10 = 71.7 26.15 = 45.55

EJERCICIO 2: Los siguientes datos agrupados representan los pagos por almacenamiento
para los 50 ms grandes detallistas durante el ao 2003. Hallar, la media, mediana, moda,
la varianza y la desviacin tpica

f Xc fA Fi Xc Xc - X F1(Xc- X) (Xc- X)2 F1(Xc - X)2


Li Ls
1.10 - 1.86 4 1.48 4 5.92 1.88 7.52 3.176 12.704
1.87 - 2.63 14 2.25 18 31.5 1.11 15.54 1.024 14.336
2.64 - 3.40 11 3.02 29 33.22 0.34 3.74 0.059 .649
3.41 - 4.17 9 3.79 38 34.11 0.43 3.87 0.276 2.511
4.18 - 4.94 7 4.56 45 31.92 1.20 8.40 1.684 11.788
4.95 - 5.71 1 5.33 46 5.33 1.79 1.97 4.277 4.277
5.72 - 6.48 2 6.10 48 12.20 2.76 5.48 8.139 16.278
6.49 - 7.25 2 6.87 50 13.74 3.51 7.02 13.017 26.034

Total n=50 167.94 53.54 88.577

8
FI Xc
X I 1
n
16750.99 3.36 n/2 = 50/2= 25 est en la tercera clase

8
Li = 2.635 ( f )i 18;
i 1
fm=11

Ing. Wilson A. Velastegui. Ojeda. Msc


54
Estadstica Descriptiva
C= 5.72 4.95 = 0.77

8
N / 2i f ) y
Mdn Li
fm
1

Mdn= = 2.635 + (25 18)/11 (0.77) = 2.635 + (0.636)(0.77) = 2.635 + 0.49 = 3.125

La moda Mo Li d1d1d 2 C

d1 = 14 4 = 10 d2 = 14 11 = 3 Li = 1.865

10 7.7
Mdn 1.865 (0.77) 1.865 1.865 0.5923 = 2.4573 = 2.46
10 3 13

la desviacin media
8
f1 ( Xc x)
Dm i 1
n
5350.54 = 1.0708

* La varianza

8 2
f1 ( Xc x )
S
2 i 1
n 1
8849
.577 = 1, 80769 = 1.81

* La desviacin tpica o estndar

8
fi ( Xc X )
2

S i 1
n1
1.808 = 1.344 = 1.34

OBSERVACIN: Otros autores al lmite inferior pueden tomar el mismo valor es decir Li =
2.64 y no restar 0.001, en nuestro caso: Li = 2.64 0.001 =2.635

7.- FORMA DE DISTRIBUCION DE FRECUENCIA

La forma de la distribucin sobre conjuntos que tienen una sola moda (unimodales) se
refiere a: Su simetra o falta de ella (asimetra)

Ing. Wilson A. Velastegui. Ojeda. Msc


55
Estadstica Descriptiva
La curtosis (la agudeza de su punta).

SIMETRIA.- Una distribucin se dice que es simtrica cuando la media, mediana y la moda
son iguales, es decir

X = Mdn = Mo

Donde su asimetra es igual a cero.

Se dice que una distribucin esta sesgada positivamente, si la cola derecha es ms larga
que la cola izquierda

X > Mdn > Mo

Se dice que una distribucin esta sesgada negativamente si la cola izquierda es ms larga
que la cola derecha

Mo > Mdn > X

Esto se puede visualizar mediante el siguiente grfico

La asimetra (Sk) puede medirse por el coeficiente de simetra de Pearson

Sk = 3(u med) para poblaciones


Ing. Wilson A. Velastegui. Ojeda. Msc
56
Estadstica Descriptiva

Sk = 3(X med) para muestras.

SP

La asimetra puede medirse tambin por el tercer momento respecto a la media y se puede
hallar tambin mediante las siguientes frmulas:
k
ni ( x )3
Sk i 1
3
para poblaciones

k
fii ( x x )3
Sk i 1
s3
para muestras.

Donde, u3 es el tercer momento central;

Si u3 < 0, se dice que la distribucin es asimtrica negativamente

Si u3 > 0, se dice que la distribucin es asimtrica positivamente

Si u3 = 0, se dice que la distribucin es simtrica.

CURTOSIUS.- La curtosis estudia la puntiagudez de la curva

Una curva de punta aguda se llama leptocrtica.

Una curva de punta atachada se llama platircrtica

Una curva que se encuentra entre la leptocrtica y platicrtica se llama mesocrita (ver fig.)

La curtosis puede medirse por el cuarto momento respecto a la media dividido por la
desviacin estndar elevada a la cuarta potencia. Es frmula es:

k
ni ( x )4
Sk i 1
4 para poblaciones

k
fii ( x x )4
Sk i 1
s4 para muestras.

Donde, u2 es el cuarto momento central

La curtosis para una curva leptocrtica >3

La curtosis para una curva mesocrtica = 3

La curtosis para una curva platicrtica < 3


Ing. Wilson A. Velastegui. Ojeda. Msc
57
Estadstica Descriptiva
3( x Mdn)
Coeficiente de Pearson: P 5

Si P < 0, los datos estn sugados a la izquierda

Si P > 0, los datos estn sugados a la derecha

Si P = 0, los datos estn distribuidos normalmente.

TEOREMA DE CHEBYSHEY: Afirma que al menos un dato (observaciones) de un conjunto



se encuentra en 1 k12 , k 1yK desviacin tpica de la media.

Coeficiente de variacin: Mide el grado de dispersin de un conjunto de datos en relacin


con su media.

CV 5x (100)

Ing. Wilson A. Velastegui. Ojeda. Msc


58
Estadstica Descriptiva

POS - TEST

INSTRUCCIN: Seale con una (x) la(s) alternativa(s) verdadera(s) que correspondan a
cada pregunta.

1.- Las medidas de tendencia central son valores:

a) Que ocupan el centro de una serie ordenada

b) Con los cuales se separan los datos con respecto a su media.

c) Hacia los cuales tienden a acercase o alejarse los dems valores de la serie.

d) Que resultan de multiplicar las desviaciones para el nmero de casos.

2.- La media aritmtica es el valor promedio que resulta de:

a) Multiplicar la sumatoria de valores por el nmero total de casos.

b) Dividir la suma de las desviaciones para el nmero de casos.

c) Dividir un conjunto de valores para el nmero total de los mismos.

d) Ninguna de las proposiciones anteriores.

fX c
3.- La frmula X N
se la utiliza para hallar la media aritmtica de:

a) Una serie estadstica b) Una serie estadstica de intervalo

c) Una serie estadstica de frecuencia d) Datos agrupados

4.- La mediana de la siguiente serie de datos: 19, 15, 18, 16, 17 es:

a) 18 b) 17

c) 16 d) Ninguno de los valores anteriores.

5.- La frmula Mdn N


2 se la utiliza para:

a) Determinar el valor de la mediana

Ing. Wilson A. Velastegui. Ojeda. Msc


59
Estadstica Descriptiva
b) Encontrar el valor que ms se repite en la serie

c) Determinar la posicin de la mediana

d) Encontrar el valor de la mediana de una serie estadstica

6.- Seale cual de las siguiente medidas individuales es equivalente a la mediana.

a) El percentil 25 b) El segundo cuartil

c) El cuarto decil d) Ninguna de las anteriores

7.- El modo de la siguiente serie estadstica es:

X f
145 12
144 10
143 15
142 14
141 9
Total n = 46

a) 14.5 b) 15 c) 143 d) Ninguna de las anteriores

8.- Seale cul de las siguientes proposiciones es verdadera

a) La media geomtrica es la raz cuadrada del producto de los valores de la

variable

b) La media geomtrica es el valor recproco de la media aritmtica.

c) El modo es el valor que se presenta con ms frecuencia en el conjunto

d) Ninguna de las anteriores

9.- La media geomtrica se la puede aplicar para:

a) Hallar en economa el costo promedio

b) Obtener un promedio exacto de una progresin geomtrica

c) Para calcular la desviacin tpica

d) Hallar promedios de velocidades

10.- Identifique cul de las siguientes medidas son de dispersin


Ing. Wilson A. Velastegui. Ojeda. Msc
60
Estadstica Descriptiva
a) Modo b) Varianza

c) Mediana d) Desviacin tpica

PRUEBA DE ENSAYO

INSTRUCCIONES: Esta prueba consta de seis problemas en las cuales es preciso que
escriba todo el procedimiento

1.- Determine la media aritmtica y desviacin media de la siguiente serie estadstica

X f
66 70 16
61 65 20
56 60 12
51 55 22
46 50 10
Total n = 80

2.- Si la edad de los profesores de un colegio es la que est en la siguiente tabla: Calcular la
mediana:

X f
26 30 25
31 35 32
36 40 24
41 45 15
46 50 10
51 55 9
Total n = 115

3.- Determine la desviacin media de la siguiente tabla ordenada pero no agrupada

Peso en KG. f
60 5
61 8
62 12
63 25
64 16
65 4
Total n = 70

Ing. Wilson A. Velastegui. Ojeda. Msc


61
Estadstica Descriptiva
4.- Determine la desviacin tpica de la serie estadstica que se encuentra registrada en el
siguiente cuadro estadstico
Descendente Ascendente

EDADES f EDADES f
51 57 12 16 22 10
44 50 21 23 29 14
37 43 35 30 36 26
30 36 26 37 43 35
23 29 14 44 50 21
16 25 10 51 57 12
Total n=118 Total n = 118
5.- En la siguiente serie estadstica de intervalos: Determine. El promedio, la mediana y la
moda, para este conjunto de datos agrupados

x F
120 125 5
114 119 7
108 113 10
102 107 9
96 101 15
90 95 4
Total n = 50

6.- De Ia tabla siguiente: Determine. El promedio, la mediana y la moda, para este conjunto
de datos agrupados.

Li Ls f
19,2 19,4 1
19,5 19,7 2
19,8 20,0 8
20,1 20,3 4
20,4 20,6 3
20,7 20,9 2
TOTAL n = 20

7.- Si la media aritmtica es 7 y la varianza es 20, de los datos, X1, X2, X3,..,Xn. Calcular la
media aritmtica de las X 12 , X 22 , X 32 ,..........., X n2 . Rpta. 69

SUGERENCIA: Utilice las siguientes expresiones.

n
Xi
x x 2 x3 ..... x n
n
2
xx
x1 x x 2 x ..... x n x
2 2 2
X i 1 1 S
2 i 1

n n n n

8.- Dos marcas competidoras de calzado para corredores se sometieron a una prueba para
comprobar el desgaste del calzado. Cada una de ellas indic el siguiente nmero de horas
de uso necesarios para que se detecte un desgaste significativo.

Ing. Wilson A. Velastegui. Ojeda. Msc


62
Estadstica Descriptiva

Marca A Marca B
97 78
83 56
75 87
82 54
98 89
65 65
75
n=7 n=6

a) Qu calzado parece presentar menor desgaste?


b) Qu calzado parece tener el programa de control de calidad que produce u8n
desgaste ms uniforme?

Ing. Wilson A. Velastegui. Ojeda. Msc


63
Estadstica Descriptiva
BIBLIOGRAFIA

ALLEN L. WEBSTER: Estadstica Aplicada para la Administracin y Economa,


IRWIN, 1999.
ALLISON, D. E. 1970: Test anxiety, stress y intelligence perfomance Sxiencia, 2
CONOVER, W. J y otros 1974: Some reasons for not using the ytes.
DIXON, W. J. Y F. J. MASSER, 1980: Introduction to statical Analysis (4ta. Ed.)
Nueva York: McGrawHill.

FRENCH, J. W. 1946: Efects of anxiety on verbl and mathematical examination


scores, Educational and Bychological Mea surement, 22, 553
564.

BURSTEIN, H. 1971: Ttribute Sampling: Tables and Ex Planations o Tubles for Determinig
confidence limits and smple sizes based on close aproximations of the binomial distribution.
KENNETH D. HOPKINS y B.R. HOPKINS: Estadstica Bsica. Mxico 1997
Ingramex.

GEORGE CANAYOS: Probabilidades y Estadstica. Mxico 1992. McGrawHill

MASON/LIND/MARCHAL: 10 Edicin: Estadstica para Administracin y Economa 2003

Ing. Wilson A. Velastegui. Ojeda. Msc


64

Potrebbero piacerti anche