Sei sulla pagina 1di 19

Orbe Pealoza Miroslava Yanil

UNIDAD 1 ESTADISTICA DESCRIPTIVA


La Estadstica Descriptiva: es la parte de la Estadstica que estudia las tcnicas y
mtodos que sirven para la observacin, toma, organizacin, descripcin, presentacin
y anlisis de datos. La Estadstica Descriptiva: Es aquella que utiliza tcnicas y medidas
que indican las caractersticas de los datos disponibles. Comprende el tratamiento y
anlisis de datos que tienen por objeto resumir y describir los hechos que han
proporcionado la informacin, y que por lo general toman la forma de tablas, grficos,
cuadros e ndices. Se llama descriptiva por ser su fin primordial la descripcin de las
caractersticas principales de los datos obtenidos.

1.1

RECOPILACIN DE DATOS

Los datos son medidas y/o nmeros recopilados a partir de la observacin. Los datos
pueden concebirse como informacin numrica necesaria para ayudar a tomar una
decisin con ms bases en una situacin particular. Datos son hechos/informaciones y
cifras que se recogen, analizan y resumen para su presentacin e interpretacin. A
todos los datos reunidos para un determinado estudio se les llama conjunto de datos
para el estudio. Elementos son las entidades de las que se obtienen los datos.
Una variable es una caracterstica de los elementos que es de inters. Los valores
encontrados para cada variable en cada uno de los elementos constituyen los
datos. Al conjunto de mediciones obtenidas para un determinado elemento se le llama
observacin.
Los datos tambin son clasificados en cualitativos y cuantitativos. Los datos cualitativos
comprenden etiquetas o nombres que se usan para identificar un atributo de cada
elemento. Los datos cualitativos emplean la escala nominal o la ordinal y pueden ser
numricos o no. Los datos cuantitativos requieren valores numricos que indiquen
cunto o cuntos. Los datos cuantitativos se obtienen usando las escalas de medicin
de intervalo o de razn. Una variable cualitativa es una variable con datos cualitativos.
Los datos cuantitativos se pueden clasificar en:
Datos discretos. Son respuestas numricas que surgen de un proceso de conteo. Slo
pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos
(puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podr ser 3.45).
Datos continuos. Son respuestas numricas que surgen de un proceso de medicin.
Pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de
un vehculo puede ser 90.4 km/h, 94.57 km/h...etc.

Pgina | 1

Orbe Pealoza Miroslava Yanil


De igual manera se pueden clasificar en:
AGRUPADOS

Son datos en grandes cantidades, generalmente mayor a 30.


NO AGRUPADOS

Son datos en pequeas cantidades, no mayores a 30 datos.


Los expertos en estadstica recogen datos de una muestra y utilizan esta informacin
para hacer inferencias sobre la poblacin que representa esa muestra. As, una
poblacin es un todo, representada por (N) y una muestra es una fraccin o segmento
de ese todo, representada por (n).

Una Poblacin es Finita: cuando existe una cantidad determinada de elementos por
analizar; esto es, una cantidad de elementos, numerable y que en determinado
momento finaliza

Una Poblacin es Infinita cuando existe una cantidad indeterminada de elementos por
analizar; es decir, una cantidad de elementos que aunque los enumerramos nunca
terminaramos de hacerlo.

1.2 ORDENACIN Y CLASIFICACIN


Cuando los datos se presentan sin un orden se llama enunciado y cuando lo hay pasa
a ser listado.
Enunciado

3,9,5,2,7,5,1,7,4,5,6,3,7,8,3,4,6,9,3,2,5

Listado

1,2,2,3,3,3,3,4,4,5,5,5,6,6,7,7,7,8,9,9

1.2.3 DISTRIBUCIN DE FRECUENCIAS


La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de
tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.

Pgina | 2

Orbe Pealoza Miroslava Yanil


FRECUENCIA ABSOLUTA
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un
estudio estadstico. Se representa por fi.
La suma de las frecuencias absolutas es igual al nmero total de datos, que se
representa por N.
Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula)
que se lee suma o sumatoria.
FRECUENCIA RELATIVA
La frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el nmero total de datos.
Se puede expresar en tantos por ciento y se representa por ni .
La suma de las frecuencias relativas es igual a 1.

FRECUENCIA ACUMULADA
La frecuencia acumulada es la suma de las frecuencias absolutas de todos
los valores inferiores o iguales al valor considerado. Se representa por F i .
FRECUENCIA RELATIVA ACUMULADA
La frecuencia relativa acumulada es el cociente entre la frecuencia
acumulada de un determinado valor y el nmero total de datos . Se puede
expresar en tantos por ciento.
EJEMPLO
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30,
31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor,
en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

xi

Recuento

fi

Fi

ni

Ni

27

0.032

0.032
Pgina | 3

Orbe Pealoza Miroslava Yanil

28

II

0.065

0.097

29

0.194

0.290

30

16

0.226

0.516

31

24

0.258

0.774

32

III

27

0.097

0.871

33

III

30

0.097

0.968

34

31

0.032

31

1.2.1 NO. DE INTERVALOS DE CLASE


La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un nmero grande de valores o la variable es continua.
Los intervalos de clase se emplean si las variables toman un nmero grande de
valores o la variable es continua. Se agrupan los valores en intervalos que tengan la
misma amplitud denominados clases. A cada clase se le asigna su frecuencia
correspondiente.
LMITES

DE LA CLASE

Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la
clase.
AMPLITUD
Pgina | 4

DE LA CLASE

Orbe Pealoza Miroslava Yanil


La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase.
MARCA

DE CLASE

La marca de clase es el punto medio de cada intervalo y es el valor que representa a


todo el intervalo para el clculo de algunos parmetros.
La seleccin del nmero adecuado de intervalos y los lmites entre ellos dependen del
criterio o experiencia de quien realiza el estudio. Sin embargo, existen reglas empricas
para calcular el nmero de intervalos; la ms empleada es la Regla de Sturges, cuya
expresin es:
K= 1 + 3.3Log n
Donde: K=Nmero de intervalos el cual siempre debe ser un nmero entero. Razn por
la cual se deber redondear el resultado al entero ms cercano.
n= Nmero de datos.
Log= logaritmo en base 10.

Otra regla utilizada es la de Velleman que establece que el nmero de Intervalos se


obtiene de la raz cuadrada del nmero de datos; es decir K= n , recomendable para
tamaos de muestra pequeos (n< 50)
1.2.2 TAMAO DEL INTERVALO
AMPLITUD

ANCHURA

Se encuentra dividiendo el rango por el nmero de intervalos regularmente es de 5 a 6.


Se representa con la letra A de tal manera que Ac=R/K
CONSTRUCCIN

DE LOS INTERVALOS .

Los intervalos de clase son conjuntos numricos y deben ser excluyentes y


exhaustivos; es decir, si un dato pertenece a un intervalo determinado, ya no podr
pertenecer a otro, esto quiere decir excluyentes y adems todos y cada uno de los
datos deber estar contenido en alguno de los intervalos, esto les da el valor de
exhaustivos.
El primer intervalo se construye de la siguiente manera: Habr de iniciar con el dato
menor, el cual ser el extremo inferior del intervalo; el otro extremo se obtiene de la
suma del dato menor y la amplitud, con este mismo valor iniciamos el segundo
intervalo, del cual el segundo extremo se encuentra sumando al valor anterior la
Pgina | 5

Orbe Pealoza Miroslava Yanil


amplitud y este proceso se repite sistemticamente hasta completar el total de
intervalos indicado por la regla elegida, por ejemplo la de Sturges.
Los intervalos de clase deben estar definidos por lmites que permitan identificar
plenamente si un dato pertenece a uno u otro intervalo. Estos lmites son los valores
extremos de cada intervalo. Lmite inferior: Es el valor menor de cada intervalo, se
denota por Li Lmite superior: Es el nmero mayor de cada intervalo, se denota por Ls
Tambin ser muy til conocer y calcular la Marca de Clase (MC) de cada intervalo: Se
refiere al Punto Medio del intervalo y a travs de l representaremos a todo el intervalo
y una de las maneras de calcularla es promediando los valores lmite de cada intervalo,
su frmula es:
MC =

Li + Ls
2

EJEMPLO
Un grupo de investigadores pertenecientes a la secretara de seguridad pblica, tom
una muestra aleatoria de las velocidades (km/h) registradas por 30 vehculos con el fin
de establecer nuevos lmites mximos de velocidad para una carretera. La muestra
arrojo los datos siguientes:
90, 99, 104, 99, 119, 98, 95, 112, 95, 120, 100, 90, 116, 96, 114, 108, 98, 118, 100, 106,
114, 100, 112, 106, 100, 115, 111, 105, 114, 97
Toda vez que se tienen los datos, se recomienda ordenarlos de menor a mayor o
viceversa
90, 90, 95, 95, 96, 97, 98, 98, 99, 99, 100, 100, 100, 104, 105,106, 108, 111, 112, 112,
114, 114, 115, 116, 118, 119, 120
Ahora llevamos a la prctica los pasos descritos anteriormente para la construccin de
los intervalos. 1 obtendremos el nmero de intervalos que vamos a utilizar, para lo cual
empleamos la Regla de Sturges:
K = 1 + 3.3Log (30) = 1+ 3.3 (1.4771212547) =1+ 4.87 = 5.87 6
2 calculamos el rango de variacin, R = 120 90 = 30
3 obtenemos la amplitud de cada intervalo de clase como sigue :
Ac=

30
=5
6

4 construimos los intervalos, el primero de ellos inicia con 90 que es el extremo inferior
que, sumado a 5 obtenemos 95, que ser el extremo superior; este extremo ser el
Pgina | 6

Orbe Pealoza Miroslava Yanil


inferior del segundo intervalo; y al sumar nuevamente la amplitud tendremos 100 que
ser el extremo superior y as sucesivamente hasta completar los 6 intervalos., que se
muestran enseguida: [90 95), [95 100), [100 105), [105 110), [110 115) y [115
120]
Para la construccin de distribuciones de frecuencias, contamos el nmero de datos
que le corresponden a cada intervalo; es decir obtenemos las frecuencias absolutas y
de estas podemos generar los dems tipos de frecuencias y presentarlas en una tabla
de resumen como la que a continuacin se muestra:

1.3 ESTUDIO DESCRIPTIVO


1.3.1 MEDIDAS DE TENDENCIA CENTRAL
Cuando se tiene un grupo de observaciones, se desea describirlo a travs de un slo
nmero. Para tal fin, no se usa el valor ms elevado ni el valor ms pequeo como
nico representante, ya que slo representan los extremos. Una de las propiedades
ms sobresalientes de la distribucin de datos es su tendencia a acumularse hacia el
centro de la misma. Esta caracterstica se denomina tendencia central. Las medidas de
tendencia central ms usuales son: la media aritmtica, la mediana y la moda.
MEDIA
La medida de localizacin ms importante es la media, o valor promedio, de una
variable. La media proporciona una medida de localizacin central de los datos. Si los
datos son datos de una muestra, la media se denota ; si los datos son datos de una
poblacin, la media se denota con la letra griega . En las frmulas estadsticas se
acostumbra denotar el valor de la primera observacin de la variable x con x1, el valor
de la segunda observacin de la variable x con x2 y as con lo siguiente. En general, el
valor de la i-sima observacin de la variable x se denota x i. La frmula para la media
muestral cuando se tiene una muestra de n observaciones es la siguiente.
X=

xi
n

Dnde:

x i=x 1 + x 2+ x 3 + x n
Pgina | 7

Orbe Pealoza Miroslava Yanil


Para calcular la media de una poblacin use la misma frmula, pero con una notacin
diferente para indicar que trabaja con toda la poblacin. El nmero de observaciones en
una poblacin se denota N y el smbolo para la media poblacional es .
=

xi
N

Dnde:

x i=x 1 + x 2+ x 3 + x n

Ejemplo. Obtener la media muestral de los siguientes datos: 46 54 42 46 32


46+54 +42+46+32
x=
=44
Solucin.
5

Las caractersticas de la media aritmtica son:


1. Es una medida totalmente numrica o sea slo puede calcularse en datos de
caractersticas cuantitativas.
2. En su clculo se toman en cuenta todos los valores de la variable.
3. Es lgica desde el punto de vista algebraico.
4. La media aritmtica es altamente afectada por valores extremos.
5. No puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
6. La media aritmtica es nica, o sea, un conjunto de datos numricos tiene una y slo
una media aritmtica.
MODA
La moda de un conjunto de datos numricos es el valor que ms se repite, es decir, el
que tiene el mayor nmero de frecuencias absolutas. La moda puede ser no nica e
inclusive no existir. La moda es una medida de tendencia central muy importante,
porque permite planificar, organizar y producir para satisfacer las necesidades de la
mayora.
Ejemplo. Obtener la moda de los siguientes datos: -3, 3, -2, 0, 3, -1, -2, 4, 5, -2, 0, 1.
Solucin. Ordenando de forma ascendente: -3, -2, -2, -2, -1, 0, 0, 1, 3, 3, 4, 5. El valor
que ms se repite es el -2, por lo tanto ese valor es su moda.
Clculo de la moda para datos agrupados
1 Todos los intervalos tienen la misma amplitud

L i es el lmite inferior de la clase modal.


Pgina | 8

Orbe Pealoza Miroslava Yanil


f i es la frecuencia absoluta de la clase modal.
f i - - 1 es la frecuencia absoluta inmediatamente inferior a la en clase
modal.
f i - + 1 es la frecuencia absoluta inmediatamente posterior a la clase
modal.
a i es la amplitud de la clase.
Tambin se utiliza otra frmula de la moda que da un valor
aproximado de sta:

Calcular la moda de una distribucin estadstica que viene dada por la


siguiente tabla:
[60,63)
[63,66)
[66,69)
[69,72)
[72,75)

fi
5
18
42
27
8
100

2 Los intervalos tienen amplitudes distintas.


En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

La frmula de la moda aproximada cuando existen distintas amplitudes es:

Pgina | 9

Orbe Pealoza Miroslava Yanil


EJEMPLO
En la siguiente tabla se muestr a las calificaciones (suspenso, aprobado,
notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular
la moda.

fi

hi

[0,5)

15

[5,7)

20

10

[7,9)

12

[9,10)

50

MEDIANA
La mediana es el punto central de una serie de datos ordenados de forma ascendente o
descendente. De acuerdo al nmero de casos o datos, hay dos formas para calcular la
mediana: para nmero impar y para nmero par.
Nmero impar de datos ordenados de menor a mayor o de mayor a menor: la mediana
es el valor que queda justo al centro.
Ejemplo. Obtener la mediana de los siguientes datos: -3, 5, 18, 4, 11, -6, 9, 10, -1, 2.
Solucin. Ordenando de forma ascendente: -6, -3, -1, 2, 4, 5, 9, 10, 11, 18. Los valores
centrales son 4 y 5. Su media aritmtica es: x= 4+5/2=4.5 En este caso, la mediana de
este conjunto no pertenece al conjunto de datos.
Las caractersticas de la mediana son:
1. En su clculo no se incluyen todos los valores de la variable.
Pgina | 10

Orbe Pealoza Miroslava Yanil


2. La Mediana no es afectada por valores extremos.
3. Puede ser calculada en distribuciones de frecuencia con clases abiertas.
4. No es lgica desde el punto de vista algebraico.
MEDIANA PONDERADA
La media ponderada de un conjunto de valores de una variable x a los que se han
asignado, respectivamente, una ponderacin se calcula mediante la frmula:
Donde:

EJEMPLO:
En una materia dada se asignan pesos de importancia, de la siguiente forma: Unida I
(20% del curso), Unidad II (25% del curso), Unidad III (20% del curso), Unidad IV (15%
de la calificacin), Unidad V (20% de la calificacin). Si las calificaciones de un alumno
son 8 en la primera unidad, 5 en la segunda, 8 en la tercera unidad, 10 en la cuarta
unidad y 8 en la ltima unidad. Es decir, se tienen la siguiente tabla:
Unidad

Ponderacion (Wi)

Datos (Wi)

20% = 0.2

II

25% = 0.35

III

20% = 0.2

IV

15% = 0.15

10

20% = 0.10

1.3.2 MEDIDAS DE DISPERSIN


Pgina | 11

Orbe Pealoza Miroslava Yanil


La dispersin se refiere a la separacin de los datos en una distribucin, es decir, al
grado en que las observaciones se separan. Las medidas de dispersin nos
informan sobre cunto se alejan del centro los valores de la
distribucin . Existen otras dos caractersticas de los conjuntos de datos que
proporcionan informacin til: el sesgo y la curtosis.
Las medidas de dispersin son:
RANGO
Llamamos rango al nmero de unidades de variacin presente en los datos recopilados
y se obtiene de la diferencia entre el dato mayor y el dato menor. Se representa con la
letra R
Caractersticas del rango:
1. A medida que el rango es menor, el grado de representatividad de los valores
centrales se incrementa.
2. A medida que el rango es mayor, la distribucin est menos concentrada o ms
dispersa.
3. Su clculo es extremadamente sencillo.
4. Tiene gran aplicacin en procesos de control de calidad.
5. Tiene el inconveniente de que slo depende de los valores extremos. De esta forma
basta que uno de ellos se separe mucho para que el recorrido se vea sensiblemente
afectado.
DESVIACIN

MEDIA ABSOLUTA

La desviacin media es la divisin de la sumatoria del valor absoluto de las distancias


existentes entre cada dato y su media aritmtica y el nmero total de datos:
DESVIACIN ESTNDAR
La desviacin estndar de la poblacin, es simplemente la raz cuadrada de la varianza
de la poblacin. Como la varianza es el promedio de los cuadrados de las distancias de
las observaciones a la media, la desviacin estndar es la raz cuadrada del promedio
de los cuadrados de las distancias entre las observaciones y la media. Mientras que la
varianza se expresa con el cuadrado de las unidades utilizadas para medir los datos, la
desviacin estndar est en las mismas unidades que las que se usaron para medir los
datos.
Desviacin estndar para datos
agrupados.
Pgina | 12

Orbe Pealoza Miroslava Yanil


VARIANZA
La varianza es una medida de variabilidad que utiliza todos los datos. La varianza est
basada en la diferencia entre el valor de cada observacin (xi) y la media. Ala diferencia
entre cada valor xi y la media (cuando se trata de una muestra, cuando se trata de
una poblacin) se le llama desviacin respecto de la media. Si se trata de una muestra,
una desviacin respecto de la media se escribe (xi ), y si se trata de una poblacin se
escribe (xi ). Para calcular la varianza, estas desviaciones respecto de la media se
elevan al cuadrado. Si los datos son de una poblacin, el promedio de estas
desviaciones elevadas al cuadrado es la varianza poblacional. La varianza poblacional
se denota con la letra griega 2. En una poblacin en la que hay N observaciones y la
media poblacional es , la varianza poblacional se define como sigue.

EJEMPLO:
Calcular la varianza de la distribucin de la tabla:

[10, 20)
[20, 30)
[30,40)
[40, 50)
[50, 60
[60,70)
[70, 80)

COEFICIENTE

xi
15
25
35
45
55
65
75

fi
1
8
10
9
8
4
2
42

xi fi
15
200
350
405
440
260
150
1 820

xi2 fi
225
5000
12 250
18 225
24 200
16 900
11 250
88 050

DE VARIACIN

Pgina | 13

Orbe Pealoza Miroslava Yanil


Cuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen
dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente
de variacin de Pearson que se define como el cociente entre la desviacin estndar y
el valor absoluto de la media aritmtica:

.100
%cv= x
Este coeficiente, representa el porcentaje que la desviacin estndar contiene a la
media aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la
representatividad de la media.
EJEMPLO
Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 24. Cul
de las dos presenta mayor dispersin?

La primera distribucin presenta mayor dispersin.


1.3.3 MEDIDAS DE SESGO Y CURTOSIS
Las medidas de forma son medidas que determinan numricamente algunas
caractersticas de la forma en que estn distribuidos los datos. Entre estas medidas se
tiene: el coeficiente de asimetra o coeficiente de sesgo y el coeficiente de curtosis.
COEFICIENTE

DE ASIMETRA DE

PEARSON

Y EL MOMENTO

La asimetra es la medida que indica la simetra de la distribucin de


una variable respecto a la media aritmtica, sin necesidad de hacer la representacin
grfica. Los coeficientes de asimetra indican si hay el mismo nmero de elementos a
izquierda y derecha de la media.
Existen tres tipos de curva de distribucin segn su asimetra:

Asimetra negativa: la cola de la distribucin se alarga para valores inferiores a


la media.
Simtrica: hay el mismo nmero de elementos a izquierda y derecha de la media.
En este caso, coinciden la media, la mediana y la moda. La distribucin se adapta a
la forma de la campana de Gauss, o distribucin normal.
Asimetra positiva: la cola de la distribucin se alarga para valores superiores a
la media.

Pgina | 14

Orbe Pealoza Miroslava Yanil


El coeficiente de asimetra de Pearson CAP mide la diferencia entre la media y
la moda respecto a la dispersin del conjunto X=(x1, x2,, xN).
Este procedimiento, menos usado, lo emplearemos solamente en distribuciones
unimodales y poco asimtricas.

Si CAP<0: la distribucin tiene una asimetra negativa, puesto que la media es


menor que la moda.
Si CAP=0: la distribucin es simtrica.
Si CAP>0: la distribucin tiene una asimetra positiva, ya que la media es mayor
que la moda.

CURTOSIS

MOMENTO

O POR PERCENTILES

La curtosis (o apuntamiento) es una medida de forma que mide cun escarpada o


achatada est una curva o distribucin. Este coeficiente indica la cantidad de datos que
hay cercanos a la media, de manera que a mayor grado de curtosis, ms escarpada (o
apuntada) ser la forma de la curva.
La curtosis se mide promediando la cuarta potencia de la diferencia entre cada
elemento del conjunto y la media, dividido entre la desviacin tpica elevado tambin a
la cuarta potencia. Sea el conjunto X=(x1, x2,, xN), entonces el coeficiente
de curtosis ser:
Pgina | 15

Orbe Pealoza Miroslava Yanil

1.4 GRFICAS
1.4.1 HISTOGRAMA
Una presentacin grfica usual para datos cuantitativos es el histograma. Esta grfica
se hace con datos previamente resumidos mediante una distribucin de frecuencia, de
frecuencia relativa o de frecuencia porcentual. Un histograma consiste en una serie de
rectngulos, cuyo ancho es proporcional al rango de los valores que se encuentran
dentro de una clase, y cuya altura es proporcional al nmero de elementos que caen
dentro de la clase. Si las clases empleadas en la distribucin de frecuencias son del
mismo ancho, entonces las barras verticales del histograma tambin tienen el mismo
ancho. La altura de la barra correspondiente a cada clase representa el nmero de
observaciones de la clase. Como consecuencia, el rea contenida en cada rectngulo
(base por altura) ocupa un porcentaje del rea total de todos los rectngulos la cual es
igual a la frecuencia absoluta de esa clase correspondiente respecto a todas las
observaciones hechas.

1.4.2 POLGONO
Aunque se utilizan menos, los polgonos de frecuencias son otra forma de representar
grficamente distribuciones tanto de frecuencias como de frecuencias relativas. Para
construir un polgono de frecuencias sealamos stas en el eje vertical y los valores de
la variable que estamos midiendo en el eje horizontal, del mismo modo en que se hizo
con el histograma. A continuacin, graficamos cada frecuencia de clase trazando un
Pgina | 16

Orbe Pealoza Miroslava Yanil


punto sobre su punto medio y conectamos los puntos sucesivos resultantes con una
lnea recta para formar un polgono (una figura con muchos lados).
Un polgono de frecuencias que utiliza frecuencias relativas de datos puntuales en cada
una de las clases, en lugar del nmero real de puntos, se conoce como polgono de
frecuencias relativas. Este polgono tiene la misma forma que el polgono de
frecuencias construido a partir del mismo conjunto de datos, pero con una escala
diferente en los valores del eje vertical. En lugar del nmero absoluto de observaciones,
la escala representa el nmero de observaciones de cada clase expresadas como una
fraccin del total de observaciones.

1.4.3 OJIVA
La grfica de una distribucin acumulada, llamada ojiva, es una grfica que muestra los
valores de los datos en el eje horizontal y las frecuencias acumuladas, las frecuencias
relativas acumuladas o las frecuencias porcentuales acumuladas en el eje vertical.
La ojiva se construye al graficar cada uno de los puntos correspondientes a la
frecuencia acumulada de las clases.

Pgina | 17

Orbe Pealoza Miroslava Yanil


1.4.4 PASTEL
Este grfico se utiliza fundamentalmente, para representar distribuciones de frecuencias
relativas (es decir, porcentajes % o proporciones) haciendo corresponder la medida de
la frecuencia relativa con la medida del ngulo en grados; es decir, si el 100 % de los
datos son 360 de la circunferencia, a cada 1% le correspondern 3.6; as, para
obtener la medida del ngulo del sector, multiplicamos la frecuencia correspondiente
por 3.6. Al utilizar este grfico se aconseja no sobrepasar los 10 elementos, y ordenar
los sectores de acuerdo a una de dos formas, ya sea siguiendo el orden que se les d a
los datos o empezando del mayor al menor segmento, iniciando a partir de las 12 horas
y en el sentido de las manecillas del reloj. Por ltimo, si el texto que representa cada
sector no puede colocarse dentro del mismo, se elabora una leyenda que se coloca
fuera del segmento, unidos por una flecha.

Pgina | 18

Orbe Pealoza Miroslava Yanil

REFERENCIAS BIBLIOGRFICAS
Estadstica para administracin y economa.
Anderson, Sweeney, Williams
Thomson Editores
2008
P. 5,6,7,36,39,83,84
Estadstica para administracin y Economa.
Levin, Richard
Prentice Hall
2004
P. 9,30,31,58,59

REFERENCIAS ELECTRNICAS
http://132.248.164.227/publicaciones/docs/apuntes_matematicas/34.%20Estadistica
%20Descriptiva.pdf
http://www.ditutor.com/estadistica/estadistica_descriptiva.html
http://www.hacienda.go.cr/cifh/sidovih/cursos/material_de_apoyo-f-ccifh/1materialdeapoyocursoscifh/4estad%C3%ADsticabasica/probabilidadyestadistica.pdf
http://dieumsnh.qfb.umich.mx/estadistica/media_pond.htm
http://www.universoformulas.com/estadistica/descriptiva/asimetria-curtosis/

Pgina | 19

Potrebbero piacerti anche