Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1 ESTADISTICA: DEFINICIN
Definicin: "Es el conjunto de mtodos y tcnicas que permiten determinar, de una
muestra debidamente representativa de una poblacin, los valores estadsticos, a fin
de poder inferir sobre los parmetros poblacionales con un cierto grado de bondad"
Esta definicin comprende tanto a la estadstica descriptiva como a la estadstica
inferencial. Mark Berenson y David Levine1, definen Estadstica descriptiva como El
conjunto de mtodos que incluyen la recoleccin, presentacin y caracterizacin de
un conjunto de datos con el fin de describir apropiadamente sus caractersticas.
Mientras que a la estadstica inferencial la definen como Conjunto de mtodos que
hacen posible la estimacin de una caracterstica de la poblacin o la toma de una
decisin referente a una poblacin basndose solo en los resultados de una muestra.
La comprensin de estas definiciones se ve facilitada si se aclaran convenientemente
algunos trminos de las mismas.
1.1 POBLACIN:
Que se entiende por poblacin?
Definicin: "El conjunto de datos cuantificable pertenecientes al sistema en estudio
constituye la poblacin."
Esto implica que si el sistema en estudio es la produccin agrcola ganadera de la
Provincia de Crdoba, entonces el mismo estar constituido por todos los
establecimientos agropecuarios de la Provincia. Si en cambio se pretende estudiar la
edad promedio de los estudiantes de la Universidad Empresarial Siglo 21, la poblacin
estar conformada por todos los estudiantes de esa Institucin. Si se presenta en un
Estudio Publicitario, la necesidad de plantear una campaa para promover la venta
de un nuevo perfume en la ciudad de Crdoba, la poblacin a estudiar estar
constituida por todas las mujeres de dicha ciudad en condiciones de seleccionar y
elegir un perfume. Si se pretendiere realizar un estudio sobre la calidad de los tomates
producidos en las quintas de los alrededores de la ciudad, entonces todas las quintas
con produccin de tomates prxima a la ciudad de Crdoba se constituirn en la
poblacin.
Pudiere ser de importancia para un nuevo gobierno provincial prever el
comportamiento de los contribuyentes a las obligaciones impositivas, en caso de
reducir el monto de los impuestos, en este caso la poblacin estar constituida por
todos los contribuyentes
A fin de poder tomar las medidas ms adecuadas ser necesario contar con la mayor
informacin posible, si los datos informativos con los que contamos provienen del
estudio de toda la poblacin, no sera necesario realizar ninguna inferencia, decimos
que se ha efectuado un censo de la poblacin. Pero en ese caso dicha mayor
1
-1-
-2-
margen por sobre su opositor Rooselvet. El pronstico se basaba sobre los resultados
de una encuesta hecha sobre una muestra de dos millones de habitantes. No
obstante el triunfo fue del candidato demcrata y el error en la inferencia se deba a
que los encuestados fueron seleccionados entre los poseedores de automviles y
abonados telefnicos. En esos momentos los que estaban mejor posicionados para
poseer automvil y lneas telefnicas correspondan a la clase media y alta, en su
mayora con tendencias republicanas, pero el triunf qued en manos de Rooselvet
apoyados por la masa poblacional de menores recursos.
Definicin: Una muestra se dice que es debidamente representativa de una poblacin
cuando presenta sus mismas caractersticas.
Presentar las mismas caractersticas que la poblacin implica que, si el 20% de la
poblacin cumple con una determinada propiedad, se espera que el 20% de la
muestra cumpla con esa misma propiedad.
Esto permite disminuir los errores que se cometen cuando se efecta la inferencia de
los parmetros poblacionales a partir de los valores determinados en la muestra.
1.3. VALORES ESTADSTICOS
El estudio realizado sobre una muestra nos permite determinar valores cuyas
caractersticas nos referiremos ms adelante y a los cuales
se los denomina
estimadores pudiendo tambin tomar el nombre de valores estadsticos, mediante
los cuales se podr efectuar una correcta estimacin sobre los valores de la
poblacin.
Por otra parte, los valores propios de la poblacin toman el nombre de Parmetros.
Si se pretendiere determinar el salario de los empleados metalrgicos del Pas,
tomaramos una muestra constituida por operarios de distintas empresas y distintas
provincias y siempre proporcional al nmero de operarios de cada lugar, el salario
promedio obtenido en la muestra se denomina estadstico, mientras que el salario
promedio de toda la poblacin obrera metalrgica se constituye en parmetro
1.4. PARMETROS
Definicin: Los valores en estudio, que en la muestra toman el nombre de
Estadsticos, en la poblacin se los denominan Parmetros.
Definicin: Se define como bondad al margen de seguridad con que se realiza la
inferencia de acuerdo a los estudios realizados sobre la o las muestras.
Aseverar que tal poltico ganar las prximas elecciones presidenciales no tiene peso
como informacin si no se lo acompaa con un grado de seguridad. Indicar que las
encuestas los dan ganador por tal cantidad de puntos, solo es tomado en cuenta
cuando se acompaa esa informacin con una determinada seguridad.
-3-
2. Variable, Datos
Debemos tener en cuenta que la Estadstica basa su aplicacin en el estudio y anlisis
de nmeros los que se denominan Datos. Si dichos datos son obtenidos a travs de
una muestra, se los llama observaciones, las que deben
responder a una
determinada caracterstica que es la que tenemos en estudio, puede ser la
produccin avcola en la provincia, la inversin de dinero en publicidad en los distintos
medios durante el ao 1998, o a la cantidad de precipitaciones en el sur de la
provincia, la concurrencia a un Centro Comercial, las temperaturas mximas diarias
durante el mes de marzo en una determinada localidad,
el nmero de alumnos
ingresados en cada una de las Universidades de la provincia. De Crdoba en el
corriente ao, cada una de estas toma el nombre de Variable. En definitiva cada vez
que nos aboquemos a un estudio estadstico debemos de tener en cuenta que dicho
estudio corresponde a una Variable, y que de sta se tendrn Datos y los que
corresponden a Observaciones realizadas. Mediante la aplicacin de mtodos y
tcnicas estadsticas se estudian estas observaciones y se determinan los
estadsticos.
2.1
TIPO DE VARIABLE
Continuos
Nominales
Jerarquizados
-4-
Nominales: Cuando los valores que adopta la variable en estudio puede ser
clasificada de acuerdo a categoras, tal como lo sera el responder a una encuesta
efectuada al personal de una Empresa automotriz y en la cual se plantea la situacin
de cada uno en cuanto a su estado civil. Sabemos que en este caso se tendran las
categoras de:
Soltero
casado
viudo
divorciado
cadetes
mayores
En estos casos en donde los datos se pueden agrupar por categoras es necesario
introducir, a fin de poder realizar su estudio, una cierta codificacin. De cualquier
manera no se podrn hacer estudios matemticos entre categoras.
Jerarquizados:
Este tipo de dato se presenta cuando es necesario otorgarle a la
variable una cierta jerarqua de orden. Supongamos tener que estudiar el grado de
calidad de las obras expuestas por un cierto nmero de plsticos de Crdoba a fin de
asignar los correspondientes premios. A tal efecto ser necesario acudir al juicio de
un perito que permita definir el grado de categora de cada uno de los participantes,
esto implica que en el proceso de jerarquizar las obras de cada uno influir el
criterio de quin realiza el estudio, tal vez de ser otro el que efecte el anlisis pudiere
modificar dicho orden. Como conclusin entonces no podr en este tipo de variable
asegurar la exactitud del clculo
2.2. VALORES ESTADSTICOS
-5-
Media
Mediana
De tendencia
central o posicin
Moda
Valores
estadsticos
Rango
De dispersin
Desvo medio
Varianza
Desviacin estndar
Coeficiente de variacin
SERIE SIMPLE
A los efectos de preparar un Congreso Internacional en una zona del Sur del Pas, se
ha solicitado el registro de las temperaturas mnimas de los ltimos once das del mes
de julio del ao anterior, obteniendo como respuesta los siguientes datos:
-2
-1
-3
-1
-2
-2
-2
-2
-2
-2
-2
-1
-1
En este caso, la variable en estudio est dada por las temperaturas y cada una de las
observaciones corresponder a un nuevo valor adoptado por la incgnita.
x = temperatura
n = nmero de observaciones = 11
La Serie simple se puede expresar como:
x1
x2
x3
x4 . . . . . . . . . . . . . . . . . . . . . . . . . . .xn
-6-
donde:
x1= -3
xn = 1
Con todos los valores que adopta la variable en estudio se genera una distribucin,
denominada Distribucin de la Variable en estudio
2-3. MEDIA
Se define como media aritmtica o promedio de una distribucin al cociente entre la
suma de todas las observaciones dividido el nmero total de ellas:
xi
1
x=
-7-
Poblacin
Muestra
Tamao: N
x
Tamao: n
En nuestro caso:
-3+(-2)+(-2)+(-2)+(-2)+(-1)+(-1)+0+0+1+1
= ------------------------------------------------------ = -1
11
Dentro de los valores estadsticos de posicin central la media es el de mayor
representatividad, pero debemos tener presente que a su ves es el ms sensible a
los valores extremos de la distribucin
Los valores extremos de la distribucin pueden influir en el valor de la media y de esa
manera hacerle perder su condicin de referente, tenga Ud. en cuenta el siguiente
ejemplo: En una Empresa con 9 operarios que ganan cada uno de ellos la cantidad de
$1000 mensuales, y con un Gerente general cuyo sueldo es de $10.000, el sueldo
promedio para esa distribucin ser:
1000 + 1000 + 1000 + . . . . + 10000
19.000
= ---------------------------------------------- = ------------10
10
= $ 1900
Esto estara indicando que el sueldo promedio de los empleados de la empresa es de
$1900, cifra esta que de ninguna manera representa la realidad.
Recordar
Poblacin
Muestra
MEDIA
Cantidad de elementos
N
n
2.4. MEDIANA
Se define como Mediana de una distribucin, al valor que ocupa el punto medio de la
distribucin
Ocupar el punto medio de la distribucin implica que la mediana deja a la izquierda la
misma cantidad de valores que a la derecha. Todos los valores que se encuentran a la
izquierda son menores o eventualmente iguales a l, mientras que los valores que se
ubican a la derecha sern mayores o eventualmente iguales a l.
-8-
Continuando con el ejemplo referido a las temperaturas en una localidad del Sur:
-3
x1
-2
x2
-2
x3
-2
x4
-2
x5
-1
x6
-1
x7
0
x8
0
x9
1
x10
1
x11
Me = x6 = -1
Teniendo presente que el nmero de observaciones n = 11 el valor que ocupa el
lugar central de la distribucin corresponder a x6 y por lo tanto la mediana toma el
valor de -1.
Cuando el nmero de componentes de la distribucin es impar, la mediana est
perfectamente definida, pero para el caso de que n sea par, no se tiene un nico valor
central, en este caso la mediana estar dada por el promedio de los dos valores
centrales. Suponiendo que se le quitara el ltimo valor a la distribucin de
temperaturas que estamos analizando, el nmero de observaciones n = 10 y los dos
valores centrales seran x5 y x6.
-3
x1
-2
x2
-2
x3
-2
x4
-2
x5
-1
x6
-1
x7
0
x8
0
x9
1
x10
x5 + x 6
Se tendra en este caso que Me = ------------2
Podemos generalizar el valor de la mediana para una distribucin de n valores
teniendo en cuenta que el nmero de observaciones sea par o impar:
Si n es impar Me = x i
Mediana
Si n es par
donde i = (n+1)/2
6
10
6
18
8
20
Me = 6
Me = 14
-9-
c) 4,3 5,8
d) 2
3
e) 3,5 4,7
6,2
3
6,8
7,2
6
7,3
8,5
9
9,6
9,6
10
12,5
Me = 6,7
Me = 3
Me = 7,3
-4 su f = 1
-3 su f = 1
-2 su f = 3
-1 su f = 4
0 su f = 1
- 10 -
f = 10
Tenga en cuenta que la suma de todas las frecuencias es igual al nmero total de
observaciones.
6
4
3
4
6
4
2
2
5
4
1
1
2
4
3
4
3
3
2
2
6
2
2
5
4
7
0
4
3
5
1
3
1
4
4
5
3
4
4
6
4
1
7
7
4
Es observable que trabajar con todos los valores como lo presenta la serie simple
sera por dems engorroso si no se dispusiera de una computadora, pero si
clasificamos los valores, en este caso de acuerdo a su valor numrico y para cada
uno de ellos determinamos su frecuencia, podramos confeccionar una tabla de las
siguientes caractersticas:
Tabla 1.1
Clase
xi
fi
16
- 11 -
=i
50
Si ahora
analizamos
la tabla de esta manera, se simplifica enormemente la
determinacin de la media ya que en lugar de efectuar la
suma de todas las
observaciones, efectuaremos el producto de cada valor por su frecuencia y la suma de
estos productos lo dividiremos por el nmero total de observaciones.
8
( Xi . fi )
1
x =
fi
1
xi
fi
x i * fi
14
24
16
64
25
24
21
50
177
( xi. fi )
i =1
x=
= 177 / 50 = 3,54
x = 3, 54
2.7. FRECUENCIA RELATIVA
Definicin: Se define como frecuencia relativa de un valor y se expresa como fri, al
cociente entre su frecuencia y la suma de todas las frecuencias (la suma de todas las
frecuencias es igual al nmero de elementos de la distribucin).
fri
fi
fi
- 12 -
fi = n
fi
fr i = --------n
Podemos ampliar la tabla de frecuencias con una nueva columna que contenga la fr de
cada clase:
Tabla 1-3
Clase
xi
fi
x i * fi
fri
0,04
0,1
14
0,14
24
0,16
16
64
0,32
25
0,1
24
0,08
21
0,06
50
177
Propiedad:
La sumas de todas las frecuencias relativas
clases de una distribucin es igual a 12:
Tener en cuenta:
El concepto de frecuencia relativa, la media de una distribucin poblacional tambin se
puede expresar como:
(xi . fi)
= -------------- = (xi . fi/fi )
fi
es decir
Demostracin
fri = fr1 + fr2 + fr3 . . . . . . . . + fr n
f1
f2
f3
= --- + --- + ---- +
fi
fi
fi
fn
fi
+ --- = ------- = 1
fi
fi
- 13 -
= (xi. fri)
2.8
FRECUENCIA ACUMULADA
xi
fi
x i * fi
fri
fai
0,04
0,1
14
0,14
14
24
0,16
22
16
64
0,32
38
25
0,1
43
24
0,08
47
21
0,06
50
50
177
- 14 -
xi
fi
x i * fi
fri
fai
fds
0,04
48
0,1
43
14
0,14
14
36
24
0,16
22
28
16
64
0,32
38
12
25
0,1
43
24
0,08
47
21
0,06
50
50
177
55
63
72
44
15
18
33
- 15 -
fi
15
18
33
44
55
63
72
fri
0,05
0,06
0,11
0,1467
0,1833
0,21
0,24
fi = 300
f i%
5
6
11
14,67
18,33
21
24
fi% = 100
3-0 DIAGRAMAS
El poder graficar los valores estadsticos nos permite realizar una lectura rpida de la
distribucin y sacar conclusiones inmediatas de la misma.
Sera suficiente abrir una hoja de clculo para observar la cantidad variada de grficos
con que puede ser representada una distribucin: Diagramas de: Lneas, Barras,
Barras acumuladas, de Sectores o circular, Diagramas x-y, de Bastones etc. En este
texto haremos referencia a los diagramas: Circular, de Bastones e Histogramas y a
una combinacin de los grficos de Bastones, Barras y x-y Dispersin.
Ejercicio
Supongamos tener para analizar las notas obtenidas por 20 alumnos de una divisin
en la asignatura de Estadstica:
9
7
6
6
6
5
3
4
5
5
8
7
8
7
7
6
5
6
4
10
Generaremos una distribucin de frecuencias complementndola con: Frecuencias
relativas, Frecuencia acumulada y por ltimo Frecuencia desacumulada.
Tabla 1.7
Xi
fi
fa
fds
0,05
19
0,1
17
0,2
13
0,25
12
0,2
16
0,1
18
0,05
19
10
0,05
20
20
fr i
Toda vez que se presenta una tabla tal como la 3.1, la primera pregunta que surge es,
que se debe graficar debe de tenerse siempre en cuenta que cada vez que se
- 16 -
habla de graficar estamos deseando volcar en forma grfica una cierta relacin. En la
presente situacin, la variable en estudio es la calificacin, por lo cual se podra
graficar la relacin:
Calificacin y frecuencia Calificacin y
frecuencia relativa Calificacin y
frecuencia acumulada Calificacin y
frecuencia desacumulada
3.1
Diagrama de bastones:
Llevaremos en el eje de las abscisas las calificaciones y en el eje de las ordenadas las
frecuencias y representamos mediante un segmento centrado en cada una de las
calificaciones su correspondiente frecuencia; tendremos nuestro primer diagrama.
Cada uno de los bastones corresponde a la frecuencia de cada calificacin y toma el
nombre de densidad de frecuencia entendindose como tal al cociente:
fi
dfi = ---es decir frecuencia por unidad de intervalo de clase
x
Grfico 1.1
Diagrama de Bastones
6
frecuencia
5
4
3
2
1
0
3
10
calificaciones
3.2
DIAGRAMA DE SECTORES
Para este grfico debemos tener presente que el ngulo central del crculo es de 360
y que cada una de las clases estar dada por un sector cuyo ngulo ser proporcional
a su frecuencia:
Supongamos la calificacin de 3 cuya frecuencia es 1 tendremos que:
20 (suma de todas las frecuencias) ------------------------ 360
a 1 (frecuencia del 3)
----------------------- 1 = 360. 1 / 20 = 18
- 17 -
10
3
4
5
7
- 18 -
Grfico 1.3
Diagrama de Sectores Calificaciones
en porcentajes
9
5%
10
5%
3
5%
4
10%
8
10%
5
20%
7
20%
6
25%
3.2-HISTOGRAMA DE FRECUENCIAS:
ste es otro de los diagramas de gran utilizacin para el cul es necesario considerar
un sistema de ejes cartesianos ortogonales, debiendo representar en el eje de las
abscisas las calificaciones y en el de las ordenadas la frecuencia, las clases estn
dadas por las calificaciones. El intervalo entre dos clases sucesivas se denomina
amplitud de intervalo, en este caso es la unidad y se la expresa como x = 1. Si
consideramos el diagrama de bastones y a partir del extremo inferior de cada uno de
ellos llevamos tanto a izquierda como a derecha la mitad del intervalo, en nuestro
caso 1 / 2 = 0,5 y levantamos las ordenadas correspondientes, nos encontramos con
un diagrama de barras sin discontinuidades al que denominaremos Histograma, en
este caso de Histograma de Frecuencias.
Grfico 1.4
- 19 -
Frecuencia
Histograma de Frecuencias
6
5
4
3
2
1
0
0
9 10 11
Calificaciones
La superficie encerrada por cada una de las barras est dada por el producto entre la
base x por la altura que segn ya vimos estaba dada por la densidad de frecuencia.
dfi = fi /x por lo tanto:
Si = x. dfi = x. fi / x = fi
Cada una de ellas tendr un valor igual a su frecuencia y el rea total del diagrama
ser entonces la suma de todas las frecuencias e igual a N.
Si = fi = N
3.4 - POLGONO DE FRECUENCIAS
Si se unen los puntos medios superiores de cada una de las barras del histograma y
se considera cero las frecuencias de las clases adyacentes a los extremos de la
distribucin, se formar con el eje de las abscisas un polgono denominado, en este
caso, como Polgono de Frecuencias:
Grfico 1.5. Polgono de frecuencias
- 20 -
6
5
fi
4
3
2
1
0
2
10
11
xi
Si = fri = 1
Grfico 1.6
Dos tringulos rectngulos en A y A con los ngulos y iguales por opuestos por el vrtice, y
alternos internos entre paralelas y el lado 11 = 22= x / 2 por lo tanto son iguales.
- 21 -
fr
0,2
0,15
0,1
0,05
0
2
10
11
Grfico 1.7
- 22 -
10
11
fi
fai
10
14
17
19
20
fi = 20
Para confeccionar el grfico de frecuencias acumuladas llevaremos sobre el eje de las
abscisas los valores observados y en el eje de las ordenadas las frecuencias
acumuladas.
Para el primer valor de la distribucin cero, la frecuencia acumulada vale 1, este valor
se mantendr constante hasta 1 en donde la frecuencia acumulada toma el valor de 3,
se mantiene constante hasta el valor observado de 2 en donde la fa adopta el valor de
- 23 -
frecuencia acumulada
FRECUENCIA ACUMULADA
22
20
18
16
14
12
10
8
6
4
2
0
0
OBSERVACIONES
Observe el lector con que claridad este diagrama le entrega informacin. Por ejemplo
analizando la observacin 4, el punto inferior de la barra indica que menores a 4
accidentes diarios se han producido en 10 oportunidades mientras que el punto
superior indica que en 14 oportunidades se han producido 4 o menos accidentes
diarios. De igual manera en 17 oportunidades se produjeron menos de 6 accidentes en
un da y que en solo 2 oportunidades se produjeron 6 accidentes.
De igual manera podemos graficar la frecuencia desacumulada conjuntamente con la
acumulada tal como lo muestra el Grfico 1.8 denominado comnmente como grfico
de escalones. Debe tenerse en cuenta que para cualquier valor observado la suma de
la frecuencia acumulada y la desacumulada es igual al nmero total de observaciones.
fa + fds = n
- 24 -
frecuencia
Grfico 1.9
22
20
18
16
14
12
10
8
6
4
2
0
Frecuencia acumulada
Frecuencia
desacumulada
observaciones
La interseccin de ambas grficas debe de verificarse para fa = fds = n/2.
En el punto de interseccin ambas frecuencias son iguales por lo que podemos decir
que:
fa + fds = fa + fa = n
por lo que
2 fa = n
y
fa = n / 2
RELACIN ENTRE MEDIA, MEDIANA Y MODA
Cuando nos referimos al histograma de frecuencias relativas decamos que el rea
encerrada por cada una de las barras nos entregaba el valor de la frecuencia relativa
del valor correspondiente a dicha barra... Si este concepto lo extendemos a toda la
distribucin podemos asegurar que considerando un determinado intervalo de las
observaciones el rea encerrada por el histograma en dicho intervalo ser igual a su
frecuencia relativa, valor que segn ya vimos multiplicada por 100 nos entrega el
porcentaje de observaciones comprendidas en ese intervalo. Adems demostramos
que la superficie encerrada por el histograma de frecuencias relativas era igual a la
superficie del polgono de fr. Simplificando, el rea encerrada por el polgono de
frecuencias relativa es igual a 1 y esto implica tambin que encierra el 100% de las
observaciones.
Analicemos las distribuciones correspondientes a las calificaciones obtenidas por tres
divisiones que denominaremos como A, B y C en la asignatura de Estadstica:
- 25 -
Tabla 1.9
A
xi
fi
fi
fi
10
30
30
27
=. (xi.fi) / N
= 3,1667
Me = (x15 + x16) / 2 = 3
Mo = 2
B)
=. (xi.fi) / N = 6
Me = x16 = 6
C)
Mo = 6
= (xi.fi) / N = 7,296
Me = x14 = 8
Mo = 8
- 26 -
frecuencia relativa
10
observaciones
10 11
obs e rvacione s
10 11
observaciones
- 27 -
= Me = Mo
Derecha < Me < = Mo
Izquierda > Me > = Mo
- 28 -
k= n
Otros deciden optar por la expresin:
k = 1+ log2(n)
Pero en general se puede definir el valor de k teniendo en cuenta que:
5 <= k <= 15
Es decir que el nmero de intervalos debe estar comprendido entre 5 y 15. Una
cantidad menor de intervalos da lugar a una distribucin con informacin insuficiente.
Por otro lado una cantidad mayor a 15 intervalos genera una distribucin que resulta
engorroso operar.
Para el caso que tenemos en estudio y teniendo en cuenta que n = 21, la raz
cuadrada de 21 es de 4,58 y considerando la ltima condicin, adoptaremos para k el
valor de 5, k = 5.
b) La amplitud de intervalo x para la cul adoptaremos la expresin:
x =
xN x1
k
x =
4,6 3,1
= 0,3
5
- 29 -
3,09
3,39
3,69
3,99
4,29
4,6
[`---------------)[--------------)[-----------------)[-----------------)[-------------------]
3,24
3.2
3,54
3,84
3,14
3,44
DETERMINACIN DE LA MEDIA
(x
mi
* fi )
ls
3,39
3,69
3,99
4,29
4,6
fi
1
4
6
5
5
21
xmi
3,24
3,54
3,84
4,14
4,445
xmi * fi
3,24
14,16
23,04
20,7
22,225
83,365
83,365
= 3,9697
21
Esto nos indica que el tiempo promedio empleado por los integrantes del pelotn para
cruzar la pista de combate es de 3,9697
HISTOGRAMA DE FRECUENCIA
Para confeccionar el Histograma y Polgono de frecuencias debemos tener presente
que las frecuencias de los intervalos adyacentes a los extremos de nuestra distribucin
son nulas, adems se representa en el eje horizontal las marcas de clase.
- 30 -
Grfico 1.13
7
6
5
f
4
3
2
1
0
2,94
3,24
3,54
3,84
4,14
4,445
4,74
ls
3,09
3,39
3,69
3,99
4,29
4,6
4,39
Tabla 1. 11
fi
xmi
0
2,94
1
3,24
4
3,54
6
3,84
5
4,14
5
4,445
0
4,74
Xmi * fi
0
3,24
14,16
23,04
20,7
22,225
0
fai
0
1
5
11
16
21
21
fdsi
21
20
16
10
5
0
0
- 31 -
Analizando dicho diagrama podemos observar que de los 21 integrantes del pelotn
solo 5 de ellos cruzan la pista en menos de 3,54, es decir que, mediante anlisis del
diagrama podemos reconstruir la tabla.
Grfico 1.14
25
20
fa
15
10
5
0
2,94
3,24
3,54
3,84
4,14
4,445
4,74
fa - fds
15
10
5
0
2
2,5
3,5
4,5
-5
- 32 -
Debe verificarse que el valor de esas frecuencias, en ese punto es igual a N/2.
Como la mediana es el valor que ocupa el punto medio, la abscisa correspondiente al
punto interseccin tendr su valor. Por lo tanto las coordenadas del punto interseccin
sern (Me; n/2).
b) Mtodo Analtico
Analizaremos el intervalo medial:
Grfico 1.16
12
10
8
6
4
2
0
3,69
Me
Li
3,99
Ls
1-2
------------1 2
Si reemplazamos tendremos:
fm
- 33 -
--------Me Li
Despejando Me tendremos:
x (N/2 fai)
Me = Li + ----------------fm
En este caso particular, la Me = 3,69 + 0,3 *((10,5 - 5) / 6
Me = 3,965
3.4- DETERMINACIN DE LA MODA
Se define como intervalo modal al intervalo de mayor frecuencia, en este caso
corresponder a [3,69; 3,99) con frecuencia 6, coincide con el medial, pero bien podra
no coincidir, para la determinacin de la moda, consideremos en el histograma de
frecuencia, el intervalo modal y los intervalos adyacentes.
Grfico 1.17
7
6
5
4
3
2
1
0
3,54
3,84
4,14
Li
Ls
- 34 -
Mo = Li + x. ( d1/(d1+d2) )
En este caso tendremos:
Mo = 3,69 + 0,3 (2 / ( 2+1) ) = 3,89
Conclusiones:
En una distribucin de intervalos de clase, la moda se encuentra siempre ubicada en
el intervalo modal, pero desplazada hacia el intervalo adyacente de mayor frecuencia.
Los valores determinados para la media, mediana y moda, indican que la distribucin
tiene un leve sesgo derecho:
= 3,9697
Media
Mediana
Moda
Me = 3,965
Mo = 3,89
> Me > Mo
4- VALORES DE DISPERSIN
Son suficientes los valores de posicin central para determinar las caractersticas de
una distribucin? Para responder a esta pregunta observemos la siguiente situacin:
Tenemos tres distribuciones que presenten la misma media, la misma moda y la
misma mediana pero no obstante ello las tres son distintas.
Pueden tenerse dos distribuciones mismo nmero de elementos o tambin
conformadas por los mismos elementos y no obstante ello ambas son distintas.
Tabla 1. 12
X1
0
1
2
3
4
5
6
7
8
F1
0
3
4
7
5
4
2
1
0
26
X2
0
1
2
3
4
5
6
7
8
F2
0
6
8
4
3
2
2
1
0
26
- 35 -
Grfico 1.19
8
7
6
5
4
3
2
1
0
0
10
Grfico 1.20
9
8
7
6
5
4
3
2
1
0
0
Es necesario entonces considerar valores que nos determinen que tn cuan dispersos
estn. Estos valores se denominan valores de dispersin:
- 36 -
Si bien, una vez ordenados todos los valores, el clculo de la amplitud o recorrido es
simple e inmediata, no nos brinda ninguna informacin sobre las caractersticas de los
valores intermedios. Veamos las siguientes distribuciones:
A)
10
12
14
B)
50
50,1
50,2
50,3
50,5
50,6
50,7
50,8
60
64
En la distribucin A
R = 14 0 = 14
En la distribucin B
R = 64 50 = 14
Ambas tienen el mismo nmero de elementos, el mismo alcance, no obstante ello son
distintas, es decir que el Rango o Amplitud de una distribucin nos entrega una
informacin limitada.
4.2 DESVO MEDIO
Para determinar el grado de dispersin de los valores de la distribucin, debemos
definir con respecto a que punto de referencia se toman las distancias, el punto de
referencia ms utilizado es la media de la de la distribucin
Considerando el ejercicio de pag. 39 (Los tiempos que los integrantes de un pelotn
tardan en cruzar la pista de combate), la distribucin de intervalos la representbamos
como:
3,09
3,39
3,69
3,99
4,29
[`---------------)[--------------)[-----------------)[-----------------)[-------------------]
3,24
3,54
3,84
3,14
3,44
4,6
d1
= 3,9697
d2
En el primer intervalo se encuentra una sola observacin, la cul consideramos es
coincidente con la marca de clase, luego su distancia respecto a la media ser:
d1 = xm1 -
La dispersin de los valores ubicados en el segundo intervalo, en este caso son 4 y
habiendo considerado que los mismos se encuentran uniformemente distribuidos en
dicho intervalo, la dispersin respecto a la media estar dada por el producto de la
distancia de la marca de clase por el nmero de observaciones
d2 = xm2 -
- 37 -
pdm =
(x
). fi
mi
Pero nos encontramos con que la suma de todos los desvos es nula y siempre lo
sern por considerar como punto de referencia a la media. Todas las distancias de las
marcas de clase que se ubiquen a la izquierda de la media sern negativas, mientras
que las distancias de los que se ubiquen a la derecha sern positivas. El problema
radica en anular los signos negativos, para ello podemos:
a) considerar los desvos absolutos medios, de esta manera no se tendra ningn
desvo negativo y la suma de los desvos absolutos medios sera distinta de cero,
salvo el caso en que todas las observaciones sean iguales. La expresin matemtica
quedara como:
DM =
mi
. fi
N
Esta expresin se define como Desvo medio (Promedio de los desvos absolutos
medios).
En nuestro caso en estudio conformaremos la tabla correspondiente a la distribucin
de intervalos pero incluiremos una nueva columna conteniendo los desvos absolutos
medias.
Tabla 1. 13
Li
2,79
3,09
ls
0
3,39
fi
0
1
xmi
2,94
3,24
Xmi * fi
0
3,24
fai
0
1
fdsi
21
20
!xi - media!.fi
0,000
0,730
3,39
3,69
3,99
4,29
4,6
3,69
3,99
4,29
4,6
4,99
4
6
5
5
0
3,54
3,84
4,14
4,445
4,74
14,16
23,04
20,7
22,225
0
5
11
16
21
21
16
10
5
0
0
1,719
0,779
0,851
2,376
0,000
6,455
21
83,365
- 38 -
4.3 VARIANZA
Otra forma de obtener todos los desvos positivos, sera elevndolos al cuadrado es
decir:
) 2 .if
(x
pdmc =
mi
Esta expresin que definimos como: el promedio de los desvos cuadrticos medios y
se denomina Varianza.
Es conveniente entonces considerar una nueva columna conteniendo la suma de los
desvos cuadrticos medios tal como la tabla:
Tabla 1. 14
Li
2,79
3,09
3,39
ls
0
3,39
3,69
fi
0
1
4
xmi
2,94
3,24
3,54
Xmi * fi
0
3,24
14,16
fai
0
1
5
fdsi
21
20
16
3,69
3,99
4,29
4,6
3,99
4,29
4,6
4,99
6
5
5
0
21
3,84
4,14
4,445
4,74
23,04
20,7
22,225
0
83,365
11
16
21
21
10
5
0
0
0,10102891
0,14490505
1,12925624
0
2,647
( xi )
fi
O abreviando
= Var (x) =
= 0,126 = 0,3549
- 39 -
frecuencia
Desvo estndar = 2
Desvo estndar =0,5
Desvo estndar =1
x
4.4 COEFICIENTE DE VARIACIN
En muchas oportunidades es conveniente comparar distribuciones de distinta media o
de distinto tipo, por ejemplo si analizamos alturas y peso de los alumnos de un curso
de una Universidad, los valores de posicin central y de dispersin de una de ellas
estarn dados en metros o centmetros, pero los de la otra sern en Kg. , luego en
principio sera incorrecto pretender comparar las dispersiones de esas distribuciones,
a fin de poder comparar se opera con el Coeficiente de Variacin, que esta dado por el
cociente entre el desviacin estndar de la distribucin y su media, expresada de
manera porcentual:
CV =
. 100%
Como tanto la desviacin estndar y la media tienen las mismas unidades, al dividirlas
se simplifican y nos queda un coeficiente, es adimensional. Por otra parte el CV
entrega la proporcin de la desviacin estndar respecto de la media. En el caso que
nos ocupa el:
CV =
0,3549
.100 = 8,94
3,9697'
CV = 8,94%
Supongamos que se realiza el estudio de altura y peso de los alumnos de un curso, y
que los resultados arrojados son:
- 40 -
Desviacin estndar
Del Peso
= 10Kg
Altura
= 6cm
Media
71 k.o.
CV
14,08%
168 cm
3,57%
CUARTILES Y PERCENTILES
X1
Q1
Q2
Q3
Xn
Una cuarta parte de las observaciones se encuentran por debajo de Q1, como que
tambin estn por debajo de Q2. Entre Q3 y Q1 se concentra el 50% de las
observaciones. Es necesario aclarar que Q1 como Q2 y Q3 son los puntos fractiles,
por debajo de cada uno de ellos se encuentran los porcentajes los correspondientes
porcentajes de datos.
Cuando el nmero de valores no es lo suficientemente grande la determinacin exacta
de los cuartiles puede ser complicada, ya que es factible que el valor del cuartil quede
entre observaciones, de cualquier manera en general podemos decir que la
determinacin de cada cuartil quede satisfecha con las expresiones:
La determinacin de los cuartiles para datos no agrupados estn dadas por las
expresiones:
Q1 = X (1 / 4 N +1 / 4)
Q2 = X (1 / 2 N +1 / 2)
Q3 = X (3 / 4 N +1 / 4)
Observe que el valor del segundo cuartil corresponde al valor de la mediana. Si
recordamos que, el rea encerrada por el polgono de frecuencias era igual al nmero
- 41 -
Q1
Q2
Q3
xi
80
- 42 -
- 3
- 2
-1
+1
+2
+3 xi
68% N
95%N
99,72% N
Resumen Regla Emprica
( 1 ) se tiene el 68% de N
( 2 ) se tiene el 95% de N
( 3 ) se concentra el 100% de N
- 43 -