Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
RANGO
Rango o recorrido. El rango es la diferencia entre el valor mayor y el valor
menor encontrado en la muestra, tambin se le denomina recorrido ya que nos
dice entre que valores hace su recorrido la variable de inters; y se determina
de la siguiente manera:
R = VM Vm
Dnde:
R = rango o recorrido
VM = valor mayor en la muestra
Vm = valor menor en la muestra
Ejemplo:
1. Se han tomado como muestras las mediciones de la resistencia a la tensin
de la soldadura usada para unir dos cables, estas son: 78.5kg, 82.4, 87.3, 78.0,
90.0, 86.5, 77.9, 92.4, 75.9, determine su rango o recorrido.
Solucin:
VM = 92.4 kg
Vm = 75.9 kg
R = VM Vm = 92.4 75.9 = 16.5 kg
2. Se toman las mediciones de la cantidad de grasa de la leche en gramos por
cada 100 ml de leche que entra a un proceso de pasteurizacin, a continuacin se
1
enumeran; 14.85, 15.32, 12.76, 16.29, 15.84, 17.3, 17.61, 16.33, determine el
rango o recorrido de la cantidad de grasa de la leche.
Solucin:
VM = 17.61
Vm = 12.76
R = 17.61 12.76 = 4.85gramos
MEDIA ARITMETICA
Equivale al clculo del promedio simple de un conjunto de datos. Para
diferenciar datos mustrales de datos poblacionales, la media aritmtica se
representa con un smbolo para cada uno de ellos: si trabajamos con la poblacin,
este indicador ser ; en el caso de que estemos trabajando con una muestra, el
smbolo ser .
Hay que entender:
Media aritmtica ( o ): Es el valor resultante que se obtiene al dividir la
sumatoria de un conjunto de datos sobre el nmero total de datos. Solo es
aplicable para el tratamiento de datos cuantitativos.
Que existen dos formas distintas de trabajar con los datos tanto poblacionales
como mustrales: sin agruparlos o agrupndolos en tablas de frecuencias. Esta
apreciacin nos sugiere dos formas de representar la media aritmtica.
3,1
2,4
4,0
3,5
3,0
3,5
3,8
4,2
4,0
SOLUCIN
Aplicando la frmula para datos no agrupados tenemos:
Cabe anotar que en el ejemplo estamos hablando de una poblacin
correspondiente a todos los alumnos de la clase (10 alumnos en total). El
promedio de las notas es de 3,47.
Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media
aritmtica.
En este caso la media pasa de 3,47 a 3,15. Esta variacin notoria se debi a
que la media aritmtica es sensible a los valores extremos cuando tratamos con
pocos datos. El 0,0 es una nota atpica comparada con las dems, que estn
ubicadas entre 3,0 y 4,2.
MEDIA GEOMETRICA
Media geomtrica (G). Es la raz en ensima del producto de los valores de
los
muestra no son lineales, es decir que su valor depende de varios factores a la vez,
se determina de la siguiente forma:
3
Dnde:
G = media geomtrica
xi = dato i
n = nmero de datos en la muestra
Ejemplos:
1.
= 12.9077 oC
fabricar queso chihuahua, 21.4 oC, 23.1, 20.2, 19.7, 21.0, determine la temperatura
promedio de este proceso.
Solucin:
G=
= 21.048 oC
MEDIANA
Mediana (xmed). La mediana es aquel valor que se encuentra en la parte central
de los datos que se tienen en la muestra una vez que estos han sido ordenados
segn su valor o magnitud. Para calcular la mediana se presentan dos casos:
a.
la parte central de los mismos, el valor de este dato ser el que d valor
a la mediana.
Ejemplo:
Los siguientes datos son las mediciones obtenidas de un circuito utilizado en
un arns de lavadora; se toman como muestra siete circuitos y sus mediciones
son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5 cm.
Solucin:
Ordenando los datos de menor a mayor valor;
11.2, 11.2, 11.2, 11.3, 11.4, 11.5, 11.5
Se observa que el dato 11.3 es el que queda en la parte central, por lo que
este es el que dar valor a la mediana; entonces,
xmed = 11.3 cm.
b.
MODA
Moda (xmod). La moda se define como aquel valor o valores que ms se repiten
o que tienen mayor frecuencia entre los datos que se han obtenido en una
muestra, la muestra de una poblacin nos genera la distribucin de los datos una
vez que estos se han graficado y en esta grfica es posible observar la moda o
modas de la misma, es por esto que una distribucin de datos puede ser amodal
(carece de moda), unimodal (tiene una sola moda), bimodal (tiene dos modas) o
polimodal (tiene ms de dos modas).
Ejemplos:
1.
a la estatura de un grupo de jvenes; 1.60m, 1.65, 1.70, 1.71, 1.70, 1.70, 1.70,
1.71, 1.70, 1.93, 1.87, 1.85
Solucin:
Estatura
Frecuencia
1.60
1.65
1.70
5*
1.71
2
6
1.85
1.87
1.93
alumnos de primer semestre del tecnolgico de Chihuahua, 18 aos, 17, 19, 21,
19, 18, 22, 22, 18, 18, 17, 19, 19, 19, 18, 20, 21, 20, 18, 19, 18, 19, 18,19, 22, 35
Solucin:
Edad
Frecuencia
17
18
7*
19
8*
20
21
22
35
En este caso se observa que las edades que ms frecuencia tienen son las de
18 y 19 aos, por lo que se concluye que existen dos modas,
Xmod1= 18 aos , Xmod2= 19aos
Hay que hacer notar que la frecuencia para ambas modas puede ser de igual
magnitud o diferente, como en el caso que se ilustra.
b2. Medidas de Dispersin. Cuando se tiene una muestra de datos obtenida de
una poblacin cualquiera, es importante determinar sus medidas de tendencia
central as como tambin es bsico el determinar que tan dispersos estn los
datos en la muestra, por lo que se hace necesario determinar su rango, la
varianza, la desviacin estndar, etc., ya que una excesiva variabilidad o
dispersin en los datos indica la inestabilidad del proceso en anlisis en la mayora
de los casos.
GRAFICACIN
Datos correspondientes a un carcter cualitativo
La representacin grfica de este tipo de datos est basada en la
proporcionalidad de las reas a las frecuencias absolutas o relativas. Veremos dos
tipos de representaciones:
1. Diagrama de sectores:
Ejemplo:
As, los ngulos que corresponden a las cuatro modalidades de la tabla adjunta
sern:
8
Rehusaron ciruga
Rehusaron radiacin
Empeoraron
una
por
Nmero de casos
26
3
10
ngulo(grados)
234
27
90
enfermedad
ajena al cncer
Otras causas
1
Y su representacin en un diagrama de sectores ser:
2. Diagrama de rectngulos:
Ejemplo:
La representacin grfica de la distribucin de frecuencias absolutas del
ejemplo anterior ser de la forma:
Consiste en levantar, para cada valor de la variable, una barra cuya altura sea
su frecuencia absoluta o relativa, dependiendo de la distribucin de frecuencias
que estemos representando.
10
Ejemplo:
As, la representacin grfica de la distribucin de frecuencias del ejemplo del
n de hijos ser:
Ejemplo:
11
Al ser esta representacin una representacin por reas, hay que distinguir si
los intervalos en los que aparecen agrupados los datos son de igualamplitud o no.
Si la amplitud de los intervalos es constante, dicha amplitud puede tomarse
como unidad y al ser
Frecuencia (rea) = amplitud del intervalo altura
La altura correspondiente a cada intervalo puede tomarse igual a la
frecuencia.
Si los intervalos tienen diferente amplitud, se toma alguna de ellas como
unidad (generalmente la menor) y se levantan alturas para cada intervalo de forma
que la ecuacin anterior se cumpla.
12
Ejemplo:
En el ejemplo de los Niveles de Colinesterasa, al tener los intervalos igual
amplitud, la representacin grfica ser:
Ejemplo:
Si tuviramos una distribucin de frecuencias como la siguiente,
correspondiente a puntuaciones obtenidas en un test psicolgico y en la que los
intervalos son de diferente amplitud
Ii
0-20
20-30
30-40
40-45
45-50
50-60
60-80
80-100
ni
fi
8
8/70
9
9/70
12
12/70
10
10/70
9
9/70
10
10/70
8
8/70
4
4/70
?ni= 70
?fi=1
Tomando la amplitud 5 como unidad, deberemos levantar para el primer
intervalo una altura de 2/70 para que el rea sea la freceuncia relativa 8/70.
13
Obsrvese que la suma de todas las reas debe ser 1, tanto si los intervalos de
la distribucin de frecuencias relativas son o no de igual amplitud.
2. Polgono de frecuencias acumuladas:
14
DATOS AGRUPADOS
1- MEDIA ARITMTICA PARA DATOS AGRUPADOS
Se calcula sumando todos los productos de marca clase con la frecuencia
absoluta respectiva y su resultado dividirlo por el nmero total de datos:
15
2- MODA
Es el valor que representa la mayor frecuencia absoluta. En tablas de
frecuencias con datos agrupados, hablaremos de intervalo modal.
La moda se representa por Mo.
Li Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia
absoluta).
fi Frecuencia absoluta del intervalo modal.
fi-1 Frecuencia absoluta del intervalo anterior al modal.
fi+1 Frecuencia absoluta del intervalo posterior al modal.
t Amplitud de los intervalos.
16
3- MEDIANA
Es el valor que ocupa el lugar central de todos los datos cuando stos estn
ordenados de menor a mayor. La mediana se representa por Me. La mediana se
puede hallar slo para variables cuantitativas.
Clculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega
hasta la mitad de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre. N / 2
Luego calculamos segn la siguiente frmula:
Li-1 es el lmite
inferior de la clase
17
18
Veamos:
Recuerda:
Li-1 :es el lmite inferior de la clase donde se encuentra la mediana, en este
caso el lmite inferior es 20.
N / 2 :es la semisuma de las frecuencias absolutas, en este caso es 15,5.
Fi-1 :es la frecuencia acumulada anterior a la clase mediana, en este caso es 9.
fi : es la frecuencia absoluta del intervalo mediano, en este caso es 7
ti :es la amplitud de los intervalos. Se calcula restando el extremo superior menos
el inferior del intervalo, en este caso es:
19
30 - 20 = 10
3 Calculemos la moda Mo :
Lo primero que debemos hacer es identificar el intervalo modal:
20
CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de
ubicacin o clasificacin de las personas cuando atienden caractersticas tales
como peso, estatura, etc.
Los percentiles son ciertos nmeros que dividen la sucesin de datos
ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que
dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1,
P2,... P99), ledos primer percentil,..., percentil 99.
Datos Agrupados
Cuando los datos estn agrupados en una tabla de frecuencias, se calculan
mediante la frmula:
k= 1,2,3,... 99
21
Donde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
Primer percentil, que supera al uno por ciento de los valores y es superado por
el noventa y nueve por ciento restante.
El 60 percentil, es aquel valor de la variable que supera al 60% de las
observaciones y es superado por el 40% de las observaciones.
El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante
POBLACIN Y MUESTRA
DATOS AGRUPADOS
Si un conjunto de datos consta de todas las observaciones concebibles (o
hipotticamente posibles) de cierto fenmeno, se denomina poblacin; si un
conjunto de datos consta solamente de una parte de estas observaciones se
22
conoce como muestra por lo que una muestra debe ser un subconjunto de la
poblacin.
Por ejemplo: Un peridico local imprime un artculo poltico para todos sus
lectores. El peridico desea considerar las actitudes de 200 lectores hacia el
artculo y conocer sus puntos de vista.
De acuerdo a lo planteado en el ejemplo el total de los lectores representara
la poblacin a la que le llega el artculo y los 200 lectores seleccionados
representaran la muestra para conocer su punto de vista.
Se utilizar la palabra "muestra" solo con relacin a datos que se puedan
utilizar en forma razonable para hacer generalizaciones acerca de la poblacin de
la cual provinieron. En este sentido ms tcnico, no son aceptables muchos
conjuntos de datos que por lo comn se denominan muestras.
Como el trmino estadstica(o) se introdujo con relacin a los datos de
muestra, se agregar que tambin existe un nombre para las descripciones
estadsticas de poblaciones llamadas parmetros. Como se observar, la
distincin entre estadstica y parmetros servir para simplificar nuestro lenguaje.
En realidad, hasta se usarn smbolos diferentes de medidas estadsticas, segn
se utilicen para describir muestras o poblaciones. Para poblaciones se
utilizarn letras griegas y para muestras, latinas.
Por ejemplo para representar la media o el promedio de una muestra se utiliz
la frmula:
y la
23
MEDIDAS DE DISPERSIN
En secciones anteriores se ha discutido sobre tres medidas descriptivas del
centro. Sin embargo, estas medidas no son suficientes para caracterizar la
distribucin, puesto que otro aspecto que debe se tomar en cuenta es la
variabilidad de las observaciones.
Con el propsito de medir la dispersin o variabilidad, se discutirn en este
apartado las medidas de: Amplitud (llamada tambin rango o recorrido),
Desviacin media, Varianza, Desviacin Estndar (tambin llamada desviacin
tpica) y Coeficiente de Variacin.
Amplitud o recorrido
La medida de dispersin ms simple recibe el nombre de Amplitud o
recorrido y es muy poco usada puesto que su nica ventaja es la sencillez con
que se calcula. Es comn que se use tambin el nombre de Rango para esta
medida. La amplitud (A) de un conjunto de datos es la diferencia entre las
observaciones que tienen el mayor y el menor valor numrico en el mismo.
Por ejemplo: Supngase que en un hospital el pulso de cada paciente se mide
tres veces al da y que cierto da los registros de dos pacientes muestran:
Paciente 1: 73 77 74
Paciente 2: 64 90 73
Cul es la Amplitud en pulsaciones para cada paciente?
Para calcular la amplitud de los datos necesario identificar el valor ms grande
y el valor ms pequeo del conjunto de datos de cada uno de los pacientes.
Para el Paciente 1:
A = 77 - 73 = 4
Para el Paciente 2:
A = 90 - 64 = 26
Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a
encontrar dificultades tericas en problemas de inferencia y rara vez se usa.
Un mtodo alternativo consiste en trabajar con los cuadrados de las
desviaciones de la media, ya que tambin esto eliminar el efecto de los signos.
Los cuadrados de nmeros reales no pueden ser negativos y pueden tomar el
valor de cero.
Por consiguiente, si se promedia las desviaciones cuadradas de la media y se
toma la raz cuadrada del resultado (para compensar el hecho de que las
desviaciones fuesen cuadradas), se obtiene laDesviacin estndar de la
poblacin.
Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razn. Si se
dividiera entre n y se utilizara s2 como estimacin de
es decir, se utilizara la
varianza de una muestra para determinar la varianza de la poblacin de la cual
provino, el resultado sera demasiado pequeo y esto se corrige al dividir entre n-1
en lugar de hacerlo entre n. Si el valor de n es muy grande no importa hacerlo
entre n-1 sino que es prctico para definir s como se hizo.
Coeficiente de variacin
26
Valor mnimo 7
A = 13 - 7 = 6
-0.5
0.25
28
-2.5
6.25
11
1.5
2.25
10
0.5
0.25
13
3.5
12.25
-2.5
6.25
0.0
27.50
29
Donde:
k es el nmero de intervalos de clase
Xi es el valor medio de cada clase
fi es el valor de la frecuencia absoluta
intervalos
Punto
medio
de Conteo
clase (mi)
fi
fAi
FRi
FRAi
18
18/90 18/90
13
31
13/90 31/90
55
24/90 55/90
72
17/90 72/90
85
13/90 85/90
13
30
85
0/90
85/90
||||
89
4/90
89/90
90
1/90
90/90
90
90
90/90 90/90
TOTAL
Calcular s2 y s.
mi
fi
fimi
9.7
94.09
18
174.6 1693.62
13.7
187.69
13
178.1 2439.97
17.7
313.29
24
424.8 7518.96
31
21.7
470.89
17
368.9 8005.13
25.7
660.49
13
334.1 8586.37
29.7
882.09
33.7
1135.69
134.8 4542.76
37.7
1421.29
37.7
TOTAL
#####
90
1653.0 34208.10
1421.29
32
LA VARIABILIDAD Y SU IMPORTANCIA
La importancia del concepto de variabilidad se hace an ms clara, si se nota que
en la prctica puede suceder que varios conjuntos de datos tengan, la misma
media aritmtica y sin embargo, su dispersin sea muy diferente, tal como se
puede apreciar a continuacin:
34
ltimo grupo ni siquiera hay un valor que sea igual al promedio y esto puede
darnos una idea de las conclusiones errneas a que podramos llegar si no
tomramos en cuenta la dispersin de los datos con respecto a esta medida. Para
los investigadores, la variabilidad es un fenmeno natural y corriente del cual
tienen clara conciencia.
Es evidente que slo el conocimiento del valor central x no es suficiente para
caracterizar un conjunto de datos.
LA MEDICIN DE LA VARIABILIDAD
Dentro del tratamiento estadstico de la informacin cuantitativa, es necesario
hacer referencia a la medicin de la variabilidad. Han sido propuestas diferentes
formas de medir la dispersin o variabilidad de un conjunto de datos; cada una de
ellas posee ventajas y tambin limitaciones conceptuales y prcticas.
La eleccin de una de ellas, en particular, depender de la situacin concreta
que se considere y de si, en ese caso, las ventajas de su utilizacin superan a las
desventajas, en relacin a las dems medidas. Seguidamente se discutirn las
medidas de variabilidad ms conocidas, a saber:
a) El recorrido o amplitud.
b) La desviacin media.
c) La desviacin estndar.
d) La variancia.
e) El coeficiente de variacin.
36
7.
deben ser
Luego se calcula la
La desviacin
desviacin media:
media, no obstante
las ventajas conceptuales que rene, casi no se utiliza debido a que requiere el
manejo de valores absolutos por una parte, y por el hecho de que existe otra
medida, basada tambin en las desviaciones respecto a la media aritmtica, que
es mucho ms cmoda y til, y rene numerosas ventajas prcticas y tericas.
Esta medida es la desviacin tpica.
38
Simblicamente es as:
La Variancia
Como se dijo atrs, la variancia es el cuadrado de la desviacin tpica, as:
Simblicamente as:
39
, se utiliza n-1
(variancia de la poblacin).
(minscula).
es la siguiente:
y s.
3
10
2
8
7
=30
-3
4
-4
2
1
0
9
16
16
4
1
46
41
labor
3
10
2
8
7
=30
9
100
4
64
49
=226
42
la
EL COEFICIENTE DE VARIACIN
Una situacin corriente en la investigacin, es la necesidad de comparar dos o
ms conjuntos de datos en cuanto a su variabilidad. Si los datos estn dados en
las mismas unidades, y si los promedios de los conjuntos, es decir, la magnitud de
los datos, son bastantes similares, la desviacin estndar es una herramienta
perfectamente apropiada para realizar la comparacin.
Pero, si alguna de las condiciones antes citadas no se cumple, la desviacin
estndar, y cualquier medida absoluta de dispersin, pierde casi toda su utilidad
para este propsito.
43
ESTATURA PROMEDIO
84
160
DESVIACIN
3
ESTNDAR
5
44
En trminos
45
CURTOSIS O APUNTAMIENTO
La curtosis mide el grado de agudeza o achatamiento de una distribucin con
relacin a la distribucin normal, es decir, mide cun puntiaguda es una
distribucin.
46
Dnde:
aritmtica;
FUENTES DE INFORMACIN:
http://www.vitutor.net/2/11/medidas_dispersion.htmlhttps://prezi.com/geb
ydqv4qeaq/medidas-de-dispersion-para-datos-agrupados/
http://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934
47
http://es.slideshare.net/Igneigna/medidas-de-dispersin-para-datos-noagrupados
http://www.ditutor.com/estadistica/medidas_dispersion.html
https://prezi.com/7sknvt40sqtc/datos-no-agrupados-y-medidas-dedispersion-no-agrupados/
http://www.monografias.com/trabajos87/medidas-forma-asimetriacurtosis/medidas-forma-asimetria-curtosis.shtml#ixzz44nqSiqMi
48