Sei sulla pagina 1di 14

Probabilidad y

Estadística
3-MEDIDAS DE
Las medidas de tendencia central, de centralización o posición facilitan la
interpretación
Normalmente, de CENTRALIZACIÓN
información
la variable que sobre un conjunto
se intenta medir eso conocida
serie de datos que seocasiones
en algunas están
analizando,
de manera una vez queEsto
insuficiente. estosnodatos fueron
significa querecopilados
no se tengau algún
organizados, ya sea en
conocimiento
Por
una ejemplo, si se documental
investigación desea compararo enlasuna estaturas de alumnos
investigación varones de dos
de campo.
global de del
planteles valores quede
Colegio pueda asumir,
Bachilleres sino
del que es
quinto necesario
semestre, conocerla
y al tomar lasmejor para
medidas,
Medidas
tomar de
alguna decisión de importancia.
se encontraran
Centralización las variables entre 140 a 210 cm. Este conocimiento no es lo
suficientemente preciso paraa) Media
hacerAritmética o promedio
la comparación (
deseada, es indispensable
afinarlo más para cada uno b) de
Mediana
los dos planteles, interesa donde están centradas
las estaturas, que tanta variabilidad
c) Moda tiene, etc. De los muchos aspectos de los
datos, que intentamos representar numéricamente con estadísticas, dos son los
más importantes: x)

(x )~
Medidas de
Variabilidad o a) Rango ( R )
x
Dispersión b) Desviación Media ( D.un
M )gran número de valores
Para variables numéricas en las que puede haber
observados c) Varianza (S 2)
Las medidasdistintos, se ha de vienen
de centralización optar por
d) pregunta:
Desviación
un método de análisis
a responder
estándar o esta
distinto,
pregunta.
típica (S)
respondiendo a la siguiente
¿Alrededor de qué valor se agrupan los datos?
3.1.1 Medidas de centralización para datos no agrupados
a) Media Aritmética. La medida más evidente que podemos calcular para describir
un conjunto de observaciones numéricas es su valor medio. La media no es más
x la suma de todos los valores de una variable dividida entre el número total de
que
datos de x
los que se dispone. Siendo su fórmula la siguiente:
Donde:
n Símbolo de
Como ejemplo, consideremos 10sumatoria
pacientes que indica que
de edades se deberá
21 años, sumar
32, 15, lo 61,
59, 60,
que aparezca
64, 60, 71, y 80. La media de edadade
derecha, es decir,será
estas personas x. de:
x XCada uno de los datos obtenidos de la muestra.
x nNúmero total de datos.
21 32 15 59 60 61 64 60 71 80
52.3años 10
VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMÉTICA
Ventajas
Es de fácil cálculo e interpretación sencilla. Es la más utilizada y es útil en
Desventajas
muchos
La desarrollos
principal desventajamatemáticos.
se presenta cuando algunolooque
los dos valores
Instrucciones: En los siguientes ejercicios determina se pide:
extremos de la muestra son desproporcionados respecto al resto de los
1. Hallar
datos, la media
sobre aritmética
todo de losson
cuando éstos siguientes valores: 5,En
poco numerosos. 7, este
8, 10, 15. la
caso
2. Si
media se aleja de la realidad; es decir, deja de ser representativaun
las calificaciones de un alumno en las distintas asignaturas de decurso
los
durante
datos. una evaluación fueron: 7; 5; 6,5; 3,7; 5, 6,2. ¿Qué
3. La media de 6 elementos se sabe que es 10. Sabiendo que cinco de promedio obtuvo el
ellos son:
alumno?
8, 12, 13, 5 y 9, hallar el elemento que falta
4 Un alumno obtiene en tres exámenes parciales las siguientes notas: 7, 5 y 3; en
el examen final consigue un 6. Suponiendo que esta nota final tenga doble valor EJERCICIO 1
que las parciales, ¿cuál será su nota media?
b) Mediana
En esta medida,
La mediana los datos
del ejemplo u observaciones
anterior, equidistantes
sería el valor que deja aolaque se encuentran
mitad de los datos
más
por en medio
encima de de todo
dicho el conjunto
valor, y a la de datos.
otra mitad por debajo, es decir el 50 % por arriba
Para obtener la mediana para datos agrupados, primeramente deberemos
y el 50%los
ordenar por debajoen del conjunto de datos.
Como quieradatosque sea,forma ascendente
en este o descendente
ejemplo, el observando
número de datos la siguiente
u observaciones es
secuencia
par21,
(1032, de datos:
personas), 5, 21, 32, 59, 60, 60,61, 64, 71, 80. (Datos ordenados)
los dos valores que se encuentran en medio son 60 y 60. Si
5, 59,
realizamos el cálculo para la media nos dará:
, 60,60
0 61, 64, 71, 80. (Número de observaciones par)
x
60
2
60
x
~
Si al ejemplo anterior le agregamos un paciente más de
60años
x 55 años entonces la
mediana se determinará como el dato u observación que se encuentra más en el
~5, 21, 32, 55, 59, 60, 60,61, 64, 71, 80.
medio es decir:
Si la media
Entonces la ymediana
la mediana (x ) son
= 60iguales,
años la distribución o conjunto de datos de la
variable es simétrica.
Geométricamente Sin embargo,
la mediana la media
es el valor de laesvariable
muy sensible a la variación
que corresponde a lade las
puntuaciones,
vertical que dividey la mediana
al es menos
histograma en sensible
dos áreas a dichosCuando
iguales. cambios.determinados
VENTAJAS Y DESVENTAJAS DE LA MEDIANA
valores de un conjunto de datos u observaciones son muy grandes o muy
Ventajas
pequeños con respecto a los demás, entonces la media aritmética se puede
a) La Mediana
Desventajas
distorsionar no sesu
y perder vecarácter
afectadarepresentativo,
por los valoresen extremos, por es
esos casos, lo que la
conveniente
podemos
a) La más
utilizar utilizar en
importante,
la mediana comoaquellos
es quecasos
medidanode en que hacer
podemos
tenencia lacentral.
media aritmética
cálculos no es útil.
adicionales con la
60
mediana.
b) No utiliza mucha información de un conjunto de datos.
c) Finalmente, al menos que dispongamos de una computadora o unos
esclavos, no es fácil ordenar un conjunto grande de números. En este caso, la
mediana no es fácil de calcular.
Instrucciones:
1.
b) Determinar
5, 7, 10, 15,la20,
mediana
21, 24,para
27. el siguiente conjunto de datos
a) 5, 6, 9, 11, 15, 19, 23, 26, 27.
c) Las calderas de una planta de energía de vapor a alta presión tuvieron las
siguientes eficiencias en porcentajes: 90.3, 91.6, 90.9, 90, 90.3, 91.0, 87.9, EJERCICIO 2
89.4. ¿Cual es el significado de la mediana en este caso?
c) La moda (x ) se suele definir como el valor más frecuente. En el caso de una
variable 1:
Ejemplo no En
agrupada, es el
el caso del valor de
ejemplo la variable
anterior, que
5, 21, 32,más
59, se
60,repite.
60, 61, 64, 71, 80. La
Ejemplo 2: Determinar la moda del siguiente conjunto de datos 1, 2, 3, 4, 4, 5, 2,
1,
1, 3,
1, 4,
moda 2, 2,x4,
2, 3,
2,será: 3,=6,
3,603
3,años.
3, 4, (Unimodal)
4, 4, 4, 5, 6.


x 3 y4
Bimodal
Ejemplo 3: Determinar la moda del siguiente conjunto de datos 1, 2, 3, 4, 5, 6, 7,
8,
En9este caso, como ningún dato se repite será amodal.
Gráficamente eso se puede reflejar mediante el análisis de un histograma de
frecuencias
En el caso de que la distribución o conjunto de datos tenga una moda, se dirá
que el conjunto de datos es unimodal; si tiene dos modas, se llamara bimodal;
VENTAJAS
más Es
delados
quemodas, se le llamará
más fácilmente polimodal; puesto
se determina, y en caso
queque no tenga ninguna
la obtenemos por
moda se denominará amodal. 61
inspección y no por cómputo.
Posiciones relativas de la Media, la Mediana y la Moda.
Si la Media, Mediana y Moda se localizan en el centro y son siempre iguales, la
distribución es simétrica.
En una distribución Ello significa
positivamente que silaseMedia
sesgada, doblara por la mitad
aritmética es el al polígono
mayor de los
de frecuencia,
tres promedios. ambos
¿Por ladosPorque
qué? tienenla lamedia
mismaes forma.
más El puntoque
influida, máslaalto
Modade olalacurva,
Inversamente,
corresponde en una
avalores
la moda. distribución negativamente
Como la curva es simétrica, sesgada, la
la mediana Media aritmética
corresponde al es
Mediana,
el menor porlos
de tres extremadamente
promedios. Es altos.
evidente La Mediana
que la Media suele
se ve ser el siguiente
influida por unas
punto en que
promedio la distribución
en una distribución sedeparte a la mitad.
frecuencias Las frecuencias
positivamente más y
sesgada; altas se el
la Moda
cuantas
compensan observaciones
con lasSimás extremadamente
bajas; y así,es lamuy bajas.
Media, La Mediana
Mediana es mayor
ysería
Moda que
coinciden, la
lo que
menor
Media de los tres.
Aritmética la
y la Modadistribución
es el mayor sesgada,
de los tres no
promedios. bueno emplear
Aquí también sia la
la
significa
Media que promedio.
como cualquiera deMediana
La las tres medidas
ydebe
la Moda es adecuada
serían más para representar
representativas. una
distribución es muy sesgada, no se emplear la Media
distribución. Conforme la distribución se hace menos simétrica o sesgada, la para representar a los
datos.
relación entre los tres promedios cambia.
3.1.2 Medias de tendencia central para datos agrupados
Como recordarás, en la Unidad 2 se vieron los diferentes tipos de frecuencias con
los que seLapuede
Ejemplo: ordenar
siguiente la distribución
distribución o conjunto
de datos de datos:
representan las calificaciones de 30
alumnos
Para resumir la información del número de estudiantes que obtuvieron una
88774938100
determinada calificación, se hace por medio
Los datos95607510080
anteriores se pueden presentar porde una tabla
medio con
de una dos de
tabla encabezados,
frecuencias
lo cual permite
como sigue: exhibir, en forma concisa, el número de veces que se presenta una
Calificación
6369509082
determinada cantidad en un conjunto de datos.
Número de 65751009550
80706010075
Estudiantes
Tabla 1
80100908575
Lo anterior, se puede elaborar, si el conjunto de datos o muestra es pequeña;
pero en realidad
Ejemplo. esto conjunto
El siguiente se presenta en pocas
de datos nos ocasiones y por
representan los lo tanto,
pesos encuando los
kilogramos
datos
de 40 son demasiados,
pacientes se presentarán
sometidos a una dieta.como tablas de distribución de
49.0
frecuencias.
49.8 50,5
49.8 50.6
50.0 53.5
50.6 54.0
50.3 51.0 56.0
54.3 57.0
52.0 55.0 60.0
57.5 60.0
55.0 58.3 67.0
63.5 67.5
59.0 64.0 68.6
68.0 69.0
64.0 68.4 71.0
69.5 71.5
38 68.6 69.6 72.0
1 70.0 72.5
49 73.0
1
50
2
60
2
63
1
65
1
69
1
70
1
75
4
77
1
80
3
82
º
85
1
88
1
90 95 100
2
2
5
Los datos se deberán ordenar en forma ascendente o descendente como se
prefiera; en nuestrodel
Con la información caso se ordenaron
presente enprimero
ejemplo, forma ascendente.
hay que decidir en cuantas
clases deberá dividirse el intervalo y después su amplitud. De acuerdo a la 63
experiencia, se recomienda entre 5 y 20 clases, resulta conveniente construirlas
de modo que todas las clases tengan la misma anchura, la cual recibe el nombre
de amplitud de Clase (A).
La selección del número adecuado de clases y los cortes entre ellas es un asunto
de criterio y(1926)
1ª Sturges de experiencia. Sin embargo,
que establece aquí se
que el número dedan unas
clases es:reglas empíricas para
calcular
K = 1 + el
lognúmero máximo de clases, (Hoaglin, et. al., (1983) p. 22 y sigs.):
2 n = 1 + 3.322 log n, la cual subestima el número de intervalos.
2ª Velleman (1976), K =
es recomendada cuando n es pequeño (n £ 50).
3ª Dixon y Kronmal (1965), K = 10 log n, para n grande (n > 50).
No se puede establecer que una es superior a otra, sólo pueden utilizarse como
un
Lospunto de hemos
autores referencia. Cabe aclarar
observado quever
se puede se que
considera solamente
para cualquier n, la
el parte
númeroentera
de
que resulteo del
intervalos cálculo.
clases que funciona bastante bien es;
.
Para el caso del ejemplo anterior se aplicara primero la regla de Sturges:
K
1 3.3 log(n)
Donde:
K=
Nº de Clases en que se divide la distribución o
Nº de Intervalos
Log2 = Logaritmo base 2.en que se divide la distribución.
n=
Número de datos de la distribución o conjunto
Al de datos.
tomar el ejemplo de los pesos en kilogramos, donde n=40, el
cálculo de Sutrges quedará:
K
1 3.3 log 40 = 1 3.3 1.6021
6.28
6
n
40 = 6.3
En caso de aplicar la regla empírica, tendremos: K
6
Para determinar el valor de la amplitud(A) es decir el ancho de cada intervalo, lo
calcularemos con la siguiente fórmula empírica:
A
R será el rango de la distribución; que se calculara con la siguiente fórmula:
R
,DM
donde:
R K
dm
R=
DM=
Dm=
Rango de la distribución
dato mayor de la distribución o conjunto de
datos
Dato menor de la distribución o conjunto de
datos.
Para nuestro ejemplo tendremos:
DM=
R=7373−49; =24
dm=49 por lo tanto el rango será:
R=24
K= Número de clases o intervalos que llevará la distribución.
Por lo tanto, la amplitud para nuestro ejemplo será:
A
R
K 24
6 4
A= 4
Con la Amplitud o ancho del intervalo y a partir del dato menor que es:
49 le sumaremos 4launidades
Geométricamente amplitudque representa
representa la amplitud
la base del intervalo
del rectángulo de caday así
barra del
sucesivamente
histograma; por hasta
tanto tener las seis clases que representa K.
tendremos:
49+4=53; 49 y 53 representan los límites superior e inferior de la primera clase
53+4=57;
Al construir53la ytabla
57 representan
con los límiteslos inferiores
límites superior e inferior
y superiores, de la segunda
tendremos clasede
los límites
57+4=61;
clase de la 57 y 61 representan
distribución los límites
de INTERVALOS
la siguiente superior e inferior de la tercera clase
manera:
61+4=65; 61 y 65 representan los límites DE superior
CLASE e inferior de la cuarta clase
[49 , 53)Tabla
65+4=69; 65 y 69 representan los límites superior 2 e inferior de la quinta clase
[ 53 , límites
57)
[69+4=73; 69intervalo
= Significa y 73 representan
cerrado,[57 losdecir,
es , 61) quesuperior
el e inferior
intervalo de laalsexta
contiene datoclase
o
número; en cambio,
( = Significa intervalo abierto,[61 indicando
, 65) lo contrario; es decir, que no lo contiene.
[65 ,conocer
Esta información nos servirá para 69) cuantos datos están contenidos dentro
de cada intervalo de clase, [69
por , 73]
ejemplo:
Para en el primer intervalo de clase : [49 , 53) tendremos los siguientes datos que
los llamaremos frecuencias absolutas de la primera clase: [ 49, 49.8, 49.8 , 50.0,
50.3, 50.5, 50.5, 50.6, 51.0, 52.0); el 53.5 lo tomaremos en cuenta hasta el
siguiente intervalo, así sucesivamente, hasta completar toda la distribución o
conjunto de datos.
El siguiente paso para construir la Tabla de Frecuencias, es contar el número de
Intervalos De observaciones
Clase que pertenecen a cada clase. Este número es llamado Frecuencia
Absoluta de clase (fa); Quedando de la siguiente manera:
[49 , 53)
[[57
53 ,, 61)
57)
[61 ,, 69)
[65 65)
[69 , 73] Conteo
Total
//// //// //
////
//// ///
/
///
//// ///
//// //// Frecuencia Absoluta(fa)
10
75
73
8 Marca de Clase
n=∑40 (Mc)59
51 63
55 67
DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS 71
Tabla 3
Ahora calcularemos el punto medio o marca de clase de cada intervalo; sumando
el Mc
límite de clase superior e inferior de cada clase y luego lo dividiremos entre 2,
originándose las siguiente fórmula:
Li
2
Ls
Donde:
Mc=
Li= Marca de clase o punto medio
Ls= Límitemedio
inferior
Entonces la marca de clase o punto de la primera clase será:
Límite Superior
Mc
clase se muestran en la distribución de frecuencias absolutas
MEDIA ARITMÉTICA PARA DATOS AGRUPADOS
Para calcular esta medida de centralización o tendencia central se tomaran en
cuenta las frecuencias absolutas
Mc= y la marca de clase de cada clase; mediante la
siguiente fórmula: fa=
Donde: Marca de clase
n= Frecuencia absoluta
49 53 X = Media aritmética Mcfade datos (frecuencias absolutas) de
Número
X 2 51 ; Y así sucesivamente con todas las clases, las marcas de
la distribución.
= Sumatoria
n
Ejemplo: De la tabla 3 calcularemos; la Media aritmética para datos agrupados;
Aplicando la fórmula tendremos lo siguiente:
X
Mcfa
X n
X
(10)(51) (7)(55) (5)(59) (3)(63) (7)(67) (8)(71)
40
MEDIANA PARA DATOS AGRUPADOS.
510 385 295
Para determinar la 189 nos2416
469 568
mediana apoyaremos en la siguiente fórmula:
X 60.4
Donde:
=
n4040
 
x Li 2
f a anteriores
f mediana

A

Li =n Límite
= Suma total de frecuencias
inferior de la mediana
absolutas
f a anteriores = Suma
las frecuencias de todas
absolutas
que anteceden a la
f mediana = Frecuencia de la
mediana
mediana
A= Amplitud
Ejemplo: De la tabla que se muestra a continuación del intervalo
calcularemos de clase para
la mediana
esta distribución.DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS
Intervalos De Clase
[49 , 53)
[[61
53 ,, 65)
57)
[57
[65 ,, 61)
69) Tabla 3
[69 , 73]
Total Frecuencia Absoluta(fa)
10
57

3 x
7
8
n=∑40
Determinaremos primero
n
2
que será en nuestro caso
contaremos el total de frecuencias absolutas de la segunda columna hasta llegar
a 20, sin exceder de esta cantidad ( (n 20) , es decir: 40
2 20 , después
f a anteriores = 10+7=17; ya que 17 es menor que 20 entonces
f mediana =5

5
L i=
A=61-57=4;
Sustituyendo los valores encontrados en la fórmula para la mediana, tendremos:

~=x
~ =66.6x
57
17 5
4
~ =57+9.6x
En el caso en que el número de clases de una5distribución de frecuencias sea
impar como la siguiente distribución
Limites ~ = 57 12 4x
de frecuencias, la mediana caerá en la clase
De Clase
que se encuentra a la mitad o en medio de la distribución
Frecuencias absolutas
4 5 5
8
2
1
20


30 ,40
x 40 ,50
total
50 contiene
Esto significa que la clase que ,60 a la mediana será la tercera clase, por lo
tanto
 la mediana será: 60 ,70
x 50 70,80
10 9
(10 ) 
8 x 51.25
MODA PARA DATOS AGRUPADOS.
Para calcular la moda, en una distribución de frecuencias absolutas,
observaremos
Limites de clasela columna de las frecuencias absolutas, después escogeremos la
frecuencia mayor de todas ellas. Ejemplo. La siguiente distribución de frecuencias
Frecuencias
nos muestra las estaturas absolutas
de 35 alumnos elegidos aleatoriamente
4 6
8
10
5
2
35
Tabla 4
En este caso específico será 10 la frecuencia mayor de todas las frecuencias
absolutas. Después procederemos a determinarla con la siguiente fórmula:
1.50 155
1.55 160
1.60 165
1.65 1.70
1.70 1.75
1.75 1.80
Totales

x 
Li da
da
dp
A
Donde:
Luego entonces:
Li=1.65
da=10-8=2
Sustituyendo los datos se tiene:
dp=10-5=5
A=0.05 
dxa= Diferencia
Moda anterior
para datos agrupados
 dp= Diferencia posterior

x 1.65 Li Límite inferior modal


2
25
0.05

x 1.65 2
 0.05
x 1.66 7

Potrebbero piacerti anche