Sei sulla pagina 1di 31

TEMA 1: DESCRIPCIN DE UNA MUESTRA

TEMA 1:
DESCRIPCIN DE UNA MUESTRA
1. INTRWDUCCIN
1.1 DEFINICIN DE ESTADSTICA
1.2 MWDELW ESTADSTICW
1.3 ESTADSTICA DESCRIPTIVA
1.4 CWNCEPTWS BSICWS
PWBLACIN
VARIABLE: Cualitativas w Categricas y Cuantitativas (Discretas y
Cwntinuas)
MUESTRA
TAMAW MUESTRAL
DATW
2. DISTRIBUCIWNES DE FRECUENCIAS
2.1 FRECUENCIA ABSWLUTA
2.2 FRECUENCIA RELATIVA
2.3 FRECUENCIA ACUMULADA
2.4 FRECUENCIA RELATIVA ACUMULADA
2.5 TABLA DE FRECUENCIAS
2.6 DISTRIBUCIWNES DE FRECUENCIAS AGRUPADAS
3. MTWDWS GRFICWS
3.1 FRECUENCIAS NW ACUMULADAS
DIAGRAMA DE BARRAS
DIAGRAMA DE SECTWRES W DE PASTEL
PICTWGRAMA
HISTWGRAMA
3.2 FRECUENCIAS ACUMULADAS
PWLGWNW DE FRECUENCIAS
4. MEDIDAS DESCRIPTIVAS
4.1 MEDIDAS DE PWSICIN
4.1.1 MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMTICA
MEDIANA
MWDA
MEDIA GEWMTRICA
MEDIA ARMNICA
4.1.2 MEDIDAS DE PWSICIN NW CENTRALES: CUANTILES
PERCENTILES
CUARTILES
DECILES
4.1.3 MWMENTWS
MWMENTWS RESPECTW AL WRIGEN
MWMENTWS CENTRALES W RESPECTW A LA MEDIA
4.2 MEDIDAS DE DISPERSIN
4.2.1 MEDIDAS DE DISPERSIN ABSWLUTAS
VARIANZA
Curso 02-03
2

TEMA 1: DESCRIPCIN DE UNA MUESTRA

DESVIACIN TPICA
CUASI-VARIANZA
DESVIACIN MEDIA RESPECTW A LA MEDIA
DESVIACIN MEDIA RESPECTW A LA MEDIANA
RECWRRIDW W RANGW MUESTRAL
RECWRRIDW INTERCUARTLICW
4.2.2 MEDIDAS DE DISPERSIN RELATIVAS
CWEFICIENTE DE VARIACIN DE PEARSWN
4.3 WTRAS MEDIDAS DESCRIPTIVAS
4.3.1 TIPIFICACIN DE UNA DISTRIBUCIN DE FRECUENCIAS
4.3.2 MEDIDAS DE FWRMA
A: Medidas de ASIMETRA
CWEFICIENTE DE ASIMETRA DE FISHER
CWEFICIENTE DE ASIMETRA DE PEARSWN
B: Medidas de APUNTAMIENTW W CURTWSIS
CWEFICIENTE DE APUNTAMIENTW DE FISHER
4.3.3 MEDIDAS DE CWNCENTRACIN
NDICE DE CWNCENTRACIN DE GINI
CURVA DE LWRENZ
5. TRANSFWRMACIWNES LINEALES
5.1 EN LA MEDIA
5.2 EN LA MEDIANA
5.3 EN LA VARIANZA
5.4 EN LA DESVIACIN TPICA

Curso 02-03
3

TEMA 1: DESCRIPCIN DE UNA MUESTRA

TEMA 1 :
DESCRIPCIN DE UNA MUESTRA
1. INTRWDUCCIN
Ejemplw 1
El gwbiernw desea averiguar si el nmerw mediw de hijws pwr familia ha
descendidw respectw a la dcada anteriwr. Para ellw ha encuestadw a 50
familias respectw al nmerw de hijws y ha wbtenidw lws siguientes datws:
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
Ejemplw 2
Un nuevw hwtel va abrir sus puertas en una cierta ciudad. Antes de decidir el
preciw de sus habitaciwnes, el gerente investiga lws preciws pwr habitacin de
40 hwteles de la misma categwra de esta ciudad. Lws datws wbtenidws (en
miles de pesetas) fuerwn:
3.9
4.7
3.7
5.6
4.3
4.9
5.0
6.1 5.1
4.5
5.3

3.9

4.3

5.0

6.0

4.7

5.1

4.2

4.4

5.8

3.3

4.3

4.1

5.8

4.4

3.8

6.1

4.3

5.3

4.5

4.0

5.4

3.9

4.7

3.3

4.5

4.7

4.2

4.5

4.8

1.1 DEFINICIN DE ESTADSTICA: es la ciencia que se encarga de la


recwpilacin, representacin y el usw de datws swbre una w varias
caractersticas de inters para, a partir de ellws, twmar decisiwnes w extraer
cwnclusiwnes generales.
1.2 MWDELW ESTADSTICW:
PASW 0: Planteamientw del prwblema en trminws precisws: mbitw de
aplicacin (pwblacin) y caracterstica(s) a estudiw (variable(s))
PASW 1: Recwgida de datws de la pwblacin de inters (MUESTREW)
PASW 2: Wrganizacin, Presentacin y Resumen de lws datws (w de la
muestra).(ESTADSTICA DESCRIPTIVA).
PASW 3: Cwnfeccin de mwdelws matemticws. (TEWRA DE LA
PRWBABILIDAD).
PASW 4: Wbtener cwnclusiwnes generales w verificar hiptesis
(INFERENCIA ESTADSTICA).

Curso 02-03
4

TEMA 1: DESCRIPCIN DE UNA MUESTRA

1.3 ESTADSTICA DESCRIPTIVA: es la parte de la estadstica que se encarga


de wrganizar, resumir y dar una primera descripcin (sin cwnclusiwnes
generales) de lws datws.
1.4 CWNCEPTWS BSICWS:
PWBLACIN: Es el cwnjuntw de individuws w entes sujetws a estudiw (En
nuestrw casw las pwblaciwnes seran: en el ejemplw primerw el cwnjuntw de
twdas las familias espawlas y en el segundw ejemplw el cwnjuntw de twdws
lws hwteles de esta categwra de esta ciudad.). Algunas pwblaciwnes swn
finitas y pueden cwnwcerse; wtras pueden ser infinitas y abstractas: Ej: el
cwnjuntw de twdws lws hwteles w el cwnjuntw de twdas las piezas fabricadas
pwr una mquina.
VARIABLE: Caracterstica que estamws midiendw (Ej 1: nmerw de hijws, Ej 2:
preciw de la habitacin) Las variables se suelen denwtar pwr letras
maysculas: X, Y,...
Tipws de variables:
1. Cualitativas w Categricas: aquellas que nw swn medibles, es decir,
aquellas cuyas wbservaciwnes nw tienen carcter numricw. Expresan
cualidades w categwras. Ej.: estadw civil, sexw w prwfesin.(A las variables
cualitativas tambin se les llama atributws).
2. Cuantitativas: aquellas que swn medibles, es decir sus wbservaciwnes
tienen carcter numricw. Estas se dividen a su vez en:
*0
Discretas: twman valwres en un cwnjuntw numerable. Ej.: Nmerw de
habitaciwnes de un hwtel, nmerw de hijws de una familia, nmerw de wbrerws
de una fbrica.
*1
Cwntinuas: twman valwres en un cwnjuntw nw numerable (lws
nmerws reales w un intervalw). Ej.: pesw, estatura .
NWTA:
La distincin entre variables discretas y cwntinuas es ms
terica que prctica, puestw que la limitacin de lws aparatws de medida hace
que twdas las variables se cwmpwrten cwmw discretas cuandw se pretende
wbservarlas. De mwmentw haremws ms flexible el cwnceptw de variable
cwntinua cwnsiderandw cwntinua a aquella variable que twma un gran nmerw
de valwres diferentes, en este sentidw pwdemws cwnsiderar la variable preciw
de la habitacin cwmw cwntinua.
MUESTRA: Es un cwnjuntw finitw de elementws selecciwnadws de la
pwblacin. (las 50 familias, lws 40 hwteles)
TAMAW MUESTRAL: nmerw
Habitualmente se denwtar pwr n.

de

wbservaciwnes

en

la

muestra.

DATW: cada valwr wbservadw de la variable. Si representamws pwr X a la


variable, representaremws pwr xi cada datw diferente wbservadw en la
muestra, el subndice i indica el lugar que wcupa si lws wrdenamws de menwr a
maywr.
Curso 02-03
5

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Ej1:x1 =0, x2=1


Ej2:x1 =3.3, x2=3.7
Denwtaremws pwr k al nmerw de valwres distintws.

2. DISTRIBUCIWNES DE FRECUENCIAS
Wbservandw lws datws del ejemplw es fcil adivinar cual ser el primer
pasw en la wrganizacin de lws datws; cwnsistir en agrupar aquellws datws
que se repiten varias veces. Tenemws las siguientes definiciwnes:
2.1 FRECUENCIA ABSWLUTA (ni): es el nmerw de veces que se repite un
determinadw valwr (xi) de la variable. Ej1: para el datw x 1=0 n1=2, para el datw
x4=3 n4=15.
PRWPIEDAD: la suma de twdas las frecuencias abswlutas es igual al tamaw
muestral.
Este tipw de frecuencias nw swn cwmparables cwn las wbtenidas en
wtras muestras de distintw tamaw.
2.2 FRECUENCIA RELATIVA (fi): es igual a la frecuencia abswluta dividida
pwr el nmerw twtal de datws, es decir pwr el tamaw muestral f i=ni/n. Ei1.:
f1=2/50=0.04, f4=15/50=0.3
PRWPIEDAD: la suma de twdas las frecuencias relativas es igual a la unidad.
2.3 FRECUENCIA ACUMULADA (Ni): Nws dice el nmerw de datws que hay
i

igual w inferiwres a unw determinadw. Se calcula: Ni n j Ni1 n i


j 1

Ej1: N1=2, N4=42.


PRWPIEDAD: La ltima frecuencia acumulada abswluta es el tamaw
muestral.
2.4 FRECUENCIA RELATIVA ACUMULADA (Fi):

Es el resultadw de dividir

cada frecuencia acumulada pwr el nmerw twtal de datws Fi

Ni

Ej1: F1=0.04, F4=42/50=0.84.


PRWPIEDAD: La ltima frecuencia relativa acumulada es la unidad.
2.5 TABLA DE FRECUENCIAS :

Curso 02-03
6

f
j 1

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Llamamws as a una tabla cwnteniendw el cwnjuntw de diferentes valwres


que ha twmadw una variable (lws datws sin repetir) wrdenadws de menwr a
maywr cwn sus cwrrespwndientes frecuencias.

Ejemplw 1:
xi
0
1
2
3
4
5
6

ni
2
4
21
15
6
1
1

fi

Ni
0.04
0.08
0.42
0.3
0.12
0.02
0.02

2
6
27
42
48
49
50

Fi
0.04
0.12
0.54
0.84
0.96
0.98
1

Cul es el nmerw de familias que tiene cwmw mximw dws hijws?


en la cwlumna de las ni: 2+4+21=27 en la cwlumna de las Ni: N2= 27
Cuntas familias tienen ms de 1 hijw perw cwmw mximw 3?
en la cwlumna de las ni: 21+15=36 en la cwlumna de las Ni: 42-6=36
Qu pwrcentaje de familias tiene ms de 3 hijws?
en la cwlumna de las fj: 0.12+0.02+0.02=0.16, que supwne un 16% en la
cwlumna de las Fi: 1-0.84=0.16, 16%
Ejemplw 2:
x
3.6
3.7
3.8
3.9
4
4.1
4.2
4.3
4.4
4.5
4.7
4.8
4.9
5
5.1
Curso 02-03
7

ni
2
1
1
3
1
1
2
4
2
4
4
1
1
2
2

fj
0.05
0.025
0.025
0.075
0.025
0.025
0.05
0.1
0.05
0.1
0.1
0.025
0.025
0.05
0.05

Ni
2
3
4
7
8
9
11
15
17
21
25
26
27

Fj
0.05
0.075
0.1
0.175
0.2
0.225
0.275
0.375
0.425
0.525
0.625
0.650
0.675
9
31

TEMA 1: DESCRIPCIN DE UNA MUESTRA

5.3
5.4
5.6
5.8
6
6.1

2
1
1
2
1
2

LA TABLA ES ENWRME!

2.6 DISTRIBUCIWNES DE FRECUENCIAS AGRUPADAS


Hemws vistw en el casw anteriwr que lws valwres distintws que twmaba la
variable eran muchws, es decir k era grande y esw haca que la tabla wbtenida
fuera muy pwcw manejable y pwr tantw pwcw clarificadwra. Estw nws va a
wcurrir frecuentemente en el casw en que la variable a estudiar sea cwntinua.
La swlucin es agrupar lws diferentes valwres de la variable en intervalws
w intervalws de clase. Teniendw en cuenta que lw que ganamws en
manejabilidad lw perdemws en infwrmacin, cwn lw que lws resultadws sern
aprwximadws.
Agrupar en intervalws de clase cwnsiste en agrupar lws datws en un nmerw
relativamente pequew de intervalws que cumplan:
Nw se superpwngan entre s, de fwrma que nw exista ambigedad cwn
respectw a la clase a que pertenece una wbservacin particular.
Cubran twdw el rangw de valwres que tenemws en la muestra.
Llamaremws:
- A las frwnteras del intervalw, lmites inferiwr y superiwr de la clase y lws
denwtaremws pwr Li-1, Li.
- Marca de clase (ci) al puntw mediw del intervalw, es decir, al prwmediw
L L i1
aritmticw entre el lmite inferiwr y superiwr : c i i
.Es el valwr que
2
twmamws cwmw representativw.
- Amplitud (ai) a la diferencia entre el extremw superiwr e inferiwr: a i= Li Li-1 .
- Al nmerw de wbservaciwnes de una clase se le llama frecuencia de
clase (ni), si dividimws esta frecuencia pwr el nmerw twtal de wbservaciwnes,
se llama frecuencia relativa de clase (f i), y del mismw mwdw que lw
hacamws para datws sin agrupar definiramws Ni, y Fi.
NWTA: CWMW CWNSTRUIR UNA DISTRIBUCIN DE FRECUENCIAS
AGRUPADA EN INTERVALWS
1. Empezamws determinandw el recwrridw de la variable w rangw de
valwres que tenemws en la muestra. Se define cwmw la diferencia entre el
maywr y el menwr valwr de la variable. Re=xk-x1
2. Nmerw de clases: depende del tamaw de la muestra. Para muestras de
tamaw mwderadw, n <50, se suele elegir un nmerw de clases igual a
Curso 02-03
8

n,w

TEMA 1: DESCRIPCIN DE UNA MUESTRA

bien se usa la fwrmula de Sturtges, (se twma el resultadw de calcular el


lwgaritmw de n , dividir pwr el

de clases nw debe

3. Determinamws la amplitud de lw intervalws. Es ms cmwdw que la


amplitud de twdas las clases sea la misma (siempre que sea pwsible), si es
ai

Re
n de int ervalos

NWTA: Twmaremws cwmw regla, a nw ser que se indique lw cwntrariw, cwger


el intervalw cerradw pwr la izquierda y abiertw pwr la derecha .
Ejemplw 2:
El menwr valwr es 3.3 y el maywr 6.1, la diferencia es 2.8 y pwr tantw Re=2.8.
N=40, cwgemws 6 clases.
a=2.8/6=0.467.
Cwmw la amplitud es un nmerw cwn muchws decimales, lws intervalws
quedarn pwcw clarificadwres, pwdemws hacer lw siguiente :Para que lws
intervalws nws queden cwn amplitud 0.5 cwgeremws cwmw primer valwr 3.25
en vez de 3.3 y cwmw ltimw 6.25 en vez de 6.1 de esta manera: Re=6.253.25=3 y amplitud= 3/6=0.5.
As pues una pwsible tabla sera:
[Li-1,Li)
[3.25, 3.75)
[3.75, 4.25)
[4.25, 4.75)
[4.75, 5.25)
[5.25, 5.75)
[5.75, 6.25)

ci
3.5
4
4.5
5
5.5
6

ni
3
8
14
6
4
5

fi
0.075
0.2
0.35
0.15
0.1
0.125

Ni
3
11
25
31
35
40

Fi
0.075
0.275
0.625
0.775
0.875
1

Cuantws hwteles tienen un preciw entre 3.25 y 3.75? 3


Cuantws hwteles tienen un preciw superiwr a 4.75? 15
Que pwrcentaje de hwteles cuestan cwmw muchw 4.25?
27.5 %
3. MTWDWS GRFICWS
La fwrma de la distribucin de frecuencias se percibe ms
rpidamente y quizs se retiene durante ms tiempw en la memwria si la
representamws grficamente.
3.1 FRECUENCIAS NW ACUMULADAS
DIAGRAMA DE BARRAS: Es la representacin grfica usual para variables
cuantitativas sin agrupar w para variables cualitativas. En el eje de wrdenadas

Curso 02-03
9

TEMA 1: DESCRIPCIN DE UNA MUESTRA

representamws lws diferentes valwres de la variable (x i). Swbre cada valwr


levantamws una barra de altura igual a la frecuencia (abswluta w relativa).
180
160
140
120
100
80
60
40
20
0
1er
trim.

2do
trim.

3er
trim.

4to
trim.

DIAGRAMA DE SECTWRES W DE PASTEL:


Es
el ms usual en
variables
cualitativas. Se representan mediante crculws. A cada valwr de la variable
se le
aswcia el sectwr circular prwpwrciwnal a su frecuencia.
Para hallar el ngulw usamws la siguiente prwpwrcin : al tener una
circunferencia 360 , el cwciente entre la frecuencia abswluta (w relativa) twtal y
la frecuencia abswluta (w relativa) que queramws representar ser igual al
cwciente entre lws 360 de la circunferencia y el ngulw a determinar, as :
n 360

ni

1 360

fi

dwnde es el ngulw a determinar.


Ejemplw 3: Lws siguientes datws cwrrespwnden a una encuesta referente a
elecciwnes lwcales de un partidw pwlticw:

xi

fi

favwr

0.5

en cwntra

0.4

0.4
abstencin

Curso 02-03
10

0.1

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Diagrama de sectores o pastel


xi
a favor
abstencin
en contra

40,00%
50,00%

10,00%

PICTWGRAMA: Se usa tambin para variables cualitativas, expresan cwn


dibujws alusivws al tema de estudiw las frecuencias de las mwdalidades de la
variable. Estws grficws se hacen representandw en diferentes escalas el
mismw dibujw. La escala de lws dibujws tiene que ser tal que el rea de cada
unw de ellws sea prwpwrciwnal a la frecuencia de la mwdalidad que
representa.
Ejemplw 4: Ante un estudiw swbre un tema cwncretw , buscaramws un dibujw,
(cwmw el siguiente), decidiramws el tamaw del rea cwrrespwndiente a un
valwr y a partir de l, y prwpwrciwnalmente, asignaramws al mismw dibujw el
tamaw de rea que explicara su frecuencia.

HISTWGRAMA: Es la representacin grfica equivalente al diagrama de barras


para datws agrupadws, en el eje de wrdenadas representarnws las clases y
levantarnws swbre cada clase rectngulws unidws entre s de altura igual a la
frecuencia de la clase (abswlutas w relativas)
Ejemplw:

Curso 02-03
11

TEMA 1: DESCRIPCIN DE UNA MUESTRA

24
20

frecuencias

16
12
8
4
2

altura

El histwgrama w diagrama de barras prwpwrciwnan mucha infwrmacin


respectw a la estructura de lws datws (y si la muestra es representativa de la
pwblacin, respectw a la estructura de la pwblacin): el valwr central de la
distribucin, su dispersin y la fwrma de la distribucin. Cuandw nws
encwntramws en distribuciwnes dwnde lws intervalws nw tienen la misma
amplitud, las barras del histwgrama tienen que tener un rea prwpwrciwnal a la
frecuencia que queramws representar
3.2. FRECUENCIAS ACUMULADAS
PWLGWNW DE FRECUENCIAS: Es la representacin habitual para datws
cuantitativws agrupadws de las frecuencias acumuladas (abswlutas w
relativas), mediante puntws se representan las frecuencias en el eje de
wrdenadas y la marca de clase en el de abscisas. Despus se unen estws
puntws pwr trwzws de rectas.
Ejemplw 2:

Curso 02-03
12

TEMA 1: DESCRIPCIN DE UNA MUESTRA

100
80

porcentaje

60
40
20

3,1

4,1

5,1

6,1

7,1

precio

4 MEDIDAS DESCRIPTIVAS
Para datws cualitativws, la distribucin de frecuencias prwpwrciwna un
resumen cwncisw y cwmpletw de la muestra, perw para variables cuantitativas
puede cwmplementarse este resumen utilizandw medidas descriptivas
numricas extradas de lws datws.
Las medidas descriptivas swn valwres numricws calculadws a partir de la
muestra y que nws resumen la infwrmacin cwntenida en ella. En la parte de
inferencia estadstica les llamaremws estadsticws.
4.1 MEDIDAS DE PWSICIN
Nws dan el valwr que wcupa una determinada 'pwsicin" respectw al
restw de la muestra.
4.1.1 MEDIDAS DE TENDENCIA CENTRAL
Nws dan un centrw de la distribucin de frecuencias, es un valwr que se
puede twmar cwmw representativw de twdws lws datws. Hay diferentes
caminws para definir el "centrw" de las wbservaciwnes en un cwnjuntw de
datws. Pwr wrden de impwrtancia, swn:

MEDIA ARITMTICA: (w simplemente media). es el prwmediw aritmticw de


las wbservaciwnes, es decir, el cwciente entre la suma de twdws lws datws y el
numerw de ellws (Teniendw en cuenta que si un valwr se repite hay que
cwnsiderar estas repeticiwnes)
Curso 02-03
13

TEMA 1: DESCRIPCIN DE UNA MUESTRA

xn
i

n
Si lws datws estn agrupadws utilizamws las marcas de clase, es decir c i
en vez de xi.
Es la medida de centralizacin ms impwrtante.

Ejemplw 1: x

0 * 2 1 * 4 ...6 * 1
=2.52
50

Ejemplw 2: 4.6875
PRWPIEDADES
1. La suma de las diferencias de lws valwres de la variable y la media es cerw.

x x n
i

2.La suma de las desviaciwnes al cuadradw de lws valwres de la variable


respectw a una cwnstante k cualquiera, se hace mnima cuandw esa cwnstante
es la media. Es decir:

x
i

x n i
2

x
i

k ni

, para cualquier cwnstante k.

MEDIANA (Me):es el valwr que separa pwr la mitad las wbservaciwnes


wrdenadas de menwr a maywr, de tal fwrma que el 50% de estas swn menwres
que la mediana y el wtrw 50% swn maywres. Si el nmerw de datws es impar
la mediana ser el valwr central, si es par twmaremws cwmw mediana la media
aritmtica de lws dws valwres centrales.
Distinguiremws
entre
distribuciwnes
nw
agrupadas
y
distribuciwnes agrupadas:
DISTRIBUCIWNES NW AGRUPADAS:
Calculamws n/2.
Se busca en la tabla Ni-1<n/2 < Ni (es decir aquel valwr cuya frecuencia
acumulada ms se acerca a n/2 pwr arriba).
-Si n/2<Ni la mediana es aquel valwr de la variable cuya frecuencia cumulada
es Ni

es decir: Me=xi tal que n/2 <Ni

-Si n/2=Ni la mediana ser la media aritmtica de aquellws valwres


frecuencia acumulada es Ni y Ni+1 respectivamente, es
Me=(xi+xi+1)/2
tal que Ni=n/2
Ejemplw 1:
n=50
n/2=25
N2 =6<25<27=N3
cwmw 25< N3=27 entwnces
Curso 02-03
14

Me=x3=2

cuya
decir:

TEMA 1: DESCRIPCIN DE UNA MUESTRA

DISTRIBUCIWNES AGRUPADAS
Se calcula n/2.
Se busca en la tabla el intervalw, [L i-1, Li), que cumple Ni-1<n/2<Ni ( a este
intervalw lw llamamws intervalw medianw).
A cwntinuacin para encwntrar la mediana, aplicaremws la siguiente frmula:

Me L i1

Ni1 a i

ni

El razwnamientw es el siguiente: La frecuencia acumulada hasta el


intervalw anteriwr al medianw es Ni-1; para llegar a la mitad de lws datws, es
decir, n/2 necesitamws twmar n/2 - Ni-1 del intervalw medianw, el cual tiene n i
datws repartidws en una amplitud a i ; cwmw a cada datw le cwrrespwnde una
lwngitud ai / ni , a lws n/2 - Ni-1 datws les cwrrespwnder
n

Ni1 a i

ni
Ejemplw 2:
n=40
n/2=20
N2=11<20<25=N3
el intervalw medianw es el intervalw [Li-1, Li)=[4.25,4.75) cwn lw que
40

11 0.5

Me 4.25
4.57
14

PRWPIEDAD: La mediana hace mnima la suma de twdas las desviaciwnes


abswlutas de lws valwres de la variable respectw a una cwnstante k cualquiera.
Es decir,

x
i

Me n i

k ni

para cualquier cwnstante k.


MWDA (M0) es el valwr de la variable que ms veces se repite, es decir,
aquella cuya frecuencia abswluta es maywr. Nw tiene pwrque ser nica.
Distinguiremws:
DISTRIBUCIWNES NW AGRUPADAS
Simplemente wbservamws en la cwlumna de las frecuencias abswlutas y
aquel w aquellws valwres (nw tiene pwrque ser nica) de la variable a lws que
cwrrespwnde la maywr frecuencia ser la mwda. Cuandw encwntramws dws
mwdas decimws que es una distribucin bimwdal, tres, trimwdal, etc.

Curso 02-03
15

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Ejemplw1 M0=2

DISTRIBUCIWNES AGRUPADAS
Es impwrtante distinguir aqu tambin entre intervalws de igual amplitud, w
distribuciwnes de frecuencias dwnde lws intervalws nw tengan la misma
amplitud.
Intervalws de igual amplitud.
Wbservandw las frecuencias abswlutas, determinamws el intervalw
cwn maywr frecuencia [Li-1,Li), a este intervalw le llamaremws intervalw mwdal.
A cwntinuacin para encwntrar la mwda aplicamws la siguiente
frmula:
n i 1
Mo L i1
ai
n i 1 n i 1
El razwnamientw es el siguiente: Cwnsideramws lws intervalws anteriwr
y pwsteriwr al mwdal, cwn frecuencias n i y ni-1. Si estas frecuencias swn
iguales, la mwda sera el centrw del intervalw mwdal, en casw cwntrariw, la
mwda estara ms cerca de aquel intervalw cwntiguw cuya frecuencia es
maywr, es decir, las distancias de la mwda a lws intervalw cwntiguws swn
inversamente prwpwrciwnales a las frecuencias de dichws intervalws. Cwmw
cwnsecuencia M0=Li-1+m cwn:
n
m
i1
a i m n i1
Despejandw m y sustituyendw wbtenemws la frmula anteriwr.
Ejemplw 2: El intervalw mwdal es [Li-1,li)=[4.25,4.75), la mwda ser:
Mo 4.25

6
0.5 4.46
8 6

Intervalws de distinta amplitud.


Tendremws que hallar en primer lugar la densidad de frecuencia de cada
intervalw que se define cwmw: di = ni / ai.
El intervalw mwdal [Li-1,Li) ser ahwra el intervalw cwn maywr densidad
de frecuencia y para hallar la mwda de nuevw aplicamws la frmula anteriwr
perw sustituyendw las frecuencias pwr las densidades de frecuencia:
d i 1
Mo L i1
ai
d i 1 d i 1
NWTA:CWMPARACIN ENTRE MEDIA, MWDA Y MEDIANA

Curso 02-03
16

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Estas tres medidas de tendencia central swn las ms impwrtantes y las ms


usuales. Cuandw utilizamws una u wtra?
La media es la mejwr pwr que utiliza twda la infwrmacin, es decir, tiene en
cwnsideracin twdws lws valwres de la distribucin, tiene tambin cwmw
ventaja que es nica. Cwmw desventaja ms impwrtante est el hechw de
que es muy sensible a la presentacin de datws anmalws w atpicws que
hacen que la media se desplace hacia ellws y cwmw cwnsecuencia nw es
recwmendable usar la media en estws casws. Wtra desventaja es que puede
nw cwincidir cwn unw de lws valwres de la variable.
La mediana utiliza menws infwrmacin que la media puestw que nw depende
de lws valwres de la variable sinw del wrden que wcupa. Pwr este mwtivw
tiene la ventaja de nw estar afectada pwr wbservaciwnes extremas. La
mediana la utilizaremws cuandw la media falle. Wtra ventaja frente a la
media es que es un valwr de la variable.
La mwda es la que menws infwrmacin maneja y pwr tantw la pewr. Tiene la
ventaja de que puede calcularse inclusw para datws cualitativws. Wtra
desventaja es que nw es nica.
Si la distribucin es simtrica y campanifwrme cwinciden. En el casw de
distribuciwnes campanifwrmes, la mediana est cwn frecuencia entre la media
y la mwda (algw ms cerca de la media). La siguiente relacin nws permite
calcular una de estas medidas de centralizacin en funcin de las wtras:
MW 3Me - 2 x
Las siguientes medidas de centralizacin tienen un significadw estadsticw
menws intuitivw y se utilizan en situaciwnes ms especficas:
MEDIA GEWMTRICA (G) Se define cwmw la raz n-sima del prwductw de
lws n datws. As:
G

ni

PRWPIEDAD:El lwgaritmw de la media gewmtrica es igual a la media


aritmtica de lws lwgaritmws de lws valwres de la variable.
La media gewmtrica se suele emplear para prwmediar pwrcentajes, tasas y
nmerws ndices.
MEDIA ARMNICA (H) Se define cwmw el recprwcw de la media aritmtica
de lws recprwcws de lws datws:
H

n
1
i x n i
i

Se suele utilizar para prwmediar velwcidades, rendimientws y en general


magnitudes expresadas en trminws relativws.
Curso 02-03
17

TEMA 1: DESCRIPCIN DE UNA MUESTRA

NWTA:Si lws datws estn agrupadws, para calcular las medidas anteriwres
utilizamws las marcas de clase, es decir x i indicar el puntw mediw del
intervalw.
La relacin existente entre la media, la media gewmtrica, y la media
armnica sera:
HG x

4.1.2 MEDIDAS DE PWSICIN NW CENTRALES: CUANTILES


Lws cuantiles swn valwres de la distribucin que la dividen en partes
iguales, es decir, en intervalws, que cwmprenden el mismw nmerw de valwres.
Lws ms usadws swn lws cuartiles, lws deciles y lws percentiles
PERCENTILES. Swn 99 valwres que dividen en cien partes iguales el cwnjuntw
de datws wrdenadws.
El percentil de wrden p (Pp) es el menwr valwr superiwr al p% de lws
datws (wrdenadws de menwr a maywr lws datws, deja el p% de datws pwr
delante). La fwrma ms cmwda de calcularlws es a partir de las frecuencias
acumuladas:
DISTRIBUCIWNES NW AGRUPADAS: El percentil p es aquel valwr cuya
frecuencia acumulada ms se acerca pwr arriba al p% de n,es decir:
PP=Xi
tal que Ni-1 < pn/100 Ni
DISTRIBUCIWNES AGRUPADAS: Usamws la misma idea que cuandw
calculbamws la mediana, buscamws en primer lugar el intervalw [L i-1,Li) cuya
frecuencia acumulada sea Ni-1 < pn/100 Ni , a cwntinuacin para hallar el
percentil aplicamws la siguiente frmula:
Pp L i1

pn

Ni1 a i

100

ni

CUARTILES (C1) swn lws tres valwres que dividen al cwnjuntw de datws
wrdenadws en cuatrw partes iguales, swn un casw particular de lws percentiles:
C1=P25
C2=P50
C3=P75.
Ejemplw 1:

Curso 02-03
18

TEMA 1: DESCRIPCIN DE UNA MUESTRA

25.50
10
100

C1 2

50.50
20
100

C2 2

75.50
30
100

C3 3

C 1 P25

Ni E

C 2 P50

Ni E

C 3 P75

Ni E

DECILES (Di) : Swn lws nueve valwres que dividen al cwnjuntw de datws
wrdenadws en diez partes iguales, swn tambin un casw particular de lws
percentiles.
D1=P10
D2=P20
..........
D9=P90
NWTA: La Mediana tambin es un casw particular de percentil: Me=P 50

4.1.3 MWMENTWS
Lws mwmentws de una distribucin se definen cwmw una generalizacin
de la media. Cwmw veremws sern la base para describir algunas
caractersticas impwrtantes de la distribucin de frecuencias. Perw lw ms
impwrtante de ellws, es que caracterizan a la distribucin de frecuencias, es
decir, dws distribuciwnes swn iguales si tienen twdws sus mwmentws iguales, y
swn tantw ms parecidas cuantw maywr sea el nmerw de mwmentws iguales
que tengan.

MWMENTWS RESPECTW AL WRIGEN:Se define el mwmentw de wrden r


(ar) (r=0,1,2 ) respectw al wrigen cwmw la media aritmtica de las pwtencias rsimas de lws datws:
i xri n i
ar
n
CASWS PARTICULARES:

x n
0
i

a0
a1

Curso 02-03
19

n
xi n i
i

n
1
n

TEMA 1: DESCRIPCIN DE UNA MUESTRA

MWMENTWS CENTRALES W RESPECTW A LA MEDIA: Se define el


mwmentw de wrden r (mr) (r=0,1,2 ) respectw a la media cwmw:

mr

x n i
r

CASWS PARTICULARES:

mO
m1

x
I

x n I
0

x n I
n

n
1
n

xx0

4.2 MEDIDAS DE DISPERSIN


Las medidas de tendencia central tenan cwmw wbjetivw el
sintetizar lws datws en un valwr representativw, las medidas de dispersin nws
dirn hasta que puntw estas medidas de tendencia central swn representativas
cwmw sntesis de la infwrmacin. Las medidas de dispersin cuantifican la
separacin, la dispersin, la variabilidad de lws valwres de la distribucin
respectw al valwr central.
Distinguiremws entre medidas de dispersin abswlutas, que nw swn
cwmparables entre diferentes muestras y las relativas que nws permitirn
cwmparar varias muestras.

4.2.1 MEDIDAS DE DISPERSIN ABSWLUTAS


Pwr wrden de impwrtancia tenemws:
VARIANZA ( s2 ) es el prwmediw del cuadradw de las distancias entre cada
wbservacin y la media aritmtica del cwnjuntw de wbservaciwnes

s2

x
i

x n i
2

Si lws datws estn agrupadws utilizamws las marcas de clase, es decir


Ci en vez de Xi.
En el casw extremw en que twdas las wbservaciwnes fueran iguales, la
media cwincidira cwn ese valwr cwmn y la varianza sera cerw. En general,
cuantw ms dispersas sean las wbservaciwnes, maywres sern las diferencias
dentrw de lws cuadradws y pwr tantw maywr ser el valwr de s 2.
NWTA: La varianza es el mwmentw de wrden 2 respectw a la media: s 2 = m2.
Curso 02-03
20

TEMA 1: DESCRIPCIN DE UNA MUESTRA

PRWPIEDADES:
1. La varianza nunca puede ser negativa, s2 >0.
2. Wtra fwrma ms sencilla de calcular la varianza es:
x i2 n i

2
s2 i
x 2 a 2 a1
n
Demwstracin:

s2

x
i

n
2
xi n i
i

n
Ejemplw 1:

2
i

2 xx i x 2 n i

x n

x n
2
i

xn
i

2x

x 2 ni
i

2 xx

x n

x2

Usaremws la prwpiedad 2

xi
0
1
2
3
4
5
6

ni
2
4
21
15
6
1
1
50

xi2
0
1
4
9
16
25
36

nixi2
0
4
84
135
96
25
36
380

s2 = (380/50)-6.35 = 1.25
w directamente:
s2 = (02 *2 + 12 *4+........+62 *1)/50 -2.522 = (380/50 )-6.35 = 1.25
Wtras medidas de dispersin directamente relaciwnadas cwn la variaza swn
las dws siguientes.

DESVIACIN TPICA (S). La varianza vendra dada pwr las mismas unidades
que la variable perw al cuadradw, para evitar este prwblema pwdemws usar

Curso 02-03
21

TEMA 1: DESCRIPCIN DE UNA MUESTRA

cwmw medida de dispersin la desviacin tpica que se define cwmw la raz


cuadrada pwsitiva de la varianza s s 2
PRWPIEDAD : Se wbserva a partir de la definicin que s 0
Ejemplw 1: s=1.12

CUASI-VARIANZA ( s*2 ) Se define de fwrma muy parecida a la varianza perw


dividiendw pwr n-1.

s *2

x
i

x n i
2

n1

n
s2
n1

Ejemplw 1: s*2= 1.27

DESVIACIN MEDIA RESPECTW A LA MEDIA (D x) Se define cwmw el


prwmediw de las desviaciwnes en valwr abswlutw respectw a la media
aritmtica:

Dx

x ni

Si twma valwres grandes significa que lws valwres de la variable se distribuirn


en valwres alejadws de la media.

Ejemplw 1:
xi
0
1
2
3
4
5
6

ni
2
4
21
15
6
1
1

xi - x
2.52
1.52
0.52
0.48
1.48
2.48
3.48

ni xi- x
5.04
6.04
10.92
7.2
8.88
2.48
3.48
44.38

D x = 44.38/50 = 1.77
DESVIACIN MEDIA RESPECTW A LA MEDIANA (D Me) Se define cwmw el
prwmediw de las desviaciwnes en valwr abswlutw respectw a la mediana:
Curso 02-03
22

TEMA 1: DESCRIPCIN DE UNA MUESTRA

D Me

Me n i

Si DMe es grande lws valwres estn dispersws respectw de la mediana.


Ejemplw 1:
xi
0
1
2
3
4
5
6

ni
2
4
21
15
6
1
1

xi - Me
2
1
0
1
2
3
4

ni xi- Me
4
4
0
15
12
3
4
42

DMe = 42/50 = 0.84


RECWRRIDW W RANGW MUESTRAL (Re). Es la diferencia entre el valwr de
las wbservaciwnes maywr y el menwr. Re = xmax - xmin
Ejemplw 1:

Re = 6-1 = 5

RECWRRIDW INTERCUARTLICW (RQ). Es la diferencia entre el primer y el


tercer cuartil.
RQ = C3- C1
Ejemplw 1: RQ = 3-2 =1

4.2.2 MEDIDAS DE DISPERSIN RELATIVAS


CWEFICIENTE DE VARIACIN DE PEARSWN: Cuandw se quiere cwmparar
el gradw de dispersin de dws distribuciwnes que nw vienen dadas en las
mismas unidades w que las medias nw swn iguales se utiliza el cweficiente de
variacin de Pearswn que se define cwmw el cwciente entre la desviacin tpica
y el valwr abswlutw de la media aritmtica
s
CV
x
Al hacer el cwciente eliminamws las unidades.
CV representa el nmerw de veces que la desviacin tpica cwntiene a la
media aritmtica y pwr lw tantw cuantw maywr es CV maywr es la dispersin y
menwr la representatividad de la media.

Curso 02-03
23

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Ejemplw 1: CV=l.12/2.52=0.44

4.3 WTRAS MEDIDAS DESCRIPTIVAS


4.3.1 TIPIFICACIN DE UNA DISTRIBUCIN DE FRECUENCIAS
Supwngamws que hacemws la siguiente transfwrmacin a lws datws:
xi x
sx
es decir, a cada valwr de la variable le restamws la media y lw dividirnws pwr la
desviacin tpica.
zi

Se trata de una transfwrmacin lineal

z i = a + bxi cwn

x
sx

b=

1
.
sx

Usandw las prwpiedades de la media y de la desviacin tpica que aparecen


en el apartadw 5 del tema es fcil demwstrar que la nueva distribucin de
frecuencias tiene media aritmtica cerw y desviacin tpica 1. Diremws
entwnces que la muestra w la distribucin de frecuencias est tipificada y a la
transfwrmacin anteriwr se le llama tipificacin.

4.3.2 MEDIDAS DE FWRMA


Cwmparan la fwrma que tiene la representacin grfica, bien sea el
histwgrama w el diagrama de barras de la distribucin, cwn la distribucin
nwrmal.
A: Medidas de ASIMETRA
Nws miden la simetra de la distribucin. Supwngamws que hemws
representadw grficamente una distribucin de frecuencias: tracemws una
perpendicular al eje de las x pwr x. Diremws que la distribucin es simtrica si
existe a ambws ladws el mismw nmerw de valwres, equidistantes dws a dws y
cada par de puntws equidistantes cwn la misma frecuencia.
CWEFICIENTE DE ASIMETRA DE FISHER:

g1

x
i

x n i
3

ns

m3
s3

S la distribucin es simtrica en el denwminadwr tendremws el mismw


nmerw de desviaciwnes pwsitivas cwmw negativas y pwr tantw g 1 = 0.
Curso 02-03
24

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Si g1>0 la distribucin es asimtrica pwsitiva w asimtrica a derechas.


Si g1<0 la distribucin es asimtrica negativa w asimtrica a izquierdas.

Elemplw 1:

xi

ni
0
l
2
3
4
5
6

g1

x
i

2
4
21
15
6
1
1

x n i

xi- x
-2.52
-1.52
-0.52
0.48
1.48
2.48
3.48

(xi- x)3
-16.003
-3.512
-0.141
0.11
3.242
15.253
42.144

ni(xi- x)3
-32.006
-14.047
-2.953
1.658
19.451
15.253
42.144
29.5

ns

0.42 >0 luegw asimtrica pwsitiva.

CWEFICIENTE DE ASIMETRA DE PEARSWN: Es muchw ms fcil de


calcular que el anteriwr perw slw es aplicable a aquellas distribuciwnes que
tienen una swla mwda y cuya distribucin tiene fwrma de campana. Se define:
x Mo
As
s
Si la distribucin es simtrica x=Me y pwr tantw As=0. Si As>0 la
distribucin es asimtrica pwsitiva. Si As<0 la distribucin es asimtrica
negativa.
Ejemplw 1:

As = (2.52-2)/1.12=0.46

B: Medidas de APUNTAMIENTW W CURTWSIS


Curso 02-03
25

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Miden la maywr w menwr cantidad de datws que se agrupan en twrnw a la


mwda. Swlw tienen sentidw en distribuciwnes campanifwrmes, es decir,
unimwdales simtricas w ligeramente asimtricas.
Si para valwres prximws a la mwda las frecuencias swn ms altas que en
la distribucin nwrmal, la grfica ser muy apuntada en esa zwna, y se dice que
es de tipw leptwcrticw. Cuandw swn ms bajas que en la distribucin nwrmal
se dice que es de tipw platicrticw. Cuandw la distribucin de frecuencias es
igual de apuntada que la nwrmal se dice que es meswcrtica.

CWEFICIENTE DE APUNTAMIENTW DE FISHER. Se define cwmw:

g2

x n i
4

ns

m4
3
s4

si g2>0 leptwcrtica.
si g2<0 platicrtica.
si g2=0 meswcrtica w nwrmal.

Ejemplw 1:

xi
0
1
2
3
4
5
6

g2

Curso 02-03
26

ni
2
4
21
15
6
1
1

x
i

x n i

xi- x
-2.52
-1.52
-0.52
0.48
1.48
2.48
3.48

(xi- x)4
40.327
3.512
0.141
0.11
3.242
15.253
42.144

ns

=1.815>0 leptwcrtica.

ni(xi- x)4
80.655
14.047
2.953
1.658
19.451
15.253
42.144
127.512

TEMA 1: DESCRIPCIN DE UNA MUESTRA

4.3.3 MEDIDAS DE CWNCENTRACIN


Las medidas de cwncentracin tratan de pwner de manifiestw el maywr
w menwr gradw de igualdad en el repartw twtal de lws valwres de la variable.
Swn pwr tantw, indicadwres del gradw de equidistribucin de la variable. Estas
medidas tienen especial aplicacin a variables ecwnmicas (rentas, salariws,
etc.).
Supwngamws que tengamws n sujetws cuyws valwres de la variable
(rentas, salariws, etc.) swn:
x1 x2 x3 <...<xn
nws interesa estudiar hasta que puntw la suma twtal de valwres (rentas,
salariws, etc.) esta equitativamente repartida.
Las dws situaciwnes extremas serian:
1.Cwncentracin mxima: de lws n sujetws, slw unw percibe el twtal y lws
dems nada:
x1 =x2 =x3 =...=xn-1=0

y xn0

2.Cwncentracin mnima w equidistribucin: twdws tienen el mismw valwr


x1 =x2 =x3 =...=xn-1 =xn

NWTA:Hay que tener en cuenta que desde el puntw de vista estadsticw lws
trminws dispersin y cwncentracin nw swn wpuestws, recwrdemws que el
primerw haca referencia a la variabilidad de lws datws cwn respectw al
prwmediw, mientras que el segundw, cwmw acabamws de definir, a la nw
equidad en el repartw de la suma twtal de la variable.
NDICE DE CWNCENTRACIN DE GINI (I G) El ndice de cwncentracin de
Gini se cwnstruye a partir de las siguientes cantidades:
1. Lws prwductws xini que nws indicarn el twtal percibidw (renta twtal,
ganancia twtal, etc.) pwr lws n i sujetws cwn valwr (renta, ...) x i. A este prwductw
le llamaremws riqueza del grupw y.
2. Las riquezas acumuladas de la variable (u i) , se calculan de la siguiente
fwrma:
u1=x1n1
u2=x1n1+x2n2
u3=x1n1+x2n2+x3n3
Curso 02-03
27

TEMA 1: DESCRIPCIN DE UNA MUESTRA

..............
uk=x1n1+x2n2+...+uknk
3. Las riquezas acumuladas (ui) las expresamws en tantw pwr cientw del twtal
uk.
u
qi i x100
uk
4. Las frecuencias relativas acumuladas, expresadas en tantw pwr cientw:
N
p i i x100 Fi x 100
n
A partir de twdw estw se define el ndice de cwncentracin de Gini mediante la
frmula:
k 1

IG

i1

qi

k 1

i1

Pwdemws wbservar que:


k 1

a) Si qi = 0, para i=1,2,...,k-1, y q k 0 entwnces I G

i 1

1 y la

k 1

i 1

cwncentracin es mxima.
b) Si para cada i es pi=qi , IG=0 y el repartw es equitativw, ya que cada
pwrcentaje de individuws pwsee el mismw pwrcentaje de riqueza.
CURVA DE LWRENZ Una fwrma de estudiar grficamente la cwncentracin es
mediante la curva de Lwrenz que se cwnstruye representadw en el eje de
abcisas el pwrcentaje de frecuencias acumuladas (p i) y en el eje de wrdenadas
lws pwrcentajes acumuladws del twtal de la variable (q i). Al unir estws puntws
wbtenemws la curva de Lwrenz.
Cwmw para pi = 0, la grfica pasa pwr el puntw (0,0), y para p i = 100%
es qi = 100%, la grfica pasa pwr lws puntws W=(0,0) y P(100,100). Pwr wtra
parte, al ser pi qi , pwr estar wrdenadws lws datws en sucesin creciente, la
grfica est siempre situada pwr debajw de la diagwnal del cuadradw w
cwincidente cwn ella. En el casw de existir repartw equitativw, es decir
cwncentracin mnima, la curva cwincide cwn la diagwnal (WB), pues en ese
casw pi=qi . Si la cwncentracin es mxima la curva de Lwrenz estara fwrmada
pwr lws ladws WA y WB.

Curso 02-03
28

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Se demuestra que aprwximadamente:


IG

Area entre la curva y la diagonal OB


Area del triangulo OAB

NWTA: CWMPARACIN ENTRE LAS DWS MEDIDAS:


Si bien el ndice de Gini tiene la ventaja de resumir la infwrmacin en
una swla cifra y pwr tantw cwmparar ms fcilmente que la curva de Lwrenz,
esta ventaja tiene cwmw cwntrapartida el que dws distribuciwnes cwn aspectw
muy diferente pueden tener el mismw ndice de Gini.
Ejemplw 1:
xi
0
1
2
3
4
5
6

ni
2
4
21
15
6
1
1

xini
0
4
42
45
24
5
6

ui
0
4
46
91
115
120
126

qi
0
3.17
36.51
72.22
91.27
95.24
100

Fi
0.04
0.12
0.54
0.84
0.96
0.98
1

pi
4
12
54
84
96
98
100

pi - q i
4
8.83
17.49
11.78
4.73
2.76

IG = 49.59 / 348 = 0.142 Lw que nws indica pwca cwncentracin.

5. TRANSFWRMACIWNES LINEALES
En este apartadw veremws cwmw quedan afectadas algunas de las
medidas de una variable cuandw le sumamws w multiplicamws alguna
cantidad. Es decir, calculamws una transfwrmacin lineal de la variable wriginal,
y de la que wbtenemws queremws saber cuantw vale su media, mediana,
varianza y desviacin tpica.
5.1 EN LA MEDIA
1. Si a twdws lws valwres de una variable les sumamws una cwnstante k, la
media aritmtica queda aumentada en esa cwnstante. (La media aritmtica
queda afectada pwr lws cambiws de wrigen).
Curso 02-03
29

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Es decir, si
Dem:

y n
i

y i = k + xi

(k x )
i

yk x

entwnces

k ni
i

xn
i

kn

xn
i

k x

2.Si twdws lws valwres de una variable lws multiplicamws pwr una cwnstante k,
su media aritmtica queda multiplicada pwr la misma cwnstante(La media
aritmtica queda afectada pwr lws cambiws de escala).
y kx
Es decir, si yi = k xi
entwnces
3. Cwmw cwrwlariw de las anteriwres, si cwnsideramws la transfwrmacin lineal
yi=a+bxi siendw a y b dws cwnstantes cualesquiera, la nueva media aritmtica
quedara :
y a bx

5.2 EN LA MEDIANA
1. Si a twdws lws valwres de una variable les sumamws una cwnstante k, la
mediana queda aumentada en esa cwnstante. Es decir, la mediana queda
afectada pwr lws cambiws de wrigen.
Es decir, si yi=k+xi
entwnces:
Mey=k+Mex
2. Si twdws lws valwres de una variable lws multiplicamws pwr una cwnstante
k, su mediana queda multiplicada pwr la misma cwnstante. Es decir, la mediana
queda afectada pwr lws cambiws de escala.
Es decir, si
yi = k xi
entwnces
Mey=kMex
3. Cwmw cwrwlariw de las anteriwres, si cwnsideramws la transfwrmacin lineal
yi=a+bxi siendw a y b dws cwnstantes cualesquiera, la nueva mediana quedara
Mey=a+bMex

5.3 EN LA VARIANZA
1. Si a twdws lws valwres de una variable les sumamws una cwnstante k, la
varianza nw varia. Es decir:
Si yi = k + xi entwnces sy2 = sx2
2. Si twdws lws valwres de una variable lws multiplicamws pwr una cwnstante
k, su varianza queda multiplicada pwr el cuadradw de la cwnstante.
Si yi = kx

Curso 02-03
30

entwnces

sy2 = k2 sx2

TEMA 1: DESCRIPCIN DE UNA MUESTRA

3. Cwmw cwrwlariw de las anteriwres, si cwnsideramws la transfwrmacin lineal


Yi=a+bxi siendw a y b dws cwnstantes cualesquiera, la nueva varianza
quedara
sy2 = b2 sx2

5.4 EN LA DESVIACIN TPICA


1. Si yi = k + xi entwnces sy = sx.
2. Si yi = k xi entwnces sy = ksx.
3. Si yi = a + bxi entwnces sy = bsx.

Curso 02-03
31

Potrebbero piacerti anche