Sei sulla pagina 1di 48

FUNDAMENTOS DE

ESTADSTICA DESCRIPTIVA
Jos Luis Quintero

Distribucin
de
Frecuencias

Diagrama de
Caja y
Bigotes

Medidas de
Tendencia
Central

Estadstica
Descriptiva

Medidas
de
Dispersin

Medidas
de
Localizacin

Universidad Catlica Andrs Bello


Ingeniera en Telecomunicaciones
Serie: Probabilidad y Estadstica

FUNDAMENTOS DE
ESTADSTICA DESCRIPTIVA
Jos Luis Quintero

Distribucin
de
Frecuencias

Diagrama de
Caja y
Bigotes

Medidas de
Tendencia
Central

Estadstica
Descriptiva

Medidas
de
Dispersin

Medidas
de
Localizacin

Universidad Catlica Andrs Bello


Asignatura: Probabilidades
Caracas, Octubre 2013

PROLOGO

ROBABILIDADES (ITEL-30205)

Tema 1. Fundamentos de Estadstica Descriptiva

Distribucin de frecuencias y medidas de localizacin

Lo malo de escribir libros es que se nos va la vida en rehacerlos


Alfonso Reyes

El presente material ha tenido un proceso de actualizacin permanente, iniciado ya


hace algunos aos. En cada una de ellas, se han incluido nuevos temas y ejercicios, con lo cual
se ha venido enriqueciendo y mejorando su contenido, ajustndolo a las necesidades, para la
formacin de profesionales y para estudiosos de la materia, que requieren de esta materia.
En esta presentacin, se han mejorado sustancialmente aspectos tales como su
diagramacin haciendo ms agradable y hbil la presentacin de los diferentes tpicos, adems
en su contenido se han incluido, actualizado, revisado tanto los contenidos como los problemas
de aplicacin a fin de atender a las necesidades y consultas exigidas por estudiantes,
profesionales o personas que sin formacin acadmica requieren de su utilizacin.

Jos Luis Quintero

Jos Luis Quintero

OBJETIVOS A
LOGRAR

ROBABILIDADES (ITEL-30205)

Tema 1. Fundamentos de Estadstica Descriptiva

Distribucin de frecuencias y medidas de localizacin

Destacar la importancia del manejo estadstico descriptivo de un conjunto de datos


Familiarizar al estudiante con la terminologa empleada en la organizacin y la descripcin de
un conjunto de datos
Construir ejemplos sencillos donde se refleje la organizacin de los datos en una tabla de
distribucin de frecuencias
Establecer diferencias entre las principales medidas de tendencia central
Calcular los valores de las principales medidas de localizacin o de tendencia central tanto para
el caso de agrupacin por valor o uso de clases discretas como para el caso de agrupacin por
intervalos o uso de clases continuas
Calcular percentiles, dciles y cuartiles para un conjunto de datos organizados en clases
discretas y un conjunto de datos organizados en clases continuas
Calcular el intervalo intercuartil para una muestra aleatoria
Calcular los valores de las principales medidas de dispersin tanto para clases discretas como
para clases continuas
Construir ejemplos sencillos donde se refleje la importancia y la utilidad de las principales
medidas de dispersin
Construir un diagrama de caja y bigotes para una muestra dada
Trabajar mediante problemas los fundamentos de la Estadstica Descriptiva

Jos Luis Quintero

INDICE GENERAL

ROBABILIDADES (ITEL-30205)

Tema 1. Fundamentos de Estadstica Descriptiva

Distribucin defrecuencias y medidas de localizacin

1. Definiciones de inters

1.1. Estadstica
1.2. Estadstica Descriptiva

1
1

1.3. Muestra aleatoria

1.4. Mnimo valor de una muestra


1.5. Mximo valor de una muestra

1
1

1.6. Intervalo de una muestra

1.7. Clase
1.8. Histograma de una muestra

1
1

2. Medidas de tendencia central

2.1. Media de una muestra


2.2. Mediana de una muestra

2
2

2.3. Moda de una muestra

3. Ejemplos ilustrativos para datos agrupados por valor o uso de clases discretas
4. Ejemplos ilustrativos para datos agrupados por intervalos o uso de clases continuas

2
4

5. Clculo de las medidas de tendencia central para datos agrupados por valor

6. Clculo de las medidas de tendencia central para datos agrupados por intervalos
7. Clculo de la media recortada al %

6
10

7.1. Definicin

10

7.2. Clculo de la media recortada


7.3. Clculo para datos no agrupados

10
11

7.4. Clculo para datos agrupados por valor o uso de clases discretas

11

7.5. Clculo para datos agrupados por intervalos o uso de clases continuas
8. Percentiles

12
13

8.1. Definicin

13

8.2. Clculo para datos agrupados por valor o uso de clases discretas
8.3. Clculo para datos agrupados por intervalos o uso de clases continuas

13
14

9. Intervalo intercuartil

16

9.1. Definicin
9.2. Clculo para datos agrupados por valor o uso de clases discretas

16
16

9.3. Clculo para datos agrupados por intervalos o uso de clases continuas

16

10. Definiciones de inters


10.1. Varianza de una muestra

17
17

10.2. Varianza corregida de una muestra

17

10.3. Desviacin estndar de una muestra


10.4. Desviacin estndar corregida de una muestra

17
17

10.5. Coeficiente de variacin de una muestra

17

Jos Luis Quintero

10.6. Sesgo de una muestra


10.7. Curtosis de una muestra
11. Clculo de las medidas de dispersin para datos agrupados por valor
11.1. Varianza de la muestra
11.2. Varianza corregida de la muestra
11.3. Desviacin estndar de la muestra
11.4. Desviacin estndar corregida de la muestra
11.5. Coeficiente de variacin de la muestra
11.6. Sesgo de la muestra
11.7. Curtosis de la muestra
12. Clculo de las medidas de dispersin para datos agrupados por intervalos
12.1. Varianza de la muestra
12.2. Varianza corregida de la muestra
12.3. Desviacin estndar de la muestra
12.4. Desviacin estndar corregida de la muestra
12.5. Coeficiente de variacin de la muestra
12.6. Sesgo de la muestra
12.7. Curtosis de la muestra
13. Diagrama de caja y bigotes
13.1. Definicin
13.2. Ejemplos ilustrativos
14. Problemas resueltos
15. Problemas propuestos

Jos Luis Quintero

17
17
18
18
18
18
18
18
18
19
20
20
20
20
21
21
21
21
22
22
23
24
31

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

1. DEFINICIONES DE INTERS

1.1. Estadstica. Es una rama de la matemtica

Observacin

Consideraciones

1.

que se encarga de estudiar mtodos cientficos

acerca de la estadstica:

para recoger, organizar, resumir y analizar


datos, as como para sacar conclusiones

Los orgenes de la estadstica,


aunque no se sabe con exactitud

vlidas y tomar decisiones razonables basadas

cundo se comenz a utilizar,

en tal anlisis.

pueden estar ligados al antiguo


Egipto como a los censos chinos

1.2. Estadstica Descriptiva. Es la parte de la


Estadstica
que
se
encarga
de
reunir
informacin

cuantitativa

concerniente

individuos, grupos, series de hechos, etc

1.3. Muestra aleatoria. Grupo de resultados que


se obtienen
experimento

al repetir varias veces un


aleatorio, bajo las mismas

condiciones.

que

se

realizaron

hace

unos

4.000 aos, aproximadamente


Sin duda, fueron los romanos,
maestros de la organizacin
poltica, quienes mejor supieron
usar la estadstica. Cada cinco
aos realizaban un censo de la
poblacin,
cuyos
datos
nacimientos,
defunciones

de
y

matrimonios eran esenciales para


estudiar los avances del imperio;
sin olvidar los recuentos de

1.4. Mnimo valor de una muestra. El valor ms


pequeo de una muestra.

1.5. Mximo valor de una muestra. El valor ms


grande de una muestra.

ganancias

el valor ms grande y el valor ms pequeo de


una muestra.

riquezas

que

dejaban las tierras


Los datos a trabajar se agruparn
por valor o en clases discretas o
por
intervalo
o
en
clases
continuas,
considerando
las
caractersticas

1.6. Intervalo de una muestra. Diferencia entre

las

de

los

datos

suministrados. En tal sentido, se


justificar la mejor manera de
agrupar los datos

1.7. Clase. Es cada uno de los intervalos que se consiguen al realizar una particin dentro del
conjunto de los nmeros reales.

1.8. Histograma de una muestra. Es una representacin grfica en forma de barras de una
muestra.

Jos Luis Quintero

Probabilidad y Estadstica

2.
9

Fundamentos de Estadstica Descriptiva

MEDIDAS DE TENDENCIA CENTRAL

2.1. Media de una muestra. Promedio de los


valores de la muestra.

2.1. Mediana de una muestra. Valor que ocupa la


posicin intermedia de la muestra ya ordenada
previamente.

2.3. Moda de una muestra. Es el valor del dato


que ocurre con ms frecuencia.

Observacin

2.

Consideraciones

acerca de las medidas de tendencia


central:
Tambin son llamadas medidas
de localizacin
La media se ve afectada por la
presencia de valores extremos,
perdiendo representatividad
La media no necesariamente
coincide con un dato muestral
Por lo general, la mediana
coincide con un dato muestral
La moda puede usarse para datos
cualitativos
La moda pudiera no ser nica en
una muestra
La moda pierde representatividad
en muestras multimodales

3. EJEMPLOS ILUSTRATIVOS PARA DATOS AGRUPADOS POR


VALOR O USO DE CLASES DISCRETAS

Ejemplo 1.
Tabla de distribucin de frecuencias de la nota obtenida en un examen de Clculo

Jos Luis Quintero

Clase

Dato (xi)

fi

Fi

hi

Hi

2.8

0.0417

0.0417

3.2

0.1667

0.2084

3.9

0.1250

0.3334

4.2

13

0.2082

0.5416

5.0

17

0.1667

0.7083

5.6

20

0.1250

0.8333

6.0

24

0.1667

1.0000
2

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Notacin de inters:
fi = frecuencia absoluta , Fi = Frecuencia absoluta acumulada
hi = frecuencia relativa , Hi = Frecuencia relativa acumulada
Frmulas de inters:
n = nmero de clases , N = nmero total de datos
i

Fi =

fj = Fi 1 + fi , hi =

j =1

fi
F
, Hi = i , i = 1,...,n
N
N

Ejemplo 2.
Tabla de distribucin de frecuencias de la duracin en minutos de las llamadas
telefnicas (xi ) entre las 9 a.m. y las 10 a.m. registradas en una central telefnica
Clase

Dato

fi

Fi

hi

Hi

Clase

(xi)

Dato

fi

Fi

hi

Hi

(xi)

0.06

0.06

45

0.00

0.90

10

0.14

0.20

10

10

46

0.02

0.92

19

0.18

0.38

11

11

46

0.00

0.92

10

29

0.20

0.58

12

12

48

0.04

0.96

35

0.12

0.70

13

13

48

0.00

0.96

39

0.08

0.78

14

14

48

0.00

0.96

43

0.08

0.86

15

15

49

0.02

0.98

45

0.04

0.90

16

16

50

0.02

1.00

A continuacin la figura 1 visualiza el histograma para las frecuencias relativas:

Figura 1. Histograma de frecuencias relativas para la duracin en minutos


de las llamadas telefnicas

Jos Luis Quintero

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

4. EJEMPLOS ILUSTRATIVOS PARA DATOS AGRUPADOS POR


INTERVALOS O USO DE CLASES CONTINUAS

Ejemplo 3.
Tabla de distribucin de frecuencias del pago en miles de bolvares (MBs.) del uso
del servicio telefnico (xi ) efectuado por los usuarios en un ao

Clase

Inicio

Fin

Marca
de clase

fi

Fi

hi

Hi

0.08

0.08

(xi)
1

1.465

1.497

1.481

1.497

1.529

1.513

0.08

0.16

1.529

1.561

1.545

15

23

0.30

0.46

1.561

1.593

1.577

12

35

0.24

0.70

1.593

1.625

1.609

44

0.18

0.88

1.625

1.657

1.641

49

0.10

0.98

1.657

1.689

1.673

50

0.02

1.00

A continuacin la figura 2 visualiza el histograma para las frecuencias relativas:

Figura 2. Histograma de frecuencias relativas para el pago anual del servicio telefnico

Jos Luis Quintero

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Ejemplo 4.
Tabla de distribucin de frecuencias del pago en miles de bolvares (MBs.) del uso
del servicio telefnico (xi ) efectuado por los usuarios en dos aos

Clase

Inicio

Fin

Marca
de clase

fi

Fi

hi

Hi

0.02

0.02

(xi)
1

3.62

3.70

3.66

3.70

3.78

3.74

0.07

0.09

3.78

3.86

3.82

11

20

0.11

0.20

3.86

3.94

3.90

11

31

0.11

0.31

3.94

4.02

3.98

23

54

0.23

0.54

4.02

4.10

4.06

22

76

0.22

0.76

4.10

4.18

4.14

15

91

0.15

0.91

4.18

4.26

4.22

96

0.05

0.96

4.26

4.34

4.30

99

0.03

0.99

10

4.34

4.42

4.38

100

0.01

1.00

5. CLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA


DATOS AGRUPADOS POR VALOR

5.1. Media de la muestra (M).


Notacin:
xi = dato que pertenece a la clase i
fi = frecuencia del dato que pertenece a la clase i
n = nmero de clases
N = tamao de la muestra
n

1
M=
N

xifi

i =1

Ejemplo de las calificaciones obtenidas:

M=

2.8 1 + 3.2 4 + ... + 5.6 3 + 6.0 4 109.1


=
= 4.5458
24
24

Ejemplo de la duracin en minutos de las llamadas telefnicas:

Jos Luis Quintero

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

M=

1 3 + 2 7 + ... + 15 1 + 16 1 247
=
= 4.94
50
50

5.2. Mediana de la muestra (Me).


Notacin:
xi = dato que ocupa la posicin i despus de estar ordenada la muestra
N = tamao de la muestra

xi

Me =
xi + xi +1

N+1
si N es impar
2
N
i=
si N es par
2

i=

Ejemplo de las calificaciones obtenidas:

N = 24 es par, por lo tanto i = 12 y

Me =

x12 + x13
4.2 + 4.2
=
= 4.2
2
2

Ejemplo de la duracin en minutos de las llamadas telefnicas:


N = 50 es par, por lo tanto i = 25 y

Me =

x25 + x26
4+4
=
=4
2
2

5.3. Moda de la muestra (Mo).


Ejemplo de las calificaciones obtenidas:
El dato de mayor frecuencia (igual a 5) es 4.2, por lo tanto la moda de la muestra es 4.2.

Ejemplo de la duracin en minutos de las llamadas telefnicas:


El dato de mayor frecuencia (igual a 10) es 4, por lo tanto la moda de la muestra es 4.

6. CLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA


DATOS AGRUPADOS POR INTERVALOS

6.1. Media de la muestra (M).


Notacin:
Jos Luis Quintero

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

xi = marca de clase que pertenece a la clase i


fi = frecuencia de la clase i
n = nmero de clases
N = tamao de la muestra
n

1
M=
N

xifi .

i =1

Usando la expresin anterior se tendr entonces una estimacin de la media de la


muestra para datos agrupados por intervalos o uso de clases continuas.
Ejemplo del pago del uso del servicio telefnico anual:

M=

1.481 4 + 1.513 4 + ... + 1.641 5 + 1.673 1 78.434


=
= 1.56868
50
50

Ejemplo del pago del uso del servicio telefnico en dos aos:

M=

3.66 2 + 3.74 7 + ... + 4.30 3 + 4.38 1 399.76


=
= 3.9976
100
100

6.2. Mediana de la muestra (Me).


En primer lugar se identifica la clase k donde se encuentra el dato que ocupa la
posicin N/2. Esta clase es denominada clase medianal. Una vez ubicada la clase se procede
a estimar la mediana de la muestra usando la expresin
N F
k 1
Me = LIk + 2
(LSk LIk )
fk

Notacin:
LIk = Lmite inferior de la clase k (clase medianal)

LSk = Lmite superior de la clase k (clase medianal)


Fk 1 = Frecuencia absoluta acumulada de la clase anterior a la clase medianal
fk = Frecuencia absoluta de la clase medianal

Deduccin de la frmula de la mediana para datos agrupados por intervalos


La frmula utilizada para la estimacin de la mediana se obtiene por interpolacin
lineal, es decir se construye la recta que
(Fk 1 ,LIk ) y (Fk ,LSk ) . Esta recta tiene la ecuacin

y = LIk +

pasa

por

los

puntos

de

coordenadas

LSk LIk
(x Fk 1 )
Fk Fk 1

El punto de coordenadas (N2 ,Me) es un punto de la recta de modo que


Jos Luis Quintero

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Me = LIk +

LSk LIk N
( Fk 1 ) = LIk +
Fk Fk 1 2

N
2

Fk 1
fk

(LSk LIk )

Observacin. Se suponen que los datos dentro de la clase medianal estn equiespaciados y
se usa interpolacin lineal para la estimacin de la mediana.
Ejemplo del pago del uso del servicio telefnico anual:
N= 50 por lo tanto N/2 = 25 y la clase medianal identificada es la clase 4:
4

1.561

1.593

1.577

12

35

0.24

0.70

Calculando ahora la estimacin para la mediana se tiene:


25 23
2
Me = 1.561 +
(1.593 1.561) = 1.561 +
(0.032) = 1.5663
12
12
Ejemplo del pago del uso del servicio telefnico en dos aos:
N = 100 por lo tanto N/2 = 50 y la clase medianal identificada es la clase 5:
5

3.94

4.02

3.98

23

54

0.23

0.54

Calculando ahora la estimacin para la mediana se tiene:


50 31
19
Me = 3.94 +
(4.02 3.94) = 3.94 +
(0.08) = 4.0061
23
23
6.3. Moda de la muestra (Mo).
Deduccin de la frmula de la moda para datos agrupados por intervalos
a. En primera instancia se identifica la clase con mayor frecuencia la cual se llamar clase
modal. Esta clase pudiera no ser nica, y ese caso se estar en presencia de una muestra
con distribucin de frecuencia multimodal.
b. Una vez identificada la clase modal, la moda se estimar bajo la premisa de que ella
estar ms prxima a la clase contigua con mayor frecuencia, de modo que la distancia
entre la moda y las clases contiguas es inversamente proporcional a las frecuencias de
esas clases. El clculo de esta estimacin ser de la forma Mo = LIk + p , donde
posteriormente se hablar del clculo de p.
c. Si se denotan d1 = fk fk 1 y d2 = fk fk +1 , representarn las diferencias de la frecuencia
de la clase modal y la frecuencia de la clase premodal y la de la frecuencia de la clase
modal y la frecuencia de la clase postmodal respectivamente. Se deduce que a mayor
frecuencia de la clase contigua, menor ser la diferencia respectiva.

d. Suponga que el intervalo de la clase modal es dividido en dos partes: una de ellas de
denota con p y la otra como LSk LIk p . Se establecer la relacin

Jos Luis Quintero

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

d
p
= 1.
LSk LIk p d2
CASO 1. d1 < d2
Aqui la clase premodal tiene una frecuencia absoluta mayor que la de la clase postmodal, de
modo que se desea que la moda estimada est ms cerca de ella que de la clase postmodal.
Trabajando la expresin anterior:
d
d
p
= 1 p = 1 (LSk LIk p) ,
LSk LIk p d2
d2
lo cual permite ver que p es menor que LSk LIk p y la moda estimada como Mo = LIk + p
estar ms cerca de la clase premodal que de la clase postmodal como se deseaba.

CASO 2. d1 = d2
Aqui la clase premodal tiene una frecuencia absoluta igual que la de la clase postmodal, de
modo que se desea que la moda estimada est equidistante de ambas clases. Trabajando la
expresin anterior:
LSk LIk
p
,
= 1 p = (LSk LIk p) p =
LSk LIk p
2
lo cual permite ver que p es igual que LSk LIk p y la moda estimada como Mo = LIk + p se
ver de la forma

Mo = LIk + p = LIk +

LSk LIk
LI + LSk
= k
2
2

CASO 3. d1 > d2
Aqui la clase premodal tiene una frecuencia absoluta menor que la de la clase postmodal, de
modo que se desea que la moda estimada est ms lejos de ella que de la clase postmodal.
Trabajando la expresin anterior:
d
d
p
= 1 p = 1 (LSk LIk p) ,
LSk LIk p d2
d2
lo cual permite ver que p es mayor que LSk LIk p y la moda estimada como Mo = LIk + p
estar ms lejos de la clase premodal que de la clase postmodal como se deseaba.
Visto todo lo anterior, despejando p se tiene
d
d1
p
(LSk LIk ) ,
= 1 p(d1 + d2 ) = d1(LSk LIk ) p =
LSk LIk p d2
d1 + d2
calculando entonces la estimacin de la moda como
d1
Mo = LIk +
(LSk LIk )
d1 + d2

Ejemplo del pago del uso del servicio telefnico anual:


La clase modal identificada es la clase 3.
3

1.529

Jos Luis Quintero

1.561

1.545

15

23

0.30

0.46

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Las clases premodal y postmodal sern respectivamente las clases 2 y 4.


2

1.497

1.529

1.513

0.08

0.16

1.561

1.593

1.577

12

35

0.24

0.70

Calculando ahora la estimacin para la moda se tiene


d1
15 4
Mo = LIk +
(LSk LIk ) = 1.529 +
(1.561 1.529) 1.5541
d1 + d2
15 4 + 15 12
Ejemplo del pago del uso del servicio telefnico en dos aos:

La clase modal identificada es la clase 5.


5

3.94

4.02

3.98

23

54

0.23

0.54

Las clases premodal y postmodal sern respectivamente las clases 4 y 6.


4

3.86

3.94

3.90

11

31

0.11

0.31

4.02

4.10

4.06

22

76

0.22

0.76

Calculando ahora la estimacin para la moda se tiene


d1
(23 11)
Mo = LIk +
(LSk LIk ) = 3.94 +
(4.02 3.94) = 4.0138
d1 + d2
(23 11) + (23 22)

7. CLCULO DE LA MEDIA RECORTADA AL

7.1. Definicin (Media recortada). Se define como el promedio de los datos que quedan al
eliminar el % inferior y superior en la muestra ordenada.
7.2. Clculo de la media recortada:

La notacin a se lee parte entera de a y asigna como resultado la aproximacin


como truncamiento del nmero real a. La expresin
N
100 , [0,50)

determina la cantidad de datos que deben eliminarse de la muestra ordenada tanto


inferiormente como superiormente. En tal sentido, la muestra recortada al % tiene como
tamao

Jos Luis Quintero

10

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

.
N(1 ) N , con =
100
7.3. Clculo para datos no agrupados:
Despus de ordenarlos la media recortada al % se calcula como
N(1 )

Mrec()

1
=

N(1
) N

xi .

i = N + 1

7.4. Clculo para datos agrupados por valor o uso de clases discretas:

Mrec()

1
=

N(1 ) N

n1

xifi +
xi fi ,

i = n1 + 1
i = n2 +1

n2


xi
fi +

i =1

donde

fi = nueva frecuencia absoluta de la clase i afectada despus de eliminar datos de la muestra


aleatoria.

Ejemplo de las calificaciones obtenidas:


Se desea calcular la media recortada al 5% para los datos suministrados.
Cantidad total de datos que deben eliminarse:
24 5
2
=2
100
Tamao de la nueva muestra: 22
Clculo de la nueva media:
2.8 0 + 3.2 4 + ... + 5.6 3 + 6.0 3 100.3
Mrec(5) =
=
4.5591
22
22

Observaciones.
Las negritas se colocaron para indicar las frecuencias absolutas que fueron modificadas
La eliminacin de los 2 datos no afecta significativamente a la media anterior (4.5458) al
compararla con la nueva media (4.5591)

Ejemplo de la duracin en minutos de las llamadas telefnicas:


Se desea calcular la media recortada al 5% para los datos suministrados.
Cantidad total de datos que deben eliminarse:
50 5
2
=4
100

Jos Luis Quintero

11

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Tamao de la nueva muestra: 46


Clculo de la nueva media:
1 1 + 2 7 + ... + 14 0 + 15 0 + 16 0 214
Mrec(5) =
=
4.65
46
46
Observacin. Se puede notar la influencia de los 4 datos anteriores eliminados sobre la
media anterior (4.94) al compararla con la nueva media (4.65)
7.5. Clculo para datos agrupados por intervalos o uso de clases continuas:

Mrec()

1
=

N(1 ) N

n1

xifi +
xi fi ,

i = n1 + 1
i = n2 +1

n2


xi
fi +

i =1

donde
xi = marca de clase que pertenece a la clase i

fi = nueva frecuencia absoluta de la clase i afectada despus de eliminar datos de la muestra


aleatoria.

Ejemplo del pago del uso del servicio telefnico anual:


Se desea calcular la media recortada al 5% para los datos suministrados.
Cantidad total de datos que deben eliminarse:
50 5
2
=4
100

Tamao de la nueva muestra: 46


1.481 2 + 1.513 4 + ... + 1.641 4 + 1.673 0 72.158
Mrec(5) =
=
1.56865
46
46
Observacin. Se puede notar la poca influencia de los 4 datos eliminados sobre la media
anterior (1.56868) al compararla con la nueva media (1.56865)
Ejemplo del pago del uso del servicio telefnico en dos aos:

Se desea calcular la media recortada al 5% para los datos suministrados.


Cantidad total de datos que deben eliminarse:
100 5
2
= 10
100
Tamao de la nueva muestra: 90
3.66 0 + 3.74 4 + ... + 4.22 4 + 4.30 0 + 4.38 0 359.72
Mrec(5) =
=
= 3.9969
90
90
Observacin. Se puede notar la poca influencia de los 10 datos eliminados sobre la media
anterior (3.9976) al compararla con la nueva media (3.9969)

Jos Luis Quintero

12

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

8. PERCENTILES

8.1. Definicin (Percentil). El k-simo percentil de una muestra aleatoria se define como el
valor que ocupa una posicin tal en la muestra ordenada que aproximadamente el k% de

los datos es menor o igual que l.

8.2. Clculo para datos agrupados por valor o uso


de clases discretas:
El percentil k-simo (Pk ) ser igual a xm +1 , es
decir Pk = xm +1 , siempre y cuando se verifique
que

m<

k
N m + 1 , con m N .
100

Observacin

3.

acerca

las

de

Consideraciones
medidas

de

localizacin:
El percentil k-simo tambin es
llamado medida de localizacin
La mediana es considerada como
el percentil 50 es decir P50 = Me
El cuartil k-simo (Qk ) es una

Ejemplo de las calificaciones obtenidas:

medida de localizacin tal que


Q1 = P25 , Q2 = P50 , Q3 = P75 ,

Se desean encontrar los percentiles 25, 30


y 75, es decir P25 , P30 y P75 respectivamente.

Q4 = P100
(Dk )

es una

medida de localizacin tal que:


D1 = P10 , D2 = P20 , ... , D9 = P90 ,

Para P25 :

m<

El decil k-simo

25
24 m + 1 m < 6 m + 1
100
m = 5 P25 = x6 = 3.9

D10 = P100

Para P30 :
m<

30
24 m + 1 m < 7.2 m + 1 m = 7 P30 = x8 = 3.9
100

m<

75
24 m + 1 m < 18 m + 1 m = 17 P75 = x18 = 5.6
100

Para P75 :

Ejemplo de la duracin en minutos de las llamadas telefnicas:

Se desean encontrar los percentiles 25, 30 y 75, es decir

P25 , P30

y P75

respectivamente.
Para P25 :

m<

Jos Luis Quintero

25
50 m + 1 m < 12.5 m + 1 m = 12 P25 = x13 = 3
100

13

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Para P30 :

m<

30
50 m + 1 m < 15 m + 1 m = 14 P30 = x15 = 3
100

Para P75 :

m<

75
50 m + 1 m < 37.5 m + 1 m = 37 P75 = x38 = 6
100

8.3. Clculo para datos agrupados por intervalos o uso de clases continuas:
El percentil k-simo (Pk ) ser igual a xm +1 , es decir Pk = xm +1 , siempre y cuando se
verifique que

m<

k
N m + 1 , con m N .
100

En primer lugar se identifica la clase j donde est el dato que ocupa la posicin
encontrada anteriormente. Una vez ubicada la clase se procede a estimar el percentil ksimo de la muestra usando la expresin

Pk = LIj +

k
100

N Fj 1
fj

(LS j LIj )

La frmula utilizada para la estimacin del percentil se obtiene tambin por


interpolacin lineal, con el mismo basamento empleado para la frmula de estimacin de la
mediana discutido anteriormente.

Ejemplo del pago del uso del servicio telefnico anual:


Se desean encontrar los percentiles 25, 30 y 75, es decir

P25 , P30

y P75

respectivamente.
Para P25 :

m<

25
50 m + 1 m < 12.5 m + 1 m = 12 P25 = x13
100

La clase donde se encuentra P25 es la clase 3:


3

1.529

1.561

1.545

15

23

0.30

0.46

Calculando ahora la estimacin para P25 se tiene:

P25 = 1.529 +

Jos Luis Quintero

25
100

50 8
15

(1.561 1.529) = 1.529 +

4.5
(0.032) = 1.5386
15

14

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Para P30 :

m<

30
50 m + 1 m < 15 m + 1 m = 14 P30 = x15
100

La clase donde se encuentra P30 es la clase 3:


3

1.529

1.561

1.545

15

23

0.30

0.46

Calculando ahora la estimacin para P30 se tiene:

P30 = 1.529 +

30
100

50 8
15

7
(0.032) = 1.5439
15

(1.561 1.529) = 1.529 +

Para P75 :

m<

75
50 m + 1 m < 37.5 m + 1 m = 37 P75 = x38
100

La clase donde se encuentra P75 es la clase 5:


5

1.593

1.625

1.609

44

0.18

0.88

Calculando ahora la estimacin para P75 se tiene:


P75 = 1.593 +

75
100

50 35
9

(1.625 1.593) = 1.593 +

2.5
(0.032) = 1.6019
9

Ejemplo del pago del uso del servicio telefnico en dos aos:

Se desean encontrar los percentiles 25, 30 y 75, es decir P25 , P30 y P75 .
Para P25 :

m<

25
100 m + 1 m < 25 m + 1 m = 24 P25 = x25
100

La clase donde se encuentra P25 es la clase 4:


4

3.86

3.94

3.90

11

31

0.11

0.31

Calculando ahora la estimacin para P25 se tiene:

P25 = 3.86 +

25
100

100 20
11

(3.94 3.86) = 3.86 +

5
(0.08) 3.8964
11

Para P30 :

m<

Jos Luis Quintero

30
100 m + 1 m < 30 m + 1 m = 29 P30 = x30
100

15

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

La clase donde se encuentra P30 es la clase 4:


4

3.86

3.94

3.90

11

31

0.11

0.31

Calculando ahora la estimacin para P30 se tiene:

P30 = 3.86 +

30
100

100 20
11

(3.94 3.86) = 3.86 +

10
(0.08) = 3.9327
11

Para P75 :
m<

75
100 m + 1 m < 75 m + 1 m = 74 P75 = x75
100

La clase donde se encuentra P75 es la clase 6:


6

4.02

4.10

4.06

22

76

0.22

0.76

Calculando ahora la estimacin para P75 se tiene:

P75 = 4.02 +

9.
9

75
100

100 54

22

(4.10 4.02) = 4.02 +

21
(0.08) = 4.0964
22

INTERVALO INTERCUARTIL

9.1. Definicin (Intervalo intercuartil). Es el intervalo de la muestra que resulta al


considerar solamente aquellos datos que estn entre el primer cuartil y el tercero.
9.2. Clculo para datos agrupados por valor o uso de clases discretas:
Intervalo intercuartil de la muestra (IQ ) . IQ = Q3 Q1
Ejemplo de las calificaciones obtenidas: IQ = Q3 Q1 = 5 3.2 = 1.8
Ejemplo de la duracin en minutos de las llamadas telefnicas: IQ = Q3 Q1 = 6 3 = 3
9.3. Clculo para datos agrupados por intervalos o uso de clases continuas:
Intervalo intercuartil de la muestra (IQ ) . IQ = Q3 Q1
Ejemplo del pago del uso del servicio telefnico anual:

Jos Luis Quintero

16

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

IQ = Q3 Q1 = 1.6019 1.5386 = 0.0633


Ejemplo del pago del uso del servicio telefnico en dos aos:
IQ = Q3 Q1 = 4.0964 3.8964 = 0.2

10.
9

DEFINICIONES DE INTERS

10.1. Varianza

de

una

muestra.

Promedio

aritmtico de los cuadrados de las diferencias


de cada valor en la muestra y la media de la
muestra.
10.2. Varianza corregida de una muestra.
Cociente que resulta de dividir la suma de los
cuadrados de las diferencias de cada dato en
la muestra y la media de la muestra, entre el
nmero de datos menos uno.
10.3. Desviacin estndar de una muestra. Es
la raz cuadrada positiva de la varianza de la
muestra.
10.4. Desviacin estndar corregida de una
muestra. Es la raz cuadrada positiva de la

Observacin 4. Consideraciones
acerca de las medidas de dispersin:
Para conocer la varianza de la
muestra, previamente se debe
conocer la media de la muestra
La justificacin de la frmula de
la varianza corregida de la
muestra se halla en el estudio de
estimadores
insesgados
en
Estadstica
La desviacin estndar de la
muestra
posee
las
mismas
unidades que tienen los datos de
la muestra

varianza corregida de la muestra.


10.5. Coeficiente de variacin de una muestra.
Es la relacin entre la desviacin estndar de
la muestra y el valor absoluto de la media de
la muestra.
10.6. Sesgo de una muestra. Es la relacin entre
el promedio aritmtico de las diferencias entre
cada dato y la media de la muestra elevadas
al cubo, y el cubo de la desviacin estndar.

El coeficiente de variacin, el
sesgo y la curtosis de la muestra
son adimensionales, es decir, no
poseen unidades
El
sesgo
y
la
curtosis
proporcionan informacin acerca
de la forma de la distribucin de
la muestra

10.7. Curtosis de una muestra. Es la relacin entre el promedio aritmtico de las diferencias
entre cada dato y la media de la muestra elevadas a la cuatro, y el cuadrado de la
varianza de la muestra.

Jos Luis Quintero

17

Probabilidad y Estadstica

11.
9

Fundamentos de Estadstica Descriptiva

CLCULO DE LAS MEDIDAS DE DISPERSIN PARA DATOS


AGRUPADOS POR VALOR

11.1. Varianza de la muestra (S2 ) .


Sean n = nmero de clases , N = tamao de la muestra
Una frmula para su clculo:
n

1
S =
N
2

fi (xi M)2

i =1

Otra frmula para su clculo:


n

1
S =
N
2

1
N

i =1
n

i =1

1
fi (xi M) =
N
2

fi (xi2

i =1

fixi2

2
N

1
2xiM + M ) =
N
2

fixiM +

i =1

1
N

2
(fixi2 2fixiM + fM
)
i

i =1

2
=
fM
i

i =1

1
N

fixi2 2M2 + M2 = M2 M2

i =1

11.2. Varianza corregida de la muestra (S2c ) .


n

S2c

1
=
N1

i =1

N 1
fi (xi M) =
.
N1 N
2

fi (xi M)2 =

i =1

N
.S2
N 1

11.3. Desviacin estndar de la muestra (S).

S = + S2
11.4. Desviacin estndar corregida de la muestra (Sc ) .

Sc = + S2c
11.5. Coeficiente de variacin de la muestra (CV).
S
CV =
M
11.6. Sesgo de la muestra (SE).
n

SE =

Jos Luis Quintero

1
3

NS

fi (xi M)3

i =1

18

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

11.7. Curtosis de la muestra (K).


n

K=

1
NS4

fi (xi M)4

i =1

Ejemplo de las calificaciones obtenidas:


Varianza de la muestra (S2 ) .

n = 7 , N = 24 , M = 4.5458
Primera forma para su clculo:
1
S2 =
(2.8 4.5458)2 + 4(3.2 4.5458)2 + ... + 3(5.6 4.5458)2 + 4(6 4.5458)2

24
24.7596
=
= 1.0317
24
Segunda forma para su clculo:
1
520.71
(4.5458)2 = 1.0317
S2 =
(2.8)2 + 4(3.2)2 + ... + 3(5.6)2 + 4(6)2 (4.5458)2 =

24
24
Varianza corregida de la muestra (S2c ) .

N
24
.S2 =
1.0317 1.0766
N1
23

S2c =

Desviacin estndar de la muestra (S). S = + S2 1.0157


Desviacin estndar corregida de la muestra (Sc ) . S = + S2 1.0376
Coeficiente de variacin de la muestra (CV).
S
1.0157
CV =
=
0.2234
4.5458
M

Sesgo de la muestra (SE).


n

SE =

1
3

NS

fi (xi M)3 =

i =1

0.1047
24 (1.0157)3

= 0.0042

Curtosis de la muestra (K).


n

K=

1
NS

i =1

fi (xi M)4 =

44.7672
24 (1.0157)4

= 1.7526

Ejemplo de la duracin en minutos de las llamadas telefnicas:

Varianza de la muestra (S2 ) .


n = 16 , N = 50 , M = 4.94
Primera forma para su clculo:
1
538.82
= 10.7764
S2 =
3(1 4.94)2 + 7(2 4.94)2 + ... + 1(15 4.94)2 + 1(16 4.94)2 =

50
50
Segunda forma para su clculo:
1
1759
S2 =
3(1)2 + 7(2)2 + ... + 1(15)2 + 1(16)2 (4.94)2 =
(4.94)2 = 10.7764

50
50

Jos Luis Quintero

19

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Varianza corregida de la muestra (S2c ) .

N
50
10.7764 = 10.9963
.S2 =
N1
49

S2c =

Desviacin estndar de la muestra (S). S = + S2 = 3.2827


Desviacin estndar corregida de la muestra (Sc ) . Sc = + S2c = 3.3161

Coeficiente de variacin de la muestra (CV).


S
3.2827
CV =
=
0.6645
4.94
M

Sesgo de la muestra (SE).


n

SE =

1
3

NS

fi (xi M)3 =

i =1

2866
50 (3.2827)3

= 1.6204

Curtosis de la muestra (K).


n

K=

12.
9

1
NS4

fi (xi M)4 ==

i =1

32463
50 (3.2827)4

= 5.5911

CLCULO DE LAS MEDIDAS DE DISPERSIN PARA DATOS


AGRUPADOS POR INTERVALOS

12.1. Varianza de la muestra (S2 ) .

Sean
xi = marca de clase que pertenece a la clase i
n = nmero de clases
N = tamao de la muestra
Una frmula para su clculo:
n

1
S =
N
2

fi (xi M)2

i =1

Otra frmula para su clculo: S2 = M2 M2


12.2. Varianza corregida de la muestra (S2c ) .

S2c =

N
.S2
N 1

12.3. Desviacin estndar de la muestra (S). S = + S2

Jos Luis Quintero

20

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

12.4. Desviacin estndar corregida de la muestra (Sc ) . Sc = + S2c


12.5. Coeficiente de variacin de la muestra (CV).
S
CV =
M
12.6. Sesgo de la muestra (SE).
n

SE =

1
3

NS

fi (xi M)3

i =1

12.7. Curtosis de la muestra (K).


n

K=

1
NS

fi (xi M)4

i =1

Ejemplo del pago del uso del servicio telefnico anual:


Varianza de la muestra (S2 ) . n = 7 , N = 50
Primera forma de clculo:
1
S2 =
4(1.481 1.56868)2 + 4(1.513 1.56868)2 + ... + 1(1.673 1.56868)2 = 0.0021

50
Segunda forma de clculo: S2 = M2 M2 = 2.4628 (1.56868)2 = 0.0021

Varianza corregida de la muestra (S2c ) .

S2c =

N
50
.S2 =
0.0021 0.0021
N1
49

Desviacin estndar de la muestra (S). S = + S2 = 0.0458


Desviacin estndar corregida de la muestra (Sc ) . Sc = + S2c = 0.0458
Coeficiente de variacin de la muestra (CV).
S
0.0458
=
0.0292
CV =
M 1.56868
Sesgo de la muestra (SE).
n

SE =

1
NS3

fi (xi M)3 =

i =1

3.7434 105
50 (0.0458)3

= 0.0078

Curtosis de la muestra (K).


n

K=

1
NS4

i =1

fi (xi M)4 =

5.5862 104
50 (0.0458)4

= 2.5391

Ejemplo del pago del uso del servicio telefnico en dos aos:

Varianza de la muestra (S2 ) . n = 10 , N = 100


Jos Luis Quintero

21

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Primera forma de clculo:


1
S2 =
2(3.66 3.9976)2 + 7(3.74 3.9976)2 + ... + 1(4.38 3.9976)2 = 0.02209

100
Segunda forma de clculo: S2 = M2 M2 = 16 (3.9976)2 = 0.02
Varianza corregida de la muestra (S2c ) .

S2c =

N
100
.S2 =
0.02 0.0202
N1
99

Desviacin estndar de la muestra (S). S = + S2 = 0.1414


Desviacin estndar corregida de la muestra (Sc ) . Sc = + S2c = 0.1421

Coeficiente de variacin de la muestra (CV).


S
0.1414
CV =
=
0.0354
M 3.9976

Sesgo de la muestra (SE).


n

SE =

1
NS3

fi (xi M)3 =

i =1

0.0260
100 (0.1414)3

= 0.0920

Curtosis de la muestra (K).


n

K=

13.
9

1
4

NS

fi (xi M)4 =

i =1

0.1340
100 (0.1414)4

= 3.3520

DIAGRAMA DE CAJA Y BIGOTES

13.1. Definicin (Diagrama de caja y bigotes). Un diagrama de caja y bigotes busca

representar los tres cuartiles y los valores mnimo y mximo de la muestra con la
finalidad de definir la ubicacin de algunos valores de la muestra que no tienen un
comportamiento tpico o esperado y perfectamente podran deberse a errores en la
recoleccin y manipulacin de la muestra.
La figura 3 revela toda la informacin que se puede representar en un diagrama de caja.

Figura 3. Diagrama de caja y bigotes


Jos Luis Quintero

22

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

13.2. Ejemplos ilustrativos.


Ejemplo 1. Suponga que de una muestra dada se tiene la siguiente informacin:
Q1 = 9.586 , Q2 = 10.1825 , Q3 = 10.448
Construya el diagrama de caja y bigotes correspondiente.
Solucin.
Clculo del rango intercuartil: IQ = Q3 Q1 = 10.448 9.586 = 0.862
Clculo de la distancia 1.5IQ = 1.5 0.862 = 1.293
Clculo de los lmites inferior y superior de los bigotes:
Lmite inferior: a = Li = Q1 1.5IQ = 9.586 1.293 = 8.293
Lmite superior: d = L s = Q3 + 1.5IQ = 10.448 + 1.293 = 11.741
Finalmente el diagrama de caja y bigotes se visualiza en la figura 4.

Figura 4. Diagrama de caja y bigotes del ejemplo

Ejemplo 2. La figura 5 representa un diagrama de caja por cada mes que muestra los
niveles de precipitacin de los ltimos 38 aos en la estacin de San Fernando de Apure.

400
300
200
100
0

PRECIPITACIN (mm)

500

DIAGRAMAS DE CAJA MESES DE SAN FERNANDO

ENE

FEB

MAR

ABR

MAY

JUN

JUL

AGO

SEP

OCT

NOV

DIC

Figura 5. Niveles de precipitacin por mes medidos en la estacin de San Fernando


Jos Luis Quintero

23

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

14. PROBLEMAS RESUELTOS

PROBLEMA 1.
Se toma una muestra de 60 obreros de una fbrica y se quiere hacer un estudio del salario
semanal (en miles de bolvares). Se obtuvo la siguiente informacin presentada en el cuadro
adjunto.
Salario
(Bs/sem)

Punto
medio

Frecuencia
absoluta

Frecuencia absoluta
acumulada

Frecuencia
relativa

Frecuencia relativa
acumulada

[20,24]

22

8/60

8/60

[25,29]

27

11

19

11/60

19/60

[30,34]

32

23

4/60

23/60

[35,39]

37

30

7/60

30/60

[40,44]

42

12

42

12/60

42/60

[45,49]

47

51

9/60

51/60

[50,54]

52

60

9/60

60/60

a. Obtenga el salario promedio del grupo de obreros


b. Determine el porcentaje de obreros que tienen salarios mayores o iguales a 25.000 Bs pero
igual o menor a 44.000 Bs
c. Calcule la moda
d. Calcule el recorrido intercuartil
SOLUCIN.
a. Obtenga el salario promedio del grupo de obreros
SOLUCIN.

f1x1 + f2 x2 + f3x3 + f4 x4 + f5 x5 + f6 x6 + f7 x7
60
8 22 + 11 27 + 4 32 + 7 37 + 12 42 + 9 47 + 9 52 2255
=
=
37.583
60
60

M=

b. Determine el porcentaje de obreros que tienen salarios mayores o iguales a 25.000 Bs pero
igual o menor a 44.000 Bs
SOLUCIN.
f + f3 + f4 + f5
11 + 4 + 7 + 12
34
Porcentaje = 2
100 =
100 =
100 56.67%
60
60
60
c. Calcule la moda
SOLUCIN.
Clase modal:
Salario
(Bs/sem)

Punto
medio

Frecuencia
absoluta

Frecuencia absoluta
acumulada

Frecuencia
relativa

Frecuencia relativa
acumulada

[40,44]

42

12

42

12/60

42/60

Jos Luis Quintero

24

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Moda = 40 +

12 7
5
20 340
4 = 40 + 4 = 40 +
=
= 42.5
12 7 + 12 9
8
8
8

d. Calcule el recorrido intercuartil


SOLUCIN.
60
Clase P25 : 14 < 25100
15 14 < 15 15 P25 = x15
Salario
(Bs/sem)

Punto
medio

Frecuencia
absoluta

Frecuencia absoluta
acumulada

Frecuencia
relativa

Frecuencia relativa
acumulada

[25,29]

27

11

19

11/60

19/60

15 8
7
28 303
4 = 25 +
4 = 25 +
=
27.55
11
11
11
11
45 44 < 45 45 P75 = x45

P25 = 25 +
Clase P75 : 44 <

75 60
100

Salario
(Bs/sem)

Punto
medio

Frecuencia
absoluta

Frecuencia absoluta
acumulada

Frecuencia
relativa

Frecuencia relativa
acumulada

[45,49]

47

51

9/60

51/60

P75 = 45 +

45 42
3
12 417
4 = 45 + 4 = 45 +
=
46.33
9
9
9
9

Finalmente

IQ = Q3 Q1 = P75 P25 = 46.33 27.55 = 18.78

PROBLEMA 2.

60 datos han sido agrupados en una distribucin de frecuencias de 6 clases de igual amplitud.
Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias:
La mediana es 26
El 20% de los datos es superior a 38
H3 = 0.3

h3 = 0.1

F4 = 48

f1 = f5 =

1
f
2 6

Halle la distribucin de frecuencias.

SOLUCIN.

h3 = 0.1

f3
60

= 0.1 f3 = 6 . H3 = 0.3

F3 = F2 + f3 = 18 F2 + 6 = 18 F2 = 12 .

F3
60

= 0.3 F3 = 18 .

F4 = F3 + f4 = 48 18 + f4 = 48 f4 = 30 .

Clase medianal: clase 4


N F
30 18
3
Me = LI4 + 2
(LS4 LI4 ) 26 = LI4 +
(LS4 LI4 ) 26 = LI4 + 0.4(LS4 LI4 )
f4
30
Ubicando el percentil 80:
80
P80 : m <
60 m + 1 m = 47 P80 = x48 = 38
100

Jos Luis Quintero

25

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

El percentil 80 se ubica en la clase 4.


80 60 F
3
P80 = LI4 + 100
(LS4 LI4 ) 38 = LI4 +
f4

80
100

60 18
30

(LS4 LI4 )

38 = LI4 + (LS4 LI4 )


Resolviendo el sistema lineal:
LI4 + 0.4(LS4 LI4 ) = 26
0.6LI4 + 0.4LS4 = 26
LI = 18

4
LI4 + (LS4 LI4 ) = 38
LS4 = 38
LS4 = 38

f1 + f2 + f3 + f4 + f5 + f6 = 60 f1 + f2 + 6 + 30 + f5 + f6 = 60 f1 + f2 + 36 + f5 + f6 = 60
f1 + f2 + f5 + f6 = 24 4f1 + f2 = 24 4f1 + F2 f1 = 24
3f1 + F2 = 24 3f1 = 12 f1 = 4 f5 = 4 f6 = 8
Finalmente f1 + f2 = F2 f2 = F2 f1 = 12 4 = 8
A continuacin se muestra la distribucin de frecuencias de los datos:
Marca de
Clase

Inicio

Fin

clase

fi

Fi

hi

Hi

(xi)
1

-42

-22

-32

4/60

4/60

-22

-2

-12

12

8/60

12/60

-2

18

18

6/60

18/60

18

38

28

30

48

30/60

48/60

38

58

48

52

4/60

52/60

58

78

68

60

8/60

PROBLEMA 3.
Considere un lote de 300 muestras distribuidas en forma simtrica en seis intervalos de igual

amplitud. Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias:


La mediana es 25
El percentil 91.667 es 35
f2 = 3f1

f3 = 2f1

Halle la distribucin de frecuencias.


SOLUCIN.
Distribucin simtrica:
f1 + f2 + f3 + f4 + f5 + f6 = 300 f1 + f2 + f3 + f3 + f2 + f1 = 300 f1 + f2 + f3 = 150
Relaciones entre las frecuencias:
f2 = 3f1 , f3 = 2f1 f1 + 3f1 + 2f1 = 150 f1 = 25 = f6 , f2 = 75 = f5 , f3 = 50 = f4
Informacin de la mediana: Clase medianal: clase 3
N F
150 100
2
Me = LI3 + 2
(LS3 LI3 ) 25 = LI3 +
(LS3 LI3 ) = LS3
f3
50

Informacin del percentil: Ubicacin:


91.667
P91.667 : m <
300 m + 1 m = 274 P91.667 = x275 = 35
100

Jos Luis Quintero

26

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

El percentil 91.667 se ubica en la clase 5.


275 F4
275 200
P91.667 = LI5 +
(LS5 LI5 ) 35 = LI5 +
(LS5 LI5 )
f5
75

35 = LI5 + (LS5 LI5 ) 35 = LS5


Amplitud (d) del intervalo de clase: 2d = LS5 LS3 = 35 25 = 10 d = 5
A continuacin se muestra la distribucin de frecuencias de los datos:
Marca
Clase

Inicio

Fin

de clase

fi

Fi

hi

Hi

(xi)
1

10

15

12.5

25

25

25/300

25/300

15

20

17.5

75

100

75/300

100/300

20

25

22.5

50

150

50/300

150/300

25

30

27.5

50

200

50/300

200/300

30

35

32.5

75

275

75/300

275/300

35

40

37.5

25

300

25/300

PROBLEMA 4.
Para estudiar la cantidad de errores ortogrficos cometidos por un conjunto de 60 estudiantes
al tomar un dictado, se organizaron los datos en una tabla de distribucin de frecuencias de
seis clases de igual amplitud. De dicha distribucin solo se conoce la siguiente informacin:
a. en la cuarta clase se tiene el doble de datos que en la sexta clase
b. las clases uno y cinco tienen igual nmero de datos
c. la clase tres tiene la mayor cantidad de datos igual a 25
d. la mediana de los datos es igual a 10.24
e. el extremo inferior de la clase 6 es 20
f. por encima de la clase tres hay 19 datos
g. el nmero de datos de la clase dos triplica al nmero de datos de la clase uno
Construya la distribucin de frecuencias para esos datos.
SOLUCIN.
Informacin suministrada:
f4 = 2f6 , f1 = f5 , f3 = 25 , f4 + f5 + f6 = 19 , f2 = 3f1 , LI6 = 20
Se sabe que

f1 + f2 + f3 + f4 + f5 + f6 = 60 f1 + 3f1 + 25 + 19 = 60 4f1 = 16 f1 = 4
Por lo tanto:

f2 = 12 , f5 = 4 .
Por otro lado

f4 + f5 + f6 = 19 3f6 + 4 = 19 f6 = 5 f4 = 10
Hasta ahora se tiene la siguiente informacin:

Jos Luis Quintero

27

Probabilidad y Estadstica

Clase

Inicio

1
2

Fundamentos de Estadstica Descriptiva

a
a+d

Fin
a+d

fi

Fi

hi

Hi

4/60

4/60

a + 2d

12

16

12/60

16/60

a + 2d

a + 3d

25

41

25/60

41/60

a + 3d

a + 4d

10

51

10/60

51/60

a + 4d

55

4/60

55/60

20

20
a + 6d

60

5/60

Informacin suministrada: mediana = 10.24


Clase medianal: 3. Entonces

mediana = LI3 +

N
2

F2
f3

30 16
d = 10.24
25

(LS3 LI3 ) = a + 2d +

64
d = 10.24 25a + 64d = 256
25
Por otro lado se tiene que a + 5d = 20
a+

Construyendo y resolviendo el sistema se obtiene


25a + 64d = 256
a = 0, d = 4

a + 5d = 20
Finalmente la tabla de distribucin de frecuencias de los datos se muestra a continuacin:
Clase

Inicio

Fin

fi

Fi

hi

Hi

4/60

4/60

12

16

12/60

16/60

12

25

41

25/60

41/60

12

16

10

51

10/60

51/60

16

20

55

4/60

55/60

20

24

60

5/60

PROBLEMA 5.
Se tienen los datos correspondientes al peso (en Kg.) de 200 productos, organizados en una
distribucin de frecuencias formada por 6 intervalos de clases de igual amplitud, con las
caractersticas siguientes:
La diferencia entre el percentil 90 y el percentil 2 es 0.88
Si se elimina el 5% inferior de los datos y el 10% superior de los datos, el peso promedio es
de 0.5776 Kg
La primera clase contiene el 5% de los datos
La mediana es el lmite superior de la tercera clase
La frecuencia acumulada absoluta de la segunda clase es 40
F4 F3 = 64

5f6 = 4f5

Halle la distribucin de frecuencias de estos datos.

SOLUCIN.
Jos Luis Quintero

28

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Informacin suministrada:
P90 P2 = 0.88 , f1 = 10 , Me = LS3 , F2 = 40 , F4 F3 = 64
Clculos
F2 = 40 f1 + f2 = 40 10 + f2 = 40 f2 = 30

F4 F3 = 64 F3 + f4 F3 = 64 f4 = 64

Me = LS3 = LI3 +

100 40
100 40
(LS3 LI3 )
= 1 f3 = 60
f3
f3

Ubicando el percentil 2 y el percentil 90:


P2 :

m<

2
200 m + 1 m = 3 P2 = x 4
100

P90 :
90
200 m + 1 m = 179 P90 = x180
100
2 200 F
2 200 0
0
P2 = LI1 + 100
(LS1 LI1 ) = LI1 + 100
(LS1 LI1 ) = LI1 + 0.4(LS1 LI1 )
f1
10
m<

P90 = LI5 +

90
100

200 F4
f5

(LS5 LI5 ) = LI5 +

90
100

200 164
20

(LS5 LI5 ) = LI5 + 0.8(LS5 LI5 )

P90 P2 = (LI5 LI1 ) + 0.8(LS5 LI5 ) 0.4(LS1 LI1 ) = 4d + 0.4d = 0.88 d = 0.2
5

1
170

fixi = 0.5776

i=2

fixi = 98.192

i=2

30x2 + 60x3 + 64x4 + 16x5 = 98.192

i=2

15(2a + d) + 30(2a + 3d) + 32(2a + 5d) + 8(2a + 7d) = 98.192


170a + 3 + 18 + 32 + 11.2 = 98.192 170a + 64.2 = 98.192
a 0.2
Finalmente la tabla de distribucin de frecuencias de los datos se muestra a continuacin:

Clase

Inicio

Fin

Marca
de clase

fi

Fi

hi

Hi

(xi)
1

0.0

0.2

0.1

10

10

0.05

0.05

0.2

0.4

0.3

30

40

0.15

0.20

0.4

0.6

0.5

60

100

0.30

0.50

0.6

0.8

0.7

64

164

0.32

0.82

0.8

1.0

0.9

20

184

0.10

0.92

1.0

1.2

1.1

16

200

0.08

1.00

Jos Luis Quintero

29

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

PROBLEMA 6.
Se desea distribuir en 7 clases los datos de la vida til, medida en meses, de 50 bateras para
automviles. Para ello se dispone de la siguiente informacin acerca de esa distribucin:
La mediana de la vida til de las bateras es de 20 meses

Las tres primeras clases contienen un total de 10 datos


La mitad de los datos est en las tres ltimas clases
La suma de los datos de las clases 2 y 3 es igual al nmero de datos de la clase 6
En la clase 5 hay 11 datos y en la clase 7 hay 6 datos
f7 = 2f2 y P10 = 10
Obtenga la distribucin de frecuencias de la vida til de las 50 bateras.

SOLUCIN.
Codificacin de la informacin suministrada:
Me = P50 = 20 ; f1 + f2 + f3 = 10 ; f5 + f6 + f7 = 25 ; f6 = f2 + f3 ; f5 = 11

f7 = 6 ; f7 = 2f2 ; P10 = 10 ; f1 + f2 + f3 + f4 + f5 + f6 + f7 = 50
Usando algunas de las anteriores relaciones se tiene que
f7 = 6 f2 = 3 ; f5 = 11 f6 = 8 f3 = 5 f1 = 2 f4 = 15
Se tiene hasta ahora la siguiente distribucin de frecuencias:
Marca de clase (xi)
Clase

Inicio

Fin

fi

Fi

hi

Hi

a+d

a + d/2

0.04

0.04

a+d

a + 2d

a + d + d/2

0.06

0.10

a + 2d

a + 3d

a + 2d + d/2

10

0.10

0.20

a + 3d

a + 4d

a + 3d + d/2

15

25

0.30

0.50

a + 4d

a + 5d

a + 4d + d/2

11

36

0.22

0.72

a + 5d

a + 6d

a + 5d + d/2

44

0.16

0.88

a + 6d

a + 7d

a + 6d + d/2

50

0.12

1.00

De la distribucin anterior se observa que la clase medianal es la clase 4 y se puede inferir que 20
es el lmite superior de la clase 4, por lo tanto se tiene que a + 4d = 20 . Por otro lado se puede
inferir tambin que el percentil 10 est en la clase 2 y 10 es su lmite superior. Este hecho genera
la ecuacin a + 2d = 10 . De las dos ecuaciones se tiene que a = 0 ; d = 5 . Por lo tanto
Clase

Inicio

Fin

Marca de clase (xi)

fi

Fi

Hi

Hi

2.5

0.04

0.04

10

7.5

0.06

0.10

10

15

12.5

10

0.10

0.20

15

20

17.5

15

25

0.30

0.50

20

25

22.5

11

36

0.22

0.72

25

30

27.5

44

0.16

0.88

30

35

32.5

50

0.12

1.00

Jos Luis Quintero

30

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

15. PROBLEMAS PROPUESTOS

1. Coloque al lado de cada proposicin la letra V o F segn sea verdadera o falsa


respectivamente.
a. Los datos discretos slo se pueden expresar con nmeros enteros
b. Un histograma es una serie de rectngulos, cada uno proporcional en ancho al nmero de
elementos que caen dentro de una clase especfica de datos
c. Todos los valores de los datos se toman en cuenta cuando se calcula la mediana del
conjunto
d. La desviacin estndar se mide en las mismas unidades que las observaciones del conjunto
de datos
2. Subraye la respuesta que considere correcta.
a. Cul de las afirmaciones siguientes acerca de los rectngulos de un histograma es
correcta?
i. Los rectngulos tienen una altura proporcional al nmero de elementos de las clases
ii. Por lo general existen cinco rectngulos en cada histograma
iii. El rea de un rectngulo depende slo del nmero de elementos de la clase en
comparacin con el nmero de elementos de todas las dems clases
iv. Todas las anteriores
b. Cul es la principal suposicin que se hace cuando se calcula la media de datos
agrupados?
i. Todos los valores son discretos
ii. Cada valor de una clase es igual a su punto medio
iii. Ningn valor se presenta ms de una vez
iv. Cada clase contiene exactamente el mismo nmero de valores
c. En cul de estos casos sera la moda ms til como indicador de la tendencia central?
i. Cada valor de un conjunto de datos se presenta solamente una vez
ii. Todos los valores de un conjunto de datos, excepto tres, se presentan slo una vez. Los
tres valores se presentan 100 veces cada uno
iii. Todos los valores de un conjunto de datos se presentan 100 veces cada uno
iv. Todas las observaciones de un conjunto de datos tienen el mismo valor
d. El cuadrado de la varianza de un conjunto de datos representa
i. La desviacin estndar
ii. La media
iii. El alcance
iv. Ninguna de las anteriores
e. Por qu es necesario elevar al cuadrado las diferencias con respecto a la media cuando se
calcula la varianza de la poblacin?
i. Para que los valores extremos no afecten el clculo
ii. Porque es posible que el tamao de la poblacin sea pequeo

Jos Luis Quintero

31

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

iii. Algunas de las diferencias sern positivas y otras negativas


iv. Ninguna de las anteriores
3. Halle la media y la mediana de los primeros n nmeros naturales.
4. Halle la media y la mediana de los cuadrados de los primeros n nmeros naturales.
5. Halle la varianza muestral y la varianza muestral corregida de los primeros n nmeros
naturales.
6. Se toma una muestra de 60 obreros de una fbrica y se quiere hacer un estudio del salario
semanal (en miles de bolvares). Se obtuvo la siguiente informacin presentada en el cuadro
adjunto.
Salario
(Bs/sem)

Punto
medio

Frecuencia
absoluta

Frecuencia absoluta
acumulada

Frecuencia
relativa

Frecuencia relativa
acumulada

[20,24]

22

8/60

8/60

[25,29]

27

11

19

11/60

19/60

[30,34]

32

23

4/60

23/60

[35,39]

37

30

7/60

30/60

[40,44]

42

12

42

12/60

42/60

[45,49]

47

51

9/60

51/60

[50,54]

52

60

9/60

60/60

a. Obtenga el salario promedio del grupo de obreros


b. Determine el porcentaje de obreros que tienen salarios mayores o iguales a 25.000 Bs
pero igual o menor a 44.000 Bs
c. Calcule la moda
d. Calcule el recorrido intercuartil
7. 60 datos han sido agrupados en una distribucin de frecuencias de 6 clases de igual amplitud.
Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias:
La mediana es 26
El 20% de los datos es superior a 38
H3 = 0.3

h3 = 0.1

F4 = 48

f1 = f5 =

1
f
2 6

Halle la distribucin de frecuencias.

8. Considere un lote de 300 muestras distribuidas en forma simtrica en seis intervalos de igual
amplitud. Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias:
La mediana es 25
El percentil 91.667 es 35
f2 = 3f1

Jos Luis Quintero

32

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

f3 = 2f1

Halle la distribucin de frecuencias.


9. Para estudiar la cantidad de errores ortogrficos cometidos por un conjunto de 60 estudiantes
al tomar un dictado, se organizaron los datos en una tabla de distribucin de frecuencias de
seis clases de igual amplitud. De dicha distribucin solo se conoce la siguiente informacin:
a. en la cuarta clase se tiene el doble de datos que en la sexta clase
b. las clases uno y cinco tienen igual nmero de datos
c. la clase tres tiene la mayor cantidad de datos igual a 25
d. la mediana de los datos es igual a 10.24
e. el extremo inferior de la clase 6 es 20
f. por encima de la clase tres hay 19 datos
g. el nmero de datos de la clase dos triplica al nmero de datos de la clase uno
Construya la distribucin de frecuencias para esos datos.
10. Se tienen los datos correspondientes al peso (en Kg.) de 200 productos, organizados en una
distribucin de frecuencias formada por 6 intervalos de clases de igual amplitud, con las
caractersticas siguientes:
La diferencia entre el percentil 90 y el percentil 2 es 0.88
Si se elimina el 5% inferior de los datos y el 10% superior de los datos, el peso promedio
es de 0.5776 Kg
La primera clase contiene el 5% de los datos
La mediana es el lmite superior de la tercera clase
La frecuencia acumulada absoluta de la segunda clase es 40
F4 F3 = 64

5f6 = 4f5

Halle la distribucin de frecuencias de estos datos.


11. En un torneo de ftbol se conoce que el 15% de los jugadores ha anotado ms de 5 goles.
Hay dos jugadores que se disputan el liderato del torneo con 8 goles. El 30% de los jugadores
ha anotado 4 5 goles, sabiendo adems que la cantidad de jugadores es la misma para
ambas categoras. La cuarta parte de los jugadores anot un gol y el nmero de jugadores
que anot 2 goles es el doble del nmero que anot 3 goles. Por otro lado, se sabe que slo
un jugador ha anotado 7 goles. Los datos anteriores son relativos a aquellos jugadores que
anotaron al menos un gol y estos representan el 60% del total de 100 jugadores en el torneo.
Obtenga la tabla de frecuencias para estos datos.
12. Un complejo Sistema de Telecomunicaciones GSM est formado por 1000 nodos. El
Departamento de Estadstica Operativa que monitorea al Sistema de Telecomunicaciones se
encarg de recopilar las fallas que se presentaron en cada uno de los nodos durante un ao.
Los datos obtenidos corresponden a aquellos nodos que presentaron al menos una falla, que
representan el 90% del total de los nodos. Los resultados fueron los siguientes:
El nmero de nodos que presentaron 2 fallas es el mismo que el cudruple del nmero de
nodos que sufrieron 4 fallas

Jos Luis Quintero

33

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Solo el 20% de los nodos han presentado ms de 5 fallas


Una cuarta parte de los nodos han presentado 3 5 fallas
Solo el 20% de los nodos present una falla
El mismo nmero de nodos que presentaron 4 fallas tambin presentaron 7 fallas
El 70% de los nodos presentaron menos de 5 fallas
Slo 30 nodos presentaron un mximo de 8 fallas cada uno
a. Halle la distribucin de frecuencias de los datos
b. Calcule media, moda y mediana para la distribucin anterior
13. En una liga de bisbol aficionado slo 30 bateadores batearon por encima de 300 puntos. Los
1200 jugadores con turnos legales para ser tomados en cuenta han sido distribuidos en seis
clases de igual ancho donde el percentil 97,5 coincide con el lmite superior de la clase cinco.
Por otro lado, el tercer cuartil es 270 y coincide con el borde inferior de la clase cuatro. El
nmero de jugadores en la primera clase es el triple del nmero en la tercera clase mientras
que en la segunda clase hay el doble de jugadores que en la tercera. Finalmente, se conoce
que el 14,5% de los jugadores pertenece a la cuarta clase. Halle la distribucin de
frecuencias.
14. Una prestigiosa compaa ha decidido contratar a una compaa de recursos humanos para
que gestione la contratacin de varios ingenieros para el prximo proyecto que se va a licitar.
Esta compaa de recursos humanos tiene las calificaciones de una prueba tcnica presentada
por 800 ingenieros logrando distribuir en clases esta informacin. La informacin que se tiene
es la siguiente:
Las notas estn distribuidas en 7 clases de igual amplitud
El 10% superior de las notas supera el valor 96
La mitad de los datos est por debajo de 60
La clase 4 es una clase modal y contiene el 30% de los datos
Por encima de esa clase modal esta el 20% de las notas
La primera y la ltima clase contienen cada una 80 datos
La segunda clase contiene la tercera parte de los datos de la tercera clase
El percentil 85 es 84 puntos
a. Obtenga la tabla de distribucin de frecuencias
b. Determine el rango intercuartlico
15. Pensando en la seleccin de estudiantes para su ingreso al Sistema de Educacin Superior, se
han escogido los 5000 mejores estudiantes de aquellos que solicitan estudiar la carrera de
Ingeniera Elctrica. Para la escogencia de estos 5000 aspirantes se tom en cuenta el
promedio de sus asignaturas cursadas y aprobadas en los primeros cuatro aos de estudios de
educacin media. Se sabe que el promedio de notas de esta muestra de 5000 estudiantes es
de 15.94. Los promedios de notas para estos 5000 estudiantes han sido distribuidos en 8
clases de igual amplitud. De esta distribucin de frecuencias se conoce adems lo siguiente:
El primer cuartil es 15 y coincide con el borde inferior de la quinta clase
El percentil 90 es 18 y coincide con el borde superior de la sptima clase
El nmero de datos en la clase 4 es igual a la suma de los datos de las clases 2 y 3

Jos Luis Quintero

34

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

Las clases 5 y 6 tienen cada una 4 veces el contenido de la primera clase


La sptima clase tiene 1250 datos
Obtenga la tabla de distribucin de frecuencias
16. Una mquina produce tornillos cuya longitud nominal es de 10 cm de largo. Se considera que
un tornillo est en especificaciones si su longitud difiere menos de 2 mm de la longitud
nominal. La produccin de una hora correspondiente a 1500 tornillos, se ha distribuido en 7
clases de igual amplitud, con las caractersticas siguientes:
En las clases uno y siete hay igual cantidad de tornillos
El total de tornillos por encima de la clase cinco excede al total de la clase dos por cinco
En las dos primeras clases hay un total de 180 tornillos
Hasta la clase seis hay 1450 tornillos acumulados
El 37% de los tornillos cae en la cuarta clase
El percentil 27,33, igual a 9,95 cm, coincide con el lmite superior de la clase tres
La longitud promedio de los 1500 tornillos es de 10,033 cm
a. Obtenga la tabla de distribucin de frecuencias
b. Qu porcentaje de tornillos est en especificaciones?
17. A continuacin se presentan unos diagramas de cajas para los datos de precipitacin por mes
de la estacin meteorolgica de San Fernando en el estado Apure.

400
300
200
100
0

PRECIPITACIN (mm)

500

DIAGRAMAS DE CAJA MESES DE SAN FERNANDO

ENE

FEB

MAR

ABR

MAY

JUN

JUL

AGO

SEP

OCT

NOV

DIC

Analice el siguiente grfico considerando los siguientes aspectos de inters: media aritmtica y
mediana por mes, datos atpicos, rango intercuartlico y comportamiento de la precipitacin.
18. Una empresa productora de antenas satelitales tiene tres mquinas dedicadas a la produccin
de antenas cuyo radio de pantalla debe ser de 11 cm. Debido a desperfectos en las mquinas
el radio de cada pantalla vara dificultando la calidad de las antenas producidas. Por esta
razn, el Departamento de Control de Calidad de la empresa ha decidido tomar una muestra
de 11 antenas de cada mquina para verificar su radio. La tabla siguiente presenta los
resultados obtenidos de las muestras tomadas.
Jos Luis Quintero

35

Probabilidad y Estadstica

N de la muestra
1
2
3
4
5
6
7
8
9
10
11

Fundamentos de Estadstica Descriptiva

Mquina 1
Mquina 2
Mquina 3
11,6
12,2
11,8
11,2
11,7
11,2
11,3
11,7
11,5
11,8
12,0
11,5
11,7
11,9
11,6
11,0
11,5
11,2
9,6
11,4
10,4
10,1
11,4
10,2
10,2
11,2
11,2
9,5
11,4
10,7
9,6
11,3
10,4
Radios dados en centmetros

Con base en los diagramas de caja y bigotes para las 3 mquinas, qu podra decir usted acerca
de la calidad del lote de produccin analizado? Tome en cuenta localizacin y dispersin de la
muestra en su respuesta.
19. Se desea distribuir en 7 clases los datos de la vida til, medida en meses, de 50 bateras para
automviles. Para ello se dispone de la siguiente informacin acerca de esa distribucin:
La mediana de la vida til de las bateras es de 20 meses
Las tres primeras clases contienen un total de 10 datos
La mitad de los datos est en las tres ltimas clases
La suma de los datos de las clases 2 y 3 es igual al nmero de datos de la clase 6
En la clase 5 hay 11 datos y en la clase 7 hay 6 datos
f7 = 2f2 y P10 = 10
Obtenga la distribucin de frecuencias de la vida til de las 50 bateras.
20. Construya el diagrama de caja y bigotes para los datos del ejercicio anterior.

Jos Luis Quintero

36

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

RESPUESTAS
1. a. F b. F c. F d. V

2. a.i b.ii c.ii d.iv e.iii

3. M = Me =

n+1
2

n + 1 2

n impar

(n + 1)(2n + 1)
2
4. M =
, Me =
2
6
n + 1
1
n par
+

4
2
5. S2 =

n2 1
n(n + 1)
, S2c =
12
12

6. a. 37.583 b. 56.67 c. 42.5 d. 18.78


7.
Clase

Inicio

Fin

Marca de
clase

fi

Fi

hi

Hi

(xi)
1

-42

-22

-32

4/60

4/60

-22

-2

-12

12

8/60

12/60

-2

18

18

6/60

18/60

18

38

28

30

48

30/60

48/60

38

58

48

52

4/60

52/60

58

78

68

60

8/60

8.
Marca
Clase

Inicio

Fin

de clase

Fi

Fi

hi

Hi

(xi)
1

10

15

12.5

25

25

25/300

25/300

15

20

17.5

75

100

75/300

100/300

20

25

22.5

50

150

50/300

150/300

25

30

27.5

50

200

50/300

200/300

30

35

32.5

75

275

75/300

275/300

35

40

37.5

25

300

25/300

Clase

Inicio

Fin

fi

Fi

hi

Hi

4/60

4/60

12

16

12/60

16/60

12

25

41

25/60

41/60

12

16

10

51

10/60

51/60

16

20

55

4/60

55/60

20

24

60

5/60

9.

Jos Luis Quintero

37

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

10.
Clase

Inicio

Fin

Marca
de clase

fi

Fi

hi

Hi

(xi)
1

0.0

0.2

0.1

10

10

0.05

0.05

0.2

0.4

0.3

30

40

0.15

0.20

0.4

0.6

0.5

60

100

0.30

0.50

0.6

0.8

0.7

64

164

0.32

0.82

0.8

1.0

0.9

20

184

0.10

0.92

1.0

1.2

1.1

16

200

0.08

1.00

11.

12.

MEDIA = 3.31 MEDIANA = 3 MODA = 2

Jos Luis Quintero

38

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

13.

14.

RANGO INTERCUARTIL = 20
15.

Jos Luis Quintero

39

Probabilidad y Estadstica

Fundamentos de Estadstica Descriptiva

16.

PORCENTAJE EN ESPECIFICACIONES: 70%


19.
Clase

Inicio

Fin

Marca de
clase

fi

Fi

hi

Hi

(xi)
1

2.5

0.04

0.04

10

7.5

0.06

0.10

10

15

12.5

10

0.10

0.20

15

20

17.5

15

25

0.30

0.50

20

25

22.5

11

36

0.22

0.72

25

30

27.5

44

0.16

0.88

30

35

32.5

50

0.12

1.00

Jos Luis Quintero

40

BIBLIOGRAFA
GENERAL

ROBABILIDADES (ITEL-30205)

Tema 1. Fundamentos de Estadstica Descriptiva

Distribucin defrecuencias y medidas de localizacin

[1]

CANAVOS, GEORGE. Probabilidad y Estadstica. Aplicaciones y Mtodos. Mc Graw Hill


(1995)

[2]

DEVORE, JAY. Probabilidad y Estadstica para Ingeniera y Ciencias. Quinta edicin.


Thomson Learning (2001)

[3]

DAZ, RAFAEL. Introduccin a la Probabilidad y a los Procesos Estocsticos en Ingeniera.


Disponible en Mdulo 7 Universidad Catlica Andrs Bello (2011)

[4]

[5]

HINES, WILLIAM y MONTGOMERY, DOUGLAS. Probabilidad y Estadstica para Ingeniera.


Tercera edicin. CECSA (1999)
LPEZ, RAFAEL. Clculo de Probabilidades e Inferencia Estadstica con tpicos de
Econometra. Quinta edicin. Publicaciones UCAB (2009)

[6]

MARTNEZ, CIRO. Estadstica y Muestreo. Ecoe Ediciones (2003)

[7]

MEYER, PAUL. Probabilidad y Aplicaciones Estadsticas. Addison-Wesley Iberoamericana


(1986)

[8]

[9]

MONTGOMERY, DOUGLAS y RUNGER, GEORGE. Probabilidad y Estadstica aplicadas a la


Ingeniera. Mc Graw Hill (1998)
NIEVES, ANTONIO y DOMNGUEZ, FEDERICO. Probabilidad y Estadstica para Ingeniera.
Un enfoque moderno. Mc Graw Hill (2010)

[10] ORTEGA, JOAQUIN y WSCHEBOR, MARIO. Introduccin a la Probabilidad. Universidad


Nacional Abierta (1993)
[11] SPIEGEL, MURRAY; SCHILLER, JOHN y SRINIVASAN, ALU. Probabilidad y Estadstica.
Segunda edicin. Serie Schaum (2001)
[12] TRIOLA, MARIO. Probabilidad y Estadstica. Novena edicin. Pearson Addison Wesley
(2004)
[13] WACKERLY, DENNIS; MENDENHALL; WILLIAM y SCHEAFFER, RICHARD. Estadstica
Matemtica con Aplicaciones. Sptima edicin. Cengage Learning Editores (2010)
[14] WALPOLE, RONALD; MYERS, RAYMOND; MYERS, SHARON y YE, KEYING. Probabilidad y
Estadstica para Ingeniera y Ciencias. Onceava edicin. Pearson (2012)

Jos Luis Quintero

Jos Luis Quintero

Ingeniero de Sistemas (I.U.P.F.A.N.) Magister Scientiarum en


Investigacin de Operaciones (U.C.V.) Doctor en Ciencias de
la Computacin: rea de inters: Clculo Numrico y
Optimizacin (U.C.V.). Postdoctor en Ciencias Gerenciales
(U.N.E.F.A.). Actualmente se encuentra culminando el
Doctorado en Ingeniera: rea de inters: Estadstica (U.S.B.).
Investigador y profesor de pregrado y postgrado de la Facultad
de Ingeniera de la Universidad Central de Venezuela. Profesor
de la Escuela de Ingeniera de Telecomunicaciones de la
Universidad Catlica Andrs Bello.

Fundamentos de Estadstica Descriptiva rene en un


solo material los puntos de inters de este segundo tema para
el curso de Probabilidades que forma parte del conjunto de
asignaturas del programa de estudios de Ingeniera de
Telecomunicaciones. Aspectos de inters como organizacin
de los datos en tablas de distribucin de frecuencias, medidas
de tendencia central, medidas de localizacin, medidas de
dispersin y diagramas de caja y bigotes forman parte del
contenido del tema. Se resuelven y proponen problemas a
distintos niveles que buscan ilustran con situaciones sencillas
los aspectos tericos desarrollados en el tema. Determinados
grficos estn generados con el programa MATLAB.
El presente material se encuentra disponible para descargar
de forma gratuita del sitio web

http://www.joseluisquintero.com/

Potrebbero piacerti anche