Sei sulla pagina 1di 7

Mtodos 1

descriptivos
Tabla 1.19. Distribucin de la variable tiempo de inicio de la reaccin

Frecuencia
Frecuencia Frecuencia relativa Porcentaje
Clase Lmites Frecuencia relativa Porcentaje acumulada acumulada acumulado

1 3.75 a 5.95 2 2/40 = 0.500 5 2 2/40 = 0.050 5


2 5.95 a 8.15 4 4/40 = 0.100 10 6 6/40 = 0.150 15
3 8.15 a 10.35 10 10/40 = 0.250 25 16 16/40 = 0.400 40
4 10.35 a 12.55 16 16/40 = 0.400 40 32 32/40 = 0.800 80
5 12.55 a 14.75 6 6/40 = 0.150 15 38 38/40 = 0.950 95
6 14.75 a 16.95 2 2/40 = 0.050 5 40 40/40 = 1.000 100

EJERCICIOS 1.3

1. Una variable de inters en un estudio del cangrejo Xanthidae (pequeo cangrejo que
habita en las proximidades de Gloucester Point, Virginia) es el nmero de huevos pues
tos por individuo. Las siguientes son las observaciones obtenidas para 45 cangrejos:
1959 4534 7020 6725 6964 7428 9359 9166
2802 2462 4000 3378 7343 4189 8973 4327
2412 7624 1548 4801 737 5321 849 5749
6837 8639 7417 6082 10241 962 3894 1801
5099 6627 4484 5633 4148 6588 5847 4632
6472 8372 8225 6142 12130
a) Determinar la observacin mayor y la ms pequea.
b) Determinar el rango.
c) Si se utilizan las directrices dadas en la Tabla 1.11, cuntas clases se necesitan
para subdividir estos datos?
d) Cul es la amplitud mnima necesaria por clase para cubrir el intervalo, si se
emplean 6 clases?
e) Determinar la amplitud efectiva de la clase que seusar para la particin del cor
junto de datos.
f ) Determinar el lmite inferior para la primera clase.
g) Determinar la tabla de distribucin para el conjunto de datos y construir un histc
grama de frecuencias relativas.
h) Se sorprendera si le dijeran que la variable aleatoria nmero de huevos desovadas
presenta una distribucin en forma de campana? Expliqese.
2. En el estudio de pautas de crecimiento en nios, una variable importante es la edad d
1 nio cuando comienza el crecimiento rpido de la adolescencia. Las siguientes
observa ciones se obtuvieron en un estudio de 35 chicos y 40 chicas (edad en aos).

Chicos
16.0 14.9 14.1 14.8 14.4 14.0 14.6
15.2 14.7 13.6 14.6 16.1 13.2 13.2
14.9 14.1 15.4 15.3 14.4 14.8 14.8
13.5 15.1 13.5 15.0 14.6 15.4 15.9
13.7 15.9 14.7 14.5 14.4 13.8 15.3
Chicas
12.2 13.7 13.3 12.3 12.5 12.9 11.9 11.6
13.4 12.4 12.6 13.5 12.5 13.4 11.7 13.5
13.7 12.1 14.1 11.8 12.8 12.9 11.6 14.3
13.1 13.3 13.5 14.7 12.3 11.6 13.1 12.6
12.7 12.7 12.0 11.4 13.5 12.4 12.1 12.1

a) Dividir cada conjunto de datos en el nmero de clases apropiado segn la Ta-


bla 1.11, utilizando el mtodo expuesto en esta sec in.
b) Construir un histograma de frecuencias relativas para cada conjunto de datos. Co-
mentar las semejanzas o diferencias llamativas entre los histogramas.
3. En pacientes con distrofia muscular progresiva (enfermedad de Duchenne) la actividad
de la creatina cinasa srica se eleva llamativamente sobre el valor normal de menos
de 50 unidades/litro. Los siguientes datos son niveles sricos de creatina cinasa
medidos en 24 pacientes jvenes con la enfermedad de Duchenne (en unidades por
litro):

3720 3796 3340 5600 3802 3580


5500 2000 1571 2360 1500 1840
3723 3790 3345 3805 5595 3577
1995 5504 2055 1573 1835 1505

a) Dividir el conjunto de datos en la cantidad de clases sugerida en la Tabla 1.11.


b) Determinar la tabla de distribucin para el conjunto de datos.
c) Construir un histograma de porcentajes y describir su forma y localizacin.
4. Polgono de frecuencias relativas acumuladas (ojiva). Si la variable aleatoria que se
est estudiando es continua, es posible utilizar ungrfico de la distribucin acumulada
para as conseguir una valiosa informacin. El grfico se obtiene trazando el lmite
superior de cada clase sobre el eje horizontal y lafrecuencia relativa acumulada sobre
el eje vertical. A continuacin, los puntos obtenidosse unen con segmentos rectilneos.
El grfico se completa trazando un segmento de forma que pase por el punto 0 situado
en el lmite inferior de la primera clase. Este grfico sedenomina polgono de
frecuencias relativas acumuladas u ojiva. Por ejemplo, considere los datos del Ejemplo
1.3.2. La variable tiempo transcurrido hasta la aparicin de alguna reaccin a una
picadura de insecto, es continua. El polgono de frecuencias relativas acumuladas se
construye a partir de la informacin de la Tabla 1.19 y se muestraen la Figura 1.13.
Ahora, haremos dos preguntas:
1. Qu proporcin aproximada de pacientes ha experimentado una reaccin en
los 10 primeros minutos?
2. En qu instante se ha producido la reaccin para la mitad de los pacientes? La
primera pregunta puede responderse grficamente localizando el 10 sobre el eje
horizontal, proyectando una lnea vertical hasta la ojiva y, a continuacin, proyectando
una lnea horizontal sobre el eje vertical (Fig. 1.14). La proporcin buscada es aproxi-
madamente 0.37. La segunda pregunta se responde colocando 0.5 sobre el eje vertical y,
a continuacin, invirtiendo el proceso. La respuesta es de aproximadamente 11
minutos (Fig. 1.14).
a) Construir un polgono de frecuencias relativas acumuladas para cada conjunto de
datos del Ejercicio 2. Utilizar la ojiva para calcular aproximadamente la edad en la
0.2

1.0
0.8
0.6
0.4
0 3.75 5.95 8.15 10.35 12.55 14.75 16.95
Tiempo en minutos

Figura 1.13. Polgono de frecuencias relativas acumuladas.

que el 50% de los chicos ha iniciado el crecimientorpido de la adolescencia;


hacer lo mismo para las chicas. Existe una diferencia notable entre los dos va-
lores?
b) A la edad de 12 aos, qu porcentaje aproximado de chicas ha experimentado el
inicio del crecimiento rpido de la adolescencia? Ala edad de 14 aos, qu por-
centaje aproximado de chicos ha experimentado el comienzo del crecimiento rpi-
do de la adolescencia?
5. ) Dibujar un polgono de frecuencias relativas acumuladas para
el conjunto de datos del Ejercicio 3.
b) Basndose en estos datos, qu proporcin de pacientes con la enfermedad de Du-
chenne tienen niveles sricos de creatina cinasa deal menos 50 veces por encima
del valor normal?
6. En un estudio diseado para correlacionar el cambio estacional de testosterona en plas-
ma con el ciclo reproductor de los saurios, se obtuvieronlos siguientes datos de una
muestra de 33 saurios de una especie particular, capturada en el monte August. (Los
niveles de testosterona estn en nanogramos por mililitro.)

7.5 7.2 3.0 12.1 15.1 12.1 11.5 11.8 7.2 13.2 13.6
8.2 9.5 8.4 13.3 12.5 12.4 2.1 10.7 9.4 6.7 6.8
6.1 8.3 7.9 6.0 7.6 13.2 4.5 9.3 8.1 3.5 9.0

1.0
0.8
0.6
0.4

0.2

03.75 5.95 8.15 12.5514.75


10 11
Tiempo en minutos

Figura 1.14. Mtodo de proyeccin para estimar porcentajes.


En octubre, una muestra de 40 saurios de la misma especie revel los siguientes niveles
de testosterona en plasma:
43.7 37.2 29.0 31.6 47.5 48.3 38.3 29.7
32.5 45.2 36.1 30.5 37.2 50.5 36.9 44.5
35.9 28.7 37.5 30.2 36.9 43.2 27.0 26.2
41.8 26.4 34.3 28.6 35.9 22.0 45.4 30.3
29.8 46.1 42.7 31.5 37.4 25.1 27.2 45.0
a) Hallar la tabla de distribucin para cada conjuntode datos, utilizando el nmero
de clases sugerido en la Tabla 1.11.
b) Construir histogramas de frecuencias relativas para ambos conjuntos de datos.
c) Comparar los histogramas, teniendo en cuenta la observacin adicional de que las
caractersticas sexuales secundarias se desarrollanen saurios jvenes en el
invierno y el apareamiento tiene lugar en verano.
7. Actualmente se realizan esfuerzos para elaborarfibras textiles de fibra de turba. Esto
crear una fuente de materiales econmicos para las industrias textil y papelera. Una
variable estudiada es X, porcentaje del contenido en ceniza de una determinada
turbera. Supongamos que una muestra aleatoria de 50 turberas produce estas
observaciones: (Basado en los datos hallados en Peat Fibre: Is There Scope in
Textiles? Textile Horizons, vol. 2, n. 10, octubre de 1982, pg. 24.)
0.5 1.8 4.0 1.0 2.0
1.1 1.6 2.3 3.5 2.2
2.0 3.8 3.0 2.3 1.8
3.6 2.4 0.8 3.4 1.4
1.9 2.3 1.2 1.9 2.3
2.6 3.1 2.5 1.7 5.0
1.3 3.0 2.7 1.2 1.5
3.2 2.4 2.5 1.9 3.1
2.4 2.8 2.7 4.5 2.1
1.5 0.7 3.7 1.8 1.7
a) Construir un diagrama de tallo y hojas para estos datos. Utilizar los nmeros
0,1,2, 3, 4, 5 como tallos.
b) Existe alguna razn para sospechar que X no sigue una distribucin en forma de
campana?
c) Utilizar el mtodo descrito en esta seccin para subdividir los datos. Utilizar la
Tabla 1.11 para determinar el nmero adecuado de clases.
d) Construir la tabla de distribucin para estos datos.
8. La exposicin intensa al cadmio produce dificultad respiratoria, daos en los rones y
el hgado, y puede ocasionar la muerte. Por esta razn, se controla el nivel de polvo de
cadmio y de humo de xido de cadmio en el aire. Este nivel se mide en miligramos de
cadmio por metro cbico de aire. Una muestra de 35 lecturas proporciona estos datos:
(Basado en un informe de Environmental Management, septiembre de 1981, pg.
414.)
0.044 0.030 0.052 0.044 0.046
0.020 0.066 0.052 0.049 0.030
0.040 0.045 0.039 0.039 0.039
0.057 0.050 0.056 0.061 0.042
0.055 0.037 0.062 0.062 0.070
0.061 0.061 0.058 0.053 0.060
0.047 0.051 0.054 0.042 0.051
a)Construir un diagrama de tallo y hojas para estosdatos. Utilizar los nmeros
02,03, 04, 05, 06 y 07 como tallos.
b) Se sorprendera si le dijeran que la variable aleatoria X, nivel de cadmio del
aire, sigue una distribucin en forma de campana?
c) Utilizar el mtodo descrito en esta seccin para distribuir estos datos en seis clases.
d) Construir la tabla de distribucin para estos datos.
e)Construir un histograma de frecuencias relativas para estos datos. Tiene el histo-
grama forma de campana?
f ) Construir un polgono de frecuencias relativas acumuladas para estos datos. Utili-
zar la ojiva para obtener por aproximacin el puntoal que le correspondera el 50
% de las lecturas.
9. Se lleva a cabo un estudio para comparar la diversidad de plantas hallada en una
porcin incendiada y otra no incendiada de un bosque nacional. Para cada zona, la
variable medida fue el ndice de Comparacin Secuencial (ICS). Unalto valor de ICS
indica que se encontraron especies muy diferentes en ese sitio; un valor bajo de ICS
indica la presencia de slo unas pocas especies. Los siguientes datos se obtuvieron en
muestras de 35 sitios incendiados y 35 no incendiados. Basado en informacin
encontrada por Jackie Cummings, Departamento de Biologa, Universidad de
Radford, otoo de 1996.)

Incendiados

0.155 1.317 0.196 1.753 0.503


0.303 1.564 1.795 2.017 0.901
1.686 0.591 2.527 0.733 1.555
1.055 0.109 1.000 2.377 0.729
1.214 1.523 0.459 1.192 1.377
0.713 1.269 1.418 1.368 1.469
2.067 2.479 1.423 2.179 0.141

No incendiados

1.856 0.892 1.662 0.804 0.998


1.518 1.507 2.122 0.380 1.234
0.382 1.187 2.203 0.648 0.517
0.498 0.029 0.383 0.489 0.010
1.044 0.935 0.374 0.423 1.483
1.624 0.559 0.939 0.171 0.805
1.282 0.544 1.505 0.635 0.777

a)Una versin de SAS del histograma y de la tabla resumen de cada grupo se muestra
en la Figura 1.15. Se permiti al SAS elegir sus propias clases para construir estos
grficos. Es decir, no dimos al SAS los puntos medios obtenidos por el procedi
miento indicado en el texto. Utiliza al SAS por defecto el algoritmo especifica
en el texto para determinar el nmero de clases, lmites y puntos medios? Razone
su respuesta.
b) Qu amplitud de clase usa el SAS en cada caso?
Grupo = incendiado %
acumulado
Punto medio F
de ICS F acumulada %

0.2 5 5 14.29 14.29

0.6 6 11 17.14 31.43

1.0 4 15 11.43 42.86

1.4 11 26 31.43 74.29

1.8 3 29 8.57 82.86

2.2 4 33 11.43 94.29

2.6 2 35 5.71 100.00

2 4 8 10
F re c u e n c i a (F)
Grupo = no incendiado
F %
Punto
medio de F acu mu lada % a cu mu lado
ICS
7 7 20.00 20.00
0.2
9 16 25.71 45.71
0.6
8 24 22.86 68.57
1.0
6 30 17.14 85.71
1.4
3 33 8.57 94.29
1.8
2 35 5.71 1 0 0 . 00
2.2

1 2 3 4 5 6 7 8 9
Frecuencia (F)

Figura 1.15. Anlisis SAS de los datos del Ejercicio 9.

c)Cul es el lmite superior para la primera clasedel SAS? Cae algn punto en ese
lmite? Podra caer en este lmite un futuro dato,con una precisin de tres
decimales?
d) Si usamos el algoritmo proporcionado en el texto para encontrar los lmites,
cu- les seran los de la primera clase en cada caso? Podra caer en este lmite
un futuro dato, con una precisin de tres decimales?
e)Si se dispone del SAS, construya los histogramas usandoel algoritmo del texto y
compare los resultados con los aqu mostrados.
f ) Si se dispone del SAS, cambie el dato 0.459 en los sitios incendiados por 0.400.
Construya de nuevo el grfico y vea cmo maneja el SASun punto que cae en un
lmite de clase.
10. Histogrms: valores atpicos. Considere los datos experimentales del Ejemplo 1.3.1
con el dato extra, 201, aadido. Presentamos dos soluciones para representar los datos
en un histograma. En cada caso, el rea de la barra de una clase es proporcional al
nmero de observaciones en esa clase.
Aadir una clase. Mantenemos los lmites entre clases para el gruesode los datos
como se definieron en el texto. Aadimos una clasems para cubrir el punto atpicp.
Necesariamente, el ancho de esta clase ha de ser mayor que las otras. As que, para
que el rea de la barra sea proporcional al nmero de observaciones, la altura de la
misma no podr ser igual al nmero de observaciones en esa clase.
a) Definir los lmites de la clase aadida como 159.5y 201.5. Cul es la amplitud
de la clase?
b) Cul es el rea total del histograma de frecuencias para la totalidad de los datos?
Con qu rea est representada cada observacin?
c) Cul debera ser el rea de la barra que representa la clase aadida?
d)Cul debera ser la altura de la barra de la clase aadida para que su rea sea 1a
encontrada en c?
Aadir ms clases. Mantenemos los lmites para el volumen de los datos como
Se definieron en el texto. Aadimos ms clases con lamisma amplitud, hasta que el
valor atpico est cubierto. Normalmente, esto originar algunas clases vacas y
algunos huecos en el histograma, pero preserva la idea de que las clases sean de la
misma anchura y de que la altura de la barra en un histograma de frecuencias sea la
frecuen- cia de la clase.
e)Considrese el resultado del SAS mostrado en la Figura 1.16. Cuntas clases se
han aadido para cubrir el punto 201?
f) Si se aadiese el punto 185 a los datos de control del Ejemplo 1.3.1, cuntas
clases adicionales se necesitaran para cubrirlo? Cuntas deberan estar
vacas?
11. Construir, a partir de los datos del Ejemplo 1.3.1, un diagrama de tallo y hojas
adosa- do doble. Es decir, representar los datos experimentales y los de control en el
mismo diagrama de tallos y hojas usando como tallos 08, 08, 09, 09, 10, 10, 11, 11,
12, 12, 13, 13, 14, 14, 15, 15. Estos diagramas sealan claramente una diferencia
principal entre estos dos conjuntos de datos. Cul es esta diferencia? Qu tcnica,
diagrama de tallo y hojas, o histogramas da una mejor impresin de la forma
potencial de la poblacin?

1.4. MEDIDAS DE POSICIN O TENDENCIA CENTRAL

Recordemos que el objetivo principal de la estadstica es extraer conclusiones sobre una


poblacin basndonos en la informacin obtenida de una muestra. Ya hemos visto dos
tcnicas que pueden utilizarse para determinar la forma de la distribucin, como son el
diagrama de tallos y hojas y el histograma. Estos grficos tambin dan una idea
aproximada de la localizacin. En esta seccin consideraremosdos medidas de
localizacin: la media y la mediana. La media poblacional es el valor medio de la variable
aleatoria sobre todala poblacin. Su valor se indica con . La mediana de la poblacin es
el punto M que tienela propiedad de que aproximadamente el 50% de los valores de la
poblacin est en o por debajo de M y el resto, por encima de M. Tanto como M son
parmetros. Sus valores son desconocidos y no pueden hallarse a partir de una muestra.
Sin embargo, es posible estimar- los a partir de una muestra mediante la media muestral y
la mediana muestral. Estos estadis- ticos, que definiremos en esta seccin, se simbolizan
mediante respectivamente. La Figura 1.17 ilustra la idea.

Potrebbero piacerti anche