Sei sulla pagina 1di 24

CURSADO BIOESTADISTICA 2010

ALUMNA: FABIANA CHALCO VERA L.U: 24478

PROBLEMAS MESAS DE SETIEMBRE DICIEMBRE


PROBLEMA 1 En una gran Empresa se sospecha que su central telefnica se encuentra saturada, a partir de las quejas recibidas por las telefonistas. Con la finalidad de solucionar este problema se registraron las distintas quejas recibidas en el mes de Marzo de 2005. En este estudio considere la siguiente codificacin: LR Lnea con ruido, LA Lnea abierta, LCA Lnea con alarma, LST Lnea sin tono, LSS Lnea sin sonido. Los datos registrados fueron: LR LST LCA LSS LR LR LA LR LST LR LR LR LCA LSS LR LA LST LA LR LR LR LR LR LR LCA LR LSS LCA LSS LST LR LA LST LST LR LR

I)a) Poblacin fsica: cantidad de quejas recibidas en el mes de enero del 2005 en una central telefnica b) Objetivo: solucionar inconvenientes que pudiera tener la central telefnica. c) Variables bajo estudio Tipo de inconveniente: variable cualitativa nominal. Quejas: variable cuantitativa medible discreta.

II) a) Tabla N 1, registro de las distintas quejas recibidas en una empresa en el mes de Marzo de
2005 n de orden 1 2 3 4 5 Variable LR LST LA LCA LSS f 18 6 4 4 4 36 fr 0.5 0.17 0.11 0.11 0.11 1 % 50 17 11 11 11 100 f acum. 18 24 28 32 36 %acum. 50 67 78 89 100

El tipo de queja que se recibe con mayor frecuencia es el de lnea con ruido (LR), a la cual le corresponde el 50% de los datos.

b) Grfico N 1, registro de las distintas quejas recibidas en una empresa en el mes de Marzo de 2005

Grfico N 2, registro de las distintas quejas recibidas en una empresa en el mes de Marzo de 2005

La central telefnica debe solucionar los inconvenientes de las lneas con ruido, lneas sin tono y lneas sin sonido segn la interpretacin a partir del diagrama de Pareto. d) El Diagrama de Pareto es una grfica en donde se organizan diversas clasificaciones de datos por orden descendente, de izquierda a derecha por medio de barras sencillas despus de haber reunido los datos para calificar las causas. De tal manera que se pueda asignar un orden de prioridades. Los grficos de barra nos permiten de forma muy precisa el reconocimiento visual de patrones y tendencias, sustentados en nuestra capacidad de detectar cambios en la longitud de una forma, por lo que tambin resultan excelentes herramientas para visualizar comparaciones entre las magnitudes de los datos que representan, facilitando al observador el proceso de bsqueda de similitudes o contrastes.

CURSADO BIOESTADISTICA 2010


ALUMNA: FABIANA CHALCO VERA L.U: 24478

PROBLEMA 2 Para comprobar que el fertilizante XX mejora el porcentaje de germinacin, se llev a cabo un experimento que consisti en sembrar 500 bandejas con 8 semillas de Carex flaca cada una. Despus de 120 hs. se agreg el fertilizante bajo estudio. Al cabo de 288 hs. se observ cuntas semillas haban germinado en cada bandeja. Los resultados fueron:

I) Identifique la Poblacin Fsica. II) Identifique la/las variables bajo estudio. Clasifquelas segn su naturaleza. III) Encuentre una distribucin de frecuencias adecuada. Qu informacin se obtiene de esta tabla? IV) Identifique el nmero de semillas que germinan con frecuencia. V) Presente un grfico de Barras con porcentajes. Qu informacin se obtiene de ste grfico? VI) Presente un grfico con 2 porcentajes acumulados. Qu informacin se obtiene de ste grfico? VII) Presente un grfico con porcentajes desacumulados. Qu informacin se obtiene de ste grfico? I) Poblacin fsica: 500 bandejas con semillas de Carex flaca. No se especfica lugar ni el tiempo. II) Objetivo: comprobar que el fertilizante XX mejora el porcentaje de germinacin. Variables bajo estudio: Nmero de semillas: variable cuantitativa medible discreta Nmero de bandejas: variable cuantitativa medible discreta Es posible resolver este problema de dos maneras: 1) considerando los datos sin agrupar y 2) considerando los datos agrupados.Vamos a considerar datos sin agrupar.

III) Tabla N 1 Estudio realizado para comprobar que el fertilizante XX mejora el porcentaje de germinacin
N semillas N bandejas -1 0 0 4 1 5 2 54 3 97 4 181 5 118 6 32 7 8 8 1 9 0 TOTAL 500 fr 0 0.008 0.010 0.108 0.194 0.362 0.236 0.064 0.016 0.002 0.000 1.000 % 0.00 0.80 1.00 10.80 19.40 36.20 23.60 6.40 1.60 0.20 0.00 100.00 Fi 0 4 9 63 160 341 459 491 499 500 500 %ac 0.00 0.80 1.80 12.60 32.00 68.20 91.80 98.20 99.80 100.00 100.00 Fi* 500 500 496 491 437 340 159 41 9 1 0 %* 100.00 100.00 99.20 98.20 87.40 68.00 31.80 8.20 1.80 0.20 0.00

Fuente: Ctedra de Bioestadstica de la facultad de bioqumica, qumica y farmacia de la Universidad Nacional de Tucumn. Notas: lo que aparece en color corresponde a clases ficticias para llevar a cabo dicho estudio.

Observando la tabla se puede notar que mayormente germinan 4 semillas por bandeja. Clculo de la mayora

N 1 2 mayora 100 N
Mayora = 50,2%,

500 1 2 mayora 100 500

Segn este calculo, no se puede considerar que en la mayora de las bandejas germinan 4 semillas ya que: 50,2 % 36,2% IV) Segn la tabla realizada el numero de semillas que germina con mayor frecuencias es de 4 semillas por bandeja. V) Grfico N 1 Estudio realizado para comprobar que el fertilizante XX mejora el porcentaje de germinacin
Grafico de barras

40 35 30 % absolutos 25 20 15 10 5 0 -1 0 1 2 3 4 5 6 7 8 9

N de semillas

En este grfico podemos observar que 4 semillas germinan con mayor frecuencia VI) Grfico N 2 Estudio realizado para comprobar que el fertilizante XX mejora el porcentaje de germinacin
Grafico de porcentajes acumulados Grafico de porcentajes desacumulados

100 90 80 % desacumulados 70 % acumulados 60 50 40 30 20 10 0 -2 -1 0 1 2 3 4 5 6 7 8 9 10 -2

100 90 80 70 60 50 40 30 20 10 0 -1 0 1 2 3 4 5 6 7 8 9 10

N de semillas

N de semillas

Es evidente que del grfico de % acumulados se hace el anlisis de "a lo sumo" y el de "por lo menos" se hace del desacumulado. Adems se observa que la mayora de las bandejas (50.2%) germinan a lo sumo 5 semillas.

CURSADO BIOESTADISTICA 2010


ALUMNA: FABIANA CHALCO VERA L.U: 24478

El grfico de OJIVAS, NO es representativo de variables DISCRETAS pero si lo es para variables CONTINUAS. Es muy poco comn emplear una ojiva para una variable discreta. Por ltimo, es importante resaltar que siempre se deben incluir las clases ficticias tanto para variables discretas como para continuas de lo contrario los grficos no saldrn como lo esperamos. VIII) Los mejores graficos para representar datos cuantitativos discretos son mediante: Distribuciones de frecuencias, Distribuciones de frecuencias acumuladas, Diagrama de puntos y Diagrama de barras. Conclusiones: segn el estudio realizado con respecto al uso del fertilizante XX se observa que no hay una diferencia marcada sobre el porcentaje de germinacin con el uso de dicho fertilizante, ya que de un total de 8 semillas sembradas por bandeja a lo sumo germinan 4 de ellas en un 36,2% del total de bandejas germinadas. PROBLEMA 3

En el Instituto de Bromatologa se realiz un estudio con la finalidad de determinar si en un producto alimenticio de una destacada firma del medio, se encontraba presente una bacteria perjudicial para el ser humano. Con tal fin se realizaron 30 pruebas durante el mes de enero del corriente ao, el anlisis consisti en verificar el nmero de colonias formadas por esta bacteria cultivos realizados en cajas Petri. A los resultados obtenidos se dividieron en el nmero de colonias perjudiciales para la salud (3), obtenindose:
0,5 0 1,0 1,5 0 2,0 2,0 0 2,5 1,0 0,5 2,0 1,0 1,5 2,0 2,0 1,5 2,0 2,0 2,0 1,0 1,0 2,0 2,0 2,5 0,5 0 2,0 1,5 3,5

I) Objetivo del estudio: determinar si en un producto alimenticio de una destacada firma del medio, se encontraba presente una bacteria perjudicial para el ser humano. II) Variable bajo estudio: N de colonias formadas: variable cuantitativa medible discreta N de colonias formadas divididas en el n de colonias perjudiciales para la salud: variable cuantitativa derivada de razn. Calculamos el nmero de clases, segn el mtodo tradicional, calculamos el nmero de clases segn Sturges Mximo 3,5 Mnimo 0 Rango 3,5 Clases 8,22881869 8 Intervalos 0,42533444 0,5 N 30 Tabla N 1, estudio realizado con la finalidad de determinar si en un producto alimenticio de una destacada firma del medio, se encontraba presente una bacteria perjudicial para el ser humano

Fuente: ctedra de bioestadstica de la Facultad de Bioqumica, Qumica y Farmacia-UNT Nota: En esta tabla se puede observar que los datos fueron agrupados en clases, lo que est en amarillo son clases ficticias

Tabla N 2, estudio realizado con la finalidad de determinar si en un producto alimenticio de una destacada firma del medio, se encontraba presente una bacteria perjudicial para el ser humano
Porcentaje Porcentaje Porcentaje acumulado Desacumulado Vlidos ,0 4 13,3 13,3 100,0 ,5 3 10,0 10,0 86,7 1,0 5 16,7 16,7 76,7 1,5 4 13,3 13,3 60,0 2,0 11 36,7 36,7 46,7 2,5 2 6,7 6,7 10,0 3,5 1 3,3 3,3 3,3 Total 30 100,0 100,0 Fuente: ctedra de bioestadstica de la Facultad de Bioqumica, Qumica y Farmacia-UNT Nota: En esta tabla se puede observar que los datos no fueron agrupados en clases Nmero de colonias Frecuencia

V) Clculo de la mayora

N 1 2 mayora 100 N
Mayora = 53,33%

30 1 2 mayora 100 30

La mayora del alimento analizado contiene a lo sumo 2 colonias perjudiciales para la salud.

VI)
Estadsticos Medidas de posicin N Vlidos Perdidos Media aritmtica Mediana Moda Q1 Q2 Q3 Medidas de dispersin Desv. tp. Varianza Coef. De variacin Asimetra Error tp. de asimetra Curtosis Error tp. de curtosis Rango Mnimo Mximo Percentiles 25 50 75 30 0 1,8917 1,875 2,2188 1,0500 1,8917 2,3000 ,8748 ,7652 46,2400 -,077 ,427 -,256 ,833 3,5 ,0 3,5 ,875 1,500 2,000

CURSADO BIOESTADISTICA 2010


ALUMNA: FABIANA CHALCO VERA L.U: 24478

Interpretaciones: *El alimento analizado presenta en promedio aproximadamente 2 colonias perjudiciales para la salud humana. *El 50% del alimento analizado contiene a lo sumo 2 colonias perjudiciales para la salud humana. * En el alimento analizado es mas frecuente encontrar 2 colonias perjudiciales para la salud humana. * Q1: el 25% del alimento analizado contiene menor o igual a 1 colonia perjudicial, y el 75% restante contiene mayor o igual a 1 colonia perjudicial. * Q3: el 75% del alimento analizado contiene menor o igual a 2 colonias perjudiciales, y el 25% restante tiene mayor o igual cantidad de colonias perjudiciales. Analizando el coeficiente de apuntamiento de curtosis, este presenta una distribucin unimodal platicurtica, ya que es menor que 0 Analizando el coeficiente asimtrico este presenta una distribucin unimodal asimtrica negativa o de izquierda. Clculo del CVR CVR = 46,24% se puede observar que los datos presentan una variabilidad media. VII) Grfico Polgono de frecuencia, grficos de lnea trazados sobre las marcas de clase de cada intervalo, puede obtenerse uniendo los puntos medios de los techos de los rectngulos del histograma y tomando en cuenta que se deben extender ambos extremos del polgono hasta el eje horizontal en aquellos puntos que seran las marcas de clase adyacentes a cada extremo.

Grfico de Ojivas Es la grfica de una distribucin de frecuencias acumuladas, los intervalos de las clases se ubican en el eje horizontal; las frecuencias acumuladas (ojiva propiamente dicha), las frecuencias relativas acumuladas (ojiva relativa) y las frecuencias acumuladas porcentuales (ojiva porcentual) se muestran en el eje vertical. Podemos construir ojivas a lo sumo o las ojivas por lo menos , la diferencia entre ambas grficas es que la primera tiene pendiente negativa y decrece, mientras que la segunda tiene pendiente positiva y crece.

La ventaja de trabajar con ojivas es la facilidad (con respecto a otras grficas) para interpolar entre los puntos trazado

PROBLEMA 4 4. a est presentado en cada una de las tablas correspondiente a cada distribucin. 4. b P (x = 3) = F (3) F(2) = 0,85712346 - 0,676676416 = 0,180447044, existe una probabilidad del 18,04% de que la funcin sea igual a 3 P (x > 4,2) = 1 F (4,2) = 1 - 0,947346983 = 0,05263017, existe una probabilidad del 5,26% de que la funcin tome un valor como mnimo de 4,2
0
0.135335283 0.270670566 0.270670566 0.180447044 0.090223522 0.036089409 0.012029803 0.003437087 0.000859272 0.000190949 3.81899E-05 6.94361E-06 1.15727E-06 1.78041E-07 2.54345E-08 3.39126E-09 4.23908E-10 4.98715E-11 5.54128E-12 5.83292E-13 5.83292E-14 0.135335283 0.40600585 0.676676416 0.85712346 0.947346983 0.983436392 0.995466194 0.998903281 0.999762553 0.999953502 0.999991692 0.999998635 0.999999793 0.999999971 0.999999996 1 1 1 1 1 1

l t= E(X)= V(X)=

0.5 4 2 2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

CURSADO BIOESTADISTICA 2010


ALUMNA: FABIANA CHALCO VERA L.U: 24478

4. c P (x = 0,15) = 0,45119, existe una probabilidad del 45,119% de que la funcin sea igual a 0,15 P (x > 0,5) = 1 F(0,5) = 1 0,86466 = 0,13534, existe una probabilidad del 13,53% de que la funcin tome valores como menos de 0,5
-0.10 0.00000 0.00000 4.00000 3.27492 2.68128 2.19525 1.79732 1.47152 1.20478 0.98639 0.80759 0.66120 0.54134 0.44321 0.36287 0.29709 0.24324 0.19915 0.16305 0.13349 0.10929 0.08948 0.07326 0.05998 0.04911 0.04021 0.03292 0.02695 0.02207 0.01807 0.01479 0.01211 0.00992 0.00000 0.00000 0.00000 0.18127 0.32968 0.45119 0.55067 0.63212 0.69881 0.75340 0.79810 0.83470 0.86466 0.88920 0.90928 0.92573 0.93919 0.95021 0.95924 0.96663 0.97268 0.97763 0.98168 0.98500 0.98772 0.98995 0.99177 0.99326 0.99448 0.99548 0.99630 0.99697 0.99752

m E(X)= V(X)=

0.25 0.25 0.0625

-0.05 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00 1.05 1.10 1.15 1.20 1.25 1.30 1.35 1.40 1.45 1.50

4. d P[X = 3] = F(3) F(2) = 0,97199 0,8609 = 0,11109, existe una probabilidad del 11,109% de que la funcin tome valores igual a 3 P [X 3] = F(3) = 0,97199, existe una probabilidad del 97,199% de que la funcin tome valores a lo sumo de 3 P[X 4] = 1 F(3) = 1 0,97199 = 0,02801, existe una probabilidad del 2,801% de que la funcin tome valores por lo menos de 4 P[x > 4] = 1 F(4) = 1 0,99688 = 0,00312, existe una probabilidad del 0,312% de que la funcin tome valores menos de 4 P [2< X 5] = F(5) F(2) = 0,99985 0,8609 = 0,13895, existe una probabilidad del 13,895% de que la funcin tome valores como minimo 2 y a lo sumo 5

P [2 X < 5] = F (4) F (1) = 0,99688 - 0,58196 = = 0,41492, existe una probabilidad del 41,49% de que la funcin tome valores a lo sumo 2 y como mximo 5 P [2 X 5] = F(5) F(1) = 0,99985 0,58196 = 0,41789, existe una probabilidad del 41,789% de que la funcin tome valores a lo sumo 2 y como mximo 5 P [2<X<5] = F(4) F(2) = 0,99688 0,8609 = 0.13598, existe una probabilidad del 13,598% de que la funcin tome valores como mnimo 2 y como mximo 4
0
0,20842 0,37354 0,27894 0,11109 0,02489 0,00297 0,00015 0,20842 0,58196 0,8609 0,97199 0,99688 0,99985 1

n= 6 p= 0,23 E(X)= 1,38 V(X)= 1,063

1 2 3 4 5 6

4. e P [Z >-0,25] = 1- F(-0,25) = 1 - 0,393580 = 0,60642, existe una probabilidad del 60,642 que la funcin tome como menos el valor de -0,25 P [Z<-0.25] = F(-0,25) = 0,393580, existe una probabilidad del 39,3580% que la funcin tome como mximo el valor de -0,25 P [-1,23 Z 0.89] = F(0,89) F(-1,23)-1 = 0,815940 - 0,095098 = 0,720842, existe una probabilidad del 72,0842% que la funcin tome valores de por lo menos de -1,23 y a lo sumo 0,89 P [Z < K ]= F(K) K= 2,33

CURSADO BIOESTADISTICA 2010


ALUMNA: FABIANA CHALCO VERA L.U: 24478

-3.00

0.004432 0.006491 0.009347 0.013234 0.018423 0.025218 0.033941 0.044915 0.058441 0.074766 0.094049 0.116323 0.141460 0.169147 0.198863 0.229882 0.261286 0.292004 0.320864 0.346668 0.368270 0.384663 0.395052 0.398922 0.396080 0.386668 0.371154 0.350292 0.325062 0.296595 0.266085 0.234714 0.203571 0.173602 0.145564 0.120009 0.097282 0.077538 0.060765 0.046823 0.035475 0.026426 0.019356 0.013940 0.009871 0.006873 0.004705 0.003167 0.002096 0.001364 0.000873

0.001350 0.002052 0.003072 0.004527 0.006569 0.009387 0.013209 0.018309 0.024998 0.033625 0.044565 0.058208 0.074934 0.095098 0.119000 0.146859 0.178786 0.214764 0.254627 0.298056 0.344578 0.393580 0.444330 0.496011 0.547758 0.598706 0.648027 0.694974 0.738914 0.779350 0.815940 0.848495 0.876976 0.901475 0.922196 0.939429 0.953521 0.964852 0.973810 0.980774 0.986097 0.990097 0.993053 0.995201 0.996736 0.997814 0.998559 0.999065 0.999402 0.999624 0.999767

m s

0 1

-2.87 -2.74 -2.61 -2.48 -2.35 -2.22 -2.09 -1.96 -1.83 -1.70 -1.57 -1.44 -1.31 -1.18 -1.05 -0.92 -0.79 -0.66 -0.53 -0.40 -0.27 -0.14 -0.01 0.12 0.25 0.38 0.51 0.64 0.77 0.90 1.03 1.16 1.29 1.42 1.55 1.68 1.81 1.94 2.07 2.20 2.33 2.46 2.59 2.72 2.85 2.98 3.11 3.24 3.37 3.50

PROBLEMA 5 En el departamento de Control de Calidad de una empresa, se quiere determinar si ha habido un descenso significativo de la calidad de su producto entre las producciones de dos semanas consecutivas a consecuencia de un incidente ocurrido durante el fin de semana. Deciden tomar una muestra de la produccin de cada semana, si la calidad de cada producto se mide en una escala de 100, realice un estudio adecuado e interprete. Los resultados se presentan a continuacin: n1= 8 n2= 8

x1 = 91.5
S12= 90.1

x2

= 89.9

S22 = 17.8

Para el intervalo de confianza se cumple el supuesto 1 para utilizar este intervalo el cual dice lo siguiente: Sean X1, X2, X3,..., Xn v.a. del muestreo iid con distribucin normal con , 2 comn, en este caso no se colocan restricciones sobre el tamao de la muestra. Como 100 se encuentra contenido en el intervalo de confianza podemos decir que la calidad del producto no se vio afectado en esta semana.

CURSADO BIOESTADISTICA 2010


ALUMNA: FABIANA CHALCO VERA L.U: 24478

Para el intervalo de confianza se cumple el supuesto 1 para utilizar este intervalo el cual dice lo siguiente: Sean X1, X2, X3,..., Xn v.a. del muestreo iid con distribucin normal con , 2 comn, en este caso no se colocan restricciones sobre el tamao de la muestra. Como 100 no se encuentra contenido en el intervalo de confianza podemos decir que ha afectado la calidad del producto para esta semana. Semana1: 81,96 < 1 < 101,04 en la semana 1 se estima con un 95% de confianza que la calidad del producto esta comprendida entre 81,96 y 101,04. Semana 2: 85,66 < 1 < 94,13 en la semana 2 se estima con un 95% de confianza que la calidad del producto esta comprendida entre 85,66 y 94,13.

PROBLEMA 6 Con la finalidad de evaluar la vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo. Se eligen 100 de ellos y se les suministra la vacuna, de esta seleccin pasan la gripe 10 personas. En los otros 100 pacientes sin vacunar pasan la gripe 20 personas. a- Calcular el IC del 95% de Confianza para la proporcin de personas que pasan la gripe estando vacunados. Es efectiva la vacuna? b- Indique si el tamao de muestra es el adecuado. Considere un error del 10% de p. c- Indique si el tamao de muestra es el adecuado. Considere para dicho clculo un error del 10% de la proporcin de pacientes vacunados

Intervalo: 0,04 < p < 0,15 Se puede observar que la vacuna NO ES efectiva ya que solamente seran beneficiados por lo menos 4,1201% y a lo sumo el 15,8799% de los pacientes. Se calcula con la siguiente frmula:

q = 1- p q = 0,9 Z1-/2(0,975) = 1,960 N = 34,5744 ~ 35 Se debera trabajar con una muestra de 35 para trabajar con un 10 % de error

PROBLEMA 7 En una investigacin de laboratorio se emplean cmaras de crecimiento para estudiar el desarrollo de ciertos microorganismos cuando se varan las concentraciones de CO2 (baja y alta), y la temperatura (baja, media y alta). En distintas cmaras se cruzan todos los niveles de los dos factores y se obtienen tres replicas completas del experimento. La siguiente tabla muestra para crecimiento alto de un microorganismo las combinaciones de los dos factores bajo estudio: Tabla de frecuencias conjuntas
BAJA CO2 BAJA CO2 ALTA Total TEMPERATURAS MEDIA 51 46 49 84 100 130 Total ALTA 32 38 70 129 171 300

a) En el experimento se obtuvieron 300 datos. Las frecuencias conjuntas observadas son las de color celeste. Las frecuencias marginales horizontales son las de color amarillo y corresponden a la variable de la concentracin de CO2 Las frecencias marginales verticales son las de color rosado y corresponden a la variable de la temperatura. Se puede observar que las variables bajo estudio estn asociadas, ya que el producto de la frecuencia marginal vertical con la frecuencia marginal horizontal es distinto al de la frecuencia conjunta, si fuese igual, estas variables seran independientes entre s. a) Tabla de probabilidad conjunta BAJA CO2 BAJA CO2 ALTA TOTAL 0,1700 0,1633 0,3333 MEDIA 0,1533 0,2800 0,4333 ALTA TOTAL 0,1067 0,4300 0,1267 0,5700 0,2333 1,0000

Interpretacin de distribucin de probabilidades conjuntas: *el 28% de las muestras presenta desarrollo de microorganismos con concentracin de CO2 alta y temperatura media. * El 10,67% de las muestras presenta desarrollo de microorganismos con concentracin de CO2 baja y temperatura alta

Interpretacin de distribucin de probabilidad marginal horizontal: * El 57% de las muestras presentan desarrollo de microorganismos con concentracin de CO2 alta.

CURSADO BIOESTADISTICA 2010


ALUMNA: FABIANA CHALCO VERA L.U: 24478

Interpretacion de distribucin de probabilidad marginal vertical: * El 43,33% de las muestras presentan desarrollo de microorganismos a temperatura media

DISTRIBUCIN DE PROBABILIDADES CONDICIONALES HORIZONTALES


BAJA CO2 BAJA CO2 ALTA 0,3953 0,2865 MEDIA 0,3566 0,4912 ALTA 0,2481 0,2222 1 1

Interpretacin: el 49,12% de microorganismos desarrollados se da a temperatura media dado que tienen alta concentracin de CO2.

DISTRIBUCIN DE PROBABILIDADES CONDICIONALES VERTICALES


BAJA CO2 BAJA CO2 ALTA 0,5100 0,4900 1,0000 MEDIA 0,3538 0,6462 1,0000 ALTA 0,4571 0,5429 1,0000

Interpretacin: el 64,62% de microorganismos desarrollados se da a concentracin alta de CO2 dado que la temperatura es media b) No es suficiente la informacin presentada para decir que existe evidencia estadstica de que la concentracin de CO2 influya en el crecimiento de microorganismos. Seria necesario comprobar el crecimiento a una temperatura constante con la variacin de la concentracin de CO2

PROBLEMA 8 Para determinar si existe alguna relacin entre el aprovechamiento de un grupo de empleados de una fbrica de un programa de capacitacin y su rendimiento en el trabajo se obtiene la siguiente tabla: Aprovechamiento del programa de Entrenamiento
Desempeo en el Trabajo Deficiente Regular Buena Debajo del promedio 23 28 9 Promedio 60 79 49 Sobre el Promedio 29 60 63

Realice un estudio adecuado para determinar si el Aprovechamiento del programa de Entrenamiento influye en el Desempeo en el Trabajo, a partir de su estudio indique si usted recomendara que dicho programa se realice. Utilice un nivel del 5% de significacin.

Ho = x e y son independientes H1 = x e y estn asociados = 0,05 Rechazar Ho si p <


DESEMPE * NOTAS Crosstabulation Count NOTAS bajo promedio 23 28 9 60 promedio 60 79 49 188 sobre el promedio 29 60 63 152 Total 112 167 121 400

DESEMPE

deficiente regular bueno

Total

Chi-Square Tests Asymp. Sig. (2-sided) ,000 ,000 ,000

Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases

Value 20,179a 20,892 18,946 400

df 4 4 1

a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 16,80.

Se puede observar que p es menor que 0,001 (segn Asymp. Sig) y por lo tanto p es menor a 0,05. Se rechaza Ho, y estn asociados.
DESEMPE * NOTAS Crosstabulation % within NOTAS NOTAS bajo promedio 38,3% 46,7% 15,0% 100,0% promedio 31,9% 42,0% 26,1% 100,0% sobre el promedio 19,1% 39,5% 41,4% 100,0% Total 28,0% 41,8% 30,3% 100,0%

DESEMPE

deficiente regular bueno

Total

El 46,7 % de los empleados que tuvieron una nota por debajo del promedio presentaron un desempeo regular. El 42 % de los empleados que sacaron una nota igual promedio tuvieron un desempeo regular. El 41,4 % de los empleados que tuvieron una nota sobre el promedio presentaron un desempeo bueno.

CURSADO BIOESTADISTICA 2010


ALUMNA: FABIANA CHALCO VERA L.U: 24478

PROBLEMA NO 9
Con el fin de conocer si un cierto tipo de bacterias se distribuyen al azar en un determinado cultivo o si, por el contrario, lo hacen con algn tipo de preferencia (el centro, los extremos, etc...), se divide un cultivo en 576 reas iguales y se cuenta el nmero de bacterias en cada rea. Los resultados son los siguientes:

no de bacterias no de reas

0 229

1 211

2 93

3 35

4 7

5 1

Obedecen los datos a una distribucin de Poisson? . Utilice un nivel del 1% de significacin.
x 0 1 2 3 4 0i 229 211 93 35 8 xi * Oi 0 211 186 105 33 Ei 211,898558 211,898558 105,949279 35,3164264 10,9371784 (Oi - Ei)2/Ei 1,38018549 0,00381035 1,58268022 0,0028351 0,78877901

total

576

535

576

3,75829016

0,92881944

13,2767041

Parmetro de Poisson = * t = t (x) = m

xm
xm

1 N
1 N

x
x

fi

xm

1 535 576

f i = 0,92881944 ~ 1

Estadstico de prueba

X2

(Oi Ei ) 2 Ei

2 = 3,75829016

Ho: la variable nmero de bacterias presenta distribucin Poisson con un * t = 1 H1: la variable nmero de bacterias presenta distribucin diferente de Poisson con * t igual a 1. = 0,01 n=k1 n=51 n=4 p = 13,2767041

Como p > , no existencia evidencia suficiente para rechazar HO, los datos provienen de una distribucin Poisson 2 cae en la regin crtica.

PROBLEMA NO 10 La siguiente tabla recoge la distribucin de los triglicridos en suero, expresados en mg/dl en 90 nios de 6 aos:
Nivel de triglicridos 10 a menos de 20 20 a menos de 30 30 a menos de 40 40 a menos de 50 50 a menos de 60 60 a menos de 70 70 a menos de 80 80 a menos de 90 Pto medio 15 25 35 45 55 65 75 85 Frecuencias 5 11 15 24 18 12 4 1

a) Encontrar los estimadores puntuales de media y desvo estndar. b) A un nivel del 5% de Significacin contrastar la hiptesis de que el nivel de triglicridos en nios de 6 aos sigue una distribucin Normal.

xm

1 N

fi

xm

1 4110 90

x m 45,67
s2 1 N xi2 f i N 1 x 2 N 1 s2 1 90 209850 90 1 45,67 2 90 1

s 2 248,988764
s = 15,78

s 248,988764

CURSADO BIOESTADISTICA 2010


ALUMNA: FABIANA CHALCO VERA L.U: 24478

En promedio los nios presentan una distribucin del 45,67 mg/dl de triglicridos en suero, con un desuso de 15,77 mg/dl. Tabla N 1: Estudio realizado sobre 90 nios de 6 aos, clasificados segn su distribucin de triglicridos en suero.
xi 20 20 x <30 30 x <40 40 x < 50 50 x < 60 60 x < 70 70 x < 80 90 15 25 35 45 55 65 75 85 total Oi 5 11 15 24 18 12 4 1 90 xi * fi 75 275 525 1080 990 780 300 85 4110 xi2 *fi 1125 6875 18375 48600 54450 50700 22500 7225 209850 Ei 4,67062889 9,76067979 17,9398469 22,3587983 18,8981777 10,8316438 4,20868474 1,33153986 90 (Oi - Ei)2/Ei 0,02322713 0,15735734 0,48175996 0,12046904 0,04268788 0,12602485 0,01034749 0,08255005 1,04442372 14,0671404 45,6666667 248,988764 15,7793778

HO: proviene de una distribucin normal H1: no proviene de una distribucin normal = 0,05

(Oi Ei ) 2 Estadstico de prueba: X Ei


2

2 = 1,04442372 n=k1 n=81 n=7 p = 14,0671404 Como p > , no existencia evidencia suficiente para rechazar HO, los datos provienen de una distribucin normal

PROBLEMA NO 11 Se realiz un estudio para determinar si un nuevo tratamiento sobre un metal tena algn efecto en la cantidad de metal eliminado en una operacin de inmersin en cido. Se consideraron muestras por duplicado, sumergiendo una en un bao sin tratamiento y otra en un bao con tratamiento. Se consideraron distintos tiempos de inmersin obtenindose los siguientes resultados

Los estudios que se piden a continuacin tienen como objetivo poder analizar si el tratamiento reduce la cantidad promedio de metal removido. I) Considere: i) Horas versus Grupo Sin Tratamiento y ii) Horas versus Grupo Con Tratamiento a) Realice un grfico de dispersin e interprete. b) Analice si el presente estudio es de regresin o de correlacin. c) En caso que tenga sentido proponga un modelo matemtico ( seleccione uno de los siguientes modelos a) lineal b) y = a. x b. Encuentre los valores de a y b estimados, presente el modelo en forma conjunta con el coeficiente de determinacin, interprete. d) En caso que tenga sentido encuentre la cantidad de metal removido a las i) 11 horas, ii) 24 horas.

Se puede observar en el grfico de dispersin que las variables bajo estudio presentan una asociacin lineal positiva, por lo que podramos esperar un valor del coeficiente de correlacin de Pearson mayor o igual a 0,80, tambin podemos concluir que el modelo bajo estudio sea LINEAL El problema es de regresin porque una de las variables es controlada por el experimentador

CURSADO BIOESTADISTICA 2010


ALUMNA: FABIANA CHALCO VERA L.U: 24478

Resumen del modelo y estimaciones de los parmetros Variable dependiente: Sin tratamiento Ecuacin Resumen del modelo R cuadrado F gl1 gl2 Lineal ,923 107,703 1 Potencia ,795 34,943 1 La variable independiente es Horas.
d i m e n s i o n 1

9 9

Sig. ,000 ,000

Estimaciones de los parmetros Constante b1 11,749 ,030 11,556 ,020

Escogemos el modelo lineal ya que este presenta mayor valor de coeficiente de determinacin, cuya interpretacin es la siguiente: Segn el valor de R Square (coef. de determinacin); el 0,923 o 92,3% de la variacin total de los valores de y en la muestra se deben a una relacin lineal con los valores de x, por lo tanto es posible afirmar que el 92,3% de y se encuentra explicado por regresin, por lo tanto el modelo es el adecuado. El 7,7 % restante esta explicado por otro modelo. El modelo es y = a + b x Reemplazando me queda y = 11,749 + 0,030 x Para x = 11 hrs Y = 12,079 Para x = 24 hrs Y = 12,469

Se puede observar en el grfico de dispersin que las variables bajo estudio presentan una asociacin lineal positiva, por lo que podramos esperar un valor del coeficiente de correlacin de Pearson mayor o igual a 0,80, tambin podemos concluir que el modelo bajo estudio sea POTENCIAL

Resumen del modelo y estimaciones de los parmetros Variable dependiente: Con tratamiento Ecuacin Resumen del modelo R cuadrado F gl1 gl2 Lineal ,818 40,430 1 Potencia ,932 123,223 1 La variable independiente es Horas.
d i m e n s i o n 1

9 9

Sig. ,000 ,000

Estimaciones de los parmetros Constante b1 8,731 ,023 8,513 ,025

Se escoge el modelo potencial ya que este presenta mayor valor del coeficiente de determinacin, el cual lo interpretamos de la siguiente manera: Segn el valor de R Square (coef. de determinacin); el 0,933 o 93,2% de la variacin total de los valores de y en la muestra se deben a una relacin lineal con los valores de x, por lo tanto es posible afirmar que el 93,2 % de y se encuentra explicado por regresin, por lo tanto el modelo es el adecuado .El 6,8 % restante esta explicado por otro modelo. Y = a xb Y = 8,513 x0,025 Para x = 11 hrs Y = 9,0389 Para x = 24 hrs Y= 9,2169 II) Considere el grupo Sin Tratamiento versus Grupo Con Tratamiento a) Realice un grfico de dispersin e interprete. b) Analice si el presente estudio es de regresin o de correlacin. c) En caso que tenga sentido proponga un modelo matemtico (seleccione uno de los siguientes modelos a) lineal b) y = a. x b. Encuentre los valores de a y b estimados, presente el modelo en forma conjunta con el coeficiente de determinacin, interprete.

Se puede observar en el grfico de dispersin que las variables presentan una asociacin lineal positiva.

CURSADO BIOESTADISTICA 2010


ALUMNA: FABIANA CHALCO VERA L.U: 24478

Correlaciones Sin tratamiento Sin tratamiento Correlacin de Pearson Sig. (bilateral) Con tratamiento N Correlacin de Pearson Sig. (bilateral) 1 11 ,878** ,000 Con tratamiento ,878** ,000 11 1 11

N 11 **. La correlacin es significativa al nivel 0,01 (bilateral).

El coeficiente de correlacin de Pearson para dichas variables es de 0,878, es decir, presentan una asociacin lineal positiva en un 87,8% Este es un problema de correlacin ya que las variables no se pueden controlar.

PROBLEMA NO 12 Se lleva a cabo un estudio por medio de detectores radioactivos de la capacidad corporal de absorber hierro y plomo. Participan en el estudio 10 personas, a cada uno se le da una dosis oral idntica de hierro y plomo, luego de 12 das se mide la cantidad de cada compuesto retenida en el sistema corporal y a partir de esta se determina el porcentaje absorbido por el cuerpo. A continuacin se presentan los datos:

Se puede observar que este es un problema de correlacin ya que las variables no pueden ser controladas por el experimentador. Realizando un grfico de dispersin se puede observar que ambas variables presentan una asociacin lineal positiva, por lo que podramos esperar un coeficiente de correlacin de Pearson mayor o igual a 0,80. En el clculo pudimos encontrar que este tiene un valor de 0,840, esto me indica que hay una asociacin lineal positiva entre ambas variables del 84%

Mn(X) Mx(X) Mn(Y) Mx(Y)

17 100 8 59

Tamao Muestra n R ESTADISTICO: T0 P-value (2 colas) P-value (1 cola)

10 0.840782152 4.392698602 0.002309194 0.001154597

Tamao Muestra N R ESTADISTICO: Z P-value (1 cola)

10 0.840782152 -0.8 0.331311417 0.370204634

Si planteamos para un test bilateral, se rechaza Ho, ya que p (0,002) < (0,05), podemos concluir que las variables estn asociadas. En cambio si planteamos un test unilateral, no existe evidencia suficiente para rechazar Ho, porque el valor de p (0,370) es mayor que el valor de (0,05), podemos concluir que existe una asociacin lineal positiva.

Potrebbero piacerti anche