Sei sulla pagina 1di 17

TECNOLOGICO NACIONAL DE

MEXICO

Instituto Tecnolgico del Istmo

ESPECIALIDAD:

ING. INDUSTRIAL

MATERIA:

ESTADSTICA INFERENCIAL II

TEMA:

3.4 COMPARACIONES O PRUEBAS DE RANGOS MLTIPLES

3.5 VERIFICACIN DE LOS SUPUESTOS DEL MODELO

UNIDAD:
lll

CATEDRTICO:

ING. MARGARITA GUADALUPE RUIZ CELAYA

ALUMNO:

JOSIN ROSALINO RIOS SANTOS

SEMESTRE: GRUPO:

5. 4Q

HEROICA CD. DE JUCHITAN, DE ZARAGOZA OAX. 14 DE NOVIEMBRE DEL 2016


UNIDAD lll
Contenido
Introduccin.
3.4 Comparaciones o pruebas de rangos
mltiples.
3.5 Verificacin de los supuestos del
modelo.
Conclusin
Bibliografa
Introduccin
Los modelos de diseo de experimentos son modelos estadsticos cuyo objetivo
es averiguar si determinados factores influyen en una variable de inters y si
existe influencia de algn factor, cuantificar dicha influencia.
3.4 Comparaciones o pruebas de
rangos mltiples.
Mtodo de Duncan
Se utiliza para comparar todos los pares de medias.
Esta prueba no requiere de una prueba previa de t tratamientos, se
ordenan de forma ascendente.
Ejemplo:
Supongamos que nos interesa probar las hiptesis de cuatro mtodos de
ensamble.
En la tabla de ANOVA se lee que CME=2.46 lo cual se basa en 12 grados
de libertad. Y el error estandar de cada promedio es:

Dado que se hicieron n=4 observaciones en cada tratamiento.


De la tabla de rangos significantes de Duncan se utiliza =0.05 y 12
grados de libertad.
Rangos mnimos significantes:
Comparacin de parejas de medias de tratamientos

En un experimento el investigador puede estar interesado en comparar


todas las parejas de a medias de tratamiento.

Ho: i=j
H1:i j

Para toda ij, para llevar a cabo estas comparaciones existen muchos
metodos.

Mtodo LSD (diferencia mnima significativa)

Este procedimiento es una extensin de la prueba de t de Student para


el caso comparacin de dos medias con varianza ponderada.
Se define como la diferencia mnima que podra existir entre dos medias
de muestras significativamente diferentes.
Ejemplo
Se supone que la cantidad de carbn usada en la produccin de acero
tiene un efecto en su resistencia a la tensin.
Se desea saber cules son las parejas de medias que difieren

Formula:

Encontrando el valor del LSD, con la frmula establecida.

Calculando la diferencia de los promedios.

Se dice que una pareja de medias difieren significativamente si el valor


absoluto de las diferencias de los promedios de los tratamientos
correspondientes es mayor que LSD = 5.65
En conclusin:

a) Se observa que la pareja de medias que no difieren significativamente


son: la media tres y la media cuatro, ya que |2.75|< 5.65, por lo tanto,
no existe diferencia significativa entre el porcentaje de carbn tres y
cuatro.

b) En las dems parejas de medias (*) el valor absoluto de las diferencia


de los promedios a resultado ser mayor que el valor encontrado del LSD;
por lo tanto, los dems porcentajes tomados como parejas difieren
significativamente.

3.5 VERIFICACIN DE LOS SUPUESTOS


DEL MODELO.
La validez de los resultados obtenidos en cualquier anlisis de varianza
queda supeditada a que los supuestos del modelo se cumplan. Estos
supuestos son:

A) Normalidad
B) Varianza constante (igual varianza de los tratamientos)
C) Independencia

Esto es, la respuesta (Y) se debe distribuir de manera normal, con la


misma varianza en cada tratamiento y las mediciones deben ser
independientes. Estos supuestos sobre Y se traducen en supuestos
sobre el termino error ( ) en el modelo

Es una prctica comn utilizar la muestra de residuos para comprobar


los supuestos del modelo, ya que si los supuestos se cumplen, los
residuos o residuales se pueden ver como una muestra aleatoria de una
distribucin normal con media cero y varianza constante.

Los residuos e i j , se definen como la diferencia entre la respuesta


observada (Yij) y la respuesta predicha por el modelo (ij), lo cual
permite hacer un diagnstico ms directo de la calidad del modelo, ya
que su magnitud seala qu tan bien describe a los datos del modelo.
Veamos
Recordemos que el modelo que se espera describa los datos en el DCA
est dada por:

Cuando se realiza el ANOVA, y slo cuando ste resulta significativo,


entonces se procede a estimar el modelo ajustado o modelo de trabajo
dado por:
Los gorros indican que son estimadores, es decir, valores calculados a
partir de los datos del experimento. El trmino del error desaparece del
modelo estimado, por el hecho de que su valor esperado es igual a cero
(E(ij) = 0

Como la media global se estima con .. el efecto del tratamiento con


el
modelo ajustado del DCA se puede escribir como:

Para comprobar cada supuesto existen pruebas analticas y grficas que


veremos a continuacin. Por sencillez, muchas veces se prefieren las
pruebas grficas. stas tienen el inconveniente de que no son exactas,
pero aun as , en la mayora de las situaciones prcticas proporcionan la
evidencia suficiente en contra o a favor de los supuestos.

Normalidad

Un procedimiento grfico para verificar el cumplimiento del supuesto de


normalidad de los residuos consiste en graficar los residuos en papel o
en la grfica de probabilidad normal que se incluye casi en todos los
paquetes estadsticos. Esta grfica del tipo X-Y tiene las escalas de tal
manera que si los residuos siguen una distribucin normal, al graficarlos
tienden a quedar alineados en una lnea recta; por lo tanto, si
claramente no se alinean se concluye que el supuesto de normalidad no
es correcto. Cabe enfatizar el hecho de que el ajuste de los puntos a una
recta no tiene que ser perfecto, dado que el anlisis de varianza resiste
pequeas y moderadas desviaciones al supuesto de normalidad.
Figura 2.2 Grafica de normalidad para los cuatro tipos de cuero

Varianza constante

Una forma de verificar el supuesto de varianza constante (o que los


tratamientos tienen la misma varianza) es graficado los predichos contra
residuos , por lo general va en el eje horizontal y los
residuos en el eje vertical. Si los puntos en esta grfica se distribuyen de
manera aleatoria en una banda horizontal (sin ningn patrn claro y
contundente), entonces es seal d que se cumple el supuesto de que los
tratamientos tienen igual varianza. Por el contrario, si se distribuyen con
algn patrn claro y contundente, como por ejemplo una forma de
corneta o embudo, entonces es seal de que no se est cumpliendo el
supuesto de varianza constante.

Figura 2.3 Grafica de la varianza constante para los cuatro tipos de cuero
Independencia

La suposicin de independencia en los residuos puede verificarse si se


grafica el orden en que se colect un dato contra el residuo
correspondiente. De esta manera, si al graficar en el eje horizontal el
tiempo (orden de corrida) y en el eje vertical los residuos, se detecta una
tendencia o patrn no aleatorio claramente definido, esto es evidencia
de que existe una correlacin entre los errores y, por lo tanto, el
supuesto de independencia no se cumple. Si el comportamiento de los
puntos es aleatorio dentro de una banda horizontal, el supuesto se est
cumpliendo.

La violacin de este supuesto generalmente indica deficiencias en la


planeacin y ejecucin del experimento; asimismo, puede ser un
indicador de que no se aplico en forma correcta el principio de
aleatorizacin, o de que conforme se fueron realizando las pruebas
experimentales aparecieron factores que afectaron la respuesta
observada. Por ello, en caso de tener problemas con este supuesto, las
conclusiones que se obtienen del anlisis son endebles y por ello es
mejor revisar lo hecho y tratar de investigar por qu no se cumpli con
ese supuesto de independencia, a fin de reconsiderar la situacin.

En el ejemplo para comparar los cuatro tipos de cuero, las grficas


resultantes figuras 2.2 y 2.3. Se observa el cumplimiento de los
supuestos de normalidad y varianza constante, sin embargo, en las dos
grficas es notorio un punto que se aleja bastante del resto, el cual es
un punto aberrante cuyo origen debe investigarse.

Eleccin del tamao de la muestra


Una decisin importante en cualquier diseo de experimentos es decidir
el nmero de rplicas que se har por cada tratamiento (tamao de
muestra). Por lo general, si se esperan diferencias pequeas entre
tratamientos ser necesario un mayor tamao de muestra.

Aunque existen varios mtodos para estimar el tamao muestral,


muchas veces tienen poca aplicabilidad porque requieren cierto
conocimiento previo sobre la varianza del error experimental.

Si recurrimos a la experiencia vemos que el nmero de rplicas en la


mayora de las situaciones experimentales en las que se involucra un
factor vara entre cinco y diez; incluso, en algn caso puede llegar hasta
30. La tendencia podra inclinarse por un extremo de este rango e
incluso salirse de ste, de acuerdo con las siguientes consideraciones:

A menor diferencia que se espera en los tratamientos, mayor ser


la cantidad de rplicas si se quieren detectar diferencias
significativas, y viceversa, es decir, si se esperan grandes
diferencias quiz con pocas replicas sea suficiente

Si se espera mucha variacin dentro de cada tratamiento, debido


a la variacin de fuentes no controladas como mtodos de
medicin, medio ambiente, materia prima, etc., entonces se
necesitarn ms rplicas

Si son varios tratamientos (cuatro o ms), entonces ste es un


punto favorable para reducir el nmero de rplicas.

Adems de lo anterior, es preciso considerar los costos y el tiempo


global del experimento. De aqu que si toman en cuenta las
consideraciones antes expuestas se podr establecer el tamao de
muestra que permita responder en una primera fase las preguntas ms
importantes que se plantearon con el experimento.

Supongamos que el experimentador ya tiene el nmero de tratamientos


que desea probar, k y que tomando en cuenta las consideraciones antes
citadas tiene una propuesta inicial del nmero de rplicas por
tratamiento que va a utilizar, . Tambin tiene una idea aproximada del
valor de (la desviacin estndar del error aleatorio), as como una idea
de la magnitud de las diferencias, , entre tratamientos que le interesa
detectar. Por ejemplo, supongamos que en el caso de los tiempos
promedio de los k= 4 mtodos de ensamble (del ejemplo 1), tiene idea
realizar = 5 pruebas; en cuanto a las diferencias, le interesa detectar
2 minutos, entre un mtodo y otro, y espera que cada mtodo tenga una
variabilidad intrnseca de = 1,5; esto debido a factores no controlados
(habilidad del operador, cansancio, variabilidad de las partes a
ensamblar, error de medicin del tiempo de ensamble, etctera).
La frmula que tentativamente debemos usar para la eleccin del
tamao de muestra es:

El valor de arrojado por esta frmula dar una idea del nmero de
rplicas por tratamiento, de acuerdo con las consideraciones iniciales
que se reflejan a travs de , y sobre todo por el nmero total de
corridas experimentales, , que es lo que muchas veces interesa
ms al experimentador debido a los costos y tiempos. Si est fuera del
presupuesto se podrn revisar algunas consideraciones y quiz pensar
en un nmero menor de tratamientos.

Al aplicar esta expresin al caso de los cuatro mtodos del ensamble


obtenemos con un nivel se significancia del 0,05:

Por lo tanto se debera utilizar como tamao de muestra (nmero de


pruebas por tratamiento).
Conclusin
Ya detectado los factores que afectan en las variables, si se detecta
dicho factor debemos de descifrar dicha influencia y as poder continuar
y resolver el problema que se nos presenta

Algunos de los ejemplos donde habra que utilizar estos modelos son los
siguientes:

En el rendimiento de un determinado tipo de mquina (unidades


producidas por da): se desea estudiar la influencia del trabajador
que la maneja y la marca de la mquina.

Se quiere estudiar la influencia de un tipo de pila elctrica y de la


marca, en la duracin de las pilas.

Una compaa de software est interesada en estudiar la variable


porcentaje en que se comprime un fichero, al utilizar un programa de
compresin teniendo en cuenta el tipo de programa utilizado y el tipo
de fichero que se comprime.

Se quiere estudiar el rendimiento de los alumnos en una asignatura


y, para ello, se desean controlar diferentes factores: profesor que
imparte la asignatura; mtodo de enseanza; sexo del alumno.
Bibliografa
Anlisis y diseo de experimentos, 2da Edicin Humberto Gutirrez
Pulido y Romn de la Vara Salazar

https://14590547/9/Mtodo-de-la-Mnima-Diferencia-Significativa-LSD-
Estadstica-Inferencial.

https://es.scribd.com/doc/105850471/ESTADISTICA-INFERENCIAL-II-LIBRO

Potrebbero piacerti anche