Sei sulla pagina 1di 51

Mintab V15

Mdulo 4. Estadtica Inferencial

MINITAB 15 MDULO 4. ESTADSTICA INFERENCIAL

4.1Clculo de probabilidades
4.2Pruebas de hiptesis de una poblacin
4.3Pruebas de hiptesis de dos poblaciones
4.4Tamao de muestra y potencia
4.5Anlisis de varianza (ANOVA)
4.6Correlacin y Regresin lineal y cuadrtica simple
4.7Regresin Mltiple - Matriz de Correlaciones
4.8Aplicaciones

MDULO 4. ESTADSTICA INFERENCIAL


4.1Clculo de probabilidades
Distribucin t de Student (para nmero de muestras menor a 30 o sigma desconocida)
Se usa para pruebas de hiptesis sobre medias de una y dos poblaciones
Requiere un parmetro adicional de Grados de Libertad (gl) = n -1
Excel

=Distr.t( valor de t, gl, colas)

rea bajo la curva

=Distr.t.inv( valor de probabilidad, gl)

Estadstico t para una cierta rea


El rea siempre se divide entre 2

Calc > Probablity distributions > t


Inverse Cumulative probability, Degrees of freedom
Input constant (valor de la probabilidad alfa o rea bajo la curva)

Minitab

Estadstico t (valor a partir del cual inicia el rea bajo la curva alfa)
Probabilidad alfa (valor del rea bajo la curva corresp. A t)
Media = 0
Datos
10
10

Alfa
0.05
0.1

1- Alfa
Estadstico t
Minitab
en Minitab
0.95
1.83311
0.9
1.38303

Estadstico t
Excel
1.83311293
1.38302874

Distribucin F de Fisher (para probar hiptesis de comparacin de varianzas entre dos muestras)
Requiere dos parmetros adicionales de Grados de Libertad (gl) = n1 -1 y n2 = 2
Excel

=Distr.F( valor de F, gl 1, gl 2)
=Distr.F.inv( valor de probabilidad, gl 1, gl 2)

Minitab

Calc > Probablity distributions > F


Inverse Cumulative probability
Numerator Degrees of freedom; Denominator Degrees of Freedom

Input constant (valor de la probabilidad alfa o rea bajo la curva)


Estadstico F (valor a partir del cual inicia el rea bajo la curva alfa)

0
Slo valores positivos en eje horizontal

Fc=

S21
S22

S1 debe ser mayor a S2

Pgina 1 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

curva no simtrica
Datos de la
muestra 1
10
10

Datos de la
muestra 2
10
10

Alfa
0.05
0.1

1- Alfa
Estadstico F
Minitab
en Minitab
Excel
0.95
3.17889 3.1788931
0.9
2.44034 2.44034044

Distribucin Chi Cuadrada (para probar hiptesis de la varianza de una poblacin)


Requiere un parmetro adicional de Grados de Libertad (gl) = n -1
Excel

=Distr.Chi( valor de Chi, gl)


=Prueba.Chi.inv( valor de probabilidad, gl)

Minitab

Calc > Probablity distributions > Chi Square


Inverse Cumulative probability
Degrees of freedom

Input constant (valor de la probabilidad alfa o rea bajo la curva)


Estadstico Chi (valor a partir del cual inicia el rea bajo la curva alfa)

0
Slo valores positivos en eje horizontal
curva no simtrica

Datos de la
muestra
10
10

Alfa
0.05
0.1

1- Alfa
Estadstico Chi Cuadrado
Minitab
en Minitab
Excel
0.95
16.919 16.9189776
0.9
14.6837 14.6836566

4.2Pruebas de hiptesis de una poblacin


Referirse a los materiales sobre Pruebas de hiptesis para la teora de estas pruebas
MinitabPruebaHiptesisRes.doc InterConfPruHipo1P.xls Pruebas Hipotesis 2 pob1.xls
Las pruebas de hiptesis permiten probar una afirmacin o rechazarla en relacin
a parmetros de la poblacin que pueden ser la media, varianza y proporcin con
nivel de confianza que normalmente es del 95% (con 5% de probabilidad de error).
Para las pruebas se toman muestras de las poblaciones y en base a la informacin
que proporcionen se infiere sobre el comportamiento del parmetro en la poblacin.
Caso 1. Prueba de una media poblacional cuando se conoce la varianza de la poblacin (en base a datos histricos)
Ho: Media = valor

Ha: Media Valor

Ejemplo: Una lnea de llenado de paquetes debe llenar 4 kg en cada uno. Se toman
20 muestras y se pesan en gramos:
Usar el archivo Pesos.mtw de la hoja Archivos Datos Mdulo 4
La desviacin estndar histrica es de 25 g.
Se puede afirmar que el peso promedio es diferente a 4000 g.?
Ho: Media = 4000

Ha: Media 4000

Se introducen los valores en una sola columna C1 titulada Pesos del archivo Pesos.mtw anexo:

Pgina 2 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Stat > Basic Statistics > 1 - Sample Z

Indicar columna de datos

Esta seccin se usa cuando hay


datos de media y muestras

Desviacin estndar histrica


Media a probar

Nivel de confianza

Hiptesis alternativa, tambin se


puede probar "Menor que" o
"Mayor que"

Permite seleccionar varios tipos de grficas

I ndividual Value Plot of Pesos


(with Ho and 95% Z-confidence interval for the Mean, and StDev = 25)

_
X
Ho

3920

3940

3960

3980
Pesos

4000

4020

4040

Si la Ho queda fuera de la lnea


azul, entonces se rechaza la
hiptesis nula Ho y se acepta la
hiptesis alterna Ha indicando
que los pesos son menores a
los 4 Kgs.

OneSampleZ:Pesos
Testofmu=4000vsnot=4000
Theassumedstandarddeviation=25
VariableNMeanStDevSEMean95%CIZP
Pesos203985.7028.185.59(3974.74,3996.66)2.560.011
Este es el intervalo de confianza del 95% donde se encuentra
la media del proceso de llenado (poblacin). El 4000 no se
encuentra en el intervalo por tanto el promedio difiere de lo
que se afirma

l valor P es menor
a 0.05 por tanto se
rechaza la Ho y se
acepta la alterna en

Pgina 3 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

este caso el
promedio difiere de
los 4000 g.

Caso 2. Prueba de una media poblacional cuando no se conoce la varianza y el nmero de datos es menor a 30
Ho: Media = valor

Ha: Media Valor

Stat > Basic Statistics > 1 - Sample t


Similar al anterior sin requerir el valor de la desviacin estndar
OneSampleT:Pesos
Testofmu=4000vsnot=4000
VariableNMeanStDevSEMean95%CITP
Pesos203985.7028.186.30(3972.51,3998.89)2.270.035
Las conclusiones son iguales que en el caso 1

Caso 3. Prueba de hiptesis para una proporcin


Ejemplo: Un producto tiene accesorios que se piensa nadie usa, se hace una encuesta
a 200 usuarios y 17 si usan los accesorios.
Para un 95% de confianza se confirma la sospecha de que menos del 10% de
usuarios usan estos accesorios?
Ho: Proporcin >= 0.10

Ha: Proporcin < 0.10

Stat > Basic Statistics > 1 - Proportion


Se usa a mano si np > 5 y n(1-p) > 5
sin embargo Minitab lo calcula
por el mtodo exacto

TestandCIforOneProportion
Testofp=0.1vsp<0.1
UpperExact
SampleXNSamplepBoundPValue
1172000.0850000.1247710.285
No se rechaza Ho ya que la Proporcin del 10% de la
hiptesis se encuentra en el intervalo de confianza y el
P value es mayor a 0.05, no se acepta la hiptesis alterna.
Es vlido decir que slo el 10% de los usuarios utilizan los accesorios
Minitab 15

Caso 4. Prueba de hipotesis para una varianza


Un Pin debe medir 15" en promedio. Su varianza no debe exceder 0.001"2. Su proceso es normal.
Se miden 100 pines y se prueba la hiptesis de que su varianza no excede la especificacin.
1 File > Open worksheet AIRPLANEPIN.MTW.
2 Stat > Basic Statistics > 1 Variance.

Pgina 4 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

3 En la primera lnea del menu, seleccionar Enter variance.


3 En Samples en columns, seleccionar 'Pin length '.
4 Seleccionar Perform hypothesis test. En Hypothesized variance, poner 0.001.
5 Click Options. En Alternative, seleccionar less than. Click OK.
6 Click OK.
TestandCIforOneVariance:Pinlength
Method
Pin length
NullhypothesisSigmasquared=0.001
14.99
AlternativehypothesisSigmasquared<0.001
15.01
Thestandardmethodisonlyforthenormaldistribution.
14.96
Theadjustedmethodisforanycontinuousdistribution.
15.00
Statistics
15.03
VariableNStDevVariance
14.96
Pinlength1000.02670.000715
Etc.
95%OneSidedConfidenceIntervals
UpperBoundUpperBound
VariableMethodforStDevforVariance
Seleccionar el Mtodo
estndar ya que los datos PinlengthStandard0.03030.000919
siguen la distribucin norm Adjusted0.02950.000869
Tests
VariableMethodChiSquareDFPValue
PinlengthStandard70.7799.000.014
Adjusted112.64157.570.003
Como el valor de la varianza de la hiptesis (0.001 no se encuentra en el intervalo de confianza y
el valor P value es menor a 0.05, se acepta la hiptesis Ha de que la varianza es menor a 0.001")

4.3Pruebas de hiptesis de dos poblaciones


Caso 1. Comparacin de dos medias - Muestras independientes
H: Media A - Media B = 0

Ha: Media A - Media B 0

Ejemplo: 10 pieles son curtidas usando el mtodo A y 10 usando el mtodo B, las


resistencias a la traccin son las siguientes:
Mtodo A
Mtodo B
24.3
24.4
25.6
21.5
26.7
25.1
22.7
22.8
24.8
25.2
23.8
23.5
25.9
22.2
26.4
23.5
25.8
23.3
25.4
24.7
Se puede decir que los dos mtodos producen resistencias a la traccin diferentes?
Usar un nivel de confianza del 95%.
Se colocan los valores en dos columnas diferentes C1 y C2 corresp. A Metodos A y B
Paso 1. Se realiza un anlisis de comparacin de varianzas poblacionales:
Ho: Varianza A = Varianza B
Ha: Varianza A Varianza B

Stat > Basic Statistics > 2 Variances

Pgina 5 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

TestforEqualVariances:MtodoA,MtodoB
95%Bonferroniconfidenceintervalsforstandarddeviations
FTest(normaldistribution)
Teststatistic=1.01,pvalue=0.991
Como el P value es mayor a 0.05 no se rechaza la Hiptesis nula de igualdad de
varianzas, por tanto se asume que son iguales. Esta inf. se usar a continuacin:
Paso 2. Se realiza un anlisis de comparacin de medias poblacionales
H: Media A - Media B = 0 Ha: Media A - Media B 0

Stat > Basic Statistics > 2 - Sample t

La grfica de puntos individuales indica diferencia entre las muestras


Individual Value Plot of Mtodo A, Mtodo B
27
26

Data

25

24
23

22
21
Mtodo A

Mtodo B

Y los resultados de la prueba estadstica lo confirman:


TwosampleTforMtodoAvsMtodoB
NMeanStDevSEMean
MtodoA1025.141.240.39
MtodoB1023.621.240.39
Difference=mu(MtodoA)mu(MtodoB)
Estimatefordifference:1.52000
95%CIfordifference:(0.355,2.685)
TTestofdifference=0(vsnot=):TValue=2.74PValue=0.013DF=18
Como el cero no se encuentra en el intervalo de confianza de la
diferencia de las dos medias y el valor P value es menor a 0.05
se rechaza la hiptesis nula de igualdad de medias y se acepta
la alterna afirmando que son diferentes
Caso 2. Muestras pareadas - Prueba si las diferencias entre sujetos son iguales.
Ho: Media de diferencias = 0

Ha: Media de diferencias

Pgina 6 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Se utilizan cuando se trata de comparar el efecto de dos tratamientos a los mismos


sujetos u objetos, por ejemplo el peso de individuos antes y despus de una rutina.
Tambin se aplica cuando cuando antes de comparar se hacen parejas de sujetos
por ejemplo para comparar los promedios de alumos de dos universidades, primero
se forman parejas (dos ingenieros, dos administradores, dos arquitectos, etc.)
Ejemplo: Se hacen dos tratamientos superficiales para lentes A y B, se seleccionan
10 personas a las que se les instala uno de esos lentes en cualquier lado al azar.
Despus de un periodo se mide el deterioro (rayas, desgaste, etc.) de cada lente:
Persona
1
2
3
4
5
6
7
8
9
10

Lente A
6.7
5.0
3.6
6.2
5.9
4.0
5.2
4.5
4.4
4.1

Lente B
6.9
5.8
4.1
7.0
7.0
4.6
5.5
5.0
4.3
4.8

A un 95% de nivel de confianza


Se puede afirmar que los 2 tratamientos producen diferente deterioro en los lentes?
Se colocan los datos en las columnas C1 y C2 para los Lentes A y B.
Ho: Diferencia de medias = 0

Ha: Diferencia de medias 0

Stat > Basic Statistics > Paired t

Individual Value Plot of Differences


(with Ho and 95% t-confidence interval for the mean)

_
X
Ho

-1.2

-1.0

-0.8

-0.6
-0.4
Differences

-0.2

0.0

Como el valor de Ho no se
encuentra en el intervalo de
confianza de la diferencia de las
dos medias, se rechaza Ho
y se acepta Ha indicando que el
deterioro es diferentes en los dos
mtodos.

PairedTTestandCI:LenteA,LenteB
PairedTforLenteALenteB
NMeanStDevSEMean
LenteA104.960001.029780.32564
LenteB105.500001.130390.35746
Difference100.5400000.3438350.108730
95%CIformeandifference:(0.785964,0.294036)
TTestofmeandifference=0(vsnot=0):TValue=4.97PValue=0.001

Pgina 7 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Como el cero no se encuentra en el intervalo de confianza de la


diferencia de las dos medias y el valor P value es menor a 0.05
se rechaza la hiptesis nula de igualdad de medias y se acepta
la alterna afirmando que los tratamientos producen deterioros diferentes.
Caso 3. Comparacin de dos proporciones
Ejemplo: En una encuesta a 300 clientes de la zona A, 33 estan descontentos
En otra zona B se encuestaron a 250 clientes y 22 se mostraron descontentos.
A un 95% de nivel de confianza o 5% de nivel de sigfinicancia,
Hay diferencia en las proporciones de clientes descontentos en las dos zonas?
Ho: Proporcin A = Proporcin B

Ha: Proporcin A Proporcin B

Stat > Basic Statistics > 2 - Proportions

Se usa la seccin de datos


resumidos
Como Options NC = 95%
Alternate = Not equal, Test Dif = 0
Use Pooled estimate p for test
TestandCIforTwoProportions
SampleXNSamplep
1333000.110000
2222500.088000
Difference=p(1)p(2)
Estimatefordifference:0.022
95%CIfordifference:(0.0278678,0.0718678)
Testfordifference=0(vsnot=0):Z=0.86PValue=0.392
Como el cero si se encuentra en el intervalo de confianza de la
diferencia de las dos proporciones y el valor P value es mayor a 0.05
no se rechaza la hiptesis nula de igualdad de proporciones
o sea que no hay razn para decir que las proporciones sean diferentes.
Minitab 15

Prueba de una muestra por Poisson


Calcula el intervalo de confianza para la tasa de ocurrencia y el nmero medio de ocurencias
de eventos en una muestra en un proceso de Poisson, y prueba la hiptesis de que la tasa de
ocurrencias es igual a un valor especificado.
Un proceso de Poisson describe el nmero de ocurrencias de un evento en un cierto periodo de tiempo
rea, volumen, etc. Por ejemplo:
El nmero de llamadas telefnicas diarias a un centro de servicio a clientes
El nmero de defectos en un tramo de alambre
Por ejemplo:
La empresa A de receptores de TV cuenta el nmero de unidades con pantallas defectivas que se
producen cada trimestre durante los ltimos 10 aos.
Los directivos establecen que 20 defectivos por cuatrimestre es el mximo aceptable, y quieren
determinar si la produccin actual cumple este requerimiento.

1 File > Open the worksheet TVDEFECT.MTW.


2 Stat > Basic Statistics > 1-Sample Poisson Rate.
3 En Samples in columns, Seleccionar 'Defective A '.

Pgina 8 de 51

P. Reyes / Nov. 2007

Mintab V15

4
5
6

Mdulo 4. Estadtica Inferencial

Seleccionar Perform hypothesis test. En Hypothesized rate, poner 20.


Click Options. En Alternative, seleccionar less than.
Click OK en cada cuadro de dilogo

Defective A
18
18
21
14
19
14
Etc.

Defective B
20
35
19
30
26
22
Etc.

Resultados:
TestandCIforOneSamplePoissonRate:DefectiveA
Testofrate=20vsrate<20
TotalRateof95%UpperExact
VariableOccurrencesNOccurrenceBound Como P value es menor
DefectiveA7134017.825018.9628 a 0.05, se rechaza Ho y se
Lengthofobservation=1.
acepta Ha donde la tasa de
defectos es menor a 20
Se puede probar si la empresa A tiene una tasa mayor de defectos que la
empresa B. La empresa A mide cada tres meses sus defectos y la empresa B cada seis meses.
Se trata de probar cual empresa tiene la menor tasa de defectos mensual.

1 File > Open the worksheet TVDEFECT.MTW.


2 Stat > Basic Statistics > 2-Sample Poisson Rate.
3 Samples in different columns, Seleccionar 'Defective A '.
4 First 'Defective A'
5 Second 'Defective B'
6 Click Options. En "Length" of observation [time, items, area, volume, etc], poner '3 6'
7 Click OK en cada cuadro de dilogo
TestandCIforTwoSamplePoissonRates:DefectiveA,DefectiveB
Total"Length"ofRateofMean
VariableOccurrencesNObservationOccurrenceOccurrence
DefectiveA7134035.9416717.825
DefectiveB5152064.2916725.750
Difference=rate(DefectiveA)rate(DefectiveB)
Estimatefordifference:1.65
95%CIfordifference:(1.07764,2.22236)
Como el valor P value
Testfordifference=0(vsnot=0):Z=5.65PVa es menor a 0.05, se
ExactTest:PValue=0.000
acepta la hiptesis alterna
que A y B son diferentes
Difference=mu(DefectiveA)mu(DefectiveB)
donde B tiene la menor
Estimatefordifference:7.925
tasa de ocurrencia
95%CIfordifference:(10.5053,5.34474)
Testfordifference=0(vsnot=0):Z=6.02PValue=0.000
ExactTest:PValue=0.000

4.4Tamao de muestra y potencia


Potencia:

Es la capacidad de una prueba para detectar una diferencia cuando realmente existe.

Pgina 9 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Hiptesis Nula
Desicin
Verdadera
Falsa
No rechazar Desicin correcta
Error tipo II
p=1-
p=
Rechazar
Error tipo I
Desicin correcta
p=
p=1-
Potencia
La potencia de la prueba es la probabilidad de de rechazar correctamente
la hiptesis nula siendo que en realidad es falsa.
El anlisis de potencia puede ayudar a contestar preguntas como:
* Cuntas muestras se deben tomar para el anlisis?
* Es suficiente el tamao de muestra?
* Qu tan grande es la diferencia que la prueba puede detectar?
* Son realmente valiosos los resultados de la prueba?
Para estimar la potencia, Minitab requiere de dos de los siguientes parmetros:
* Tamaos de muestra
* Diferencias - un corrimiento significativo de la media que se desea detectar
* Valores de potencia - La probabilidad deseada de rechazar Ho cuando es falsa

Caso 1. Prueba t de una media poblacional


Ejemplo: Se tiene una poblacin normal con media de 365 y lmites de especificacin
de 360 y 370. Si la media se desplaza 2.5 gramos por arriba de la media, el nmero de
defectos sera inaceptable, la desviacin estndar histrica es de 2.403:

CORRI DA DE 2.5 GRS. EN PROMEDIO


0.18
LIE 360

0.16

Ha: Corrida
367.5

Ho:
Meta
365

Variable
Original
Corrida

LIE 370

0.14

Y-Data

0.12
0.10
0.08
0.06
0.04
0.02
0.00
355

360

365
C1

370

375

Stat > Power and Sample Size > 1 - Sample t


Completar el dilogo como sigue:

Los resultados se muestran a continuacin:


PowerandSampleSize

Pgina 10 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

1SampletTest
Testingmean=null(versusnot=null)
Calculatingpowerformean=null+difference
Alpha=0.05Assumedstandarddeviation=2.403
Sample
DifferenceSizePower
2.560.537662

Se tiene un 53.76% de Potencia para detectar


una diferencia de 2.5 si se usan 6 muestras
O sea que hay una probabilidad del 46.24%
que no se rechaze Ho y se concluya que no
hay diferencia significativa.

cuntas muestras se requieren para tener un 80% de probabilidad de detectar


el corrimiento, y para 85%, 90% y 95%?

Stat > Power and Sample Size > 1 - Sample t

Se cambia este parmetro

Los resultados se muestran a continuacin:


SampleTarget
DifferenceSizePowerActualPower
2.5100.800.832695
2.5110.850.873928
2.5120.900.905836
2.5150.950.962487
Silapotenciaesdemasiadoaltapordecir99%sepuedendetectardiferencias
querealmentenosonsignificativas.
Caso 2. Prueba t de comparacin de dos medias poblacionales
Ejemplo: La potencia de una prueba depende de la diferencia que se quiera detectar
respecto a la desviacin estndar, para una sigma poner 1 en diferencia y desviacin
estndar, con valores deseados de Potencia de 0.8 y 0.9.

Stat > Power and Sample Size > 2 - Sample t


PowerandSampleSiz 2SampletTest
Testingmean1=mean2(versusnot=)
Calculatingpowerformean1=mean2+difference
Alpha=0.05Assumedstandarddeviation=1
SampleTarget
DifferenceSizePowerActualPower
1170.80.807037
1230.90.912498
Serequierentamaosdemuestradeentre17y23
Caso 3. Prueba de 1 proporcin

Pgina 11 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Para estimar la potencia, Minitab requiere de dos de los siguientes parmetros:


* Tamaos de muestra
* La proporcin - una proporcin que se desea detectar con alta probabilidad
* Valores de potencia - La probabilidad deseada de rechazar Ho cuando es falsa
Suponiendo que se desea detectar una proporcin de 0.04 con el 0.8 y 0.9 de niveles
de Potencia:

Proporcin que se desea detectar con alta


probabilidad (0.80, 0.90)

Es la proporcin de la Hiptesis nula


TestforOneProportion
Testingproportion=0.02(versus>0.02)
Alpha=0.05
AlternativeSampleTarget
ProportionSizePowerActualPower
0.043910.80.800388
0.045800.90.900226
Si se desea saber la Potencia si se utiliza un tamao de muestra de 500 se tiene:

Stat > Power and Sample Size > 2 - Proportions


Proportion 1 value 0.02
Sample sizes = 500 Alternative values of p = 0.04
Options: Greater Than
Significance Level = 0.05
TestforOneProportion
Testingproportion=0.02(versus>0.02)
Alpha=0.05
AlternativeSample
ProportionSizePower
0.045000.5828
Por tanto con un tamao de muestra de 500, la potencia de la prueba para detectar
un corrimiento de 2% a 4% es del 86.6%

4.5Anlisis de varianza (ANOVA)


Para la teora revisar el artculo anexo en el archivo ANOVARes.Doc
El Anlisis de Varianza es una prueba de hiptesis que trata de probar la
igualdad de varias medias al mismo tiempo:

H 0 =1 =2 =3 =. . . .= k

H 1 : Al menos dos medias son diferentes .


Requiere que las poblaciones sean normales y con varianza similar.
ANOVA de una va con datos de tratamientos en diferentes columnas:

Pgina 12 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

P. Reyes / Nov. 2007

Ejemplo: Los tcnicos de una fbrica de papel hacen un experimento de un factor


para ver que variedad de rbol produce menos fenoles en los desechos de pasta de
papel. Se colectan los siguientes datos en porcentajes:
A
1.9
1.8
2.1
1.8

B
1.6
1.1
1.3
1.4
1.1

C
1.3
1.6
1.8
1.1
1.5
1.1
A un 95% de nivel de confianza, hay alguna variedad que produzca ms fenoles que otra?
Se colocan los datos en tres columnas distintas C1, C2 y C3:

Stat > ANOVA > One Way (Unstacked)

Residual Plots for A, B, C


Normal Probability Plot of the Residuals

Residuals Versus the Fitted Values

99

0.4
Residual

Percent

90
50

0.0
-0.2

10
1

0.2

-0.50

-0.25

0.00
Residual

0.25

0.50

-0.4

1.4

1.6
Fitted Value

Histogram of the Residuals

Frequency

3
2
1
0

-0.3 -0.2 -0.1 0.0 0.1


Residual

0.2

0.3

0.4

Los residuos deben mostrar


un comportamiento normal
y aleatorio alrededor de la media
para que el anlisis sea vlido
Los resultados se muestran a continuacin:
OnewayANOVA:A,B,C
Como el valor P value es menor
SourceDFSSMSFa 0.05 existe una diferencia
Factor20.90000.45008.440significativa entre algunas medias
Error120.64000.0533
Total141.5400
S=0.2309RSq=58.44%RSq(adj)=51.52%
Individual95%CIsForMeanBasedon
PooledStDev
A produce ms fenoles que B,C
LevelNMeanStDev++++
A41.90000.1414(*)
B51.30000.2121(*)
La media de A es
C61.40000.2828(*)
diferentes a A y B
++++
1.201.501.802.10
PooledStDev=0.2309
Las medias B y C
Desviacin estndar poblacional
son similares
Tukey95%SimultaneousConfidenceIntervals
AllPairwiseComparisons
Individualconfidencelevel=97.94%

Como el cero no est en el

Pgina 13 de 51

1.8

Mintab V15

Mdulo 4. Estadtica Inferencial

P. Reyes / Nov. 2007

intervalo de la diferencia B-A


Asubtractedfrom:
o C-A, A es diferente de B y C
LowerCenterUpper++++
B1.01300.60000.1870(*)
C0.89740.50000.1026(*)
++++
0.800.400.000.40
Bsubtractedfrom:
LowerCenterUpper++++
C0.27280.10000.4728(*)
++++
0.800.400.000.40
El intervalo de la diferencia C-B si incluye
el cero por tanto B no es diferentes de C
ANOVA de una va con datos de tratamientos en una sola columna

Respuesta
1.9
Los datos del ejemplo anterior arreglados en una
1.8
sola columna se muestran a continuacin
2.1
1.8
1.6
1.1
1.3
1.4
1.1
1.3
1.6
1.8
1.1
1.5
1.1

Factor
A
A
A
A
B
B
B
B
B
C
C
C
C
C
C

Stat > ANOVA > One Way

Los resultados son similares a los anteriores


excepto que se obtiene 4 en uno en vez de 3 en uno.
Residual Plots for Respuesta
Normal Probability Plot of the Residuals

Residuals Versus the Fitted Values

99

0.4

Residual

Percent

90
50

-0.50

-0.25

0.00
Residual

0.25

-0.4

0.50

Histogram of the Residuals

1.6
Fitted Value

1.8

Residuals Versus the Order of the Data

Residual

Frequency

Mintab 15

1.4

0.4

1
0

0.0
-0.2

10
1

0.2

0.2
0.0
-0.2

-0.3 -0.2 -0.1 0.0 0.1


Residual

0.2

0.3

0.4

-0.4

Tamao de muestra en ANOVA


Se usa para calcular uno de las pruebas siguientes en prueba de igualdad de medias poblacionales
potencia
tamao de muestra

Pgina 14 de 51

9 10 11 12 13 14 15

Observation Order

Mintab V15

Mdulo 4. Estadtica Inferencial

diferencia mnima detectable entre la media menor y la mayor (diferencia mxima)

Se requiere como dato dos de estos valores, Minitab calcula el tercero.

1
2
3
4
5

Stat > Power and Sample Size > One-way ANOVA.


En Number of levels, poner 4.
En Sample sizes, poner 5.
En Values of the maximum difference between means, poner 4.
En Standard deviation, poner 1.64. Click OK.

Los resultados son los siguientes:


PowerandSampleSize
OnewayANOVA
Alpha=0.05Assumedstandarddeviation=1.64NumberofLevels=4
SSSampleMaximum
MeansSizePowerDifference
850.8268604
Thesamplesizeisforeachlevel.
Por tanto si se asignan cinco unidades a cada nivel de tratamiento, se tendr una potencia de 0.83
para detectar una diferencia de 4 o ms unidades entre las medias de los tratamientos.

Minitab 15

Anlisis de varianza de dos vas


Prueba la igualdad de medias poblacionales cuando la clasificacin de tratamientos es por variables
o factores, las celdas deben estar balanceadas con el mismo nimero de observaciones y los factores
deben ser fijos.
Para mostrar las medias en las celdas y sus desviaciones estndar utilizar la opcin
Cross Tabulation and Chi Square.
Si se desea que ciertos factores sean aleatorios, usar ANOVA balanceado o el Modelo lineal general
si se desea comparar medias usando comparaciones mltiples.
Por ejemplo:
Se estudia el plancton en dos lagos. Se preparan doce tanques en el laboratorio, seis con agua de cada
uno de los lagos, se agrega uno de tres nutrientes en cada tanque y al mes se cuenta el plancton en
cada unidad de volumen de agua. Se utiliza el ANOVA de dos vas para este experimento.
1 File > Open worksheet EXH_AOV.MTW.
Zooplankton Supplement
Lake
34
1
Rose
43
1
Rose
57
1
Dennison
40
1
Dennison
85
2
Rose
68
2
Rose
67
2
Dennison
53
2
Dennison
41
3
Rose
24
3
Rose
42
3
Dennison
52
3
Dennison

2
3
4
5

Stat > ANOVA > Two-Way.


En Response, seleccionar Zooplankton.
En Row factor, seleccionar Supplement. Seleccionar Display means.
En Column factor, seleccionar Lake. seleccionar Display means. Click OK.

Los resultados se muestran a continuacin:

Pgina 15 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

TwowayANOVA:ZooplanktonversusSupplement,Lake
SourceDFSSMSFP
Supplement21918.50959.2509.250.015
Lake121.3321.3330.210.666
Interaction2561.17280.5832.710.145
Error6622.00103.667
Total113123.00
S=10.18RSq=80.08%RSq(adj)=63.49%

Individual95%CIsForMeanBasedon
PooledStDev
SupplementMean++++
143.50(*)
268.25(*)
339.75(*)
++++
30456075
Individual95%CIsForMeanBasedon
PooledStDev
LakeMean++++
Dennison51.8333(*)
Rose49.1667(*)
++++
42.048.054.060.0
De la tabla de ANOVA se ve que no hay una interaccin significativa entre Supplement*Lake o por Lake.
Hay evidencia significativa de que el Supplement afecta al crecimiento para un alfa de 0.05.
De la grfica de medias parece que el Supplement 2 es mejor para el crecimiento del plancton.
Para examinar comparaciones mltiples de medias, utilizar el modelo lineal general.
Anlisis de medias
Sirve para realizar un anlisis de medias (ANOM) para datos normales, binomiales o de Poisson y
opcionalmente imprime una tabla resumen para datos normales o binomiales.
Por ejemplo para datos normales:
Se evala el efecto de tres tiempos de nvieles de proceso y tres niveles de resitencia en la densidad.
Se analizan las medias y un diseo de dos vas para identificar interacciones o efectos principales
significativos.
1

3
4
5

File > Open worksheet EXH_AOV.MTW.


Density
Minutes
Strength
7
10
3
8
10
3
10
10
3
7
10
3
1
15
1
4
15
1
3
15
1
2
15
1
6
15
2
7
15
2
8
15
2
Etctera
En Response, seleccionar Density.
Seleccionar Normal.
En Factor 1, seleccionar Minutes. En Factor 2, seleccionar Strength. Click OK.

Los resultados se muestran a continuacin:


Two-Way Normal ANOM for Density
Alpha = 0.05
Interaction Effects
2

Effect

Minitab 15

1.578
0

Pgina 16 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Two-Way Normal ANOM for Density


Alpha = 0.05
Interaction Effects
Effect

1.578

0
-2
Strength
Minutes

0
-1.578
1
10

1
15

Main Effects for Minutes

Mean

Mean

6.222

Main Effects for Strength


7.145

1
18

7.145
6.222
5.300

6
4

5.300
10

15
Minutes

18

2
Strength

Se muestra una grfica de interaccin y de efectos principales para los dos factores.
La grfica ANOM tiene una lnea central y lmites de decisin, si un punto cae fuera de estos lmites
es evidente que es diferente de la gran media. Si la interaccin fuera significativa, ya no se consideran
los efectos principales por separado, dado que unos dependen de otros. En este caso no es significat.
El punto que representa la media del nivel 3 del factor Minutes se muestra con un asterisco en rojo,
indicando que hay evidencia al nivel de alfa = 0.05 de que difiera significativamente de la media gral.
En el caso de Strenght, hay evidencia de que los efectos principales para los niveles 1 y 3 estn fuera
de los lmites de decisin y son diferentes de la media general.
Los puntos que estn fuera se pueden investigar.
Ejemplos con datos binomiales
Se cuenta el nmero de soldaduara rechazadas en muestras de tamao 80 para identificar que
proporciones estn fuera de la lnea con las otras muestras.
Como las muestras tienen dos resultados, la proporcin de xitos es constante y son independientes
se usa el anlisis de medias para datos binomiales.
1 File > Open worksheet EXH_AOV.MTW.
WeldRejects
3
6
8
14
6
1
8
1
8
10
1
2
3
4

Stat > ANOVA > Analysis of Means.


En Response, seleccionar WeldRejects.
Seleccionar Binomial y poner 80 en Sample size. Click OK.

Los resultados se muestran a continuacin:


One-Way Binomial ANOM for WeldRejects
Alpha = 0.05
0.20

Proportion

0.15

0.1547

0.10
0.075
0.05

0.00

Pgina 17 de 51

P. Reyes / Nov. 2007

0.20

Mintab V15

Mdulo 4. Estadtica Inferencial


0.1547

Proportion

0.15

0.10
0.075
0.05

0.00

6
Sample

10

11

La grfica muestra la proporcin de defectos para cada muestra, la lnea central representando la
proporcin promedio, y los lmites superior e inferior.
En este caso la muestra cuatro sale de los lmites de decisin y es anormal.
Ejemplo con datos de Poisson
Una fbrica de juguetes, quiere monitorear el nmero de defectos de carros de juguete.
Se toman 20 muestras de carros y se crea una carta de medias para examinar el nmero de defectos
en cada muestra.
1

File > Open worksheet TOYS.MTW.


Defects
Defects
9
4
11
4
2
2
5
5
15
5
13
2
8
3
7
2
5
1
2
6

2
3
4

Stat > ANOVA > Analysis of Means.


En Response, seleccionar Defects
Seleccionar Poisson . Click OK.

One-Way Poisson ANOM for Defects


Alpha = 0.05

16

12.49

Defects

12

8
5.55
4

10 11 12 13 14 15 16 17 18 19 20
Sample

La grfica muestra el nmero de defectos en cada muestra, la lnea central representando el promedio
de defectos, y los lmites de decisin superior e inferior.
En este caso, el nmero de defectos de los carros cinco y seis son anormales ya que caen fuera de los
lmites de decisin.
Mintab 15

ANOVA Balanceado
Se usa para realizar anlisis univariado de varianza para cada una de las variables de respuesta.
El diseo debe ser balanceado, con las mismas observaciones por celda.

Pgina 18 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Los factores pueden ser cruzados o anidados, fijos o aleatorios. Se pueden incluir hasta 50 variables de
respuesta con hasta 31 factores al mismo tiempo.
Los factores son predictores (independientes) que se seleccionan a que varien durante el experimento
para determinar su efecto en la variable de respuesta (variable dependiente).
Por ejemplo, si se quiere evaluar el acabado superficial de partes metlicas producidas por varias
mquinas y se miden por varios operadores. Tanto "Mquina" como "Operador" son factores en este
experimento. Los factores pueden ser cruzados o anidados, dependiendo de cmo se colecten los
datos.
Factores cruzados:
Dos factores son cruzados cuando cada nivel de un factor ocurre en combinacin con cada nivel del
otro factor. Por ejemplo, los mismos tres operadores evalan el acabado superficial de las 2 mquinas.
Factores anidados:
Dos factores son anidados cuando los niveles de un factor son similares pero no idnticos, y cada uno
ocurre en combinacin con diferentes niveles de otro factor.
En este caso, si la mquina 1 est una ciudad y la otra en otra diferente, cada una tendr diferentes
operadores.
Modelo:
En la caja de Model solo se especifican las X's no la Y. La opcin Make Patterned data, single set of
numbers puede ayudar a cargar los nmeros de niveles de un factor.
Las reglas para expresar modelos son:
1 * indica un trmino de interaccin, por ejemplo A*B.
2 () indica anidado, cuando B est anidado dentro de A, poner B(A). Si C est anidado dentro de A y B
poner C(A B). Los trminos entre parntesis son factores del modelo y se separan con espacio.
3 Abreviar el modelo con | o ! Para indicar factores cruzados o - para remover trminos.
Por ejemplo:
Dos factores cruzados: A B A*B
Tres factores cruzados: A B C A*B A*C B*C A*B*C
Tres factores anidados: A B(A) C(A B)
B anidado dentro de A, y ambos cruzados con C: A B(A) A*C B*C(A)
Para introducir nmeros de niveles para un conjunto de datos:
Por ejemplo para un diseo cruzado de tres vas con niveles a, b y c de factores A, B, C, con n
observaciones por celda, se tiene:
1 Calc>Make Patterned Data > Simple set of numbers, F3 (Reset defaults).
Poner A en Store patterned data in. Poner 1 en From first value, niveles de A en To last value.
Poner el producto bcn en List the whole sequence. Clik OK
2 Calc>Make Patterned Data > Simple set of numbers, F3 (Reset defaults).
Poner B en Store patterned data in. Poner 1 en From first value, niveles de B en To last value.
Niveles de A en List each value. Poner el producto cn en List the whole sequence. Clik OK
3 Calc>Make Patterned Data > Simple set of numbers, F3 (Reset defaults).
Poner C en Store patterned data in. Poner 1 en From first value, niveles de C en To last value.
Producto ab en List each value. Poner el tamao de muestra n en List the whole sequence. Clik OK
Ejemplo de ANOVA con dos factores cruzados
Se quiere probar cuanto toma usar una calculadora nueva y una antigua. Seis ingenieros trabajan en
ambos un problema estadstico y uno de ingeniera usando cada modelo de calculadora y se toma
el tiempo en minutos que toma resolver el problema.
Los ingenieros se pueden considerar como bloques del diseo experimental. Hay dos factores
Tipo de problema y modelo de calculadora, cada uno con dos niveles. Como cada nivel del factor
ocurre en combinacin con cada nivel del otro factor, los factores son cruzados.
1
SolveTime
3.1
7.5
2.5

File > Open worksheet EXH_AOV.MTW.


Engineer
ProbType
Calculator
Engineer
Jones
Stat
New
Dixon
Jones
Stat
Old
Dixon
Jones
Eng
New
Dixon

ProbType
Stat
Stat
Eng

Calculator
New
Old
New

Pgina 19 de 51

P. Reyes / Nov. 2007

Mintab V15

5.1
3.8
8.1
2.8
5.3
3
7.6
2
4.9
3.4
7.8
2.7
5.5
3.3
6.9
2.5
5.4
3.6
7.8
2.4
4.8

Mdulo 4. Estadtica Inferencial

Jones
Williams
Williams
Williams
Williams
Adams
Adams
Adams
Adams
2
3
4
5
6
7

Eng
Stat
Stat
Eng
Eng
Stat
Stat
Eng
Eng

Old
New
Old
New
Old
New
Old
New
Old

Dixon
Erickson
Erickson
Erickson
Erickson
Maynes
Maynes
Maynes
Maynes

Eng
Stat
Stat
Eng
Eng
Stat
Stat
Eng
Eng

Old
New
Old
New
Old
New
Old
New
Old

Stat > ANOVA > Balanced ANOVA.


En Responses, seleccionar SolveTime.
En Model, seleccionar Engineer ProbType | Calculator.
En Random Factors, seleccionar Engineer.
Click Results. En Display means corresponding to the terms, poner ProbType | Calculator.
Click OK en cada cuadro de dilogo.

Los resultados se muestran a continuacin:


ANOVA:SolveTimeversusEngineer,ProbType,Calculator
FactorTypeLevelsValues
Engineerrandom6Adams,Dixon,Erickson,Jones,Maynes,Williams
ProbTypefixed2Eng,Stat
Calculatorfixed2New,Old

AnalysisofVarianceforSolveTime
SourceDFSSMSFP
Engineer51.0530.2113.130.039
ProbType116.66716.667247.520.000
Calculator172.10772.1071070.890.000
ProbType*Calculator13.6823.68254.680.000
Error151.0100.067
Total2394.518
S=0.259487RSq=98.93%RSq(adj)=98.36%
Means
ProbTypeNSolveTime
Eng123.8250
Stat125.4917

CalculatorNSolveTime
New122.9250
Old126.3917

ProbTypeCalculatorNSolveTime
EngNew62.4833
EngOld65.1667
StatNew63.3667
StatOld67.6167
Se muestran los factores con su tipo (fijos o aleatorios), nmero de niveles y valores. Despus se
muestra la tabla de ANOVA, indicando una interaccin significativa entre tipo de problema y calculadora.
Tambin se muestran las medias de todos los factores y sus combinaciones como efectos principales.
Donde se puede observar que el tiempo se reduce al cambiar de la calculadora antigua a la nueva.
Ejemplo de ANOVA con diseo de mediciones repetidas
Se corre un experimento para ver como afectan los factores la exactitud de ajuste de indicadores.
Tres personas realizan las pruebas en uno de dos niveles de ruido. En cada uno de los tres periodos
de tiempo, las personas monitorean tres diferentes indicadores y realizan ajustes conforme se requiere
La respuesta es una medida de la exactitud. El ruido, tiempo e indicadores son factores fijos y cruzados

Pgina 20 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

La persona en un factor aleatorio, anidado dentro del ruido. El ruido es un factor entre personas,
el tiempo e indicadores estan dentro de las personas.
1

2
3
4
5
6
7
8
9

File > Open worksheet EXH_AOV.MTW.


Score
Noise
Subject
ETime
45
1
1
1
53
1
1
1
60
1
1
1
40
1
1
2
52
1
1
2
57
1
1
2
28
1
1
3
37
1
1
3
46
1
1
3
35
1
2
1
41
1
2
1
50
1
2
1

Dial
1
2
3
1
2
3
1
2
3
1
2
3

Stat > ANOVA > Balanced ANOVA.


En Responses, seleccionar Score
En Model, seleccionar Noise Subject(Noise) Etime
Noise*ETime ETime*Subject Dial Noise*Dial Dial*Subject ETime*Dial Noise*ETime*Dial.
En Random Factors, seleccionar Subject
Click Options.
Seleccionar Use the restricted form of the mixed model, y click OK.
Click Results.
Seleccionar Display expected mean squares and variance components. Click OK en dilogos.

Los resultados se muestran a continuacin:


ANOVA:ScoreversusNoise,ETime,Dial,Subject
FactorTypeLevelsValues
Noisefixed21,2
Subject(Noise)random31,2,3
ETimefixed31,2,3
Dialfixed31,2,3

AnalysisofVarianceforScore
SourceDFSSMSFP
Noise1468.17468.170.750.435
Subject(Noise)42491.11622.7878.390.000
ETime23722.331861.1763.390.000
Noise*ETime2333.00166.505.670.029
ETime*Subject(Noise)8234.8929.363.700.013
Dial22370.331185.1789.820.000
Noise*Dial250.3325.171.910.210
Dial*Subject(Noise)8105.5613.191.660.184
ETime*Dial410.672.670.340.850
Noise*ETime*Dial411.332.830.360.836
Error16127.117.94
Total539924.83
S=2.81859RSq=98.72%RSq(adj)=95.76%
VarianceErrorExpectedMeanSquareforEach
SourcecomponenttermTerm(usingrestrictedmodel)
1Noise2(11)+9(2)+27Q[1]
2Subject(Noise)68.31511(11)+9(2)
3ETime5(11)+3(5)+18Q[3]
4Noise*ETime5(11)+3(5)+9Q[4]
5ETime*Subject(Noise)7.13911(11)+3(5)
6Dial8(11)+3(8)+18Q[6]
7Noise*Dial8(11)+3(8)+9Q[7]
8Dial*Subject(Noise)1.75011(11)+3(8)
9ETime*Dial11(11)+6Q[9]

Pgina 21 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

10Noise*ETime*Dial11(11)+3Q[10]
11Error7.944(11)
Se muestra la tabla de niveles de factores, la tabla de ANOVA y los cuadrados medios esperados.
Esto ltimo permite ver los componentes estimados de la varianza y descubrir cul trmino de error
es usado para probar los diferentes trminos del modelo.
El trmino de error est en fila 11 de la tabla de cuadrados medios esperados. La columna Error Term"
indica que el trmino 11 se usa para probar los trminos 2, 5, 8 y 10. Dial*Subject se numera como 8
y se usa para probar el sexto y sptimo trminos. Se puede seguir el patrn para otros trminos.
Se puede tener alguna idea de cmo afecta el diseo la sensibilidad de las pruebas F observando los
componentes de la varianza. Los componentes para probar los factores dentro de las personas
son ms pequeos (7.139, 1.750, 7.994) que la varianza entre personas (68.315). Es tpico que
para el modelo de mediciones repetidas, pueda detectar diferencias ms pequeas en medias dentro
de personas cuando se compara a la varianza entre personas.
De las cuatro interacciones entre los factores fijos, la interaccin de Noise*Etime fue la nica significativa
P-value = 0.029. Implica que la sensibilidad al ruido de las personas cambia en el tiempo.
Tambien es significativo el efecto del indicador Dial P value < 0.0005. Entre trminos aleatorios,
hay evidencia significativa para tiempo por persona (Etime*Subject con P value = 0.013) y persona
(Subject P value < 0.0005).

Modelo de ANOVA mezclado


Una empresa corre experimentos para como diversas condiciones afectyan el espesor de un
recubrimiento que fabrican. El experimento se corre en la maana y en la noche. Se seleccionan
tres operadores al azar. El proceso de manufactura se ajusta en tres puntos 35, 44, y 52. Se hace dos
determinaciones de espesor para cada operadoren cada tiempo y punto de ajuste.
As los tres factores son cruzados, un factor "Operator" es aleatorio y los otros dos son fijos.
El modelo estadstico y sus trminos se muestran a continuacin:

Paso 1. Encontrar la forma del modelo restringido


1

File > Open worksheet EXH_AOV.MTW.


Thickness
Time
Operator
Setting
38
1
1
35
40
1
1
35
63
1
1
44
59
1
1
44
76
1
1
52
78
1
1
52
39
1
2
35
42
1
2
35
72
1
2
44
70
1
2
44

Pgina 22 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

95
96
2
3
4
5
6
7
8

1
1

2
2

52
52

Stat > ANOVA > Balanced ANOVA.


En Responses, seleccionar Thickness.
En Model, seleccionar Time | Operator | Setting.
En Random Factors, seleccionar Operator.
Click Options. Seleccionar Use the restricted form of the mixed model. Click OK.
Click Results. Seleccionar Display expected mean squares and variance components.
Click OK en cada cuadro de dilogo

Paso 1. Encontrar la forma del modelo no restringido


1 Repetir pasos 1-8 excepto que, en 6, no seleccionar Use the restricted form of the mixed model.
Los resultados se muestran a continuacin:
Modelo restringido
ANOVA:ThicknessversusTime,Operator,Setting
FactorTypeLevelsValues
Timefixed21,2
Operatorrandom31,2,3
Settingfixed335,44,52

AnalysisofVarianceforThickness
SourceDFSSMSFP
Time19.09.00.290.644
Operator21120.9560.4165.380.000
Setting215676.47838.273.180.001
Time*Operator262.031.09.150.002
Time*Setting2114.557.32.390.208
Operator*Setting4428.4107.131.610.000
Time*Operator*Setting496.024.07.080.001
Error1861.03.4
Total3517568.2
S=1.84089RSq=99.65%RSq(adj)=99.32%
ExpectedMeanSquare
VarianceErrorforEachTerm(using
Sourcecomponenttermrestrictedmodel)
1Time4(8)+6(4)+18Q[1]
2Operator46.4218(8)+12(2)
3Setting6(8)+4(6)+12Q[3]
4Time*Operator4.6028(8)+6(4)
5Time*Setting7(8)+2(7)+6Q[5]
6Operator*Setting25.9318(8)+4(6)
7Time*Operator*Setting10.3068(8)+2(7)
8Error3.389(8)
Modelo no restringido

ANOVA:ThicknessversusTime,Operator,Setting
FactorTypeLevelsValues
Timefixed21,2
Operatorrandom31,2,3
Settingfixed335,44,52

AnalysisofVarianceforThickness
SourceDFSSMSFP
Time19.09.00.290.644

Pgina 23 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Operator21120.9560.44.910.090x
Setting215676.47838.273.180.001
Time*Operator262.031.01.290.369
Time*Setting2114.557.32.390.208
Operator*Setting4428.4107.14.460.088
Time*Operator*Setting496.024.07.080.001
Error1861.03.4
Total3517568.2
xNotanexactFtest.

S=1.84089RSq=99.65%RSq(adj)=99.32%

VarianceErrorExpectedMeanSquareforEach
SourcecomponenttermTerm(usingunrestrictedmodel)
1Time4(8)+2(7)+6(4)+Q[1,5]
2Operator37.194*(8)+2(7)+4(6)+6(4)+12
2
3Setting6(8)+2(7)+4(6)+Q[3,5]
4Time*Operator1.1677(8)+2(7)+6(4)
5Time*Setting7(8)+2(7)+Q[5]
6Operator*Setting20.7787(8)+2(7)+4(6)
7Time*Operator*Setting10.3068(8)+2(7)
8Error3.389(8)

*SynthesizedTest.

ErrorTermsforSynthesizedTests
Synthesisof
SourceErrorDFErrorMSErrorMS
2Operator3.73114.1(4)+(6)(7)
La organizacin de la salida es la misma para el modelo restringido o no restringido:
- Una tabla de niveles de factores, la tabla ANOVA, y como se requiri, los cuadrados medios
esperados. Las diferencias en la salida se encuentran en los cuadrados medios esperados,
y las pruebas F para algunos trminos del modelo. En este caso la prueba F para el operador se
sintetiza para el Operator en el modelo no restringido dado que no puede ser calculada exactamente.
Al examinar la interaccin de los tres factores Time*Operator*Setting, la prueba F es la misma en
ambos modelos con un P value de 0.001, por tanto el espesor depende de la combinacin de tiempo,
operador y ajuste. En algunos casos aqu termina este anlisis, no siguiendo con los factores.
En los casos donde los modelos dan diferente salida es en: La prueba F para Operator*Setting es
diferente, asi como Time*Operator*Setting, Time*Operator, Operator, Time*Operator, Oper*Setting.

Modelo Lineal general (GLM)


Se usa para hacer anlisis univariados de varianza con diseos balanceados y no balanceados, anlisis
de covarianza y regresin, para cada una de las variables de respuesta.
Los clculos se realizan con el mtodo de regresin para lo caul se requiere un arreglo completo de
factores y covariados para hacer una regresin con cada variable de respuesta.
Se puede especificar un modelo jerrquico, si se incluye un trmino de interaccin todas las interacciones
de menor orden y los factores que comprende la interaccin deben aparecer en el modelo.
Los factores pueden ser cruzados, o anidados, fijos o aleatorios. Los covariados pueden ser cruzados
entre s o con los factores, o anidados dentro de los factores. Se pueden analizar hasta 50 variables de
respuesta con hasta 31 factores y 50 covariados al mismo tiempo.
Los modelos de ANOVA balanceado y modelo lineal general (GLM) son procedimientos de ANOVA para
analizar datos colectados con diversos diseos experimentales. La seleccin de estos procedimientos

Pgina 24 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

depende del diseo experimental y las opciones disponibles. El diseo experimental se refiere a la
seleccin de unidades o sujetos a medir, la asignacin de tratamientos a esas unidades o sujetos, y la
secuencia de las mediciones tomadas en las unidades o sujetos. Ambos modelos pueden ajustar modelos
univariados para datos balanceados con hasta 31 factores. Algunas opciones son las siguientes:
ANOVA balanceado
Puede ajustar datos no balanceados
No

GLM
Si

Puede especificar factores como


aleatorios y obtener cuadrados medios
esperados

Si

Si

Ajusta covariados

No

Si

Realiza comparaciones mltiples

No

Si

Ajusta modelos mezclados restringidos y


restringidos

Si

Solo no restringidos

Se puede usar el ANOVA balanceado para analizar datos de diseos balanceados. Se usa GLM para
analizar datos de diseos balanceados, a pesar de que no se puede seleccionar el ajuste para el caso
restringido del modelo mezclado, el cual solo el ANOVA balanceado puede ajustarlo.
Para clasificar las variables, determinar si los factores son:
- Cruzados o anidados: cruzados cuando cada nivel de un factor ocurre combinado con cada nivel del otro.
Anidados cuando los niveles de un factor son similares pero no idnticos y cada uno ocurre
en combinacin con diferentes niveles de otro factor.
- Fijos o aleatorios: son fijos si se controla su nivel; son aleatorios si se seleccionan aleatoriamente de
los niveles de un factor de una poblacin (por ejemplo seleccionar tres operadores de una poblacin).
- Covariados es un predictor continuo, que puede ser controlable o no controlable. Por ejemplo se puede
estar interesado en el efecto del covariado edad en los ingresos de ventas por Internet.
En un DOE es una variable que es observable pero dficil de controlar. Se introduce al
modelo para reducir la varianza del error. Por ejemplo, se tiene intenrs en el efecto del
covariado temperatura en el tiempo de secado de dos diferentes tipos de pintura.
Especificacin del modelo:

Para especificar los covariados:

Pgina 25 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Para especificar modelos abreviados:

Ejemplo de ajuste de efectos lineales y cuadrticos


Se realiza un experimento para probar el efecto de la temperatura y tipo de vidrio en la luminosidad de un
osciloscopio.
Hay tres niveles en tipos de vidrio y temperatura: 100, 125 y 150 F. Son factores fijos (Montgomery 252).
Cuando un factor es cuantitativo con tres o ms niveles, es adecuado particionar la suma de cuadrados de
ese factor en efectos de rdenes polinomiales. Si hay k niveles del factor, se puede particionar en k-1
rdenes de polinomios. Es este ejemplo, el efecto de la temperatura se puede particionar en efectos
lineales y efectos cuadrticos, de la misma forma se puede hacer con la interaccin. Para esto se debe
codificar la variable cuantitativa con los valores del tratamiento real (o sea, cdigos de niveles de
temperatura en 100, 125, y 150F), usar el GLM para analizar los datos, y declarar la variable cuantitativa
a ser una covariable.
1 File > Open worksheet EXH_AOV.MTW.
LightOutput Temperature GlassType
580
100
1
LightOutput Temperature GlassType
1090
125
1
1312
150
2
1392
150
1
579
100
2
568
100
1
1000
125
2
1087
125
1
1299
150
2
1380
150
1
546
100
3
570
100
1
1045
125
3
1085
125
1
867
150
3
1386
150
1
575
100
3
550
100
2
1053
125
3
1070
125
2
904
150
3
1328
150
2
599
100
3
530
100
2
1066
125
3
1035
125
2
889
150
3
2
3
4
5
6

Stat > ANOVA > General Linear Model.


En Responses, seleccionar LightOutput.
En Model, poner Temperature Temperature Temperature GlassType
GlassType *Temperature GlassType * Temperature *Temperature.
Click Covariates. En Covariates, seleccionar Temperature.
Click OK en cada cuadro de dilogo.

Los resultados se muestran a continuacin:


GeneralLinearModel:LightOutputversusGlassType
FactorTypeLevelsValues
GlassTypefixed31,2,3

AnalysisofVarianceforLightOutput,usingAdjustedSSforTests
SourceDFSeqSSAdjSSAdjMSFP
Temperature11779756262884262884719.210.000
Temperature*Temperature1190579190579190579521.390.000
GlassType2150865414162070856.650.000
GlassType*Temperature2226178511262556369.940.000
GlassType*Temperature*Temperature264374643743218788.060.000

Pgina 26 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Error1865796579366
Total262418330

S=19.1185RSq=99.73%RSq(adj)=99.61%

TermCoefSECoefTP
Constant4968.8191.325.970.000
Temperature83.8673.12726.820.000
Temperature*Temperature0.285160.0124922.830.000
Temperature*GlassType
124.4004.4235.520.000
227.8674.4236.300.000
Temperature*Temperature*GlassType
10.112360.017666.360.000
20.121960.017666.910.000

UnusualObservationsforLightOutput
ObsLightOutputFitSEFitResidualStResid
111070.001035.0011.0435.002.24R
171000.001035.0011.0435.002.24R
Rdenotesanobservationwithalargestandardizedresidual.
Se muestra la tabla de factores con sus niveles y valores. La segunda tabla da una tabla de ANOVA,
seguida por una tabla de coeficientes y una tabla de observaciones no normales.
La suma secuencial de cuadrados se calculan dependiendo de que trminos se puedieron primero en
el modelo, o sea que depende del orden del modelo. La suma ajustada de cuadrados son las sumas de
cuadrados dado que todos los otros trminos estn en el modelo. Estos valores no dependen
del orden en el modelo. Si se selecciona la opcin de suma secuencial de cuadrados, estos se usan para
la determinacin de los valores F.
En el ejemplo, todos los valores P fueron ceo, indicando que hay evidencia significativa de que afectan los
factores de vidrio y temperatura en el brillo as como su interaccin lineal y cuadrtica.
El valor de R2 indica que el modelo explica el 99.73% de la varianza de la salidad de luz, muy bueno.
Las siguientes tablas dan los coeficientes estimados para la covariada, temperatura, y las interacciones,
el error estndar, estadsticos t, y valores p. Despus se muestran los valores atpicos, con valor
estandarizado mayor a 2.

Minitab 15

Ejemplo de comparaciones mltiples con diseos anidados


Cuatro empresas qumicas producen insecticidas para mosquitos, pero la composicin difiere de empresa
a empresa. Se hace un experimento poniendo 400 mosquitos en un contenedor de vidrio y contando los
mosquitos vivos cuatro horas despus. Se realizan tres rplicas para cada producto. La meta es comparar
la efectividad del producto de las diferentes empresas. Los factores son fijos. Los factores estn anidados
dado que cada uno de los insecticidas de cada empresa es nico.
Se usa el GLM dado que el diseo no es balanceado y se usan comparaciones mltiples para comparar
las respuesta media de cada empresa.
1 File > Open worksheet EXH_AOV.MTW.
NMosquito
Company
Product
151
A
A1
135
A
A1
137
A
A1
118
A
A2
132
A
A2
135
A
A2
131
A
A3
137
A
A3
121
A
A3

Pgina 27 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

140
2
3
4
5
6

B1

Stat > ANOVA > General Linear Model.


En Responses, seleccionar NMosquito.
En Model, seleccionar Company Product(Company).
Click Comparisons. En Pairwise Comparisons, seleccionar Company en Terms.
En Method, seleccionar Tukey. Click OK en cada cuadro de dilogo.

Los resultados se muestran a continuacin:


GeneralLinearModel:NMosquitoversusCompany,Product
FactorTypeLevelsValues
Companyfixed4A,B,C,D
Product(Company)fixed11A1,A2,A3,B1,B2,C1,C2,D1,D2,D3,D4

AnalysisofVarianceforNMosquito,usingAdjustedSSforTests
SourceDFSeqSSAdjSSAdjMSFP
Company322813.322813.37604.4132.780.000
Product(Company)71500.61500.6214.43.740.008
Error221260.01260.057.3
Total3225573.9

S=7.56787RSq=95.07%RSq(adj)=92.83%

Tukey95.0%SimultaneousConfidenceIntervals
ResponseVariableNMosquito
AllPairwiseComparisonsamongLevelsofCompany
Company=Asubtractedfrom:
CompanyLowerCenterUpper+++
B2.928.1719.25(*)
C52.2541.1730.08(*)
D61.6952.4243.14(*)
+++
50250

Company=Bsubtractedfrom:
CompanyLowerCenterUpper+++
C61.4849.3337.19(*)
D71.1060.5850.07(*)
+++
50250

Company=Csubtractedfrom:
CompanyLowerCenterUpper+++
D21.7711.250.7347(*)
+++
50250

TukeySimultaneousTests
ResponseVariableNMosquito
AllPairwiseComparisonsamongLevelsofCompany
Company=Asubtractedfrom:
DifferenceSEofAdjusted
CompanyofMeansDifferenceTValuePValue

Pgina 28 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

B8.173.9892.050.2016
C41.173.98910.320.0000
D52.423.33715.710.0000

Company=Bsubtractedfrom:
DifferenceSEofAdjusted
CompanyofMeansDifferenceTValuePValue
C49.334.36911.290.0000
D60.583.78416.010.0000

Company=Csubtractedfrom:
DifferenceSEofAdjusted
CompanyofMeansDifferenceTValuePValue
D11.253.7842.9730.0329
Se muestra una tabla de niveles de factores, tabla de ANOVA, comparaciones mltiples de Tukey para
diferencias entre empresas y las pruebas de hiptesis correspondientes. La prueba F indica que la
empresa es significativa.
El valor de R2 indica que el modelo explica el 95.07% de la varianza en el nmero de mosquitos vivos,
siendo adecuado el modelo.
De la comparacin de diferencias se observa que las empresas A y B son similares (cero incluido), y ambas
diferentes de C y D (cero no incluido).

Minitab 15

ANOVA completamente anidado


Se usa para realizar un ANOVA completamente anidado (jerrquico) y para estimar los componentes de la
varianza para cada variable de respuesta. Todos los factores se asumen como aleatorios, Minitab usa
sumas secuenciales de cuadrados para los clculos.
Se pueden analizar hasta 50 variables de respuesta con hasta 9 factores a un tiempo.
Si el diseo no est anidado jerrquicamente o si se tienen factores fijos, usar ANOVA balanceado o GLM
Si el diseo no est completamente balanceado, no se calcularn ni los valores F ni los P.
Por ejemplo:
Se intenta comprender la variabilidad en la fabricacin de jarras de vidrio. El proceso de hacer vidrio
requiere mezclar materiales en hornos pequeos para lo cual se ajusta la temperatura a 475C.
La empresa tiene varias plantas de jarras, de las cuales se seleccionan cuatro como muestra aleatoria.
Se realiza el experimento y se mide la temperatura del horno para cuatro operadores de cuatro turnos
diferentes. Se toman tres mediciones del lote durante cada turno.
1

2
3
4

File > Open worksheet FURNTEMP.MTW.


Temp
Plant
Operator
Shift
481
1
4
3
477
1
4
3
475
1
4
3
470
1
4
4
475
1
4
4
474
1
4
4
484
2
1
1
477
2
1
1
481
2
1
1
477
2
1
2
482
2
1
2

Batch
1
2
3
1
2
3
1
2
3
1
2

Etctera

Stat > ANOVA > Fully Nested ANOVA.


En Responses, seleccionar Temp.
En Factors, seleccionar Plant - Batch. Click OK.

Los resultados se muestran a continuacin:

Pgina 29 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

P. Reyes / Nov. 2007

NestedANOVA:TempversusPlant,Operator,Shift,Batch
AnalysisofVarianceforTemp
SourceDFSSMSFP
Plant3731.5156243.83855.8540.011
Operator12499.812541.65101.3030.248
Shift481534.916731.97742.5780.000
Batch1281588.000012.4062
Total1914354.2448

VarianceComponents
%of
SourceVarComp.TotalStDev
Plant4.21217.592.052
Residual
Plots for
Velo.max
Line
Plot
Residuals
Versus
the
Fitted
Values
Residual
Plots
for
Velo.max
Fitted
Line
Plot
Residuals Versus Pot.(CV)
IFitted
nterval
Plot
Durability
Scatterplot
of Peso
cerebro
(g)
Peso
total
(kg)
Interval
Plot
of
Week
1,
Week
2,
Week
3
Y
=(response
15.12
+ vs
2.829
Xof
Fitted
Line
Plot
Interaction
Plot
for
LightOutput
Main
Effects
Plot
for
Versus
the
Fitted
Values
Interval
Plot
of
Durability
Y)
Operator0.8063.370.898
(response
Normal Probability
PlotResiduals
of Residuals
the
Residuals
Residuals
Versus
FittedYield
Values
Matrix
Plot
Interval
of
Num.Cil.,
Plot
of
Week
Cil.(cc),
1,the
Week
Pot.(CV),
2,total
Week
Velo.max
logten(Peso
cerebro
(g))
=is
+Mean
0.7517
logten(Peso
(kg)) 3is Velo.max)
Versus
Pot2
95%
the
95%
CI
for
the
Mean
+ 0.2355
X*
*0.9271
2for
6000
Weight
=
204.7
+ 5.092
Height
(response
isCI
Y)
Normal
Probability
Plot
of
the
Residuals
Residuals
Versus the Fitted Values
Scatterplot
of
Weight
vs
Data
Means
95% Data
CI for
forHeight
Means
the
Mean
30
0.50
20 95%
(response is Velo.max)
CI
the
Mean
Shift6.52427.242.554
100000.00
99.9
1.0
220
0
2500
5000
160 Regression
240
35
7.0
220
70
30
205000
99
9
20 20
1400
Batch12.40651.803.522
95% CI
Variety 0
Field
16
10000.00
95%
PI
3.3
90
10
200
4000
200
30
Total23.9484.894
0.25
60
100.5
0
1300
-20
99.9

Regression
95% CI
95% PI

DurabilityPeso cerebro (g)


Mean
Mean
Durability
DataWeight
Peso cerebro (g)

50

6.5

50

3.2
25

10 0
-40
0.00
0.0
6.0
2000

0.1

1000.00

3000
15
25180
1200

3.1

Num.Cil.
8

180
100.00
-20

Weight

10

Residual

Residual

Percent
Percent
Residual
Data
Residual
ResidualY

90

-40
0

20

150

Residual

1
160
1100 10.00
ExpectedMeanSquares
20160
20
-10
0.1

20

S
R-Sq
R-Sq(adj)

0.228822
99.9%
99.9%S

-20 -10

50
300

200
250
Fitted
-20 Value

R-Sq
R-Sq(adj)

0.301528
92.1%
91.9%

Fitted Line Plot


Y = 14.16 + 4.075 X
320

-0.25
140

-40

Fitted Value

15.0

20

Residual

Residual

Frequency

Frequency

7.5

3.47429
86.6%
86.3%

S
14.7920
61.6%
Residuals Versus
the Order of the Data
-30
40 250 R-Sq
40
150
200
300
18.115
R-Sq(adj)
61.2%
20
-40

152.9
40-20
Cil.(cc)
1Plant1.00(4)+3.00(3)+12.00(2)+48.00(1)
2500 0
30
15
0
0.101 of 14.4825
-50
0 Histogram
2
3
4
5
30
the
Versus the Order of the Data
13 900
1000
2000Residuals
3000
4000
5000 Residuals
6000
7000
120
2Operator1.00(4)+3.00(3)+12.00(2)
120 0 6
X
0
100
200
300
400
-30
2.8
-1.0
5.0
Peso
total
(kg)
12.8075
20800
Pot.(CV)
-0.50 800 0.01
-20
20
3Shift1.00(4)+3.00(3)
400
20
10
1515 100
2020
25
25
30
30
35
35
2.7
-40 100
60
1210
Fitted
Fitted
Value9.735
-40Value
4Batch1.00(4)
0
5
10.0
12.5
15.0
17.5
20.0
22.5
4.55.0700 7.5
-30.0 -22.5 -15.0 -7.5 0.0
60
Week
60 Residual
621

S
R-Sq
R-Sq(adj)

GlassType
12
1
2
8
3

14
Histogram
of the Residuals
3.0
7
50001000
-40
-20
0
1000 1.00
-0.5
5.5
140 Residual

Residual

99

40

60

80
0

500

100 120 140 160 180 200 220 240

200
62
64Pot2
66
70 Pot.(CV)
72
74 10 76 76
2.6
Order
2 68 Observation
64
66 Week68
70
72Week 374
Height
600
Peso Height
total
(kg)
-20
5
0
2
4
6
8
10 cuadrados
12
11
2.5
Se 20
muestran
tres tablas: 1) ANOVA; 2) Componentes estimados de la varianza;
3)
medios
0
320
4
X
500
esprados.
Hay
cuatro
fuentes
secuenciales
anidadas
de
variabilidad:
Planta,
operador,
turno
y
lote.
-40 3
Week
1
Week
2
Week
Week
1
Week
2
Week
3
2.4
0
1 100
2 125
3 150
4
1 20 40 60 80 100 120 140 160 180 200 220 240
240 -40
-30 -20 -10
0
10
20
Machine
1 Temperature
Carpet Observation Order2 Velo.max
Residual
1
2
3
4
5
6
1
2
3
4

40

La tabla
ANOVA indica que que hay evidencia significativa de planta y turno para alfa de 0.05.
160
Los estimados de los componentes de la varianza indican que la variabilidad atribuible a lotes, turnos y
4
8
12
0
200
400
plantas fue
de 52,
27,
y 18 porciento resp.
De
la varianza
total.
Si el estimado de un componente de varianza es menor que cero, Minitab lo toma como cero en clculos.

Minitab 15

Grficas de intervalos
Se usan las grficas por intervalos para graficar medias, intervalos de confianza o barras de errores para
una o ms variables. La grfica de intervalos muestra tanto la tendencia central como la variabilidad de los
datos.
Nota: Por default Minitan muestra los intervalos de confianza para el 95%. Para cambiar el tipo de
despliegue para una grfica especfica, usar el Editor > Edit Interval Bar > Options.
Para cambiarlo en todas las grficas futuras usar Tools > Options > Individual Graphs > Interval Plots.
Las opciones son las siguientes:

Pgina 30 de 51

Mintab V15

Mdulo 4. Estadtica Inferencial

Ejemplo de grfica para un intervalo simple:


Se quiere examinar la durabilidad de alfombras. Se instalan muestras en cuatro casas y se mide la
durabilidad promedio despus de 60 das.
1

2
3
4

File > Open worksheet CARPET.MTW.


Durability
Carpet
Composition Durability
18.95
1
A
10.92
12.62
1
B
13.28
11.94
1
A
14.52
14.42
1
B
12.51
10.06
2
A
10.46
7.19
2
B
21.4
7.03
2
A
18.1
14.66
2
B
22.5

Carpet
3
3
3
3
4
4
4
4

Composition
A
B
A
B
A
B
A
B

Graph > Interval Plot or Stat > ANOVA > Interval Plot.
En One Y, seleccionar Simple. Click OK.
En Graph variables, seleccionar Durability. Click OK.

Los resultados se muestran a continuacin:

La media se observa colocando el cursor en el punto central y es de 13.785


el intervalo de confianza se extiende de 11.3632 to 16.2068

Ejemplo de grfica de intervalos por grupos


Se quiere examinar la durabilidad de alfombras. Se instalan muestras en cuatro casas y se mide la
durabilidad promedio despus de 60 das. Incluir etiquetas de datos para los proimedios.
1
2
3
4
5
6
7

File > Open worksheet CARPET.MTW.


Graph > Interval Plot or Stat > ANOVA > Interval Plot.
En One Y, seleccionar With Groups. Click OK.
En Graph variables, seleccionar Durability.
En Categorical variables for grouping (1-4, outermost first), seleccionar Carpet.
Click Labels, y click en la ceja de Data Labels.
En Label, seleccionar Means. Click OK en cada cuadro de dilogo.

Los resultados se muestran a continuacin:

Pgina 31 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

La media ms grande es para la alfombra 4, y todas se traslapan sugieriendo que no son diferentes.
El intervalo de confianza corresponde al 95%, se puede cambiar con:
Editor > Edit Interval Bar > Options.

Ejemplo de grfica de intervalos para Y mltiple


Se usa para mostrar grficas de intervalo de mltiples variables en la misma grfica.
Una empresa hace tubos de plstico y est preocupada por la consistencia de sus dimetros. Se miden
10 tubos cada semana durante tres semanas, y se crea una grfica de intervalo para ver las distribuciones.
1

2
3
4

File > Open worksheet PIPE.MTW.


Week 1
Week 2
Week 3
5.19
5.57
8.73
5.53
5.11
5.01
4.78
5.76
7.59
5.44
5.65
4.73
4.47
4.99
4.93
4.78
5.25
5.19
4.26
7
6.77
5.7
5.2
5.66
4.4
5.3
6.48
5.64
4.91
5.2

Machine
1
2
1
2
1
2
1
2
1
2

Operator
A
B
A
B
A
A
B
B
A
B

Graph > Interval Plot or Stat > ANOVA > Interval Plot.
En Multiple Y's, seleccionar Simple. Click OK.
En Graph variables, seleccionar 'Week 1' 'Week 2' 'Week 3'. Click OK.

Los resultados se muestran a continuacin

En la semana 4 se observa una mayor media y variabilidad. Acercando el cursor se ven los valores.

Ejemplo de grfica de intervalos para Y mltiple


Se usa para mostrar grficas de intervalos para variables mltiples en grupos.
1
2

File > Open worksheet PIPE.MTW.


Graph > Interval Plot or Stat > ANOVA > Interval Plot.

Pgina 32 de 51

P. Reyes / Nov. 2007

Mintab V15

3
4
5
6
7

Mdulo 4. Estadtica Inferencial

En Multiple Y's, seleccionar With Groups. Click OK.


En Graph variables, seleccionar 'Week 1' 'Week 2' 'Week 3'.
En Categorical variables for grouping (1-3, outermost first), seleccionar Machine.
En Scale Level for Graph Variables, seleccionar Graph variables displayed innermost on scale.
Click OK.

Los resultados se muestran a continuacin:

Se observa que:
- Para la mquina 1, las medias e intervalos de confianza tienen tendencia creceinte cada semana
- Para la mquina 2, las medias e intervalos de confianza son consistentes durante las semanas

Minitab 15

Grfica de medias de Efectos Principales para factores mltiples


Se usa para comparar las magnitudes de los efectos principales.
Los puntos en la grfica son las medias de la variable de respuesta en los diferentes niveles del factor.
Se muestra una lnea de referencia dibujada como la gran media de la respuesta.
Por ejemplo:
Se siembran seis variedades de alfalfa dentro de cuatro campos diferentes, y se pesa el rendimiento
de los cortes. Se tiene inters en comparar los diferentes rendimientos de las diferentes variedades,
y se considera a los campos como bloques. Se quiere revisar los datos y examinar el rendimiento por
variedad y campo usando la grfica de efectos principales.

File > Open worksheet ALFALFA.MTW.


Yield
Variety
Field
3.22
1
1
3.04
2
1
3.06
3
1
2.64
4
1
3.19
5
1
2.49
6
1
3.31
1
2
2.99
2
2
3.17
3
2
2.75
4
2
3.4
5
2
2.37
6
2

Yield
3.26
3.27
2.93
2.59
3.11
2.38
3.25
3.2
3.09
2.62
3.23
2.37

Variety
1
2
3
4
5
6
1
2
3
4
5
6

2 Stat > ANOVA > Main Effects Plot.


3 En Responses, seleccionar Yield.
4 En Factors, seleccionar Variety Field. Click OK.
Los resultados se muestran a continuacin:

Pgina 33 de 51

Field
3
3
3
3
3
3
4
4
4
4
4
4

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Se muestra la media de la respuesta para cada uno de los niveles de los factores en orden si los
factores son numricos o en formato de fecha fecha/hora o en orden alfabtico si es texto.
Se muestra una lnea horizontal como la gran media. Los efectos son las diferencias entre las medias
y la lnea de referencia.
En este ejemplo los efectos de Variety sobre el rendimiento son grnades comparados con los efectos
del factor Field (la variable de bloqueo):

Minitab 15

Grfica de interacciones
Crea una grfica simple de interaccin de dos factores, o una matriz de grficas de interaccin para
tres a nueve factores.
Una interaccin se presenta cuando la respuesta en el nivel de un factor, depende de los niveles de
otros factores. Las lneas paralelas indican que no hay interaccin; entre menos paralelas sean las
lneas mayor ser el grado de interaccin.
Ejemplo de grfica de interacciones para dos factores
Se realiza un experimento para probar el efecto de la temperatura y el tipo de vidrio en la
luminosidad de un osciloscopio. Hay tres niveles para tipo de vidrio y para temperatura, 100, 125, y 150
grados farenheit.
1 File > Open worksheet EXH_AOV.
LightOutput Temperature GlassType
580
100
1
1090
125
1
1392
150
1
568
100
1
1087
125
1
2
3
4

Etctera

Stat > ANOVA > Interactions Plot.


En Responses, seleccionar LightOutput.
En Factors, seleccionar GlassType Temperature. Click OK.

Los resultados se muestran a continuacin:

Pgina 34 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Se muestra una posible interaccin entre el tipo de vidrio y la temperatura del lado superior (150C).

Minitab 15

MANOVA balanceado
Se usa para realizar anlisis multivariado de varianza (MANOVA) para diseos balanceados. Se puede
tomar ventaja de la estructura de la covarianza de los datos para probar al mismo tiempo la igualdad
de medias de diferentes respuestas.
Por ejemplo:
Se quieren determinar las condiciones ptimas para extruir capa de plstico. Se miden tres respuestas
resistencia, gloss, y opacidad - cinco veces cada combinacin de dos factores - tasa de extrusin
y cantidad de aditivo -- cada uno es puesto en niveles bajos y altos. Se usa MANOVA dado que el
diseo est balanceado.
1

File > Open worksheet EXH_MVAR.MTW.


Tear
Gloss
Opacity
Extrusion
6.5
9.5
4.4
1
6.2
9.9
6.4
1
5.8
9.6
3
1
6.5
9.6
4.1
1
6.5
9.2
0.8
1
6.9
9.1
5.7
1
7.2
10
2
1
6.9
9.9
3.9
1
6.1
9.5
1.9
1
6.3
9.4
5.7
1

Additive
1
1
1
1
1
2
2
2
2
2

Etctera.

2 Stat > ANOVA > Balanced MANOVA.


3 En Responses, seleccionar Tear Gloss Opacity.
4 En Model, seleccionar Extrusion | Additive.
5 Click Results. En Display of Results, sel. Matrices (hypot., error, partial corr.) y Eigen analysis.
6 Click OK en cada cuadro de dilogo
Los resultados son los siguientes:
ANOVA:Tear,Gloss,OpacityversusExtrusion,Additive
MANOVAforExtrusion
s=1m=0.5n=6.0
TestDF
CriterionStatisticFNumDenomP
Wilks'0.381867.5543140.003
LawleyHotelling1.618777.5543140.003
Pillai's0.618147.5543140.003
Roy's1.61877

SSCPMatrixforExtrusion
TearGlossOpacity
Tear1.7401.5040.855SS Extrusin para las tres respuestas
Gloss1.5041.3010.7395
Opacity0.8550.7390.4205

SSCPMatrixforError
TearGlossOpacity
Tear1.7640.02003.0SSE para las tres respuestas

Pgina 35 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Gloss0.0202.62800.552
Opacity3.0700.552064.924

PartialCorrelationsfortheErrorSSCPMatrix
TearGlossOLas correlaciones entre respuestas son dbiles y se
Tear1.000000.009290pudo haber corrido un ANOVA por separado para cada
Gloss0.009291.000000una de las respuestas.
Opacity0.286870.042261.00000

EIGENAnalysisforExtrusion

Eigenvalue1.6190.000000.00000
Proportion1.0000.000000.00000
Cumulative1.0001.000001.00000

Eigenvector123
Tear0.65410.4315 Aqu la mayor diferencia entre niveles de factores
Gloss0.33850.5163 es para Tear, despus Gloss y al ltimo Opacity
Opacity0.03590.03020.1209

MANOVAforAdditive
s=1m=0.5n=6.0
TestDF
CriterionStatisticFNumDenomP
Wilks'0.523034.2563140.025
LawleyHotelling0.911924.2563140.025
Pillai's0.476974.2563140.025
Roy's0.91192

SSCPMatrixforAdditive
TearGlossOpacity
Tear0.76050.68251.93SS Aditivo para las tres respuestas
Gloss0.68250.61251.732
Opacity1.93051.73254.901

EIGENAnalysisforAdditive

Eigenvalue0.91190.000000.00000
Proportion1.00000.000000.00000
Cumulative1.00001.000001.00000

Eigenvector123
Tear0.63300.44800.1276
Gloss0.32140.49920.1694
Opacity0.06840.00000.1102

MANOVAforExtrusion*Additive
s=1m=0.5n=6.0
TestDF
CriterionStatisticFNumDenomP
Wilks'0.777111.3393140.302
LawleyHotelling0.286831.3393140.302

Pgina 36 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Pillai's0.222891.3393140.302
Roy's0.28683

SSCPMatrixforExtrusion*Additive
TearGlossOpacity
Tear0.0005000.016500.04450
Gloss0.0165000.544501.46850
Opacity0.0445001.468503.96050

EIGENAnalysisforExtrusion*Additive

Eigenvalue0.28680.000000.00000
Proportion1.00000.000000.00000
Cumulative1.00001.000001.00000

Eigenvector123
Tear0.13640.18060.7527
Gloss0.53760.30280.0228
Opacity0.06830.11020.0000
Se observa que el factor extrusin y el factor aditivo son significativos, con P value < 0.05
Aqu la mayor diferencia entre niveles de factores es para Tear, despus Gloss y al ltimo Opacity

Minitab 15

MANOVA general
Se usa para realizar anlisis multivariado de varianza (MANOVA) para diseos balanceados y no
balanceados si se tienen covariados. Se puede
tomar ventaja de la estructura de la covarianza de los datos para probar al mismo tiempo la igualdad
de medias de diferentes respuestas.
Los clculos se hacen por el mtodo de regresin, para lo que es necesaria una mtriz de rango
completo formada de factores y covariados donde para cada variable se hace una regresin.

Los factores pueden ser cruzados o anidados, pero no pueden ser declarados aleatorios.
Los covariados pueden ser cruzados entre ellos o con los factores, o anidados dentro de los factores.
Se pueden analizar hasta 50 variables de respuesta con hasta 31 factores y 50 covariados a un tiempo

4.6Correlacin y Regresin lineal y cuadrtica simple


Revisar el archivo anexo sobre Anlisis de RegresinRes.doc para conceptos de teora.
Coeficiente de Correlacin
Establece si existe una relacin entre las variables y responde a la pregunta,
Qu tan evidente es esta relacin?".
La correlacin es una prueba fcil y rpida para eliminar factores que no influyen
en la prediccin, para una respuesta dada.
* Es una medida de la fuerza de la relacin lineal entre dos variables x y y.
* Es un nmero entre -1 y 1
* Un valor positivo indica que cuando una variable aumenta, la otra variable aumenta
* Un valor negativo indica que cuando una variable aumenta, la otra disminuye
* Si las dos variables no estn relacionadas, el coeficiente de correlacin tiende a 0.

Pgina 37 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Ejemplo:
Se utiliza el archivo PULSE.MTW campos Peso (Weight) y Altura (Height)
File > Open Worksheet > Pulse.Mt o copiar los datos del archivo anexo
Antes de calcular el coeficiente de correlacin se sugiere hacer un diagrama
bivariante para identificar posibles valores anmalos, relaciones no lineales, etc.

Graph > Scatterplot: Simple

Y = Weight y X = Height

Ahora se calcula el coeficiente de Correlacin que mide el grado de relacin que existe
entre dos variables, como sigue:

Stat > Basic Statistics > Correlation


Seleccionar en Variables Weight Height
Seleccionar Display P values
Los resultados son los siguientes:
Correlations:Weight,Height
PearsoncorrelationofWeightandHeight Coeficiente de correlacin
PValue=0.000
Como el P value es menor a 0.05, la correlacin si es significativa
Si se agrega la variable "Pulse1":
Correlations:Weight,Height,Pulse1
WeightHeight
Height0.785
Correlaciones
0
P values
Pulse10.2020.2 Correlaciones
0.0530.0 P values
CellContents:Pearsoncorrelation
PValue

Pgina 38 de 51

P. Reyes / Nov. 2007

Mintab V15

Minitab 15

Mdulo 4. Estadtica Inferencial

Se trata de investigar la correlacin entre calificacion de habilidades verbales y de matemticas

1
2
3

File > Open worksheet GRADES.MTW.


Seleccionar Stat > Basic Statistics > Correlation.
En Variables, poner Verbal Math GPA. Click OK.
Verbal
623
454
643
585
719
693
Etc.

Math
509
471
700
719
710
643
Etc.

GPA
2.6
2.3
2.4
3
3.1
2.9
Etc.

Correlations:Verbal,Math,GPA
VerbalMath
Math0.275
0
GPA0.3220.194
0.0000.006
CellContents:Pearsoncorrelation
Todas las correlaciones son significativas, ya que su P value es menor a 0.05
Mintab 15

Covarianza entre cada par de variables


Calcula la covarinaza para todos los pares de columnas. Mide la relacin entre dos variables, sin
embargo la covarianza no ha sido estandarizada como sucede con el coeficiente de correlacin.
El coeficiente de correlacin se estandariza dividiendo por la desviacin estndar de las dos variables.

1
2
3

File > Open worksheet GRADES.MTW.


Seleccionar Stat > Basic Statistics > Covariance.
En Variables, poner Verbal Math GPA. Click OK.

Resultsfor:Grades.MTW
Covariances:Verbal,Math,GPA
VerbalMathGPA
Verbal5359.6859
Math1333.97044401.9388
GPA13.69957.47900.3368
Regresin simple por medio de grfica:

File > Open Worksheet > Pulse.Mtw


Stat > Regression > Fitted line Plot
Seleccionar en Response (Y) Weight y en Predictor (X) Height
Seleccionar modelo Linear aunque puede ser Quadratic o Cubic
Ecuacin de
Regresin
S Desv. Estandar de
los residuos
(valor real-estimado
por la regresin)
R-Sq Coeficiente
de Determinacin
en porcentaje de
variacin explicada
por la ecuacin de
regresin
R-Sq (Adj) - Slo para regresin mltiple
RegressionAnalysis:WeightversusHeight

Pgina 39 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Theregressionequationis
Weight=204.7+5.092Height
S=14.7920RSq=61.6%RSq(adj)=61.2%
AnalysisofVariance
SourceDFSSMSFP
Regression131591.631591.6144.380.000
Error9019692.2218.8
Total9151283.9
El valor p menor a 0.05 indica que SI
es significativa la Correlacin entre Y y X.
Regresin simple:
Efecta un anlisis de regresin simple:

Stat > Regression > Regression


Seleccionar en Response Weight y en Predictors Height
RegressionAnalysis:WeightversusHeight
Theregressionequationis
Weight=205+5.09Height

Ecuacin de regresin

PredictorCoefSECoefTP
Constant204.7429.167.020.000
Height5.09180.423712.020.000
S=14.7920RSq=61.6%RSq(adj)=61.2%
Coef. De determinacin
AnalysisofVariance
SourceDFSSMSFP
Regression13159231592144.38Regresin significativa
ResidualError9019692219
Total9151284
UnusualObservations
ObsHeightWeightFitSEFitResidualStResid
972.0195.00161.872.0833.13 Puntos con un
2561.0140.00105.863.6234.14 residuo estndar
4072.0215.00161.872.0853.13 mayor a 2
8468.0110.00141.501.5731.502.14R
Rdenotesanobservationwithalargestandardizedresidual.
En algunos casos hay puntos que estn muy alejados de la mayora de los puntos
se marcan con X y pueden sesgar los resultados, se sugiere investigarlos.
Por ejemplo:
Usando el archivo PUNTOS_RX.MTW anexo:
Copiar los datos del archivo a Minitab

Graph > Scatterplot: Simple

Y=yyX=x

Stat > Regression > Regression


Seleccionar en Response Y y en Predictors X

Pgina 40 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

UnusualObservations
ObsXYFitSEFitResidualStResid
512.540.00024.3430.48315.6574.55R
5212.060.00063.0562.1783.0561.13X
Rdenotesanobservationwithalargestandardizedresidual.
XdenotesanobservationwhoseXvaluegivesitlargeinfluenc
Regresin simple con datos transformados:
En algunos casos el ajuste se mejora mucho si se transforman los datos:
Por ejemplo usando los datos del archivo CEREBRO.MTW anexo que tiene los pesos
del cerebro y los pesos del cuerpo en 62 especies de mamferos se tiene:
Copiar los datos del archivo a Minitab
Haciendo una grfica de dispersin bivariada se tiene:

Graph > Scatterplot: Simple

Y = Peso cerebro y X = Peso total

En este caso los pesos de los elefantes pueden sesgar la ecuacin de la recta
no se pueden eliminar como anmalos y se intentar transformarlos en forma
logartmica:

Stat > Regression > Fitted line Plot


Seleccionar en Response (Y) Peso Cerebro y en Predictor (X) Peso Cuerpo
Seleccionar modelo Linear aunque puede ser Quadratic o Cubic
En Options seleccionar lo siguiente:

Como resultado se obtiene una grfica mucho ms uniforme:

Intervalos de
confianza de Ymedia

en base a una X

Pgina 41 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Intervalo de
prediccin de Y para

valores individuales
en base a una X
Coeficiente de
determinacin
muy cercano a uno

Regresin simple cuadrtica:


Usar el archivo RESIDUOS.MTW anexo o copiar los datos de las columnas X, Y a Minitab

Stat > Regression > Fitted line Plot


Seleccionar en Response (Y) Y, Predictor (X) X
Seleccionar modelo Linear
En Options seleccionar Display Confidence Interval y Prediction Interval :
En Graphs seleccionar Residuals vs Fits
Aparece la grfica siguiente de residuos que no varian aleatoriamente alrededor
de la media, sino ms bien con un patrn que sugiere un modelo cuadrtico:

Repitiendo las instrucciones anteriores pero para modelo Quadratic se tiene:

Los residuos aparecen en forma aleatoria indicando un modelo adecuado.

Pgina 42 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

4.7 Regresin mltiple - Matriz de correlaciones


Se utiliza el archivo COCHES.MTW anexo en los Archivos de Datos del Mdulo 2.
Cargar los datos a Minitab

Stat > Matrix Plot: Simple


Graph Variables: Num. Cil.; Cil. (cc); Pot. (CV); Velo.max

Parece que la relacin entre Potencia y Velocidad mxima es cuadrtica.


Cambiando la escala horizontal del nmero de cilindros a 4 a 6,
se identifica que un coche tiene 5 cilindros, con Brush y Set ID Variables
indicando Marca y Modelo se ve que es un VOLVO 850 GLT (rengln 244)
Evaluando la fuerza de la relacin entre los predictores por medio de un anlisis de
correlacin se tiene:

Stat > Basic statistics > Correlation


Display Variables 'Num.Cil.' 'Cil.(cc)' 'Pot.(CV)'
Correlations:Num.Cil.,Cil.(cc),Pot.(CV)
Num.Cil.Cil.(cc)
Cil.(cc)0.852
0
Pot.(CV)0.8290.854
0.0000.000
CellContents:Pearsoncorrelation
Aqu se observa que hay MULTICOLINEALIDAD entre las variables predictoras.
por lo que el modelo puede ser inestable.

Regresin mltiple

Stat > Regression > Regression


Response Velo.max Predictors Num.Cil, Cil.(cc), Pot.(CV)

Residuals versus variables Pot.(CV)


Graphs: Four in One
Options: Prediction intervals for new observations 4 1124 100
Se obtienen los siguientes resultados:
RegressionAnalysis:Velo.maxversusNum.Cil.,Cil.(cc),Pot.(CV)
Theregressionequationis
Velo.max=1575.72Num.Cil.0.00218Cil.(cc)+0.521Pot.(CV)
244casesused,3casescontainmissingvalues
PredictorCoefSECoefTP

Pgina 43 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Constant157.1782.56261.340.000
Num.Cil.5.71770.98935.780.Significativo
(P value < 0.05)
Cil.(cc)0.0021780.0016101.350.No significativo (Pvalue > 0.05)
Pot.(CV)0.520920.0192727.030.Significativo
(P value < 0.05)
S=9.76245RSq=89.1%RSq(adj)=Coef. De determinacin
AnalysisofVariance
SourceDFSSMSFP
Regression318788762629657.140.000
ResidualError2402287395
Total243210760
R residuos con
SourceDFSeqSS
ms de 2 sigmas
Num.Cil.198419
Cil.(cc)119841
X residuos muy
Pot.(CV)169627
alejados del
grupo normal
UnusualObservations
ObsNum.Cil.Velo.maxFitSEFitResidualStResid
106.0222.000195.3511.12326.6492.75R
224.0211.000189.2590.70521.7412.23R
248.0235.000218.4702.25416.5301.74X
256.0250.000291.7192.70741.7194.45RX
268.0235.000218.4702.25416.5301.74X
2812.0250.000274.3713.82224.3712.71RX
468.0295.000301.7723.1096.7720.73X
4712.0302.000306.8903.8384.8900.54X
482.0127.000160.3581.39633.3583.45R
764.0232.000248.2152.33516.2151.71X
1028.0270.000274.2502.6464.2500.45X
1066.0216.000194.5811.51421.4192.22R
1178.0250.000267.3002.24917.3001.82X
11812.0250.000280.7693.73830.7693.41RX
1294.0150.000181.8790.69731.8793.27R
1304.0170.000195.5910.82025.5912.63R
1446.0233.000205.9881.05927.0122.78R
1644.0252.000252.8162.4990.8160.09X
1656.0280.000302.5623.06022.5622.43RX
1798.0210.000213.9435.3003.9430.48X
1808.0200.000213.9435.30013.9431.70X
Rdenotesanobservationwithalargestandardizedresidual.
XdenotesanobservationwhoseXvaluegivesitlargeinfluence.
PredictedValuesforNewObservations
ObsFitSEFit95%CI95%PI
1183.9511.161(181.663,186.239)(164.584,203.318)
ValuesofPredictorsforNewObservations
ObsNum.Cil.Cil.(cc)Pot.(CV)
14.001124100
Los residuos muestran un comportamiento normal por lo que el modelo es adecuado

Pgina 44 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

El comportamiento de los residuos


vs Potencia sugiere que es necesaria
una transformacin de variables por
ejemplo sacarle raz cuadrada.

Transformando la variable Pot.(CV) por Pot2 = raiz cuadrada de Pot.(CV) se tiene:


RegressionAnalysis:Velo.maxversusNum.Cil.,Cil.(cc),Pot2
Theregressionequationis
Velo.max=73.51.42Num.Cil.0.00699Cil.(cc)+12.8Pot2
PredictorCoefSECoefTP
Constant73.5022.25832.560.000
Num.Cil.1.42010.67702.100.037
Cil.(cc)0.0069880.0012025.820.Significativo
Pot212.82320.317740.360.000

(P value < 0.05)

S=7.03547RSq=94.4%RSq(adj)=Mejora el ajuste
PredictedValuesforNewObservations
ObsFitSEFit95%CI95%PI
11342.28629.024(1285.111,1399.461)(1283.455,1401.117)XX
XXdenotesapointthatisanextremeoutlierinthepredictors.
ValuesofPredictorsforNewObservations
ObsNum.Cil.Cil.(cc)Pot2
14.001124100

Los residuos vs Pot2 ya tienen un mejor comportamiento ms aleatorio:

Pgina 45 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Seleccin de la mejor ecuacin: Best Subsets


Permite obtener un "buen modelo" en funcin de su sencillez o facilidad de
interpretacin.

Stat > Regression > Stepwise

Variables candidatas a entrar en


el modelo
Variables forzadas a entrar en los
modelos

Mnimo numero de variables en el modelo 1


Mximo nmero de variables en el modelo
todas
Nmero de ecuaciones que aparecen con
1, 2, 3.... Variables regresoras

Los resultados son los siguientes:


BestSubsetsRegression:Velo.maxversusNum.Cil.,Cil.(cc),...
ResponseisVelo.max
244casesused,3casescontainmissingvalues
NCP
uio
mlt
...
C((P
icCo
MallowslcVt
VarsRSqRSq(adj)CpS.))2
192.592.5109.08.0783Buenos modelos
186.686.5385.310.813X
294.394.229.37.0849Incluye slo Cil.(cc) y Pot2
293.693.658.07.4544XX
394.894.83.96.7261XXX
394.494.326.57.0355XIncluye Num.Cil, Cil.(Cc), Pot2
494.994.85.06.7269XXXX
Seleccin de la mejor ecuacin: Stepwise
Se usa cuando el nmero de variables es muy grande mayor a 31, antes da los
mismos resultados que el mtodo anterior:

Variable de respuesta

Pgina 46 de 51

P. Reyes / Nov. 2007

Mintab V15

Mdulo 4. Estadtica Inferencial

Variables candidatas a entrar en


ls modelos

Criterio para la entrada y salida


de variables
El mtodo implica que las
variables puedan ir entrando o
saliendo. Iniciando con ninguna.
Las variables van entrando pero
ya no salen
Las variables van saliendo a
partir de tomar todas y no vuelven
a entrar
Permite mostrar en cada paso
las mejores opciones adems de
la seleccionada y el nmero de
pasos entre pausas.

Los resultados obtenidos son los siguientes:


StepwiseRegression:Velo.maxversusNum.Cil.,Cil.(cc),Pot.(CV),Pot2
AlphatoEnter:0.15AlphatoRemove:0.15
ResponseisVelo.maxon4predictors,withN=244
N(caseswithmissingobservations)=3N(allcases)=247
Step123
Variables que entran en cada
Constant78.9771.4843.58
paso y su calidad de ajuste
Pot210.4112.6917.41
TValue54.6640.5018.33
PValue0.0000.0000.000
Cil.(cc)0.008450.00722
TValue8.587.48
PValue0.0000.000
Pot.(CV)0.206
TValue5.23
PValue0.000
S8.087.086.73
RSq92.5194.2694.85
RSq(adj)92.4894.2194.78
Modelo adecuado
MallowsCp109.029.33.9

4.8Aplicaciones
Realizar los ejercicios del Mdulo 4 incluidos en el archivo CursoTallerMinitabEjercicios

Pgina 47 de 51

P. Reyes / Nov. 2007

Mapa de archivos
PESOS
PUNTOS_RX

Ejemplo: Una lnea de llenado de paquetes debe llenar 4 kg en cada uno. Se toman
20 muestras y se pesan en gramos:

Pesos
4035
3928
3974
4024
3949
4017
4009
3983
3969
3979
3970
3997
3955
3984
4034
3964
3969
3995
3991
3988

ARCHIVO PUNTOS_RX.MTW
X
1.0419
0.2313
3.9113
3.913
4.1251
0.6399
4.9837
2.9609
0.1064
3.2944
1.7959
4.4906
1.3232
0.406
0.7498
3.7309
1.3626
0.3194
4.9198
4.9699
1.2351
4.3841
3.0166
2.0734
4.174
1.7504
3.7985
4.8115
1.439
4.879
4.8717
3.9591
4.8814
0.1703
1.2865
0.8069

Y
13.023
16.4953
28.8893
32.8623
35.7745
17.0317
34.0061
27.0021
10.2112
21.7729
22.7822
29.0109
18.524
17.7324
14.1805
31.8958
21.8475
19.0498
34.9526
38.4555
16.9255
30.4883
25.0134
22.4536
29.1249
21.9985
26.2615
35.2962
20.4422
38.1152
34.8812
30.6333
32.5794
8.9585
19.5526
18.3349

ARCHIVO CEREBRO.MTW
Nombre Peso total (kg)
Zorro blanco
3.38
Bho
0.48
Castor
1.35
Vaca
465
Lobo gris
36.33
Cabra
27.66
Corzo
14.83
Cobaya
1.04
Vervet
4.19
Chinchilla
0.43
Ardilla
0.1
Ardilla rtica
0.92
Rata africana
1
Musaraa
0
Topo
0.06
Armadillo
3.5
Tree Hyrax
2
Zarigeya
1.7
Elefante asiti
2547
Gran murcilag 0.02
Burro
187.1
Caballo
521
Erizo
0.79
Patas monkey
10
Gato
3.3
Galago
0.2
Jineta
1.41
Jirafa
529
Gorila
207
Foca gris
85
Rock hyrax
0.75
Persona humana 62
Elefante africa 6654
Zarigella de
3.5
Rhesus monkey 6.8
Canguro
35

0.8631
2.8896
1.2012
0.1498
3.7274
0.9256
0.6973
2.1619
0.2435
0.4348
4.3498
3.7273
0.911
3.8812
2.5
12

17.1237
27.2717
22.8602
15.2259
29.776
13.7623
12.6159
23.1912
18.0998
15.423
27.8229
28.1968
18.2094
30.1827
40
60

Marmota
Hamster
Ratn
Pequeo murci
Slow loris
Okapi
Conejo
Oveja
Jaguar
Chimpance
Mandril
Erizo del desie
Armadillo gigan
Rock hyrax
Mapache
Rata americana
Topo del este
Topo rata
Almizcle
Cerdo
Echidna
Tapir
Tenrec
Phalanger
Tree shrew
Zorro rojo

4.05
0.12
0.02
0.01
1.4
250
2.5
55.5
100
52.16
10.55
0.55
60
3.6
4.29
0.28
0.08
0.12
0.05
192
3
160
0.9
1.62
0.1
4.24

EREBRO.MTW
Peso cerebro (g)
44.5
15.5
8.1
423
119.5
115
98.2
5.5
58
6.4
4
5.7
6.6
0.14
1
10.8
12.3
6.3
4603
0.3
419
655
3.5
115
25.6
5
17.5
680
406
325
12.3
1320
5712
3.9
179
56

ARCHIVO RESIDUOS.MTW
X
1.04185
0.23129
3.9113
3.913
4.12512
0.63987
4.98369
2.96085
0.10635
3.29437
1.79592
4.49059
1.32325
0.406
0.74985
3.7309
1.36255
0.31936
4.91976
4.96988
1.23507
4.38413
3.01659
2.07339
4.174
1.75039
3.79849
4.81151
1.43903
4.87897
4.87167
3.95905
4.88136
0.17029
1.28646
0.8069

Y
18.0899
16.0308
29.6501
29.7359
30.7384
17.3818
35.21
25.6314
15.4889
27.1189
21.2583
32.6554
19.1882
16.2046
17.4462
29.2728
19.2741
15.793
34.8713
34.7539
19.2883
32.2554
25.5766
21.586
31.4337
20.5674
29.2888
33.8393
19.3294
34.5135
34.0387
30.0292
34.7271
15.4243
18.8098
17.4371

17
1
0.4
0.25
12.5
490
12.1
175
157
440
179.5
2.4
81
21
39.2
1.9
1.2
3
0.33
180
25
169
2.6
11.4
2.5
50.4

0.86312
2.88961
1.2012
0.14982
3.7274
0.92558
0.6973
2.16195
0.24348
0.4348
4.34982
3.72729
0.91105
3.88122

17.7384
25.1772
18.8126
15.3833
29.1058
17.8978
17.6353
22.4571
15.8191
16.8297
31.6999
29.137
17.9504
29.7899