Sei sulla pagina 1di 56

5-1

CONTENI DO


Pg.
5.0 Anlisis de regresin
5-2
5.1 Regresin lineal simple
5-4
5.2 Aplicaciones de la regresin lineal simple en el
anlisis qumico

5-13
5.3 Regresin lineal mltiple
5-22
5.4 Regresin no lineal
5-33
5.5 Ej emplos de aplicacin de anlisis de regresin
5-34
REFERENCI AS BI BLI OGRAFI CAS
5-56









5-2
5.0 ANALI SI S DE REGRESI ON

Muchos problemas de invest igacin requieren la est imacin de las relaciones exist ent es
entre la pauta de variabilidad de una variable aleat oria y los valores de una o ms
variables (aleat orias o no) de las que la primera depende o puede depender. Por ej emplo,
Cmo vara la densidad con la temperatura?
El anlisis de regresin es una t cnica est adst ica para la est imacin de los parmetros de
una ecuacin que relaciona una det erminada variable con un conj unt o de variables. El
anlisis se lleva a cabo mediante el establecimiento de un modelo de regresin cuyos
parmet ros recogen y cuant ifican los efect os que se pret ende est udiar, t al como el que se
esquemat iza en la figura 5. 1. Dichos parmetros se estiman a partir de los datos
disponibles. Algunos autores se refieren al anlisis de regresin como TECNI CA DE LOS
MI NI MOS CUADRADOS O DE AJUSTE DE CURVAS (JURAN y GRYNA, 1997, cap. 23).



Variables a
explicar
(aleat oria)
Variables o fact ores
explicat ivos (aleat orios o no)
Y
1
X
11
X
i1
.X
I 1

----
Y
j
X
1j
X
ij
.X
I j

----
Y
J
X
1J
X
iJ
.X
I J



MODELO FUNDAMENTAL E( Y
j
) = f (X
1j
X
ij
.X
I j
)


2
(Y
j
) = CONSTANTE

Tcni cas sof i st i cadas t ambi n permi t en
Est udi ar el caso en el que adems

2
(Y
j
) = g(X
1j
X
ij
.X
I j
)


FI GURA 5.1 MODELOS DE REGRESI ON MULTI PLE
( ROMERO y ZUNI CA, 1993, cap. 11)

La razn bsica por la cual se construye un modelo de regresin es describir la naturaleza
de una relacin en forma cuant it at iva. Sin embargo, los obj et ivos son con frecuencia ms
Observa-
ciones o
datos del
problema
5-3
especficos. Por ej emplo, para un proceso en el que la humedad es controlable, el obj etivo
podra ser hallar el valor particular de la humedad que minimiza inestabilidad de un
inst rument o, o alguna funcin de cost os basada en dicha inest abilidad. O bien det erminar
variables independient es import ant es de un proceso. Por ej emplo, ver si la humedad,
presin y temperatura afectan a una caracterstica de calidad de un producto.
En problemas, donde la variable (o las variables) dependient es no son cont rolables, el
obj etivo puede ser predecir el valor de dicha variable dependient e (o respuest a). Est o
puede ser int eresant e cuando la variable independiente es ms fcil de medir que la
variable dependient e o bien cuando la variable independient e est a disponible ant es que la
dependient e. En ot ros casos puede permit ir sust it uir un ensayo dest ruct ivo por uno no
dest ruct ivo (JURAN y GRYNA, 1997, cap. 23) .
En sntesis la utilidad de los modelos de regresin puede ser la siguiente (JURAN y GRYNA,
1997, cap. 23) :

1. Proyecto y prediccin
2. Descripcin cuant it at iva ent re un conj unt o de variables
3. I nterpretacin de los valores de la funcin
4. Det erminacin de variables independientes importantes
5. Descubrimiento de las condiciones de funcionamiento ptimas
6. Seleccin entre modelos alternativos
7. Estimacin de coeficientes de regresin particulares

Las fases en un estudio mediante modelos de regresin se presentan en la figura 5. 2.
En general, el anlisis de regresin puede clasificarse en: a) Regresin lineal y
b) Regresin no lineal. Ambos a su vez se clasifican en regresin lineal (no lineal) simple y
mltiple.
5-4


FI GURA 5. 2 FASES EN EL ANALI SI S DE REGRESI ON


5.1 REGRESI ON LI NEAL SI MPLE

En este tipo de regresin se desea caracterizar el efecto lineal de una nica variable
explicat iva sobre la variable respuest a.
Los pasos para efectuar un anlisis son los siguientes (JURAN y GRYNA, 1997, cap. 23):

1. Represent acin grfica de dat os
2. Planteamiento del modelo
3. Estimacin de la ecuacin de prediccin
4. Examen de la adecuacin del modelo lineal
5. I ntervalos de confianza para la estimacin


OBJETIVO,
PLANIFICACION
FORMULACION DEL MODELO
Seleccin de variables
Forma analtica
DESARROLLO DEL MODELO
Recoleccin de
datos existentes
Muestreo, diseo de
experimentos
ESTIMACION DE PARAMETROS
VALIDACION
USO DEL MODELO
Experiencia,
realidad
Objetivos de la
empresa
Simulacin
Observacin
de datos
Definicin del
problema
Diseo
Evaluacin
no
si
5-5
5.1.1 REPRESENTACI ON GRAFI CA DE DATOS

El primer paso para el est udio de relaciones ent re variables, consist e en t razar una grfica
de los datos (corrientemente llamado diagrama de dispersin). La variable respuesta se
indica en el ej e vert ical y la variable explicat iva en el horizont al. En la figura 5. 3 se
presentan ej emplos de grficos de dispersin.
Los grficos de dispersin son t iles debido a los siguient es aspect os (JURAN y GRYNA,
1997, cap. 23) :

Facilita informacin sobre la relacin existente entre las variables
Permite sugerir modelos posibles para los datos o transformaciones de datos.
Puede sealar la existencia de observaciones anmalas
Puede facilitar una indicacin de y para x fij a. Adems puede most rar que esa
variabilidad permanece constante para todos los valores de x o que cambia con x.


5.1.2 PLANTEAMI ENTO DEL MODELO

La ecuacin que relaciona los datos para una regresin lineal simple es la siguiente
(MONTGOMERY, 1991, cap. 15) :

+ + x y
o 1
(ec. 5.1)

Donde:
o
y
1
son respect ivament e la ordenada en el origen y el nivel de variacin de y
por cada unidad de variacin de x (desconocidas de la rect a de regresin); x variable
explicat iva o una t ransformacin de est a (ej : log x); es el error aleatorio con media cero
y varianza const ant e (
2
). Tambin se supone que las {} const it uyen un conj unto de
variables aleatorias independientes. El error aleatorio puede deberse a errores en la
medicin de y y/ o a efectos de variables no incluidas en el modelo . Se denota como
error de la ecuacin.


5-6


FI GURA 5. 3 GRAFI COS DE DI SPERSI ON ( KUME, 1997, cap. 6)


5.1.3 ESTI MACI ON DE LA ECUACI ON DE PREDI CCI ON

El obj et ivo de est a et apa es hallar est imadores (b
o
, b
1
) de los parmetros desconocidos
(
o
,
1
), y obt ener la ecuacin de prediccin en base a los dat os ( JURAN y GRYNA, 1997,
cap. 23) :
5-7
x b b y
o 1
+
(ec. 5.2)
donde:
y es el valor de y pronosticado por el modelo para un valor de x.
El mt odo que proporciona los est imadores ms eficient es, lineales no sesgados, b
o
y b
1
a
partir de un conj unto de n observaciones (x
1
, y
1
)..(x
n
, y
n
), es el mtodo de los mnimos
cuadrados, b
o
y b
1
se denominan por tanto estimadores mnimocuadraticos, porque son los
que minimizan la suma de desviaciones elevadas al cuadrado entre los valores observados
y los valores pronosticados por el modelo para la variable respuesta (JURAN y GRYNA,
1997, cap. 23) :



2
1
2
) ( ) (
m o m m m
x b b y y y (ec. 5.3)

Las condiciones para la aplicacin del mtodo de los mnimos cuadrados para estimar los
parmet ros
o
,
1
, son las siguient es (JURAN y GRYNA, 1997, cap. 23):

1. Las observaciones son independient es
2. La varianza de los errores es constante para estas observaciones
3. El modelo lineal promulgado es correcto. Entonces los estimadores de mnimos
cuadrados son los mej ores estimadores lineales no sesgados

En la figura 5. 4, se presenta el significado de la recta de regresin lineal.
Los est imadores mnimos cuadrados para el modelo lineal simple se est iman como sigue
(JURAN y GRYNA, 1997, cap. 23):

( )( )
( )
XX
XY
m
m m
o
S
S
x x
y y x x
b
x b y b

2 1
1
(ec. 5. 4)

Unas formulas que permit en facilit ar para el clculo de S
xy
y S
xx
son las siguient es
(MONTGOMERY, 1991, cap. 15) :

5-8
n
x
x S
n
y x
y x S
n
i
i
n
i
i xx
n
j
j
n
i
i
n
j
j j xy
2
1
1
2
1 1
1

,
_

,
_

,
_

(ec. 5.5)
Todas las sumatorias desde i j = 1 hasta i j = n.



















FI GURA 5. 4 SI GNI FI CADO DE LA RECTA DE REGRESI ON ( JURAN y GRYNA, 1997, cap. 23)

Por otra parte, x y y vienen dados por:
n
x
x
n
y
y
n
i
i
n
j
j

1
1
(ec. 5.6)


5.1.4 EXAMEN DE ADECUACI ON DEL MODELO

El examen preliminar de adecuacin del modelo, consiste en dibuj ar la ecuacin.
Aproximadament e la mit ad de los punt os deben quedar por encima de la rect a y la ot ra
m o m m m
x b b y y y
1

x b b y
o m 1
+
y
x
.
x
m
y
m
5-9
mit ad por debaj o. Adems la ecuacin debe pasar exact ament e por ( ) y x, (JURAN y
GRYNA, 1997, cap. 23) .
A cont inuacin del examen preliminar debe det erminarse la significacin global del aj ust e,
lo cual se logra a travs del clculo del coeficient e de regresin o det erminacin R
2
(JURAN
y GRYNA, 1997, cap. 23) :

( )
( )
( )( )
( )
2
1
1
2
2
1 2

) (

y y
y y x x b
y y
y y
S
regresion SC
R
j
i i
n
j
j
n
j
j
yy
(ec. 5.7)

Donde el numerador de la ecuacin se refiere a la variacin explicada por el modelo, y el
denominador se refiere a la variacin t ot al. R
2
debe oscilar ent re 0 y 1. Cuant o ms
cercano a 1, la mayor part e de la variabilidad const at ada de y estar asociada a las
variables explicat ivas incluidas en el modelo (MONTGOMERY, 1991, cap. 15).
Cuando la variable explicativa es aleatoria, la raz cuadrada del coeficiente de
det erminacin R
2
, es el coeficient e de correlacin ent re x e y (MONTGOMERY, 1991, cap.
15).
Para estudiar la hiptesis de significacin del efecto de la variable explicativa (a nivel
poblacional), se utiliza el resultado que se explica a continuacin. Dado el modelo:
x y
o 1
+
La variable x influye en y si y solo si
1
es significat ivament e dist int o de cero.
Se puede probar el grado de significacin de la regresin, es decir, se puede cont rast ar la
hiptesis estadstica (JURAN y GRYNA, 1991, cap. 23) :

H
o
:
1
= 0
H
1
:
1
0

La prueba para contrastar las hiptesis puede efectuarse de dos formas equivalent es:

a) FORMA DE PRUEBA 1 (ROMERO y ZUNI CA, 1993, cap. 11):

5-10
Si
1
= 0
2 / , 2
1
1


n
b
t
S
b

Si
1
0
2 / , 2
1
1

>
n
b
t
S
b


Y se deduce si x influye sobre y. S
b1
es la varianza del estimador que se calcula como:
xx
b
S
S S
1
1
con S calculado como
( )
2


n
y y
S
i i
(ec. 5.8)

donde la sumatoria es de i = 1 hasta i = n.
La prueba de significacin par a b
o
( H
o
:
o
= 0 cont ra H
1
:
o
0) viene dada como:
2 / , 2

n
bo
o
t
S
b
, si se cumple H
o
y
2 / , 2
>
n
bo
o
t
S
b
, si H
o
es falsa, con

,
_

+
xx
bo
S
x
n
S S
2
1
.
En la tabla 5.1 se presenta un resumen para esta prueba.

TABLA 5.1 RESUMEN PRUEBA 1 DE SI GNI FI CANCI A DE COEFI CI ENTES

Coef i ci ent e valor desv. Est ndar
del coef i ci ent e
t
o

o b
o

,
_

+
xx
bo
S
x
n
S S
2
1

bo
o
S
b

1
b
1
xx
b
S
S S
1
1


1
1
b
S
b


b) FORMA DE PRUEBA 2 (ROMERO y ZUNI CA, 1993, cap. 11):

Sean:
CM
residual
, el cuadrado medio residual del aj uste con la variable x con n - 2 grados de
libert ad, y calculado como:

( )
2 2
1

n
S b S
n
SC
CM
xy yy
residual
residual
(ec. 5.9)
5-11
Consideramos el valor del cuadrado medio explicado (CM
regresion
) , por el modelo incluyendo
x, con un grado de libertad y calculado como:

1 1
1 xy regresion
regresion
S b SC
CM (ec. 5.10)

Si
1
= 0
2 , 1 ,

n
residual
regresion
F
CM
CM



Si
1
0
2 , 1 ,
>
n
residual
regresion
F
CM
CM



Y se deduce si x influye sobre y. Con:

residual total regresion
SC SC SC

En la tabla 5.2 se presenta un resumen para esta prueba.

TABLA 5.2 RESUMEN DE PRUEBA 2 DE SI GNI FI CACI ON DEL MODELO DE REGRESI ON

Fuent e de
vari aci n
Suma de
cuadrados
Grados de
l i bert ad
Medi a de
cuadrados
F
o
regresin b
1
S
xy
1 CM
regresion
residual
regreion
CM
CM

residual S
yy
- b
1
S
xy
n - 2 CM
residual

t ot al S
yy
n -1



5.1.4.1 DESVI ACI ONES Y FALTA DE AJUSTE. FORMA GRAFI CA

Las desviaciones y falta de aj uste del modelo lineal pueden determinarse a partir del
anlisis de los residuos (MONTGOMERY, 1991, cap. 15).
Si en los grficos de los residuos contra los valores predichos y contra la variable de
regresin, se observa una dispersin aleat or ia de punt os por encima y por debaj o de la
lnea de desviacin cero, puede concluirse que la falta de aj uste no es significativa y por lo
5-12
tanto adoptar el modelo lineal planteado. Por otra parte, si en el grfico de residuos contra
valores predichos por el modelo lineal se observan tendencias como curvaturas,
t endencias de aument o o disminucin de los valores de los residuos al aument ar los
valores predichos, et c., puede concluirse que exist e una falt a de aj ust e significat iva y debe
aj ust arse ot ro modelo, como un modelo simple no lineal, o bien un modelo mlt iple. Ot ro
grfico til es el de normalidad de los residuos (ROMERO y ZUNI CA, 1993, cap. 11) .

5.1.5 CREACI ON DE I NTERVALOS DE CONFI ANZA

Los intervalos de confianza sobre los parmetros proporcionan otra medida de la fiabilidad
de los estimadores y de las estimaciones (JURAN y GRYNA, 1997, cap.23).
El intervalo de confianza para
1
, viene dado a partir de (JURAN y GRYNA, 1997, cap.23)
(ROMERO y ZUNI CA, 1993, cap. 11):

( )
1 1
2
1 b
i
tS b
x x
tS
b t

( ec. 5.11)
Donde t
/ 2, n-2
, el t rmino
( )


2
x x
S
m
se denomina error del coeficient e de regresin
( S
b1
). Similarment e un intervalo de confianza del 100(1- )% para
o
es dado por
(JURAN y GRYNA, 1997, cap.23) (ROMERO y ZUNI CA, 1993, cap. 11) :

bo o
xx
o
tS b
S
x
n
tS b t

,
_

+ t
2
1
(ec. 5.12)

El intervalo de confianza para el valor medio de y correspondiente a un valor dado de x
viene dado por (JURAN y GRYNA, 1997, cap.23):

( )
xx
o
S
x x
n
tS x b b
2
1
1
+ t + (ec. 5.13)
Donde x es el valor para el que se det ermina el int ervalo de confianza, y t t iene n-2
grados de libertad.
5-13
5.1.2 CONFI ABI LI DAD DE UNA NUEVA PREDI CCI ON

El int ervalo de prediccin del 100(1 - )% para la media de k observaciones fut uras en x
o

es (JURAN y GRYNA, 1997, cap.23) (MI LLER y MI LLER, 1993, cap. 5):

( )
xx
o
o o
S
x x
n k
tS x b b
2
1
1 1
+ + t + con t
/ 2, n-2
(ec. 5.14)


5.2 APLI CACI ONES DE LA REGRESI ON LI NEAL SI MPLE EN EL ANALI SI S
QUI MI CO

Dentro de las aplicaciones de las rectas de regresin al anlisis qumico se encuentran:

a) Grficas de calibracin en anlisis instrumental.
b) Determinacin de la incertidumbre asociada al calculo de una concentracin.
c) Mt odo de las adiciones est ndar.
d) Rectas de regresin ponderadas.
e) Uso de rectas de regresin para comparar mtodos analticos.

A continuacin se presenta un resumen de estas aplicaciones.

A) GRAFI CAS DE CALI BRACI ON EN ANALI SI S I NSTRUMENTAL

La capacidad de las t cnicas de anlisis inst rument al para manej ar un int ervalo amplio de
concentraciones de analito significa que se calculan los resultados, y se evalan los errores
aleatorios de manera concreta, que difiere de la que se utiliza cuando se repite una sola
medicin varias veces. El procedimient o habit ual es como sigue: El analist a t oma una
serie de muest ras (normalment e t res o cuat ro, o posiblement e ms) en las que se conoce
la concent racin del analit o, valores x . Est as calibraciones est ndar se miden en el
inst rument o analt ico en las mismas condiciones que las usadas para la muest ra problema
(es decir, las desconocidas ), obteni ndose las mediciones y . Una vez que se ha
establecido la ecuacin de calibracin, se puede obtener la concentracin del analito en
5-14
cualquier muest ra problema por prediccin. Est e procedimient o general plant ea varias
pregunt as est adst icas import ant es (MI LLER y MI LLER, 1993, cap. 5):

I . Es lineal la grfica de calibracin? Si es curva Qu forma tiene?
I I . Teniendo en cuenta que cada uno de los puntos de la lnea de calibracin est
suj eto a errores, cul es la mej or lnea recta (o curva) que pasa por esos punt os?
I I I . Suponiendo que la calibracin es realment e lineal, Cules son los errores
est imados y los lmites de confianza para la pendiente y la ordenada en el origen
de la rect a?
I V. Cuando la grfica de calibracin se usa para el anlisis de una muestra problema,
Cules son los errores y los lmites de confianza para la concent racin
det erminada?
V. Cul es el lmit e de det eccin del mt odo? Est o es, Cul es la menor
concentracin de analito que se puede detectar con un nivel de confianza
predeterminado?

Todas las pregunt as ant eriores pueden responderse mediant e el anlisis de regresin
simple, que se ha expuesto en el tema 5.1. En los ej ercicios de la seccin 5.4.4, se
presenta esta aplicacin al anlisis qumico.

B) EL METODO DE LAS ADI CI ONES PATRON ( O DE ADI CI ON ESTANDAR)

En el mtodo de adiciones estndar, se prepara una curva de calibracin de forma que
todos los patrones contengan muestra, y la contengan en la misma cantidad. El primer
punto de la curva de calibracin, es una disolucin de la muestra a la que no se ha
aadido pat rn, y por t ant o, cont iene la cant idad de analit o original de la muest ra. El
segundo punto de la curva de calibracin contiene esa misma cantidad de analito ms una
cantidad conocida de patrn que se le ha aadido. El tercer punto de la curva contiene de
nuevo el analit o original de la muest ra, mas una cant idad mayor de pat rn, y as
sucesivament e. Por ot ra part e, debe prepararse y medirse cuidadosamente un blanco.
Luego se obt ienen las lect uras en el inst rument o (dat os de calibrado). Con los dat os de
5-15
calibrado se hace la representacin grfica de la figura 5. 5, y se obt iene la
correspondiente recta de regresin (RAMI S, 1997, tema 5).
Es muy importante tener en cuenta que el origen de las coordenadas debe colocarse en la
lectura del blanco, o alternativamente, la seal del blanco debe restarse de todos los
dems valores de la seal. Si se utiliza la seal dada por el disolvente puro, o lo que es
peor, el valor cero de la seal dada por el instrumento, se comete un error sistemtico que
puede ser muy grande. El result ado buscado, x
E
(E valor extrapolado) la concentracin del
analit o en la muest ra problema, se puede leer sobre la propia grfica, ext rapolando el ej e
de las abscisas. Tambin puede calcularse como x
E
= b
o
/ b
1
, est o es, la concentracin de
analit o en la muest ra es igual a la razn ent re la ordenada en el origen y la pendient e. La
desviacin estndar del resultado se calcula mediante (RAMI S, 1997, t ema 5):

( )
2 / 1
2 2
1
2
1
1
1
1
]
1

x x b
y
n b
S
s
i
E
(ec. 5.15)

Donde n es el nmero de punt os de la rect a de adicin est ndar. De la expresin ant erior
puede concluirse lo siguiente (RAMI S, 1997, tema 5) :

a) I gual que en el caso de la curva de calibrado ordinario, la precisin se mej ora si los
puntos estn poco dispersos (s
xy
es pequeo) y si b
1
es grande.
b) Al aumentar el valor de n mej ora la precisin, pero no se obtendrn mej oras
importantes cuando ya se tengan al menos 6 puntos. Con frecuencia se trabaj a con
3 o 4 puntos.
c) La sumatoria del denominador del lt imo trmino indica que la precisin se mej ora
cuando los valores de x
i
se alej an del cent roide, est o es, cuando se aument a el
intervalo de valores de concentracin abarcado. Sin embargo, no es conveniente
cubrir un int ervalo excesivament e grande, pues pueden aparecer desviaciones de
la linealidad, lo que producir un error sistemtico.

El mtodo de adicin estndar se utiliza para descubrir y corregir la presencia de efecto de
mat riz. Sin embargo, por s solo, el mt odo de adicin est ndar no sirve para validar un
mt odo, puest o que (RAMI S, 1997, tema 5):
5-16
a) No es capaz de descubrir ni corregir las interferencias.
b) No siempre corrige el efecto de matriz en un grado suficientemente satisfactorio.
c) Mediant e la sola aplicacin del mt odo de adicin est ndar no se puede est ablecer
si las interferencias y el efect o mat riz han sido corregidos sat isfact oriament e.

Existe efecto de matriz cuando la recta obtenida por el mtodo de adicin estndar no
tiene la misma pendiente que la recta obtenida por calibracin externa.
Las limit aciones del mt odo de adiciones est ndar se pueden resumir como sigue (RAMI S,
1997, t ema 5):

a) Es un mt odo de ext rapolacin, y por lo t ant o es menos preciso que el calibrado
por interpolacin (la medida del analito se realiza muy lej os del centroide). Si la
curva de calibrado no es lineal, el mt odo de adicin est ndar, que est a basado en
una extrapolacin lineal, no puede aplicarse.
b) Se gast a ms muest ra, lo que puede ser un problema cuando se dispone de
pequeas cant idades.
c) Es necesario repet ir el calibrado para cada muest ra o t ipo de muest ras, o en
cualquier circunstancia en que se sospeche que ha habido un cambio del efecto
mat riz.
d) Como ya se ha indicado, no es capaz de descubrir ni corregir las interferencias, y
no siempre corrige el efecto matriz en un grado suficiente.



FI GURA 5.5 METODO DE LAS ADI CI ONES ESTANDAR
seal
Seal de muestra
Cantidad de analito en
la muestra problema
Cantidad aadida
5-17
C) USO DE RECTAS DE REGRESI ON PARA COMPARAR METODOS
ANALI TI COS

Supngase que se ha desarrollado un mt odo nuevo para det erminar un analit o en una
matriz dada. Para validar la incertidumbre y la exact it ud del mt odo est e se aplica a un
mat erial de referencia cert ificado. Finalment e, se realizarn pruebas est adst icas para
saber si el mt odo t iene mayor incert idumbre que la deseada, o si exist e error sist emt ico
respect o al valor cert ificado (RAMI S, 1997, tema 5).
Sin embargo, el proceso de validacin cambia cuando se quiere validar un mtodo a varios
niveles de concentracin, y no a uno solo. Para ello, ser necesario utilizar varios
materiales de referencia, conteniendo distintos niveles de concentracin de analito, o
t ambin, aplicar el mt odo a un conj unt o de muest ras ya est udiadas por ot ro
procedimiento estndar o de prestigio.
Cuando se comparan dos mt odos a diferent es concent raciones de analit o, se adopt a
normalmente el procedimiento que ilustra la figura 5. 6. Uno de los ej es de la grfica de
regresin se utiliza para los resultados obtenidos con el nuevo mtodo, y el otro para los
que se obtienen aplicando el de comparacin o referencia a las mismas muestras. As cada
punt o de la grfica represent a una nica muest ra analizada por dos mt odos separados
(RAMI S, 1997, tema 5) .
Si cada muestra conduce a un resultado idntico en ambos mtodos para todos los niveles
de concent racin est udiados, la rect a de regresin t endr una ordenada en el origen igual
a cero, y una pendient e y un coeficient e de correlacin iguales a 1. Cualquier result ado
que no sea este, implica error sistemtico de un mtodo con especto al otro, a algunos o a
todos los niveles de concentracin. En la prctica, debido a la presencia de los errores
aleat orios, nunca sern exact ament e cero la ordenada en el origen ni uno la pendient e.
Sin embargo, la sola observacin del grfico dar una idea clara acerca del mantenimiento
o no de la exact it ud a lo largo del int ervalo de concent racin est udiado. Se dist inguirn
varios casos (RAMI S, 1997, tema 5) :

a) La recta de regresin tiene una pendiente de 1, pero la ordenada en el origen no
es cero. Este resultado implica que al menos uno de los mtodos sufre una
interferencia, o lo que es igual, la seal de fondo de uno de los mtodos no est
5-18
bien medida, est o es, al menos uno de los blancos o los dos no est a bien
construido.
b) La pendient e no es la unidad, o t ambin, la represent acin grfica de la curva.
Ent onces exist e error sist emt ico de un mt odo, y error se agrava cuant o ms se
alej an los puntos de la recta y = x.
c) Los errores a) y b) suceden simult neament e.

Para validar un mt odo con respect o al ot ro (o con respect o a los mat eriales de referencia
ut ilizados) se est ablecen las dos hipt esis nulas siguient es:
o
= 0 y
1
= 1. Para comprobar
estas hiptesis se aplican los siguientes ensayos estadsticos: se establecen los lmites de
confianza para b
o
y b
1
, para un nivel de confianza del 95% y se comprueba si el cero y el
uno est n dent ro de los correspondientes intervalos de confianza. El valor del coeficiente
de determinacin tiene menos importancia, no dice nada respecto a la exactitud de un
mt odo respect o al ot ro, si los punt os est n dispersos (R
2
< 0.99) es indicativo que al
menos uno de los dos mtodos tiene una precisin pobre (RAMI S, 1997, t ema 5).
Las limit aciones de est e mt odo de validacin de la exact it ud son las siguient es (RAMI S,
1997, t ema 5):

a) Este mtodo constituye un ej emplo tpico de los casos en los que no est
justif icada la utilizacin de una recta de regresin de Y sobre X, puesto que los
errores en la direccin de X pueden ser t an import ant es o ms que en la direccin
Y. Sin embargo, los result ados pueden ser confiables si se t oman las precauciones
siguient es:

1. El mt odo ms preciso se represent a en el ej e X. Para ello se debe
est ablecer previament e la precisin de ambos mt odos.
2. Utilizar un nmero razonable de puntos (al menos 10). Ya que los limites de
confianza se basan en n 2 grados de libertad, es importante evitar valores
pequeos de n.
3. Los punt os experiment ales deberan cubrir el int ervalo de concent raciones
de int ers de una manera aproximadament e uniforme, est o es, debera
haber tantos puntos a concentraciones baj as como a intermedias y altas,
5-19
dentro del int ervalo est udiado. Est e requisit o debe ser difcil de cumplir
cuando se t rabaj a con muest ras reales.

b) Si no exist e homocedast icidad debera ut ilizarse la rect a de regresin ponderada.
La falt a de homocedast icidad es muy frecuent e en la prct ica: para muchos
procedimientos analticos, la desviacin estndar relativa (coeficiente de variacin)
es aproximadamente constante en un intervalo de concentraciones, por tanto, la
desviacin est ndar en valor absolut o aument a con la concent racin de analit o (en
vez de tener el mismo valor para todas las concentraciones).



FI GURA 5. 6 USO DE RECTAS DE REGRESI ON PARA COMPARAR
METODOS ANALI TI COS: a) MUESTRA UNA CONCORDANCI A
PERFECTA ENTRE LOS DOS METODOS PARA TODAS LAS MUESTRAS
b) a f ) I LUSTRA LOS RESULTADOS DE VARI S TI POS DE ERRORES
SI STEMATI COS (MI LLER y MI LLER, 1993, cap. 5)


D) RECTAS DE REGRESI ON PONDERADAS

Los clculos de regresin ponderada se utilizan para la determinacin de la
concentracin de un nico analito y no para comparar dos mt odos separados (MI LLER
y MI LLER, 1993, cap. 5).
5-20
Los clculos de regresin ponderada requieren ms informacin (estimaciones de la
desviacin estndar a varios niveles de concentracin) y son ms complej os de
ej ecut ar. Por ot ra part e, aparentemente proporcionan datos muy similares a los
obt enidos a part ir del mt odo, mucho ms simple, de regresin no ponderada. Dichas
consideraciones de hecho pueden j ust ificar que en la prct ica se desprecien los
clculos de regresin ponderada (RAMI S, 1997, tema 5) .
Pero un qumico analtico que utiliza mtodos instrumentales no emplea clculos de
regresin simplemente para determinar la pendiente y la ordenada en el origen de una
grafica de calibracin y las concent raciones de las muest ras problema. Tambin quiere
obt ener est imaciones de los errores o lmit es de confianza de esas concent raciones, y
en este contexto el mtodo de regresin ponderada ofrece una gran ventaj a respecto
al mt odo no ponderado si los punt os experiment ales son clarament e
het erocedsticos: las estimaciones de las desviaciones estndar de la pendiente y la
ordenada en el origen son mucho ms realistas (RAMI S, 1997, tema 5).
Supngase que se lee una concentracin sobre una recta de regresin que tiene un
error relat ivo const ante. Puesto que la desviacin estndar absoluta aumenta con la
concent racin, no es lgico que se obt enga un error const ant e a cualquier nivel de
concentracin, sino que la lectura de concentraciones altas debe dar errores mayores
que la lectura de concentraciones baj as. Si se ha utilizado una recta de regresin
ponderada, el error de la lect ura s
xo,w
variar dependiendo de la concentracin. Las
expresiones que permiten calcular s
xo,w
son (RAMI S, 1997, tema 5):

( ) ( )
( )
( )
2 / 1
2 2 2
1
2
1
,
,
2 / 1
2 2 2
1
2 2
,
1 1
2
1
1
]
1

+ +
1
1
]
1


w i i
w o
o
w xy
w xo
w i i w i i
w xy
x n x w b
y y
n w b
s
s
n
x n x w b y n y w
s
(ec. 5.16)

En donde:
5-21
n
y w
y
n
x w
x
x n x w
y x n y x w
b
n
s
s
w
i
i i
w
i
i i
w
i
w i i
i
w w i i i
i
i
i

,
_

2 2 1
2
2
(ec. 5.17)

la expresin para s
xo,w
es en todo similar a su anloga para la regresin no ponderada. Ello
confirma que los punt os cercanos al origen, donde las ponderaciones son ms alt as, y los
cercanos al centro de gravedad, donde
w o
y y es pequeo, t endrn lmites de confianza
pequeos. La principal diferencia ent re las dos ecuaciones es la int roduccin del t rmino
1/ w
o
(donde w
o
es la ponderacin de y
o
), que aument a rpidament e cuando aument a y.
Por t ant o se obtienen lmites de confianza mayores, a valores alt os de concent racin. Est o
concuerda mucho ms con el experiment o de calibracin real que los result ados obt enidos
al ut ilizar la regresin no ponderada. Adems los mt odos de regresin ponderados
pueden ser absolutamente necesarios cuando se obtenga una recta por transformaciones
algebraicas de una represent acin int rnsecament e curva (RAMI S, 1997, tema 5).

E) I NCERTI DUMBRE ASOCI ADA AL USO DE UNA RECTA DE REGRESI ON

De las ecuaciones que permiten calcular las desviaciones estndar y los lmites de
confianza de: 1) La pendient e, 2) La ordenada en el origen, y 3) la confiabilidad de una
nueva prediccin, se extraern algunas consecuencias de orden prctico referentes a la
forma como debe prepararse y utilizarse una curva de calibrado (RAMI S, 1997, tema 5) .
Supngase que se dispone ahora de un valor experiment al de y (o un promedio de k
replicas) al que se denominar y
o
. Se lee est e valor, y se hace uso de la ecuacin de
regresin para obtener el correspondient e valor de x , x
o
. La desviacin est ndar de x
o
,
s
xo
, viene dada por (RAMI S, 1997, tema 5):

5-22
( )
( )
2 / 1
2 2
1
2
1
1 1
1
1
]
1

+ +

x x b
y y
n k b
S
s
i
o
xo
(ec. 5.18)


5.3 REGRESI ON LI NEAL MULTI PLE

Aunque hay muchos problemas que ataen a variables explicativas nicas, es muy
frecuente que aparezcan varias. El problema de regresin lineal mltiple consiste en
aj ust ar el modelo general ( JURAN y GRYNA, 1997, cap. 23) :

+ + + + +
k k o
x x x y .......
2 2 1 1
(ec. 5.19)

Donde los son los parmetros desconocidos, llamados coeficientes de regresin, y es el
error aleatorio.
Las variables x
1
, x
2
, ., x
k
pueden ser :

La variable original cuant it at iva.
Transformaciones de la variable original: polinmicas, logart micas, et c.

Ej emplo:
2
1 1
cx bx a y + + , puede definirse una nueva variable x
2
= x
1
2
y se
obtiene el modelo lineal:
2 2 1 1
x x y
o
+ +

Variables cualitativas con p variantes, deben incluirse en este caso lo que se
conoce como variable dummy (p -1) cuyos nicos valores probables son 0 y 1.
Generalment e se simbolizan como z
i
. Por ej emplo, para incluir el efect o lineal de
una variable cuant it at iva x
1
y de ot ra cualit at iva x
2
con dos posibles variant es, el
modelo sera:
2 3 1 2 1 1
z z x y
o
+ + +

I nclusin de interacciones: es posible que se den efectos interactivos entre las
variables explicativas. Este efecto debe incluirse como una nueva variable que sea
5-23
el product o de las variables implicadas en dicha int eraccin. Por ej emplo, una
int eraccin ent re los efect os lineales de dos variables cuant it at ivas x
1
y x
2
implica
crear un nuevo trmino: x
1
x
2
= x
3
.

En general en el modelo lineal, se asume que los errores son normales e idnt icament e
distribuidos con media cero y varianza constante es decir: N(0,
2
).
La interpretacin de los parmetros del modelo es la siguient e (ROMERO y ZUNI CA, 1993,
cap. 11) :


o
valor medio de y cuando x
1
= x
2
= = x
k
= 0


i
incremento en el valor medio de y cuando x
i
aumenta en una
unidad, si x
i
es una variable cuantitativa, mantenindose constantes
las rest ant es variables explicat ivas.

En general, los pasos para el anlis is de regresin lineal mltiple son los siguient es (JURAN
y GRYNA, 1997, cap. 23) :

1. Planteamiento del modelo.
2. Proceso de estimacin.
3. Examen de adecuacin del modelo.
4. Estimacin de intervalos de confianza.

5.3.1 ESTI MACI ON EN MODELOS DE REGRESI ON

El esquema general del proceso de est imacin se present a a cont inuacin (ROMERO y
ZUNI CA, 1993, cap. 11):









5-24
Dado el modelo:

+ + + + +
k k o
x x x y .......
2 2 1 1


Y dados los dat os:



Variables a
explicar
(aleat oria)
Variables o fact ores
explicat ivos (aleat orios o no)
Y
1
X
11
X
i1
.X
I 1

----
Y
j
X
1j
X
ij
.X
I j

----
Y
J
X
1J
X
iJ
.X
I J





Son conocidas para cada observacin j (j = 1,, n)
y
j
: valor de la variable dependient e
x
1j
, , x
ij
, ., x
I j
: valores de las variables explicat ivas

El residuo
j
que se obtendra para los posibles valores b
o
, ., b
I
de los coeficientes se
define como (ROMERO y ZUNI CA, 1993, cap. 11):
) ...... (
1 1 Ij I o j j
x b x b b y + + +
Se demuest ra que los est imadores b
o
, b
1
, .., b
k
ptimos desde el punto de vista de
sus propiedades est adst icas son los que conducen a un valor mnimo de
j
2

(ROMERO y ZUNI CA, 1993, cap. 11), lo cual puede lograrse por el mtodo de los
mnimos cuadrados.
Estimacin de los coeficientes
1
b
o
b
1
. b
i
b
I

(as como de la precisin de estas estimaciones)
y
Estimacin de la varianza residual
2
S
2

ESTIMACION
(Proceso de calculo)
5-25
Resultados matemticos: De los dat os (ROMERO y ZUNI CA, 1993, cap. 11):

'

M
M
r
.
1
j
y
y
y
1
1
1
1
]
1

M M M
L
M M M
K
Ij j
I
x x
x x
x
1
1 11
1
1

La estimacin de los coeficientes de regresin viene dada por (ROMERO y ZUNI CA,
1993, cap. 11) :
y x x x b
r
r

1
) ( (ec. 5. 20)
La est imacin de la varianza residual es obt enida por (ROMERO y ZUNI CA, 1993, cap.
11):

) 1 (
)) ..... ( (
) 1 (
1
2
1 1
1
2
2
+
+ + +


k n
x b x b b y
k n
S
N
kj k o j
N
j

(ec. 5.21)

En donde k represent a el nmero de variables explicat ivas y n el nmero de punt os
para el anlisis.
La estimacin de la varianza de los coeficientes de regresin viene dada por (ROMERO
y ZUNI CA, 1993, cap. 11):
ii bi
c S S donde c
ii
es el elemento i, i de la diagonal principal ( )
1
x x

5.3.2 SI GNI FI CACI ON GLOBAL DEL AJUSTE

La variabilidad t ot al de la variable dependient e y en el conj unt o de las n
observaciones, viene dada por (ROMERO y ZUNI CA, 1993, cap. 11):

( )


n j
j
j TOTAL
y y SC
1
2
con n -1 grados de libertad (ec. 5.22)

parte de la variabilidad es debida (o al menos esta asociada) a las variables
explicat ivas x
1
, .., x
k
. Esta parte explicada tiene k grados de libertad.
5-26
El resto de la variabilidad estar recogida en los residuos, viniendo medida su
magnitud por la suma de cuadrados residual (ROMERO y ZUNI CA, 1993, cap. 11) :

n
j
j RESIDUAL
SC
1
2
con (n -1) k grados de libertad (ec. 5.23)
La diferencia:
RESIDUAL TOTAL EXPLICADA
SC SC SC (ec. 5.24)

es la parte de la variabilidad de y asociada a las variables explicat ivas.
Se define el coeficient e de det erminacin R
2
como (ROMERO y ZUNI CA, 1993, cap.
11):
TOTAL
EXPLICADA
SC
SC
R
2
(ec. 5.25)

Cuyos valores est n comprendidos ent re 0 y 1. Cuant o ms cercano a 1 sea R
2
, mayor
part e de la variabilidad const at ada de y est ar asociada a las variables explicat ivas
incluidas en el modelo (ROMERO y ZUNI CA, 1993, cap. 11).
Para est udiar la hipt esis nula de si al menos una de las variables explicat ivas
est udiadas t iene efect o poblacional o si al menos un
i
es diferent e de cero, se usa el
siguiente resultado (ROMERO y ZUNI CA, 1993, cap. 11):

Si:
Ho:
1
=
2
= =
k
= 0
Ent onces,
RESIDUAL
EXPLICADA
RESIDUAL
EXPLICADA
CM
CM
k n SC
k SC

) 1 /(
/
F
, k, (n-1-k)


H
o
se rechaza si F
o
> F
, k, (n-1-k)
; H
1
al menos un
i
0

5.3.3 SI GNI FI CACI ON DEL EFECTO DE UNA VARI ABLE X
i


Dado el modelo:
+ + + + +
k k o
x x x y .......
2 2 1 1

5-27
La variable x
i
no influye sobre y si y solo s
i
= 0
La prueba para cont rast ar las hipt esis:
H
o
:
i
= 0
y
H
1
:
i
0
que implica un efect o poblacional de x
i
sobre y, puede realizarse de dos formas
equivalent es (ROMERO y ZUNI CA, 1993, cap. 11).

a) FORMA DE PRUEBA 1 (ROMERO y ZUNI CA, 1993, cap. 11):

Si
i
= 0 entonces
k n
i
i
t
Sb
b

1 , 2 /

Por tanto si
k n
i
i
t
Sb
b

>
1 , 2 /
debe rechazarse H
o
, y se deduce que x
i
influye sobre y.

b) FORMA DE PRUEBA 2 (ROMERO y ZUNI CA, 1993, cap. 11) :


Sean:

CM
residual
, el cuadrado medio residual del aj ust e con t odas las variables con n -1 - k grados
de libertad. Calculado a partir de:

k n
y x b y y
I n
SC
CM
residual
residual

1 1
r r
(ec. 5.26)

SC
residual
, el incremento de la suma de cuadrados residual si se repite el aj uste sin incluir a
x
i
entre las variables explicativas.
Si
i
= 0 , ent onces SC
residual
/ CM
residual
se dist ribuye como una F
,1, n-1-k
, por t ant o se
rechaza H
o
si el cociente anterior es mayor que la variable F.
Mientras que si
i
0, la suma de cuadrados residual se increment ar significat ivament e si
se elimina la variable x
i
del modelo, por tanto:

( SC
residual
/ CM
residual
) > F
,1, n-1-k

Y el efecto de x
i
es significat ivo.
5-28
5.3.4 PRUEBA GENERAL PARA EL CONTRASTE DE HI POTESI S EN
MODELOS DE REGRESI ON.

Sea un modelo lineal:
+ + + + +
k k o
x x x y .......
2 2 1 1


Se desea contrastar la hiptesis nula que implica r restricciones sobre los valores de
i
(ROMERO y ZUNI CA, 1993, cap. 11)
.
Ej emplos:

1. H
o
:
2
= 0
3
= 0
4
= 0 ( 3 restricciones )
2. H
o
:
3
=
1
( 1 restriccin )

Un procedimient o general para cont rast ar hiptesis de este tipo consiste en estudiar la
significacin estadstica del SC
residual
que se produce al restringir el modelo obligando a
que los est imadores b
i
verifiquen la hipt esis. De t al forma que (ROMERO y ZUNI CA, 1993,
cap. 11) :

Suma de cuadrados
resi dual
Grados de l i bert ad
Modelo restringido SC
r
n 1 k + r
Modelo completo SC
c
n 1 k
I ncrement o
SC
RESI DUAL
= SC
r
- SC
c

(siempre > 0)
r


Se demuest ra que si H
o
es cierta (implicando las r restricciones) (ROMERO y ZUNI CA,
1993, cap. 11)

) 1 ( k N
SC
r
SC
c
RESIDUAL

F
, r, n-1- k


Si H
o
es f alsa, ent onces (ROMERO y ZUNI CA, 1993, cap. 11),

5-29
) 1 ( k N
SC
r
SC
c
RESIDUAL

> F
, r, n-1- k



5.3.5 PREDI CCI ON EN MODELOS DE REGRESI ON MULTI PLE

Los intervalos de confianza al 100(1- )% para los
i
pueden calcularse como (JURAN y
GRYNA, 1997, cap. 23) :

ii k n i
c S t b

t
1 , 2 /
(ec. 5.27)

Por ot ra part e, el int ervalo de confianza para el valor medio poblacional de y para
determinados valores de las x
i
, vendr dado como (ROMERO y ZUNI CA, 1993, cap. 11) :

' 1 ' 2
1 , 2 /
) (
t t k n t
x x x x S t y
r r

t

(ec. 5.28)

Donde (ROMERO y ZUNI CA, 1993, cap. 11) :

'

kt
t
x
x
x
M
r 1
1
y
) 1 (
1
2
2
+

k n
CM S
N
j
RESIDUAL



5.3.6 VALI DACI ON DEL MODELO: ANALI SI S DE RESI DUOS

Todo el anlisis inferencial expuesto se realiza baj o la hiptesis de que el modelo
postulado es correcto. Resulta por tanto esencial utilizar adicionalmente la informacin
contenida en los datos para cuestionarse la adecuacin de dicho modelo (ROMERO y
ZUNI CA, 1993, cap. 11).
Debe recordarse que el modelo se sintetiza en la ecuacin:

+ + + + +
k k o
x x x y .......
2 2 1 1

5-30
Donde los residuos son N(0,
2
) e independientes.
Dist int as cuest iones pueden plant earse relat ivas a la adecuacin o no de est as hipt esis
ant e unos dat os concret os (ROMERO y ZUNI CA, 1993, cap. 11):

Es admisible el que los residuos, , se distribuyen normalmente?
Hay algn dato claramente anmalo?
Es admisible que la varianza de los errores no depende de los valores
de las variables explicat ivas?
Es realmente lineal la relacin entre la E(y) y una x
i
cuant it at iva?

La herramient a ms poderosa para analizar est as cuest iones es el anlisis de residuos
(ROMERO y ZUNI CA, 1993, cap. 11).
El residuo est imado para cada observacin e
t
no es ms que la diferencia ent re el valor
realment e observado y
t
y el valor medio previsto a partir del modelo estimado para esos
valores concret os de las variables explicat ivas (b
o
+ b
1
x
1t
+ .+ b
k
x
k t
) (ROMERO y ZUNI CA,
1993, cap. 11)
e
t
= y
t
( b
o
+ b
1
x
1t
+ .+ b
k
x
k t
) (ec. 5. 29)

Los residuos, son en realidad las est imaciones de los valores de las pert urbaciones
aleat orias
t
en cada observacin.
Determinadas representaciones grficas de los residuos son extremadamente tiles para
responder a algunas cuest iones que se plant ean en la fase de validacin de modelos de
regresin (ROMERO y ZUNI CA, 1993, cap. 11) :

1. Un grfico de los residuos e
t
en papel probabilst ico normal permit e est udiar si es
admisible la hipt esis de normalidad, as como det ect ar posibles observaciones
anmalas. Ver grafico 5. 7.

2. Un grfico de los cuadrados de los residuos frente a las diferentes x
i
puede poner
de manifiest o el hecho de que algunas de las variables explicat ivas afect an a las
varianzas de las y
t
,. En situaciones de este tipo, un anlisis aproximado de los
5-31
efectos sobre la varianza puede llevarse a cabo realizando un aj uste de regresin
mltiple de los valores de los e
t
2
frent e a las x
it
.

3. Un grfico de los residuos e
t
frent e a los valores previst os para cada observacin
y puede poner de manifiest o la exist encia de relaciones no lineales o bien de
dependencia de los residuos, como en los casos presentados en el grafico 5. 8
respectivamente. Para estudiar que variables son responsables de esta no
linealidad, son especialment e t iles los grficos del t ipo component e ms residuo
en los que se represent an frent e a los valores de x
it
de una variable explicat iva los
valores y
t
, una vez eliminados de los mismos los efectos estimados de las restantes
variables explicat ivas. Por ej emplo, si se t rat a de est udiar la nat uraleza del efect o
de x
1
:
It I t o t t
It I t t o t
x x Y E x f
x x x f Y E


+ + +
+ + + +
.... ( ) ( ) (
.... ) ( ) (
2 2 1
2 2 1


Que puede estimarse a partir de:

t t It I t o t
e x b x b x b b Y + + + +
1 1 2 2
) .... ( (ec. 5. 30)

(componente + residuo)


















FI GURA 5.7 GRAFI CO DE NORMALI DAD DE LOS RESI DUOS

0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
-0.03 -0.02 -0.01 0 0.01 0.02 0.03
5-32

FI GURA 5. 8 COMPORTAMI ENTO DE LOS RESI DUOS CONTRA X
i
Y VALORES
PREDI CHOS


5.4 REGRESI ON NO LI NEAL

Al modelar una relacin como la que se present a en la figura 5.1, en ocasiones resulta una
relacin no lineal. Cuando el comport amient o es no lineal, el modelo ms apropiado para
un conj unt o part icular de dat os viene definido segn el modo en que se present an los
coeficientes desconocidos. Si los coeficientes se pueden sumar linealmente, despus de
aplicar una linealizacin al modelo, se t iene un modelo lineal. Por el cont rario, si los
coeficient es no se pueden sumar en forma lineal, el modelo se conoce como no lineal.
Ej emplos de estos dos tipos de modelos son como sigue (PERRY, 1997, cap. 3):

Tipo lineal
5-33
2
2
ln
x
c
x
b
a y
x c bx a y
cx bx a y
+ +
+ +
+ +
(ec. 5. 31)

Tipo no lineal

( ) x c
b
a y
cx bx a y
be a y
c
cx
+
+
+ +
+
) 1 /( ) (
2 1
(ec. 5. 32)

Para el primero se puede aplicar en forma directa el mtodo de los mnimos cuadrados
para det erminar los valores pt imos de los parmet ros, usando posiblement e las variables
originales t ransformadas segn lo sugiere la linealizacin del modelo (FOGLER, 2001, cap.
5).
Para la regresin no lineal, el principio de los mnimos cuadrados no se puede aplicar
direct ament e, porque las ecuaciones normales result ant es cont ienen coeficient es
desconocidos en forma no lineal y no es posible resolverlas en forma directa. Por
consiguient e, es necesario ut ilizar un procedimient o it erat ivo de clculo, en el que se
buscan los valores de los parmetros que minimizan la suma de los cuadrados de las
diferencias ent re los valores medidos y los valores calculados para todos los puntos de
dat os (PERRY, 1997, cap. 3) (FOGLER, 2001, cap. 5) .
No exist en mt odos analt icos para det erminar el modelo ms adecuado para un conj unt o
part icular de dat os. Sin embargo, en muchos casos se pueden seleccionar modelos
posibles y razonables con base en la nat uraleza de la aplicacin (MI LLER y MI LLER, 1993,
cap. 5) .
Para una regresin simple y cuando no se conoce la forma funcional se pueden utilizar las
curvas generales de t endencia como gua inicial de seleccin. Para desarrollar una relacin
viable y adecuada, se debe aj ust ar a los dat os una variedad de funciones posibles. La
seleccin ms adecuada se logra cuando se dispone de observaciones duplicadas. En estos
casos, cabe asegurar direct ament e la fact ibilidad de una forma particular de modelo,
mediante lo que se conoce como anl i si s de f al t a de aj ust e (PERRY, 1997, cap. 3).
5-34
En est as aplicaciones, la prctica comn consiste en concentrarse en el desarrollo y clculo
del modelo, en lugar de hacerlo en los aspect os est adst icos. En general, la regresin no
lineal slo debe aplicarse a problemas en los que exist e una asociacin clara y bien
definida ent re las variables; en consecuencia, la prueba de hipt esis en la significacin del
aj ust e es en ciert o modo risible. Adems, la generalizacin de la t eora para los int ervalos
asociados de confianza de los coeficient es no lineales no est bien desarrollada (PERRY,
1997, cap. 3) .

5.5 EJEMPLOS DE APLI CACI N DE ANALI SI S DE REGRESI ON

5.5.1 REGRESI ON LI NEAL SI MPLE

1. Los siguientes valores son las reas relativas de los picos de los cromatogramas
correspondient es a unas soluciones est ndar de met ilvinilcet ona (MVK) (MI LLER y
MI LLER, 1993, cap.5) .


Concent raci n
MVK, mol es/ l
rea rel at i va del pi co
0.50 3.76
1.50 9. 16
2.50 15.03
3.50 20.42
4.50 25.33
5.50 31.97


a) Evaluar el aj uste de un modelo de regresin lineal simple a estos datos.
b) Las reas relat ivas de los dos picos correspondient es a dos muest ras de
MVK fueron 6.3 y 27.5. Est ime los limit es de confianza para las
concentraciones de MVK en cada solucin.
c) Suponer que los resultados del apartado b) representan una nica medida
as como la media de cuatro mediciones. Calcular en ambos casos las
desviaciones est ndar absolut a y relat iva.

SOLUCI ON

a) El modelo a aj ustar viene dado por:

+ + x y
o 1

Donde los estimadores mnimo cuadrticos de
o
y
1
vienen dados
por:

5-35
( )( )
( )


2 1
1
x x
y y x x
b
x b y b
m
m m
o

Con
n
x
x
n
y
y
m
m



Para los datos del problema se presentan los clculos en la tabla E51. 1

Tabla E51.1. dat os para el problema de det erminacin de concent raciones de MVK

Concent r aci n
MVK, mol es/ l
r ea
r el at i va
del pi co
x x
m


y y
m


) )( ( y y x x
m m


2
) ( x x
m

2
) ( y y
m

0.50 3.76 -2.5 -13.85 34.625 6.25 191.823
1.50 9.16 -1.5 -8.45 12.675 2.25 71.403
2.50 15.03 -0.5 -2.58 1.290 0.25 6.656
3.50 20.42 0.5 2.81 1.405 0.25 7.896
4.50 25.33 1.5 7.72 11.58 2.25 59.598
5.50 31.97 2.5 14.36 35.9 6.25 206.210
3 6 / 18 x 61 . 17 y 97.475 17.5 543.585


Las estimaciones de los parmetros del modelo son:

( )( )
( )
57 . 5
5 . 17
475 . 97
9 . 0 ) 3 ( * ) 57 . 5 ( 61 . 17
2 1
1

x x
y y x x
b
x b y b
m
m m
o

El coeficiente de determinacin para el modelo viene dado por:

( )( )
( )
9988 . 0
585 . 543
475 . 97 * 57 . 5
) (
) (
2
1
2
2

y y
y y x x b
y y
regresion SC
R
m
m m
m


As pues la ecuacin de la lnea es:

rea del pico = 0.9 + 5.57concentracin

La varianza residual, tomando como base el clculo de residuos de la tabla E51. 2 es:

( )
4030 . 0
2 6
64975 . 0
2


n
y y
S
i i


5-36
TABLA E51.2 CALCULO DE RESI DUOS


La varianza asociada a cada coeficiente viene dada por:


( )
09633 . 0
5 . 17
4030 . 0
5 . 0
2
1

x x
S
Sb
m


332555 . 0
) 5 . 71 /( ) 18 ( 6
1
* 4030 . 0
/ ) (
1
2 2 2

i i
o
x x n
S Sb

La prueba de significacin se har a partir de la prueba 1, del modelo de regresin
lineal simple:

Par met r o Val or desv. est ndar t o
b
o
0.9 0.09633 9.342884
b
1
5.57 0.33256 16.7488573
t
0.025,4
= 2.776

De acuerdo a esta prueba, ambas estimaciones son significativamente distintas de cero
a un nivel de significancia del 5%.

La validacin del modelo viene descrita por el anlisis de residuos. Al graficar el
comportamiento de los residuos frente a los valores predichos y valores de x, grafica
E51.1, se observa que esta grfica no revela la existencia de una relacin no lineal:

Grafico E51.1 a) residuos versus valores predichos; b) residuos cont ra valores de x








Concent r aci n
MVK, mol es/ l
(x)
r ea
r el at i va
del pi co
( y)
y

= 0.9
+ 5.57x

Resi duos
y y
i

Resi duos
est andar i zados
( Resi duos)
2

0.50 3.76 3.685 0.075 0.230362 0.005625
1.50 9.16 9.255 -0.095 -0.249992 0.009025
2.50 15.03 14.825 0.205 0.5027 0.042025
3.50 20.42 20.395 0.025 0.0554291 0.000625
4.50 25.33 25.965 -0.635 -4.80987 0.403225
5.50 31.97 31.535 0.435 0.189225
t ot al . 0.64975
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0 10 20 30 40
valores predichos
r
e
s
i
d
u
o
s
5-37












El grfico de los residuos en papel probabilstico normal, grafico E51.2, permit e
observar que los residuos se distribuyen normalmente:


GRAFI CA E51.2 GRAFI CO DE PROBABI LI DAD NORMAL DE LOS RESI DUOS ESTANDARI ZADOS














Los intervalos de confianza para cada parmetro estimado son:

( )
27 . 0 57 . 5
5 . 17
4030 . 0 * 776 . 2
57 . 5
2
2 , 2 /
1
t t

x x
S t
b
m
n



b) Las reas relativas de los dos picos correspondientes a dos muestras de MVK
fueron 6.3 y 27.5. Estime los limites de confianza para las concentraciones de
MVK en cada solucin. Los lmites de confianza vienen dados por:

Para el rea de 6.3, se tiene:

l moles
y
x
o
o
/ 9695 . 0
57 . 5
9 . 0 3 . 6
57 . 5
9 . 0



Para el rea de 27.5, se tiene:
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
-0.03 -0.02 -0.01 0 0.01 0.02 0.03
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0 1 2 3 4 5 6
x
r
e
s
i
d
u
o
s
5-38
l moles
y
x
o
o
/ 776 . 4
57 . 5
9 . 0 5 . 27
57 . 5
9 . 0



c) Suponer que los result ados para el pico de rea 6.3 del apartado b)
representan la media de cuatro mediciones. Calcular las desviaciones
estndar absoluta y relativa:

Para 0.9695 moles/ l

Desviacin absoluta:


0584 . 0
) 5 . 17 ( * 57 . 5
) 61 . 17 3 . 6 (
6
1
4
1
57 . 5
4030 . 0
) (
) ( 1 1
2
2
2 2
1
2
1

+ +

+ +

x x b
y y
n k b
S
s
i
c
xo


Desviacin relat iva:

00928 . 0
3 . 6
0584 . 0

o
xo
y
s




5.5.2 REGRESI ON LI NEAL MULTI PLE

2. El rendimiento de una reaccin qumica depende de la temperatura de operacin y
de la concentracin inicial del reactivo. Efectu un anlisis de regresin a los
siguient es dat os (MONTGOMERY, 1991, cap. 15) .

Rendi mi ent o concent raci n t emperat ura
81 1 150
89 1 180
83 2 150
91 2 180
79 1 150
87 1 180
84 2 150
90 2 180

SOLUCI ON

Se aj ustara el modelo lineal: + + +
2 2 1 1
x x y
o
a los datos, el modelo puede
expresarse en t rminos mat riciales mediant e:

5-39
1
1
1
1
1
1
1
1
1
1
1
]
1

+
1
1
1
]
1

1
1
1
1
1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
1
1
1
1
]
1

8
7
6
5
4
3
2
1
2
1
180 2 1
150 2 1
180 1 1
150 1 1
180 2 1
150 2 1
180 1 1
150 1 1
90
84
87
79
91
83
89
81

o

5 . 85 y

La estimacin de los coeficientes viene dada por

1
1
1
]
1



25 . 0
0 . 3
75 . 39
) (
1
y x x x b
r
r


La varianza residual es ent onces:

04881 . 1
5
5 . 5
5
)) ..... ( (
) 1 2 ( 8
1
2
1 1
1
2
2

+ + +


n
IJ I o j
n
j
x b x b b y
S



Los residuos vienen dados en la tabla E52.1:

TABLA E52.1
y
i

i i
y y (
i i
y y )
2
( y y
i
)
2

81 0.75 0.5625 20.25
89 1.25 1.5625 12.25
83 -0.25 0.0625 6.25
91 0.25 0.0625 30.25
79 -1.25 1.5625 42.25
87 -0.75 0.5625 2.25
84 0.75 0.5625 2.25
90 -0.75 0.5625 20.25
Tot al 5.5 136

El coeficiente de determinacin dado a partir de:
( )
( )
959559 . 0
136
5 . 5 136
1
2
1
2
1
2
2

n j
j
j
n
j
j
n j
j
j
TOTAL
EXPLICADA
y y
y y
SC
SC
R


5-40
Las varianzas asociadas a cada uno de los estimadores de los parmetros que son dadas a
partir de
ii bi
c S S donde c
ii
es el elemento i, i de la diagonal principal de ( )
1
x x , se
presentan en la tabla E52.2:

TABLA E52.2
Parmet ro estimacin S
bi

o 39.75 4.24411

1 3. 0 0.74162

2 0.25 0.02472

La significacin global del aj uste se presenta en la tabla E52.3:

TABLA E52. 3
fuent e SC g.l. CM F
o
explicada 130.5 2 65.25 59.32
residuos 5. 5 5 1. 1
F
, I , ( n-1-I )
= F
0.05, 2, 5
= 5.79

Al comparar F
o
con el F
0. 05, 2, 5
puede concluirse que el modelo es significativo y que al
menos un
i
es distinto de cero.
La significancia del ef ect o de cada X
i
se probara a partir de la prueba 1, basada en una
prueba t, dicho anlisis se presenta a continuacin:

Parmet ro estimacin S
bi
t
o

o 39.75 4.24411 9.366

1 3. 0 0.74162 4.045

2 0.25 0.02472 10.11


t
/ 2, n-1-I
= t
0.025,5
= 2.571

Al comparar el t
o
asociado a cada
i
con la t
0.025,5
puede observarse que los efectos tanto
de la temperatura como de la concentracin son significativos a un nivel de confianza del
95%.
El modelo aj ustado es por tanto:

a temperatur ion concentrac y * 25 . 0 * 0 . 3 75 . 39 + +

Los intervalos de confianza al 95% para cada coeficiente del modelo de regresin son:


Parmet ro est imacin b
i
S
bi
limite
inferior
limite
superior

o 39.75 4.24411 28.8401 50.6599

1 3. 0 0.74162 1.0936 4.9064

2 0.25 0.02472 0.18645 0.31355


El intervalo de conf ianza para los b
i
se calcul como:
bi i
S t b
5 , 025 . 0
t

5-41
La validacin del modelo se har en base al anlisis de los residuos, a travs de los
siguientes grficos: a) grafico de probabilidad normal de los residuos (figura E52.1); b)
grafico de los residuos frent e a los valores predichos (figura E52.2 a); c) grficos de los
residuos frente a cada variable (figura E52.2 b) :

FI GURA E52.1 GRAFI CO DE PROBABI LI DAD NORMAL DE LOS RESI DUOS













Segn el grafico ant erior puede observarse que la dist ribucin de los residuos es
normal.


FIGURA E52.2 GRAFICO DE RESIDUOS VERSUS VALORES PREDICHOS Y VALORES DE X
i













(a)










(b)
or den resi duo f racci n
1 -1.25 0.0625
2 -0.75 0.1875
3 -0.75 0.3125
4 -0.25 0.4375
5 0.25 0.5625
6 0.75 0.6875
7 0.75 0.8125
8 1.25 0.9375
valores
predichos
y
residuos
80.25 0.75
87.75 1.25
83.25 -0.25
90.75 0.25
80.25 -1.25
87.75 -0.75
83.25 0.75
90.75 -0.75
0
0.2
0.4
0.6
0.8
1
-1.5 -0.5 0.5 1.5
residuos
p
o
r
c
e
n
t
a
j
e
-1.5
-1
-0.5
0
0.5
1
1.5
0 1 2 3
concentracion
r
e
s
i
d
u
o
s
-1.5
-1
-0.5
0
0.5
1
1.5
145 150 155 160 165 170 175 180 185
temperatura
r
e
s
i
d
u
o
s
-1.5
-1
-0.5
0
0.5
1
1.5
75 80 85 90 95
VALORES PREDICHOS
R
E
S
I
D
U
O
S
5-42
En la grafica de residuos cont ra valores predichos parece observarse un
comport amient o curvilneo, sin embargo, por venir est e aj ust e de un diseo 2
2
con
2 replicas no se puede t rat ar de aj ust ar un modelo cuadrt ico, ya que para est o se
necesita un diseo con al menos t res niveles para cada fact or. Un anlisis de los
grficos de los residuos contra las variables concentracin y temperatura permite
concluir que en cuanto al factor concentracin se presenta un efecto muy
importante sobre la variabilidad del rendimient o, ya que una mayor concent racin
reduce la variabilidad en cuanto al rendimiento de la reaccin qumica.


5.5.3 REGRESI ON NO LI NEAL

3. La hidrogenacin (H) de etileno para formar etano (EA),
6 2 4 2 2
H C H C H + , se
efect a sobre un catalizador de cobalto y molibdeno [Collect . Czech. Chem.
Comn., 51,2760 (1988)]. Realice un anlisis de mnimos cuadrados no lineal con
los datos que se dan en la tabla a continuacin:


Nmer o
de
prueba
Vel oc. de
reacci n
( mol / kg
cat . s)
P
E

(at m)
P
EA

( at m)
P
H
(at m)
1 1.04 1 1 1
2 3.13 1 1 3
3 5.21 1 1 5
4 3.82 3 1 3
5 4.19 5 1 3
6 2.391 0. 5 1 3
7 3.867 0. 5 0. 5 5
8 2.199 0. 5 3 3
9 0.75 0. 5 5 1


Determine cul de las siguientes leyes de velocidad es la que mej or describe los datos:

( a)
E E
H E
A
P k
P kP
r
+

1
; (b)
b
H
a
E A
P kP r

SOLUCI ON

(a) MODELO:
E E
H E
A
P k
P kP
r
+

1
;
El modelo es un modelo no lineal, sin embargo, puede ser linealizable al
trabaj ar con el inverso de -r
A
, de la siguiente forma:


5-43

,
_

,
_

H
E
H E H E
E E
H E A
P k
k
P P k P kP
P k
P kP r
1 1 1 1 1


Los parmetros del modelo son k y k
E
. Para el anlisis de mnimos cuadrados
se podr trabaj ar con una regresin lineal mltiple sobre las variables
transformadas, en la tabla E53.1 se presenta esta trasformacin de variables:

TABLA E53.1

1/ -r
A
1/ ( P
E
* P
H
) 1/ P
H

0.96153846 1 1
0.31948882 0.33333333 0.33333333
0.19193858 0. 2 0. 2
0.2617801 0.11111111 0.33333333
0.23866348 0. 06666667 0.33333333
0.41823505 0.66666667 0.33333333
0.2585984 0. 4 0. 2
0.45475216 0.66666667 0.33333333
1. 33333333 2 1


El anlisis del modelo de regresin lineal mltiple puede realizarse tal como se
presenta en el ej ercicio 2, para las variables t ransformadas:

1
1
1
1
1
1
1
1
1
1
1
1
]
1

+
1
]
1

1
1
1
1
1
1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
1
1
1
1
1
]
1

98
8
7
6
5
4
3
2
1
/
/ 1
1 2 0
3333 . 0 6667 . 0 0
2 . 0 4 . 0 0
3333 . 0 6667 . 0 0
3333 . 0 0667 . 0 0
3333 . 0 1111 . 0 0
2 . 0 2 . 0 0
3333 . 0 3333 . 0 0
1 1 0
3333 . 1
4548 . 0
2586 . 0
4182 . 0
2387 . 0
2618 . 0
1919 . 0
3195 . 0
9615 . 0

k k
k
E


La estimacin de los coeficientes viene dada por

1
]
1



6221 . 0
3507 . 0
) (
1
y x x x b
r
r


El coeficiente de determinacin es dado a partir de:

5-44
( )
( )
99894 . 0
1
2
1
2
1
2
2

n j
j
j j
n
j
j
n j
j
j j
TOTAL
EXPLICADA
y y
y y
SC
SC
R



Las varianzas asociadas a cada uno de los estimadores de los parmetros
que son dadas a partir de
ii bi
c S S donde c
ii
es el elemento i, i de la
diagonal principal de ( )
1
x x , se presentan en la tabla E53. 2:

TABLA E53.2

Parmet ro estimacin S
bi

1/ k

0.35069 0.01419
k
E
/ k 0.62207 0.02175

La significacin global del aj uste se presenta en la E53. 3:

TABLA E53.3

fuent e SC g.l. MC F
o
explicada 1.2253 2 0.61264 3293. 38
residuos 0.00130 7 0.0001857
F
, I , ( n-1-I )
= F
0.05, 2, 7
= 4.74

Al comparar F
o
con el F
0.05, 2,7
puede concluirse que el modelo es
significat ivo, siendo la suma de cuadrados mnima de 0.0013.
En la tabla E53.4 se presentan los residuos calculados y en el grafico E53.1
se presenta el comportamiento de los residuos contra los valores predichos
por el modelo.

TABLA E53.4 GRAFI CO E53.1

-0.025
-0.02
-0.015
-0.01
-0.005
0
0.005
0.01
0.015
0.02
0 0.5 1 1.5
VALORES PREDICHOS
R
E
S
I
D
U
O
S


Los valores de k y k
E
para el modelo son por tanto:
Observacin
Pronst ico
para Y
Residuos
0.961546 0.972768 -0.011221
0.319489 0.324260 -0.004767
0.191938 0.194554 -0.002615
0.261780 0.246324 0.015456
0.238663 0.230738 0.007925
0.418235 0.441153 -0.022918
0.258510 0.264692 -0.006094
0.454752 0.441153 0.013599
1.333333 1.323460 0.009873
5-45
774 . 1 ) 852 . 2 ( * ) 6221 . 0 ( 6221 . 0
852 . 2 35069 . 0 / 1


k k
k
E


Y por tanto, el modelo queda escrito como:
E
H E
A
P
P P
r
774 . 1 1
852 . 2
+


Est e ej ercicio tambin puede desarrollarse usando la funcin regresin de la opcin
anlisis de dat os del men Herramient as en la hoj a de clculo de Excel. En el archivo
regresin no lineal m1. xls, se presentan las salidas para dicha aplicacin:

r egr esi n no l i neal
m1. xls


(b) MODELO:
b
H
a
E A
P kP r

Al igual que en el caso anterior el modelo no es un modelo lineal, sin
embargo, es linealizable al aplicar una transformacin logartmica, como se
presenta a continuacin:

H E A
b
H
a
E A
P b P a k r P kP r ln ln ln ) ln( + +

Los parmetros del modelo en este caso son lnk, a y b. Para el anlisis de
mnimos cuadrados se podr trabaj ar con una regresin lineal mltiple sobre
las variables transformadas. En la tabla E53. 5 se presenta esta
trasformacin de variables:

TABLA E53. 5
Ln( - r
A
) l n( P
E
) Ln( P
H
)
0.0392 0.0000 0.0000
1.1410 0.0000 1.0986
1.6506 0.0000 1.6094
1.3403 1.0986 1.0986
1.4327 1.6094 1.0986
0.8717 -0.6931 1.0986
1.3525 -0.6931 1.6094
0.7880 -0.6931 1.0986
-0.2877 -0.6931 0.0000

El anlisis del modelo de regresin lineal mltiple puede realizarse tal como se
present a en el ej ercicio 2, para las variables t ransformadas:

5-46
1
1
1
1
1
1
1
1
1
1
1
1
]
1

+
1
1
1
]
1

1
1
1
1
1
1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
1
1
1
1
1
]
1

98
8
7
6
5
4
3
2
1
ln
0000 . 0 6931 . 0 1
0986 . 1 6931 . 0 1
6094 . 1 6931 . 0 1
0986 . 1 6931 . 0 1
0986 . 1 6094 . 1 1
0986 . 1 0986 . 1 1
6094 . 1 0000 . 0 1
0986 . 1 0000 . 0 1
0000 . 0 0000 . 0 1
2877 . 0
7880 . 0
3525 . 1
8717 . 0
4327 . 1
3403 . 1
6506 . 1
1410 . 1
0392 . 0

b
a
k


La estimacin de los coeficientes viene dada por

1
1
1
]
1



05384 . 1
26719 . 0
10934 . 0
) (
1
y x x x b
r
r


El coeficiente de determinacin es dado a partir de:

( )
( )
9898 . 0
1
2
1
2
1
2
2

n j
j
j j
n
j
j
n j
j
j j
TOTAL
EXPLICADA
y y
y y
SC
SC
R



Las varianzas asociadas a cada uno de los estimadores de los parmetros que son dadas a
partir de
ii bi
c S S donde c
ii
es el elemento i, i de la diagonal principal de ( )
1
x x , se
presentan en la tabla E53. 6:

TABLA E53. 6
Parmet ro est imacin S
bi

ln k

-0.042239026 0.061462455
a 0.271021234 0.028559749
b 1.001607145 0.051953273

La significacin global del aj uste se presenta en la E53. 7:

TABLA E53. 7
fuent e SC g.l. MC F
o
explicada 3.427844373 2 1.713922186 293.540846
residuos 0.035032716 6 0.005838786
F
, I , ( n-1-I )
= F
0.05, 2, 6
= 5. 14

Al comparar F
o
con el F
0.05, 2, 6
puede concluirse que el modelo es significat ivo, siendo la
suma de cuadrados mnima de 0.03503.
5-47
En la t abla E53.8 se present an los residuos calculados y en el grafico E53.2 se present a el
comportamiento de los residuos contra los valores predichos por el modelo.


TABLA E53.8 GRAFI CO E53.2

-0.1
-0.08
-0.06
-0.04
-0.02
0
0.02
0.04
0.06
0.08
0.1
-0.5 0 0.5 1 1.5 2
VALORES PREDICHOS
R
E
S
I
D
U
O
S

Los valores de k, a y b para el modelo son por tanto:

001 . 1
271 . 0
9586 . 0 ) 04224 . 0 (


b
a
e k


Y el modelo queda escrito como:
H E A
P P r
27 . 0
9586 . 0

Est e ej ercicio t ambin puede desarrollarse usando la funcin regresin de la opcin
anlisis de dat os del men Herramient as en la hoj a de clculo de Excel. En el archivo
regresin no lineal m2. xls, se presentan las salidas para dicha aplicacin:

Regresin no lineal
m2.xls


En funcin de la comparacin del R
2
y de la MCE (ver t abla E53.7) para ambos modelos
puede concluirse que el modelo que mej or representa la ley de velocidad de los datos es el
modelo del literal a).

TABLA E53.7
Modelo R
2
MCE
E
H E
A
P
P P
r
774 . 1 1
852 . 2
+

0.9989 0. 0001857
H E A
P P r
27 . 0
9586 . 0

0.9898 0.005838
Observacin
Pronst ico
para Y
Residuos
0.0392 -0.042239 0.0814597
1.1410 1.0581389 0.0828941
1.6506 1.5697855 0.0807944
1.3403 1.3558862 -0.0156357
1.4327 1.4943307 -0.0616300
0.8717 0.8702813 0.0014304
1.3525 1.3819279 -0.0294489
0.7880 0.8702813 -0.0822786
-0.2877 -0.230097 -0.0575854
5-48
5.5.4 OTROS TEMAS DE APLI CACI N DE LA DE REGRESI ON LI NEAL
AL ANALI SI S QUI MI CO

4. Una determinacin con un electrodo selectivo de iones (ESI ) de sulfato procedente
de sulfato reducido por bacterias, se compar con una determinacin gravimtrica.
Los result ados obt enidos se expresaron en miligramos de sulfuro, t al como se
presenta en la tabla a continuacin:


MUESTRA Mt odo
ESI
Gravimetra
1 108 105
2 12 16
3 152 113
4 3 0
5 106 108
6 11 11
7 128 141
8 12 11
9 160 182
10 128 118


Coment e sobre la conveniencia del mt odo ESI para est a det erminacin de sulfuro.
(Al-Hit t i, I .K., Moody, G.J. y Thomas, J.D.R., Analyst , 1983, 108, 43).

SOLUCI ON

El obj et ivo del problema es comparar el nuevo mt odo ESI con el mt odo
gravimtrico para la determinacin de sulfatos. Con los datos proporcionados la
comparacin de los mtodos puede hacerse a travs del uso de rectas de regresin. En
la prct ica de est e mt odo, el analist a con frecuencia desea realizar una prueba para
contrastar una ordenada en el origen significativamente diferente de cero, y una
pendient e significat ivament e diferent e de 1. Tales pruebas se realizan det erminando
los intervalos de confianza para
o
y
1
, generalmente al 95% de significancia.
Los result ados de los anlisis con los dos mt odos se represent aran en una lnea de
regresin, con los datos obtenidos por el mtodo gravimtrico en el ej e x y los que
result aron del ESI en el ej e y, ver grfico E54.1.











5-49
GRAFI CO E54.1
COMPARACION DE METODOS
METODO GRAVIMETRICO
M
E
T
O
D
O

E
S
I
0 40 80 120 160 200
0
40
80
120
160


Usando los mtodos de las secciones precedentes las estimaciones de los parmetros

o
y
1
, y de R son:

b
o
= 4.4337; b
1
= 0.929; R = 0.9697; S = 16.7264; S
b1
= 0.0857; S
bo
= 8.649

Los int ervalos de confianza al 95%, para los parmet ros son los siguientes
(
bi i
S t b
9 , 025 . 0
t ) :

b
o
= 4.4337 t 19.56 y b
1
= 0.929 t 0.1938

De est os result ados se desprende que la pendient e y la ordenada en el origen
calculadas no difieren significat ivament e de los valores ideales de 1 y 0
respectivamente, y por lo tanto no existen diferencias sistemticas entre la serie de
result ados. Sin embargo, el coeficient e de det erminacin es inferior al 99%, lo que
indica que alguno de los mtodos es menos preciso.

5. El cont enido de oro de una muestra de mar concentrada se determin por
espectrometra de absorcin atmica mediante el mtodo de las adiciones
estndar. Los resultados obtenidos fueron los siguientes (MI LLER y MI LLER, 1993,
cap.5) :

Or o aadi do
ng/ ml de
muest r a
concent r ada
absorbanci a
0 0.257
10 0.314
20 0.364
30 0.413
40 0.468
50 0.528
60 0.574
70 0.635
5-50
Est ime la concent racin de oro en la muest ra de agua de mar, y det ermine los lmit es
de confianza para esta estimacin.

SOLUCI ON

Basndose en las ecuaciones ya descrit as en el t ema 5.1, y usado el modo de
regresin lineal de la calculadora HP-49G, la est imacin de los coeficient es de
regresin es:

b
o
= 0.25692 ; b
1
= 0.00534881; R
2
= 0.99966

La razn ent re b
o
y b
1
proporciona la concentracin de oro en la muestra problema de
48.0331 ng/ ml. Los lmit es de confianza para est e result ado se pueden det erminar con
la ayuda de la ecuacin 5.15:

( )
2 / 1
2 2
1
2
1
1
1
1
]
1

x x b
y
n b
S
s
i
E


Aqu S = 0.0036939, y = 0.444, y ( )


2
x x
i
= 4200; S
E
= 1.5977 y los limites de
confianza son 48.0331t 2.447x1.5977, es decir 48.0331t 3.9096 ng/ ml.

6. La absorbancia de una serie de soluciones de cadmio fue det erminada 3 veces, los
result ados se exponen a cont inuacin:


Concentracin
mg/ l
1 2 3
0. 1 0.028 0.029 0.029
0. 3 0.084 0.083 0.081
0. 5 0.135 0.131 0.133
0. 7 0.180 0.181 0.183
0. 9 0.215 0.230 0.216

Determine: (a) La recta de regresin no ponderada; (b) La recta de
regresin ponderada; (c) Utilizando ambas rectas calcule los lmites de
confianza para la concentracin de una disolucin de cadmio que fue
medida dos veces con una absorbancia media de 0.191 (con s
i
=
0.0021).

SOLUCI ON

(a) Aplicando las ecuaciones 5.4 a la 5.12, con la concentracin
representada en el ej e x y la absorbancia en el ej e y. La estimacin de
los coeficientes de la recta no ponderada es la siguiente:

b
o
= 0.0087 y b
1
= 0.2410 (de ec. 5.4); R
2
= 0.9944 (de ec. 5.7);
5-51
S = 0.005486 (de ec. 5.8)

La desviacin estndar asociada a cada coeficiente y el calculo del
intervalo de confianza (ecs. 5.11 y 5.12) viene dado por:

Parmet ro estimacin S
bi
t
o
b
i
t tS
bi

o 0.0087 0.002877 3.0243 0.0087t0.0062

1 0.2410 0.005008 48.126 0.2410t0.0108


t
/ 2, 13
= 2.160

La estimacin de la concentracin de la solucin de cadmio cuando la
absorbancia es de 0.191, viene dada a partir de la ecuacin 5.14, y es:

756 . 0
241 . 0
0087 . 0 191 . 0
1

b
b y
x
o
o


La incertidumbre asociada al clculo de la concentracin viene dada por:

( )
xx
o
S
x x
n k b
S
c u
2
1
1 1
) (

+ +
con 2 . 1 ) (
1
2

n
j
j xx
x x S , k= 2, y t
/ 2, 13
= 2.160

( )
2 . 1
5 . 0 756 . 0
15
1
2
1
241 . 0
005486 . 0
) (
2

+ + c u = 0.018 mg/ l

(b) La recta ponderada viene dada a partir de las ecuaciones:
En donde:
n
y w
y
n
x w
x
x n x w
y x n y x w
b
n
s
s
w
i
i i
w
i
i i
w
i
w i i
i
w w i i i
i
i
i

,
_

2 2 1
2
2
(ec. 5.17)

Las sumatorias y clculos que involucran las ecuaciones se presentan a continuacin:



5-52

Concent racin
mg/ l
Absorbancia
promedio
desviacin
( S
i
)
1/ S
i
2
w
i
w
i
x
i
w
i
y
i
w
i
x
i
y
i
w
i
x
i
2

0. 1 0.028 0.00058 2972652 3.632956 0.363296 0.101723 0.010172 0.03633
0. 3 0.084 0.00153 427186.1 0.522075 0.156623 0.043854 0.013156 0.046987
0. 5 0.135 0.002 250000 0.305532 0.152766 0.041247 0.020623 0.076383
0. 7 0.180 0.00153 427186.1 0.522075 0.365453 0.093974 0.065782 0.255817
0. 9 0.215 0.00839 14206.14 0.017362 0.015626 0.003733 0.003359 0.014063
Sumas
4091230 5.0 1.053762 0.28453 0.113093 0.429579


De estos nmeros queda claro que
w
y = 0.28453/ 5 = 0.05691 y
w
x = 1.05376/ 5 =
0.2108, Mediante la ecuacin se calcula b
1
, como:

i
w i i
i
w w i i i
x n x w
y x n y x w
b
2 2
1
2561 . 0
) 2108 . 0 * 5 ( 429579 . 0
) 2108 . 0 * 05691 . 0 * 5 ( 113093 . 0
2



De f orma que b
o
esta dado por
w w
x b y
1
= 0.05691 (0.2561* 0.2108) = 0.00292.
Est os valores de b
o
y b
1
, se usan para estimar que la concentracin de cadmio de la
solucin para la absorbancia de 0.191 es de:

l mg
b
b y
x
o
o
/ 7348 . 0
256 . 0
00292 . 0 191 . 0
1



Con una incertidumbre en la estimacin calculada a partir de la ecuacin 5.16:

( ) ( )
( )
( )
2 / 1
2 2 2
1
2
1
,
,
2 / 1
2 2 2
1
2 2
,
1 1
2
1
1
]
1

+ +
1
1
]
1


w i i
w o
o
w xy
w xo
w i i w i i
w xy
x n x w b
y y
n w b
s
s
n
x n x w b y n y w
s


clculos adicionales:











w
i
y
i
2

0.002848
0.003684
0.005568
0.016915
0.000803
= 0.029818
5-53
De est a forma: S
xy,w
= 2.7386x10
-3
, w
o
= (1/ 0. 0021
2
)/ 818246 = 0.2771

( )
2 / 1
2 3
,
013602 . 0
05691 . 0 191 . 0
5
1
2771 . 0
1
2561 . 0
10 7386 . 2
1
]
1


+ +

x
s
w xo
= 0.02422

El int ervalo de confianza para la est imacin es: 0.7348 t 3.18* 0.02422 = 0.7348 t
0.0770 mg/ l.

7. Estime el lmite de deteccin para el anlisis de Metilvinilcetona del ej emplo 1.

SOLUCI ON

Una definicin que se usa comnmente en la bibliografa de qumica
analtica es que el lmite de deteccin es la cantidad de concentracin de
analito que proporciona una seal igual a la del blanco, y
B
, ms t res veces la
desviacin estndar del blanco, s
B
, lo anterior se explica con la ecuacin y y
B
=
3S
B
.
Para el ej emplo, con los valores y
B
(= b
o
) y S
B
(= S) calculados previamente
en el ej emplo 1, el valor de y en el lmite de deteccin es y = y
B
+ 3S
B
=
0.9 + 3* 0.4030, es decir, 2.109. El uso de la ecuacin de regresin conduce a un
lmite de deteccin de:

l moles
b
b y
x
o
o
/ 121 . 2
57 . 0
9 . 0 109 . 2
1


Es importante evitar la confusin entre el lmite de deteccin de una tcnica con su
sensibilidad. La sensibilidad de una tcnica se define correctamente como la
pendiente de una lnea de calibracin, es decir la variacin en la seal por cada
unidad de aumento de la concentracin del analito, y siempre que la
representacin sea lineal, puede ser medida en cualquier punto de ella. Por el
contrario, el limite de deteccin de un mtodo se calcula con ayuda de la zona de
representacin cercana al origen, y usando tanto la pendiente como la ordenada en
el origen.

8. En la determinacin de plomo en solucin acuosa por espectrofotometra por
absorcin at mica con at omizacin de cmara de grafit o, se obt uvieron los
siguient es result ados:

Conc. de Pb
ng/ ml
Absorbancia
10 0.05
25 0.17
50 0.32
100 0.60
200 1.07
300 1.40

5-54
Examine el int ervalo de calibracin lineal de est e experiment o. (Basado en Giri, S.K.,
Shields, C.K., Litt lej ohn, D. y Ottaway, J.M., Analyst, 1983, 108,244).
SOLUCI ON

El punto de partida para examinar el intervalo de calibracin lineal es elaborar una
grafica en la que la concent racin se coloque en el ej e de las absisas y la absorbancia
en el ej e de las ordenadas, tal como se muestra a continuacin:

















Como puede observarse existe una desviacin del comport amient o lineal del lt imo
punt o, sin embargo, es convenient e, aplicar clculos de regresin lineal(no ponderada)
a t odos los dat os; de la aplicacin de los mtodos del tema 5.1, y valindose del modo
regresin de la calculadora HP-49G, se tiene:

R = 0.99355; b
o
= 0.07033; b
1
= 0.00465

En este caso los residuos de la absorbancia, y, son:

y y r esi duos r esi duos
2
0.05 0.11687 -0.06687 0.00447
0.17 0.185583 -0.015583 0.000243
0.32 0.303034 0.016966 0.000288
0.60 0.535735 0.064265 0.00413
1.07 1.00114 0.06886 0.00474
1.40 1.46654 -0.06654 0.00443
Suma de
cuadrados
0.0191 0.018301

La tendencia de los valores de los residuos (que no debe esperarse ninguna, si no una
dist ribucin aleat oria de los residuos, si el modelo es complet ament e lineal) sugiere
que el ltimo valor de la tabla est probablemente fuera del intervalo lineal. Por otra
parte, adems, el coeficiente de correlacin lineal con un valor de 0.99355, aunque
parece marcar una buena correlacin lineal entre las variables, es baj o para el caso de
Identificacion del intervalo lineal
0
0.5
1
1.5
2
0 100 200 300 400
concentracin de Pb(ng/ml)
A
b
s
o
r
b
a
n
c
i
a
5-55
la aplicacin de una curva de calibracin lineal. En la situacin donde una grfica de
calibracin sea lineal sobre parte de su intervalo, y curva en otra, es de gran
importancia para el qumico analtico establecer el intervalo sobre el cual se supone
linealidad.
Si se elimina el ltimo punto, los parmetros de la recta de calibracin son:

R = 0.9972; b
o
= 0.0352; b
1
= 0.00528

Como puede observarse el valor de R es mayor que en el primer calculo. Los residuos
de los primeros seis puntos de esta segunda ecuacin de regresin son:

y y r esi duos r esi duos
2
0.05 0.0880195 -0.0380195 0.0014455
0.17 0.167269 0.002731 0.000007
0.32 0.29351 0.02649 0.0007
0.60 0.563516 0.036484 0.001331
1.07 1.09184 -0.02184 0.00048
Suma de
cuadrados
0.0039635

El uso de la segunda rect a de regresin muest ra que la absorbancia esperada para un
pat rn de 300 ng/ ml es de 1. 62, es decir el residuo es de -0.22, dado el valor de est e
ltimo residuo puede decirse que todava falta aj uste del intervalo lineal. Si se usan los
primeros cuat ro punt os para el clculo de una nueva lnea rect a, se obt ienen los
siguient es result ados:

R = 0.998; b
o
= 0.00738; b
1
= 0.006

Como puede observarse hay una mej ora en el coeficient e de correlacin, los valores
de los residuos son ahora:

y y r esi duos r esi duos
2
0.05 0.0674 -0.0174 0.0003
0.17 0.1574 0.0126 0.0002
0.32 0.3075 0.0125 0.0002
0.60 0.6076 -0.0076 0.0001
Suma de
cuadrados

0.0008

Como puede observarse el residuo del punt o correspondient e a 200 ng/ ml es de -0.14.
Puede concluirse, por t ant o, que el quint o punt o puede excluirse t ambin del int ervalo
lineal del mt odo. Pruebas similares aplicadas al cuart o punt o indican, al compararlos,
que probablement e deberan formar parte del intervalo lineal, y un analista podra usar
mtodos de regresin lineal en el intervalo de absorbancia de 0 0.6 con confianza.





5-56
REFERENCI AS BI BLI OGRAFI CAS

Bar t s A. P., Mar t or el l Ll abr s. X. T., Ci nt as. P. G. y Fer nandez. L. P. ( 2000) .
Mt odos est adst icos. Cont rol y mej ora de la calidad. Mxico: Alf aomega Grupo Edit or.

Box.G.E.P, Hunt er .N.G y Hunt er . J.S ( 1989) . Est adst ica para invest igadores. Espaa :
Revert .

Capi l l a Rom C. ( 1997) . Curso de anlisis de regresin, Maest ra en est adst ica. El
salvador: Universidad Polit cnica de Valencia.

Fer r .J. y Ri us F.X. ( 2000) . I nt roduccin al diseo est adst ico de experiment os.
Tarragona: Depart ament o de Qumica Analt ica y Qumica Orgnica. Universit at Rovira i
Virgili.

Fogl er H.S. ( 2001) . Element os de I ngeniera de las reacciones qumicas. Tercera Edicin.
Mxico: Pearson Educacin.

Juran J.M y Gryna F. M. ( 1998) . Manual de cont rol de calidad. ( 2 t omos) . Espaa:
McGRAW- HI LL.

Kenet t R. S. y Zacks S. ( 2000) . Est adst ica indust rial moderna. Diseo y cont rol de la
calidad y la conf iabilidad. Mxico: I nt ernat ional Thomson Edit ores.

Kuehl . R. O. ( 2001) . Diseo de experiment os. Principios est adst icos de diseo y anlisis
de invest igacin. Mxico: I nt ernat ional Thomson Edit ores.

Lawson J., Madr i gal J.L. y Er j avec J. ( 1992) . Est rat egias experiment ales para el
mej oramient o de la calidad en la indust ria. Mxico: Grupo Edit orial Hiberoamrica.

Mi l l er J. C. y Mi l l er J. N. ( 1993) . Est adst ica para qumica analt ica. Segunda edicin.
Wilmingt on, Delaware, E.U.A: Addison-Wesley I beroamericana, S.A.

Mont gomer y D. C. ( 1991) . Diseo y anlisis de experiment os. Mxico: Grupo Edit orial
I beroamrica.

Pr ez.C. ( 2002) . Est adst ica aplicada a t ravs de Excel. Espaa: Pearson Educaci n.

Per r y J. ( 1998) . Manual del I ngeniero qumico, vol. 1. Spt ima edicin. Mxico: McGRAW
HI LL.

Rami s R.G. ( 1997) . Curso de Quimiomet ra. Maest ra en Qumica analt ica. Espaa/
Nicaragua: Universidad de Valencia y Universidad Nacional Aut noma de Nicaragua.

Romer o V. R., Ziga L.R.( 1993) . Est adst ica, Proyect o de innovacin educat iva.
Espaa: Universidad Polit cnica de Valencia.

Skoog.D.A.y West .D.M. ( 2001) . Qumica analt ica. Spt ima edicin. Mxico: McGRAW
HI LL.

Potrebbero piacerti anche