Sei sulla pagina 1di 16

Universidad de Costa Rica

Facultad de Ingeniera
Escuela de Ingeniera Qumica
Tarea 3:
Modelo para frmula o parmetro (Ajuste de Datos)

Anlisis de Procesos II
Profesores:
Gerardo Chacn Valle
Erick Solano Carmona
Estudiantes:
Mnica Cerdas Chacn B11703
Anghie Villalobos Arce A96755
Alonso Hurtado Bolaos B23348

Grupo 5

San Jos, 2014

I. INTRODUCCIN
Cuando se estudia un fenmeno, muchas veces es necesaria la la
recoleccin de datos experimentales con el fin de poder agrupar los
datos segn su compartimiento y formar modelos matemticos que
constituyen una valiosa herramienta especialmente para los
profesionales en ciencia e ingeniera.
Sin embargo, un modelo
matemtico difcilmente ser aplicable para todos los casos de dicho
fenmeno, por lo que para confirmar, corroborar, estimar el error o la
incertidumbre asociado a este, es necesario comparar el modelo
experimental con otros ya existentes.
Esta comparacin se puede dar mediante el uso pruebas grficas o
estadsticas, esta comparacin cumple un papel de gran importancia
debido a que permite tener la certeza de que el mtodo que se desea
para el proyecto cumple con los niveles de confianza requeridos o no. Es
decir, permite obtener el modelo de mejor ajuste para una serie de
datos de inters.
Para este caso en especial se desea estudiar el equilibrio lquido
vapor de una mezcla binaria de cloroformo y metanol. Para ello se
compararan dos modelos: el emprico y el Pseudo Margulles. Los
modelos son ajustados con la volatilidad relativa, y se considera que la
desviacin aleatoria de la variable independiente, x, se integra al
evaluar la variable dependiente y.

II. OBJETIVOS
Objetivo general

Efectuar un anlisis estadstico para aceptar o rechazar los


modelos propuestos para el ajuste de datos correspondientes al
clculo de la volatilidad de una mezcla binaria cloroformo-metanol.

Objetivos especficos

Utilizar criterios de comparacin lgicos, sistemticos y


estadsticos vlidos para la escogencia del modelo.
Evaluar los modelos mediante la aplicacin de criterios
estadsticos para las pruebas de hiptesis con el fin de determinar
con la hiptesis nula si el modelo semi terico se cumple.
Determinar la tendencia y normalidad de los datos realizando un
anlisis de residuos.

III. MARCO TERICO


Un modelo matemtico se expresa utilizando los instrumentos de
la teora matemtica, declaraciones, relaciones, proposiciones
sustantivas de hechos o de contenidos simblicos. Estn implicadas
variables, parmetros, entidades y relaciones entre variables u
operaciones, para estudiar comportamientos de sistemas complejos
ante situaciones difciles de observar en la realidad.
Propiamente, un modelo es la descripcin de la relacin entre la
variable dependiente y las variables independientes, que se consideran
que lo afectan ms significativamente. Se expresa en forma de smbolos:
verbales, escritos, imgenes, esquemas, relaciones funcionales
matemticas, entre otros. La funcin analtica F(x) propuesta para la
regresin, por medio de una variable independiente x, se conoce como
modelo matemtico (Chacn, 2004).
Existe un Modelo emprico o curva de ajuste, el cual consiste en
proponer un modelo basado en el comportamiento de los datos
observados, al compararlo con la forma de alguna funcin conocida o
una serie polinomial, se utiliza cuando no se conoce el comportamiento
de las variables de inters y cuando se requieren estimaciones poco
precisas pero con una exactitud apropiada.
Una vez propuesto un modelo para el estudio en cuestin, la etapa
siguiente consiste en el clculo de los coeficientes que conforman la
funcin, a partir de datos observados, accin que suele llamarse,
estimacin de parmetros (Chacn, 2004). El modelo de estimacin que
involucra ms de una variable regresiva se llama modelo de regresin
mltiple.
El modelo ms utilizado para obtener los parmetros de la curva
de regresin es el principio estadstico de mnimos cuadrados, el cual es
muy usado en situaciones donde se involucran dos variables y cuya
relacin es lineal La utilizacin de este mtodo debe contemplar el
conocimiento de una de las variables.

Para el estudio del caso los modelos elegidos fueron dos, el primero es el
modelo emprico (modelo A en las tablas de resultados) descrito de la
siguiente forma:
ln ( ) = A + (1-Bx)/ (1+Cx + Dx2)
(3.1)

El segundo corresponde al modelo de Pseudo Margules (modelo B),


descrito por:
ln( ) = A (1- Bx + Cx2+ DX3)
(3.2)

Donde las variables A, B, C y D son coeficientes constantes de una serie


de datos en especfico, es la volatilidad y x es la fraccin lquido.
A continuacin, se procede a definir un concepto de suma
importancia en el rea de la Estadstica y la Probabilidad, el primero de
ellos es el coeficiente de correlacin el cual mide la fortaleza relativa de
una relacin lineal entre dos variables numricas. Los valores de los
coeficientes varan desde -1 para una correlacin negativa perfecta,
hasta +1 para una correlacin positiva perfecta; esto quiere decir que si
se trazaran los puntos en un diagrama de dispersin, todos ellos se
podran unir por medio de una lnea recta. La frmula para su clculo se
muestra seguidamente.
2

R=

( S xy )

(3.3)

S xx S yy

En donde:
2

(3.4)

( y )
y
n

(3.5)

x y

(3.6)

( x )
S xx = x
n
2

S yy =

S xy = xy

Cuando se ha escogido el modelo y se han evaluado los


parmetros, el paso siguiente es confrontar el modelo con la realidad y

establecer criterios para evaluarlo (Chacn, 2004). La decisin de si un


modelo es aceptable o no, requiere del establecimiento de metas
concretas sobre la precisin, la exactitud y la reproducibilidad, que el
modelo debe poseer para representar aceptablemente la realidad y
satisfacer las necesidades del usuario.

Existen una serie de parmetros para la evaluacin del ajuste de


un modelo, el primero de ellos es la varianza es una medida de la
dispersin o de la variabilidad de una variable aleatoria. Es un promedio
ponderado de las desviaciones de una variable aleatoria con respecto a
su promedio, elevadas al cuadrado. La varianzas est dada por la
ecuacin:
n

s2 =

( x i - x )2
i=1

(3.7
)

n-1

Para determinar la varianza de un grupo de datos previstos por un


modelo. Dicha varianza se determina de manera diferente debido a que
no se cuenta con un valor x nico, sino que todos los datos previstos
deben compararse con un valor diferente para calcular su desviacin. De
este modo, para una muestra sin repeticin, se puede estimar su
varianza de la siguiente forma:
k

se 2 =

( y i - y ) 2
i=1

(3.8
)

k-v

Donde, se2 es la varianza, i representa cada uno de los datos


correspondientes a cada variable independiente, k es el nmero total de
y la estimacin de
datos, y es la variable dependiente experimental,
y utilizando el modelo y v el nmero de parmetros del modelo.
El siguiente parmetro que se analiza es la desviacin de la estima
se pretende evaluar la cercana entre los valores observados y la
regresin, hecha con un modelo estudiado o desviacin de modelo. La

desviacin, eij, es el valor que se obtiene de efectuar las diferencias


entre el valor observado de la variable dependiente y la regresin, para
un valor correspondiente de la variable independiente. Se define la
desviacin como:
e ij = y ij - y ij = y ij - f ( x )a,b,c
k

ei , j

(3.9)
(3.10)

S e 2= j=1 i=1
k nv

Para la distribucin del muestreo de la varianza, cuando se trabaja


con una poblacin normal se tiene el siguiente teorema:
Teorema 1. Si S12 y S22 son las varianzas de muestras aleatorias
independientes de tamao n1 y n2 respectivamente, tomadas de dos
poblaciones normales con la misma varianza, entonces:
S21
F= 2
S2

(3.11)

Es una variable aleatoria de distribucin F de Fisher con los parmetros


v1 = n1 1 y v2 = n2 1.
Para la prueba de la normalidad de datos si se tiene una serie de
observaciones al azar, n, y se ordenan segn su magnitud, presentan
intervalos de probabilidad iguales. Lo que permite realizar una prueba
en forma grfica de que los datos estn distribuidos con una
probabilidad normal. Para realizar esta prueba lo primero que se hace es
ordenar los datos de las desviaciones de menor a mayor y se procede a
asignarle una probabilidad a cada uno, la cual se obtiene dividiendo el
rea bajo la curva de la distribucin normal estndar en n+1 intervalos
de igual probabilidad. La probabilidad acumulada para cada dato i es:
P=

i
n+1

(3.12)

Y la calificacin normal que representa el valor de la variable de una


muestra idealizada con distribucin normal es:

z=N INV P=

i
, 0,1
n+1

(3.13)

Prueba de hiptesis (H0)


Muchos problemas requieren decidir si se acepta o se rechaza una
afirmacin relacionada a algn parmetro. Esta afirmacin suele
llamarse hiptesis y el procedimiento de toma de decisiones en torno a
ella recibe el nombre de prueba de hiptesis. Una hiptesis estadstica
es una afirmacin acerca de la distribucin de probabilidad de una
variable aleatoria.
Cuando una hiptesis se somete a una prueba se pueden cometer
dos tipos de errores: si la hiptesis (H 0) es verdadera pero se rechaza, se
est rechazando equivocadamente, a eso se le llama error tipo 1 y la
probabilidad de cometerlo se designa con la letra griega ; si la hiptesis
(H0) es falsa pero se le acepta, es aceptada equivocadamente, a esto se
le llama error tipo 2 y la probabilidad de cometerlo se le asigna la letra
griega . El objetivo de la prueba de hiptesis es verificar la teora o
modelo.
Cuadro I. Decisiones en la prueba de hiptesis.
Se acepta H0
Se rechaza H0

H0 verdadera
Ningn error
Error tipo 1

H0 falsa
Error tipo 2
Ningn error

Para realizar una prueba de hiptesis se realizan cinco pasos esenciales,


los cuales son:
Se formula la hiptesis nula: esta corresponde a una proposicin
que es sometida a examen para ver si se cumple o no.
Se especifica el nivel de significancia.
Se encuentra el criterio de rechazo, basado en un valor terico que
depende de la distribucin utilizada.
Se encuentra el estadstico de prueba (especifico del tipo de
prueba) con el que se compara el valor terico.
Se toma una decisin basndose en el estadstico de prueba y el
criterio de rechazo, acerca de rechazar o no la hiptesis nula.

Para la hiptesis de una varianza si S 2 es la varianza de una


muestra aleatoria de tamao n tomada de una poblacin normal con la
varianza 2, entonces se tiene que:
X 2=

(3.14)

( n1 ) S2
2

As, para la hiptesis nula 2 = 02 , es verdadera, la razn de las


varianzas mustrales S12 y S22 ofrece una estadstica en la que pueden
basarse las pruebas de hiptesis nula. Sea SM2 la mayor de las varianzas
mustrales y Sm2 la menor de ellas, se rechaza la hiptesis nula si:
F> F / 2 (n M 1 , nm1)

(3.15)

IV. RESULTADOS Y OBSERVACIONES


Para el caso que se presentar se utilizaron los datos de volatilidad
y fraccin lquida para una mezcla binaria para el cloroformo y metanol,
tomados de la 7ma edicin del Perry's Chemical Engineering Handbook,
los cuales son presentados en el cuadro I

10

Cuadro I. Datos para el equilibrio lquido vapor de la mezcla binaria


cloroformo-metanol
Fraccin
Fraccin
Volatilidad relativa
Lquido
Vapor
ln()
X
Y
63
0,04
0,102
1,00286
60,9
0,095
0,215
0,95901
59,3
0,146
0,304
0,93800
57,8
0,196
0,378
0,91344
55,9
0,287
0,472
0,79788
54,7
0,383
0,54
0,63718
54
0,459
0,58
0,48714
53,7
0,557
0,619
0,25631
53,5
0,636
0,646
0,04346
53,5
0,667
0,655
-0,05356
53,7
0,753
0,684
-0,34246
54,4
0,855
0,73
-0,77975
55,2
0,904
0,768
-1,04543
56,3
0,937
0,812
-1,23649
57,9
0,97
0,875
-1,53019
* Tomado del Perrys Chemical Engineering Handbook (7 edicin).

Temperatura
(C)

Se emplea la funcin:

ln ( )=(

y
x
)/(
x)
1 y 1x

Ecuacin (3.16)

para la volatilidad relativa de las fracciones lquido y vapor (x


respectivamente) a diferentes temperaturas.

y y

Se decide usar dos modelos que permitan comparar la serie de datos para el
estudio del equilibrio lquido vapor de la mezcla binaria cloroformo y metanol. A
continuacin se presentan los modelos Emprico y Pseudo Margules elegidos
para representar la relacin de los datos del cuadro I.
x=Fraccin Lquido
y=Fraccin Gas

=Volatilidad
Modelo A: (emprico)

11

ln ( ) =Volatilidad
ln ( )=

(1.0581.611 x)
(10.828 x +0.151 x 2)

Modelo B: (Pseudo Margules)


2

ln ()=1.05(10.771 x+0.078 x 1.882 x )


Los valores para los coeficientes son obtenidos a partir del software Curve
Expert para el caso del Pseudo Margulles se toman a partir de Excel al usar el
mtodo de mnimo cuadrados.
En el cuadro ll se muestran las desviaciones con relacin a la variable
independiente. Se presenta la desviacin de la estima, la cual se emplea para
comparar los modelos entre s.
Prueba de hiptesis

H 0 :2eN =2eC
Criterio de comparacin entre los modelos
A con B

F=

S2eB 3,1467. 105


=
=1.3185
S2eA 2,3913. 105

Con el anlisis de varianza por medio de los valores del estadstico F, se


muestra que no existe suficiente evidencia para rechazar la hiptesis, nula, de
que las desviaciones de la estima de los dos modelos sean iguales.
Cuadro II. Anlisis de residuos de los dos modelos, para el equilibrio del
lquido-vapor para la mezcla binaria cloroformo-metanol.

Fraccin de Lquido

Desviacin de la regresin de la volatilidad

12

Modelo
A
0.00226
0.00368
-0.00118
-0.00788
-0.00732
-0.00301
0.00025
0.00406
0.00412
0.00458
0.00119
-0.00311
-0.00343
-0.00483
0.00418

0.04
0.095
0.146
0.196
0.287
0.383
0.459
0.557
0.636
0.667
0.753
0.855
0.904
0.937
0.97

Modelo
B
0.00142
0.00233
-0.00212
-0.00781
-0.00493
0.00100
0.00428
0.00627
0.00370
0.00301
-0.00324
-0.00766
-0.00546
-0.00416
0.00715

Estadsticos
Datos
g.l.
s e 2 .105
se
F=s eN 2 /s12
F INV (0.05,11,11)
F INV (0.01,11,11)
Tolerancia, T
0 T/6
2
=( kn ) se 2 / 20
2 (0.05,6)
2 (0.01,6)

15
11
2.39134
0.0048901
1
2.81793
4.46243

15
11
3.1467
0.005609
1.31850
2.81793
4.46243

0.01
0.00167
94.70 | 124.69
4.57481
3.053484

sy
2

21 /2

r=1s eN /s y
Fcorr =

s eN /s y

0.674146
0.99976
>100

0.67280
0.99968
>100

13

El otro anlisis que se puede hacer, es comparar la variacin de la


estima con la varianza de una poblacin terica (puede ser ideal)
formulada sobre la base de una tolerancia o de una incertidumbre de
datos. La varianza arbitraria se estima, entonces, con la incertidumbre
de los datos recopilados para las fracciones lquido y vapor.
Cuadro III. Anlisis de residuos, ordenados para los dos modelos, para
la volatilidad de la mezcla de cloroformo y agua

Desviaciones
ordenadas
Modelo
A

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

0.03333
0.10000
0.16667
0.23333
0.30000
0.36667
0.43333
0.50000
0.56667
0.63333
0.70000
0.76667
0.83333
0.90000
0.96667

-1.83391
-1.28155
-0.96742
-0.72791
-0.52440
-0.34069
-0.16789
0.00000
0.16789
0.34069
0.52440
0.72791
0.96742
1.28155
1.83391

0.0078
8
0.0073
2
0.0048
3
0.0034
3
0.0031
1
0.0030
1
0.0011
8
0.0002
5
0.0011
9
0.0022
6
0.0036

B
f.m.
-0.00781
-0.00766
-0.00546
-0.00493
-0.00416
-0.00324
-0.00212
0.00100
0.00142
0.00233
0.00301
0.00370
0.00428
0.00627
0.00715

14

8
0.0040
6
0.0041
2
0.0041
8
0.0045
8
Recta de los residuos
0
0.921

r2

0.898

-0.004

Intercepto
Pendiente

0.0009

0.004

0.0042
0.01
0.01
0.01
0

Desviaciones ordenadas
d.ord
Modelo A

-3 (Modelo-2A)
Linear

0
0 0B
-1 Modelo

1 Linear (Modelo
2
B)3

0
-0.01
-0.01
-0.01

Calificacin normal,z

Figura1: Anlisis de normalidad de los residuos ordenados para el caso


de la volatilidad de una cloroformo-metanol para los dos modelos

15

0.010
0.008
0.006
0.004
0.002
Desviaciones

0.000
0
0.1
-0.002Modelo B

0.2

0.3

0.4

0.5

0.6
0.7 A 0.8
Modelo

0.9

-0.004
-0.006
-0.008
-0.010
Fraccin de lquido

Figura 2. Anlisis de residuos para el caso de volatilidad de una


mezcla de cloroformo-metanol.
1
0.9
0.8
0.7
0.6
y calculado

0.5
0.4
Observados

Modelo A

Modelo B

0.3
0.2
0.1
0
0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Fraccin de liquido

Figura3: Anlisis del comportamiento para la mezcla binaria


cloroformo-metanol segn los modelo Emprico y Margules.

V.CONCLUSIONES

16

Los residuos del modelo de ajuste se encuentran ms dispersos,


de ah que la desviacin estndar sea mayor para este caso que
con el modelo emprico, no obstante, mediante la prueba F y Chi2
se concluye que ninguno de los dos modelan idealmente el
problema que se est tratando.

Es necesario realizar un anlisis estadstico ms extenso, as como


extender el mbito de trabajo para poder rechazar alguno de los
modelos propuestos.

Es necesario recurrir a la estadstica y la realizacin de pruebas


por medio de ella para realizar un anlisis exhaustivo de la
comparacin entre dos modelos semejantes, por este medio es
posible comparar cuantitativamente dos modelos, que como nos
competen en este caso, el modelo Emprico y el Pseudo Margules
Ambos modelos no presentar un comportamiento normal pues
tienen curvas muy pronunciadas, grficamente Margules se
acerca de mejor forma a los datos tericos, por lo que se puede
decir que este es un mejor modelo para este mbito de datos.

VI.BIBLIOGRAFA

Spiegel,

estadstica. Mc. Graw-hill, Mexico, (1976).


Chacn V, G. Anlisis de procesos (Caso de la Ingeniera qumica),

Murray

R.

Teora

problemas

de

probabilidad

Universidad de Costa Rica. San Jos, Costa Rica 2004.

Perry, Robert. Perrys Chemical Engineers Handbok 7ma ed. Mc.


Graw Hill. Mxico, 1997

Potrebbero piacerti anche