Sei sulla pagina 1di 12

UNIVERSIDAD DE MAGALLANES

FACULTAD DE CIENCIAS
DEPTO. DE MATEMÁTICA Y FÍSICA
Dr. Félix Zamorano B.

ANÁLISIS DE DATOS EXPERIMENTALES

El procedimiento para obtener la relación funcional entre dos variables: una independiente
(x) y otra dependiente (y), dependerá del comportamiento de ambas variables, esto es, si
tienen un comportamiento lineal o no lineal.

Decimos que los datos tienen un comportamiento lineal si el gráfico de estos es una línea
recta y el parámetro de correlación ‘r’ es 1 o bien -1 (o muy aproximado en ambos casos),
en tanto que tendrán un comportamiento no lineal en el caso en el cual el gráfico es una
línea curva y por lo tanto, el parámetro ‘r’ se encontrará en el intervalo: -1 < r <1.

Ejemplo de aplicación:

1. Tabulación de los datos

Tabla 1. Cantidad y obtenida a partir de la cantidad x

Nº X Y x·y x2 y2
Dato (Luts) (Pers)
1 10 32 320 100 1024
2 14 44 616 196 1936
3 16 50 800 256 2500
4 17 52 884 289 2704
5 20 62 1240 400 3844
6 25 78 1950 625 6084
7 32 98 3136 1024 9604
 134 416 8946 2890 27696
Fuente: Datos experimentales obtenidos en laboratorio
2
2. Gráfico de los datos

100

90

80

70
y (Luts)

60

50

40

30

20

10

0
0 5 10 15 20 25 30 35
x (Pers)
Gráfico 1. Comportamiento de la cantidad y en función de la cantidad x .

Observe que se ha trazado la mejor recta de modo que quede el máximo de puntos sobre la
recta y los restantes queden distribuidos en igual cantidad sobre y bajo la recta.

3. Cálculo del parámetro de correlación r

Como mencionado anteriormente, el parámetro de correlación r, es un parámetro que sirve


para establecer si la relación entre dos variables cualesquiera, x e y, tienen una relación
lineal o una relación no lineal, es decir, si la relación es de la forma y = mx + n (una línea
recta) o es diferente de dicha forma (una línea curva). Su valor se obtiene mediante la
expresión:
 x i • y i 
 x • y 
r N [1]
σx • σy
siendo x y y, respectivamente:
3

σx 
  x
 xi
2
2
y σy 
 yi  y
2
2
[2]
N N

Para los datos de la tabla anterior, el cálculo del parámetro de correlación arroja los
siguientes resultados:

x i • y i  8946 134 416


  1278 ; x  19 ; y  59
N 7 7 7

σx 
  x
 xi
2
2

2890
 19 2  7.2
N 7

σy 
 yi  y
2
2

27696
 59 2  21.8
N 7

1278  10 • 59
r 1
7.2 • 21.8

Este resultado indica que los datos de la tabla anterior tienen un comportamiento lineal (es
una línea recta con pendiente positiva) y, a continuación, veremos cómo establecer la
relación funcional para el primer caso: los datos tienen un comportamiento lineal.

Cómo el gráfico de los datos y el parámetro de correlación indican que la relación buscada
es una línea recta, la ecuación de ésta tiene la forma particular:

y = mx + n [3]

en la cual ‘m’ corresponde a la pendiente de la recta y ‘n’ al corte ( cuando x = 0) y el


problema se reduce a determinar el valor correspondiente de m y el de n.

Existen tres métodos diferentes para determinar estos valores y así establecer la relación
funcional. A saber, los métodos son:

a. Método gráfico
b. Método de los promedios
c. Método de los cuadrados mínimos

a. El método gráfico utiliza el gráfico para tal efecto de forma que para calcular ‘m’ se
escogen dos puntos de la recta trazada, P1 = (x1 , y1) y P2 = (x2 , y2) y se efectúa la
operación:

y 2  y1
m [4]
x 2  x1
4
en tanto que para determinar ‘n’ se lee directamente el punto en el gráfico en el cual la
recta corta al eje de la variable independiente (punto en el cual x = 0).

Como ejemplo, usemos la tabla de datos anterior, en la que el parámetro de correlación de


los datos presentados es r = 1 y el gráfico correspondiente es:

100

90 Referencia
P2
y = f(x)
80 Extrap.

70
y (Luts)

60

50 P1

40

30

20

10
n = 2(Luts)

0
0 5 10 15 20 25 30 35
x (Pers)
Gráfico 2. Comportamiento de la cantidad y en función de la cantidad x .

En este, el punto P1 tiene coordenadas (12,38) y las del punto P2 son (24,74); entonces la
pendiente será:

(74  38) Luts 36 Luts  Luts 


m   3 
(24  12) Pers 12 Pers  Pers 

Del gráfico se obtiene directamente el corte, siendo este n = 2(Luts). Así entonces,
sustituyendo estos valores en la ecuación [3], la relación funcional es:

y = 3x + 2,
x medido en unidad Pers e y en unidad Luts.

Otra forma de expresar lo mismo es:

 Luts 
y  3  x  2(Luts)
 Pers 
5
b. El método de los promedios utiliza la tabla de datos de tal forma que la divide en dos
grupos para formar un sistema de ecuaciones y de esta manera determinar el valor de m y
n. El sistema se forma con las ecuaciones que resultan de:

M
M 

i =1
y i    x i m  Mn
 i =1 
[5]

N
 N 
 i  i=
y  x i m  N - M n [6]
i =M +1 M +1 

en la cual, M es la cantidad de datos correspondiente a la primera mitad de la tabla y N es


la cantidad total de datos.

Observando la tabla de datos, hay 7 pares de datos (x,y) de modo que se toman los
primeros 4 pares para la primera ecuación y los restantes para la segunda ecuación. En la
tabla, esto es:

X Y
(Pers) (Luts)
10 32 4
4
14 44  yi  178
i 1
x i  57
16 50 i 1

17 52
7 20 62 7

 x i  77 25 78 
i  5
y i  238
i 5
32 98
Luego, introduciendo cada sumatoria en las ecuaciones correspondientes, se obtiene el
sistema:
1) 178 = 57m + 4n
2) 238 = 77m + 3n

que, al resolver, resulta m = 3 y n = 2. Por lo tanto, la relación funcional es:

y = 3x + 2,
x medido en unidad Pers e y en unidad Luts.

o bien:
 Luts 
y  3 x  2(Luts)
 Pers 

la cual es idéntica a la obtenida en el método anterior.

c. El método de los cuadrados mínimos es un método estadístico el cual evalúa N


ecuaciones del tipo y = mx + n, las cuales se suman y, además, se forman N ecuaciones
6
del tipo xy = mx2 + nx, las cuales también se suman. Siendo N la cantidad total de datos,
se obtienen dos ecuaciones de las cuales al despejar m y n resulta:

 N   N  N
[7]
  xi  *   y i   N  x i * y i 
m   i 1   i 1 2  i 1

 N  N

  x i   N  xi   2

 i 1  i 1

 N  N  N   N 
  x i  *  x i * y i     x i2  *   y i  [8]
n  i 1  i 1  i 1   i 1 
2
 N  N

  x i   N  x i   2

 i 1  i 1

Para los datos de la tabla anterior se obtiene:

134 * 416  7 * 8946  Luts 


m 2
 3 
134  7 * 2890  Pers 

134 * 8946  416 * 2890


n  2(Pers)
134 2  7 * 2890

Entonces, la relación funcional resulta ser:

 Luts 
y  3 x  2(Luts)
 Pers 

Observe que en los tres métodos se ha obtenido la misma relación funcional, vale decir, los
mismos valores para m y n, cosa que se habría de esperar, pero no siempre ocurre esta
situación, en especial cuando el valor del parámetro de correlación r no es exactamente 1
(recta con pendiente positiva) ó -1 (recta con pendiente negativa). En general, un
parámetro de correlación mejor que 0.98…. se considera una recta.

Como ya se ha mencionado, en el caso que el parámetro de correlación se encuentre en el


intervalo comprendido entre -1 y 1, es decir, -1< r < 1, el gráfico será una línea curva y
decimos que los datos tienen un comportamiento no lineal.

Para poder determinar la relación funcional, lo que hay que hacer primero es transformar
los datos para que tengan un comportamiento lineal, esto es, rectificar los datos y,
posteriormente, aplicar cualquiera de los métodos vistos anteriormente, puesto que ahora
los datos tendrán un comportamiento lineal.

Existen dos métodos para rectificar los datos y así determinar la relación funcional de un
conjunto de datos que tienen un comportamiento no lineal:

a. método logarítmico
b. método del cambio de variable.
7
a. Método logarítmico: Consiste en aplicar logaritmo a todos los pares de datos (variable
independiente y dependiente) de forma que la nueva tabla de datos tiene dos nuevas
columnas: una log x y la otra log y. Si se grafican estos pares de datos (logx, log y) y
con estos se calcula el nuevo parámetro de correlación ( r’) se espera que el gráfico sea
una recta y que r’ =1 o r’ = -1, o aproximados a estos valores).

Con los datos (log x, log y) se ha conseguido rectificarlos por lo tanto la ecuación de esa
recta es ahora:

log y = m (log x) + n [9]

en donde m y n se determinan ya sea utilizando el método gráfico, el de los promedios o el


de los cuadrados mínimos. Sabemos que es más correcto aplicar este último.

A continuación, aplicamos propiedades logarítmicas en la expresión [9] y también


antilogaritmo al corte n; esto es, a = antilog n (de modo que al aplicar logaritmo a la
cantidad a se obtiene: log a = log(antilog n) = n). De esta manera resulta:

log y = log xm + log a

log y = log (a xm)

y al aplicar antilogaritmo en ambos lados de la igualdad, resulta:

y = a xm [10]

siendo a = antilog n. La expresión [10] es la que se establece mediante éste método y es


la relación funcional buscada.

Ejemplo de aplicación. La siguiente es una tabla de datos que ha sido ya completada


para todos los efectos de cálculo y el gráfico 3 corresponde a la gráfica de los datos (x,y).

Tabla 2. Datos experimentales de la cantidad y en función de la cantidad x.


Dato x(Fats) y(Lots) log x log y log x * log y (log x)2 (log y)2

1 1.0 1.000 0.000 0.000 0.000 0.000 0.000
2 3.0 0.111 0.477 -0.955 -0.456 0.228 0.912
3 4.0 0.063 0.602 -1.201 -0.723 0.362 1.442
4 6.0 0.028 0.778 -1.553 -1.208 0.605 2.412
5 7.0 0.020 0.845 -1.699 -1.436 0.714 2.887
6 9.0 0.012 0.954 -1.921 -1.833 0.910 3.690
7 10.0 0.010 1.000 -2.000 -2.000 1.000 4.000
8 12.0 0.007 1.079 -2.115 -2.235 1.164 4.644
 52 1.251 5.735 -11.484 -9.981 4.983 19.987
8
1.2

1.1

1.0

0.9

0.8

0.7

y(Luts)
0.6

0.5

0.4

0.3

0.2

0.1

0.0

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
x(Fats)

Gráfico 3. Comportamiento de la cantidad y en función de la cantidad x .

Si con los datos (x,y) se calcula el parámetro de correlación, éste dará r = -0.66 y su gráfico
corresponde a una línea curva, como se muestra en el gráfico 4. Al analizar ambos
resultados, se concluye que los datos NO tienen un comportamiento lineal. En tanto, si
calculamos el nuevo parámetro de correlación, ahora con los datos (logx, logy), resulta r’ = 1
y el gráfico correspondiente a tales datos, es el observado en el gráfico 2.
0.0

-0.5

-1.0
logy

-1.5

-2.0

-2.5

0 0.5 1 1.5
logx
Gráfico 4. Comportamiento de la cantidad logy en función de logx

A partir de los resultados de los parámetros de correlación y los gráficos anteriores, se


observa que se ha procedido a la rectificación de los datos y ahora procedemos a
determinar el valor de m y n con los datos (logx, logy); aquellos que se encuentran en el
rectángulo oscurecido. Aplicando el método de los cuadrados mínimos se obtiene: m = -
9
2.004 y n = 0.001 los cuales al ser aproximados resultan m = -2 y n = 0. A su vez, sabemos
que a = antilog n; luego, a = 1. Por lo tanto, la relación funcional buscada es:

y(Lots) = 1 * [x(Fats)]-2
o simplemente,
1
yLots 
x Fats2
b. Método del cambio de variable: Este método consiste en cambiar la variable
independiente o la dependiente o ambas, por una función de ella; es decir, se cambia la
variable en cuestión z por una g(z), como por ejemplo, 1/z, z2, 1/z2, log z, ez, sen z, z ,
etc. Podemos ver que existe un sin número de funciones posibles. Para simplificar la
situación, se recurre al conocimiento de geometría analítica, la cual mediante la simple
inspección del gráfico, es posible establecer a priori las posibles funciones de rectificación.

Para establecer cuál es la correcta, habrá que calcular el parámetro de correlación para
cada una de las posibles funciones, es decir, calcular r para cada par de datos (g(x), y) ó (x,
g(y)) ó ambas (g(x), g(y)) y escoger aquella cuyo valor sea más próximo a 1 ó -1. Una vez
determinada la mejor función de rectificación, ésta tendrá (por ejemplo) la forma:

y = m g(x) + n [11]

en donde hay que determinar m y n mediante el método, por ejemplo, de los cuadrados
mínimos o de los promedios, que tienen mayor confiabilidad.

Al aplicar uno de estos métodos a la tabla de datos anteriormente utilizada y sustituir la


variable independiente x por g(x) = 1/x2, resulta la siguiente tabla de datos:

Tabla 3. Datos experimentales para el cambio de variable.

Dato x(Fats) 1/x2 y(Lots)


-2
Nº (Fats )
1 1.0 1.000 1.000
2 3.0 0.111 0.111
3 4.0 0.063 0.063
4 6.0 0.028 0.028
5 7.0 0.020 0.020
6 9.0 0.012 0.012
7 10.0 0.010 0.010
8 12.0 0.007 0.007
 52 1.251 1.251

en la cual usted puede observar que x se ha sustituido por 1/x2 y los valores de y son los
mismos. En efecto, al calcular r’ con los nuevos datos (1/x2, y), éste resulta ser 1 y el
gráfico 5 muestra que se ha logrado la rectificación.
10

1.0

y (Lots)

0.5

0.0

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2
1/x2 (Fats-2)
Gráfico 5. Comportamiento de la variable y en función de 1/x2.

En este caso, ahora la pendiente es m  1 Lots * Fats 2   y el corte n = 0, por lo que la


relación funcional será:

y(Lots) = 1( Lots*Fats2) * 1/x2 + 0,


o simplemente:
1
yLots 
x Fats2
Observe que la relación es idéntica a la anterior, pero es importante entender que con el
método logarítmico resulta una relación funcional con un término en la derecha, en tanto
que con el método del cambio de variable resulta una relación funcional de dos términos.
Observe las expresiones [10] y [11].

El método de las diferencias finitas

A continuación, veremos como establecer la relación funcional entre dos variables (las que
hemos generalizado como x e y), cuando se tiene la certeza de que la relación funcional a
determinar es un polinomio en la forma de la serie de Taylor; es decir, de la forma:

y = a0 + a1x + a2x2 + a3x3 + .........+ anxn [12]

y en la cual algunas de las constantes (ai) puede ser cero y otras hay que determinar.

El método se denomina “método de las diferencias finitas” y lo primero que hay que hacer
es determinar el grado del polinomio, es decir, cuál ha de ser el máximo exponente de la
variable independiente (x). Para tal efecto, se debe realizar las sucesivas diferencias y
entre los datos de la variable dependiente (y). Veamos como se realiza en la siguiente tabla
de datos:
11
Tabla 4. Datos experimentales de la
cantidad y en función de la cantidad x.
x(Fis) y(Mat)
0,0 1,0
1,0 4,0
1,5 7,0
2,0 11,0
2,5 16,0
3,0 22,0
3,5 29,0

Tabla 5. Datos obtenidos en las diferencias finitas.


y(Mat) i=1 i=2 i=3 i=4
1,0
3,0
4,0 0,0
3,0 1,0
7,0 1,0 -1,0
4,0 0,0
11,0 1,0 0,0
5,0 0,0
16,0 1,0 0,0
6,0 0,0
22,0 1,0
7,0
29,0
Pi 28,0 /1 4,0 /2 1,0 /6 -1,0 /24

en donde P   i
Δ
i!
i

Para establecer el grado del polinomio, se observa si existe una columna de ceros en las
columnas de las diferencias, que sea obtenida en forma natural. Si esto ocurre, entonces el
grado del polinomio lo da el valor de i de la columna anterior a la columna de ceros. Si
esto no ocurre se analiza el parámetro Pi, entre los Pi donde ocurre el cambio de signos (de
positivo a negativo o viceversa). Aquel Pi que tenga valor más próximo cero (antes del
cambio de signos) indicará que el i de la columna anterior corresponde al grado del
polinomio. Para el caso de nuestra tabla, observe que no hay ninguna columna de ceros y
al analizar los Pi, se produce el cambio de signo entre i = 3 e i = 4, siendo P3 más cercano
a cero que el P2; por lo tanto, el grado del polinomio es 2, con lo que resulta la serie de
Taylor:

y = a0 + a1x + a2x2 (*)

faltando por determinar los valores de a0 , a1 y a2. Para ello, vea si en la tabla de datos
aparece el dato (0, d). Si es así, entonces a0= d, faltando por determinar a1 y a2 los cuales
12
se obtienen por el método de los promedios; esta vez, dividiendo la tabla en dos y formando
un sistema de dos ecuaciones de la forma:

M
1) M   M 2

i 1
y i  M * a 0    i 1  
x
 i1 
 * a 
i 1
xi  * a 2

N  N   N 2
2)   j  1  x j  *a2
y j  N * a 0   x  * a   
j1  j1   j1 

siendo M la cantidad de pares de datos considerados en la primera ecuación y N, la


cantidad de pares de datos consideradas para la segunda ecuación.

Para el caso de nuestra tabla de datos, tenemos el par (0, d), lo que nos permite decir que
a0 = 1,0. Así, hay que determinar únicamente dos constantes: a1 y a2 por lo que se forman
dos ecuaciones; esto es:

Tabla 6. Datos para determinación de ctes.


No. x(Fis) x2 (Fis2) y(Mat)
2 1,0 1,00 4,0
3 1,5 2,25 7,0
4 2,0 4,00 11,0
 4,5 7,25 22,0

5 2,5 6,25 16,0


6 3,0 9,00 22,0
7 3,5 12,25 29,0
 9,0 27,50 67,0

Observación: no se considera el dato (0, d), de donde ya se obtuvo a0.

De la tabla anterior, resulta:

1) 22,0 = 3 * 1,0 + 4,5 * a1 + 7,25 * a2


2) 67,0 = 3 * 1,0 + 9,0 * a1 + 27,50 * a2
_______________________________

que al resolver, se obtienen los valores: a1 = 1,0 y a2 = 2,0 , que al sustituir en (*), la
relación funcional buscada es:

y = 1,0 + x + 2,0x2

x en unidades (Fis) e y en unidades (Mat)

Potrebbero piacerti anche