Sei sulla pagina 1di 57

METODOS DE

MODELIZACION GEOFISICA
ING. NINO PUMA SACSI
2017

Ingeniera Geofsica
METODOS DE MODELIZACION GEOFISICA

METODOS DE MODELIZACION
GEOFISICA
INDICE
INTRODUCCION
RESUMEN
OBJETIVOS
1. CORRELACIN LINEAL ........................................................................................................... 6
1.1 Coeficiente de correlacin lineal de pearson .............................................................. 12
1.1.1 Frmula utilizada ................................................................................................. 13
1.1.2 Significacin del coeficiente de correlacin ........................................................ 16
2. DIAGRAMA DE DISPERSIN................................................................................................. 18
2.1. Definicin .................................................................................................................... 18
2.2. Caractersticas principales ........................................................................................... 18
2.3. Construccin................................................................................................................ 19
2.3.1.Pasos previos a la construccin de un Diagrama de Dispersin......................... 19
2.3.2.Ejemplo ............................................................................................................... 20
2.4. Tipos de diagrama ....................................................................................................... 24
2.5. Utilizacin .................................................................................................................... 25
2.5.1.Utilizacin del diagrama de dispersin en mineraloga magntica de suelos
volcnicos en una topo secuencia del valle de teotihuacn........................................ 25
3. REGRESIN LINEAL CON ERRORES DE REDONDEO ............................................................. 28
3.1. Criterio para un mejor ajuste ...................................................................................... 29
3.2. Ajuste de una lnea recta por mnimos cuadrados...................................................... 31
3.2.1.Ejemplo aplicativo............................................................................................... 32
3.3. Cuantificacin del error en la regresin lineal ............................................................ 32
3.4. Linealizacin de relaciones no lineales ....................................................................... 38
3.5. Ejemplos en ingeniera geofsica ................................................................................. 41
Ingeniera Geofsica

4. REGRESIN POR MNIMOS CUADRADOS ............................................................................ 46


4.1. Ajuste........................................................................................................................... 46
4.2. Interpolacin y ajuste .................................................................................................. 46

1
METODOS DE MODELIZACION GEOFISICA
4.3. Proyecciones ............................................................................................................... 47
4.4. Caso de una recta ........................................................................................................ 47
4.5. Generalizacin ............................................................................................................. 49
4.6. Recta de mnimos cuadrados ...................................................................................... 53
4.7. La parbola de los mnimos cuadrados ....................................................................... 53
CONCLUSIONES
BIBLIOGRAFIA
PAGINAS WEB
ANEXOS
Ingeniera Geofsica

2
METODOS DE MODELIZACION GEOFISICA
INTRODUCCION

Este documento describe el proceso completo a seguir para analizar la


existencia de una relacin lgica entre dos variables. Describe la construccin
de los Diagramas de Dispersin a partir de la recogida de datos acerca de dichas
variables y el anlisis posterior necesario para confirmar la correlacin que puede
mostrar dicho diagrama, ya que sta no implica la existencia de una relacin
lgica.
Las relaciones estadsticas se obtienen mediante una primera fase de
exploracin conocida como anlisis de correlacin. Consiste en analizar los
datos muestrales para saber el grado de asociacin o correlacin entre dos o
ms variables de una poblacin. El grado de correlacin se expresa como un
nmero comprendido entre -1 y +1 y se le conoce como coeficiente de
correlacin.
Como corresponde a un estudio exploratorio, el anlisis de correlacin no es un
fin en s mismo sino que su objetivo es establecer la pertinencia de la segunda
fase o anlisis de regresin. Este da lugar a una funcin y = f (x) que describe
estadsticamente la asociacin o relacin entre las variables en estudio y, por
tanto, su fin no es calcular sin error sino obtener predicciones del valor de una
variable, para un valor dado de la otra variable.
Debido a que los clculos para el coeficiente de correlacin y los parmetros que
definen la funcin se basan en una muestra aleatoria, se espera que varen de
una muestra a otra (tal como la media vara de una muestra a otra). Esto plantea
preguntas de significancia del coeficiente de correlacin, de los parmetros de la
funcin y de los valores de prediccin obtenidos con ella. Tales preguntas son
respondidas mediante intervalos de confianza y pruebas de hiptesis; esto es,
mediante anlisis inferencial.

Ingeniera Geofsica

3
METODOS DE MODELIZACION GEOFISICA

RESUMEN

En Ingenieras, la aplicacin de software para procesamiento de datos de campo


es imprescindible para una mejor elaboracin e interpretacin de resultados. Es
por ello que el trabajo est enfocado en los mtodos de modelizacin geofsica.
El presente informe consta de cuatro tems principales que sern explicados en
forma general.
Correlacin lineal es la relacin entre dos variables, para determinar su afinidad.
Todo anlisis de correlacin lineal debe estar acompaado de un diagrama de
dispersin para poder visualizar mejor dicha relacin, teniendo como posibles
resultados una relacin positiva, negativa o en su defecto ninguna relacin.
Abarca conceptos tales como el coeficiente de Pearson.
Diagrama de dispersin es la relacin entre dos parmetros ya sea X y Y, su
utilidad es para visualizar la correlacin entre dichos valores, esto nos sirve para
concluir un anlisis de datos. Abarca conceptos tales como tipos de diagramas
respecto a la correlacin, pasos para realizar un diagrama y finalmente un
ejemplo prctico en relacin a Ingeniera Geofsica.
Regresin Lineal es un paso posterior a la realizacin del diagrama de
dispersin, el cual nos indica el grado de relacin entre las variables
independientes y dependientes a nivel algebraico. Se muestra adems el ajuste
correcto que se debe seguir al momento de elaborar dicha regresin. Adems,
no toda relacin en campo es lineal, por ello se presenta la transformacin para
convertir una ecuacin de relacin no lineal a una que es intrnsecamente lineal.
Como tem final tenemos la explicacin especifica del Mtodo de mnimos
cuadrados.
Ingeniera Geofsica

4
METODOS DE MODELIZACION GEOFISICA
OBJETIVOS

Estudiaremos la correlacin los problemas referentes a la variacin


conjunta de dos variables, su intensidad y su sentido (positivo o negativo).
Definir las reglas bsicas a seguir para la construccin e interpretacin de
los Diagramas de Dispersin, resaltando las situaciones en que pueden o
deben, ser utilizados.
Analizar y comprender la elaboracin de la Regresin lineal a partir de
Diagramas de Dispersin considerando ajustes por mnimos cuadrados,
tanto en teora como aplicacin prctica en Ingeniera Geofsica.
Enfatizar la importancia del Mtodo de los Mnimos Cuadrados como parte
importante del constatado de validez y relacin de datos experimentales.

Ingeniera Geofsica

5
METODOS DE MODELIZACION GEOFISICA
1. CORRELACIN LINEAL

Se entiende por correlacin el grado de relacin existente entre dos


variables. Concepto Cuando entre dos variables existe una correlacin
total, se cumple que a cada valor de una, le corresponde un nico valor
de la otra (funcin matemtica). Es frecuente que dos variables estn
relacionadas de forma que a cada valor de una de ellas le correspondan
varios valores de la otra. En este caso es interesante investigar el grado
de correlacin existente entre ambas.
La correlacin mide el grado en que las variables:
covaran
dependen uno del otro
predecir el uno al otro

El grado de correlacin entre dos variables, por convencin, se denota r ,


y la correlacin entre la variable X y la variable Y se indica por r XY .
Las correlaciones estn estandarizados para variar entre -1 y 1, donde 0
representa ninguna relacin, -1 una relacin negativa perfecto, y 1 una
relacin positiva perfecta.
Una variedad de estadsticas de correlacin de dos variables estn
disponibles, la eleccin de las cuales depende de las variables nivel de
medicin:
Nominal por nominal: Tabla de contingencia , prueba de chi-
cuadrado de Pearson , Phi / V de Cramer
Ordinal por ordinal: rho de Spearman , de Kendall tau-b
Dicotmica por intervalo / relacin coeficiente de correlacin
biserial Point
Intervalo / racin por intervalo / proporcin: coeficiente de
correlacin momento-producto de Pearson

Anlisis correlacional deben ir acompaadas de grficos bi variados


apropiados, tales como:
Nominal por nominal: Agrupado grficos de barras
Ordinal por ordinal: Diagrama de dispersin (con los
compartimientos de punto)
Intervalo / relacin de intervalo / proporcin: Diagrama de
dispersin
Ingeniera Geofsica

Dicho lo anterior y con el fin de contextualizar el estudio de la correlacin


lineal, se recurre a una situacin real.
El diagrama de dispersin permite visualizar las parejas y establecer
algn patrn de comportamiento grfico.

6
METODOS DE MODELIZACION GEOFISICA
En la figura 1 se confirma la relacin al aumentar x aumenta y; adems,
se resaltan algunos aspectos de inters, como el que los valores extremos
(encerrados en crculos) pudieran ser atpicos, dada la dimensin de los
huecos entre stos y los racimos ms cercanos No obstante el valor de la
informacin anterior, hay, sin embargo, un aspecto visual importante:

La disposicin de los puntos sigue un patrn grfico lineal

Figura 1 Diagrama de dispersin del Alquitrn-CO.

Los diagramas de dispersin de la figura 2 pueden ser descritos tambin


con la expresin al aumentar x aumenta y; no obstante, su patrn grfico
no corresponde al tipo lineal sino al de otras curvas.

Ingeniera Geofsica

Figura 2 Grficas de dispersin no lineales en las que al aumentar x aumenta

7
METODOS DE MODELIZACION GEOFISICA
Un comportamiento global descrito por la expresin al aumentar x
aumenta y (en lo que resta de esta seccin nos referiremos al tipo lineal)
suele describirse como una correlacin o asociacin positiva de y
respecto a x (vea figura 3 a). En caso contrario, esto es, si al aumentar x
disminuye globalmente y siguiendo un patrn grfico lineal (vea figura 3
b), se dice que hay una correlacin o asociacin negativa de y respecto
a x.
Por otro lado, si el diagrama de dispersin es del tipo mostrado en el
inciso c) de la figura 3, el recorrido de izquierda a derecha en el eje x no
muestra asociacin o relacin de ningn tipo entre los valores de x y y ya
que, al aumentar x igualmente aumenta y disminuye y. Un diagrama de
estas caractersticas, es indicativo de que no hay relacin (correlacin)
entre las variables en estudio.

Figura 3 Distintos tipos de correlacin o asociacin de datos

En el caso de variables aleatorias es poco probable tener una correlacin


lineal perfecta; sin embargo, para fines de anlisis, resulta til e
importante considerarla. En los incisos a) y b) de la figura 4 se muestra
una correlacin lineal positiva y una negativa perfectas respectivamente.
Como se observa, los puntos estn distribuidos a lo largo de lneas
rectas.

Figura 4 correlaciones lineales positivas y negativas perfectas

La no relacin puede tambin manejarse mediante una serie de puntos


a lo largo de una lnea recta horizontal (ver figura 5). El significado
Ingeniera Geofsica

algebraico de esto es que y es independiente de x o, en trminos


estadsticos, que no hay correlacin entre x e y.

8
METODOS DE MODELIZACION GEOFISICA

Figura 5. No asociacin

Una consideracin importante que se desprende de esto es que:

Las relaciones deterministas vistas en otros cursos, pueden verse como


correlaciones perfectas y por tanto como un caso particular de las
relaciones estadsticas.

Las descripciones de correlacin lineal vistas hasta ahora son de tipo


cualitativo. Para avanzar a una descripcin cuantitativa se procede a
dividir el diagrama de dispersin en cuatro regiones, dibujando lneas
paralelas a los ejes por un punto central. El punto central puede ser el
de las medianas o el de las medias; en este captulo se considerar
el punto central correspondiente a las medias (x, y) promedios, llamado
Calculando las medias de las columnas x e y, se obtiene x =12.216 y
y=12.528. Colocando el punto central (12.2, 12.5) en el diagrama de la
figura 1 y trazando paralelas a los ejes por ese punto se llega a la figura
6.

Figura 6. Divisin del diagrama de dispersin en cuatro regiones.

Cualquier punto ubicado en la regin I o III apoya una correlacin


positiva; cualquier punto en la regin II o IV apoya en cambio una
Ingeniera Geofsica

correlacin negativa. Tomando en cuenta que se trabaja con muestras


de n puntos o datos, puede llamarse n(I) al nmero de puntos en la regin
I y de igual forma n(II), n(III) y n(IV) el nmero de puntos de las regiones
II, III y IV respectivamente.

9
METODOS DE MODELIZACION GEOFISICA
Con estos elementos, se puede definir un nmero c que permita
establecer tipo y grado de correlacin o asociacin entre las variables en
estudio, de la siguiente manera (Peter Holmes, Correlation: From Picture
to Formula, Teaching Statistics volume 23, Num. 3, Autumn 2001 p p. 67-
70):
n(I) n(III) n(II) n(IV)
(1)
n
A la clase de nmeros a que pertenece c se les conoce genricamente
como coeficientes de correlacin. Analizando la definicin de correlacin
pueden verse algunas de las ideas generales con que se construyen
tales coeficientes.

Propiedades del coeficiente de correlacin c.


a) Si todos los puntos estn en I y III, entonces c =1.
b) Si todos los puntos estn en II y IV, entonces c = -1.
c) Si los puntos estn repartidos equitativamente en las cuatro
regiones, entonces c =0.
d) Si todos los puntos estn en tres o cuatro regiones, entonces c
estar entre -1 y +1: si los puntos estn predominantemente en
I y III, entonces c ser positivo, pero si los puntos estn
predominantemente en II y IV, entonces c ser negativo.

Con el fin de avanzar en el estudio de los coeficientes de correlacin se


recurre a una situacin distinta a la vista pero tambin en un contexto
real.
Tabla 1. Tabla ordenada de menor a mayor considerando la temperatura

Ao T (F) t Mujeres (min)


1996 4 148.300
1980 9
5 145.700
1992 5
0 144.667 Observe que
1982 1
5 147.233 la
1981 5
2 145.483
1998 5 145.283 temperatura
4
1989 5
5 145.500 media pueda
1991 5
6 147.533 repetirse en
1983 5
7 147.000 algunas
1997 9
6 148.717 ocasiones
1995 6
1 148.100
1987 6
2 150.283 (i.e. 73o F) y
1986 4
6 148.100 que, sin
1988 6
5 148.117 embargo, le
1994 7
7 147.617
Ingeniera Geofsica

0 corresponda
1985 7 148.567
1990 7 150.750 n tiempos
2
1993 3
7 146.400 distintos.
1978 7
3 152.500 Esto es
1984 7
5 149.500 comn en
1979 9
8 147.550 parejas de
0 datos
10 estadsticos.
METODOS DE MODELIZACION GEOFISICA
Al recorrer simultneamente las columnas de T y t de arriba abajo, no
logra apreciarse una asociacin entre las variables. Construyendo el
diagrama de dispersin con las temperaturas en el eje horizontal y los
tiempos de las ganadoras en el eje vertical, se llega a la figura 7.

Figura 7 Diagrama de dispersin temperatura vs. Tiempo

El diagrama tampoco es muy revelador del tipo de asociacin, por lo que


se obtiene el punto central y se trazan por ste las lneas de divisin.
Punto central: T = 63.048; t= 147.757.

Figura 8 Diagrama de dispersin con lneas de divisin

La divisin permite distinguir que la distribucin de los puntos se da


predominantemente en las regiones I y III y por tanto considerar una
correlacin positiva entre las variables. Los puntos, sin embargo, se
encuentran muy dispersos respecto a lo que pudiera ser un patrn grfico
lineal, por lo que se esperara un grado de asociacin dbil. Con el fin de
tener medidas numricas se calcula el coeficiente de correlacin c:
Ingeniera Geofsica

n = 21; n(I) = 7; n(II) = 3; n(III) = 8; n(IV) = 3


7+8-3-3
c= = 0.42857
21

11
METODOS DE MODELIZACION GEOFISICA
El signo positivo de c indica la preponderancia de los puntos en las
regiones I y III confirmando la asociacin positiva; la magnitud de c
(0.42857), sin embargo, refleja un grado de correlacin dbil ya que se
encuentra ms bien cercana a cero.
Pudiera pensarse que la magnitud de c indica la dispersin de los puntos
de un diagrama, sin embargo, puede no resultar as en todos los casos,
ya que por ejemplo en las dos grficas de la figura 9 se obtiene c =1, el
grado mximo de correlacin. Esta falla de la magnitud del coeficiente
c a diferenciar el grado de dispersin en ambos diagramas, sugiere
construir un coeficiente de correlacin que, por ejemplo, deje el grado
mximo de asociacin exclusivamente a los casos en que se tienen las
correlaciones lineales positiva y negativa perfectas. Asimismo, que
refleje que el diagrama de dispersin del inciso b) corresponde a una
correlacin de mayor grado que la correlacin que guardan los puntos
del diagrama del inciso a).

Figura 9 Correlacin positiva dbil y fuerte

El cientfico Ingls Karl Pearson desarroll un coeficiente de correlacin


que cumple con los requisitos mencionados y es uno de los ms
ampliamente usados en ingeniera y ciencias.

1.1 Coeficiente de correlacin lineal de pearson


El coeficiente de correlacin de Pearson, pensado para variables
cuantitativas (escala mnima de intervalo), es un ndice que mide el
grado de covariacin entre distintas variables relacionadas
linealmente. Advirtase que decimos "variables relacionadas
linealmente". Esto significa que puede haber variables fuertemente
relacionadas, pero no de forma lineal, en cuyo caso no proceder a
aplicarse la correlacin de Pearson. Por ejemplo, la relacin entre la
ansiedad y el rendimiento tiene forma de U invertida; igualmente, si
relacionamos poblacin y tiempo la relacin ser de forma
exponencial.
En estos casos (y en otros muchos) no es conveniente utilizar la
correlacin de Pearson. Insistimos en este punto, que parece
Ingeniera Geofsica

olvidarse con cierta frecuencia. El coeficiente de correlacin de


Pearson es un ndice de fcil ejecucin e, igualmente, de fcil
interpretacin. Digamos, en primera instancia, que sus valores
absolutos oscilan entre 0 y 1. Esto es, si tenemos dos variables X
e Y, y definimos el coeficiente de correlacin de Pearson entre

12
METODOS DE MODELIZACION GEOFISICA
estas dos variables como x y r entonces:
0 r 1
Hemos especificado los trminos "valores absolutos" ya que en
realidad si se contempla el signo el coeficiente de correlacin de
Pearson oscila entre 1 y +1. No obstante ha de indicarse que la
magnitud de la relacin viene especificada por el valor numrico del
coeficiente, reflejando el signo la direccin de tal valor. En este
sentido, tan fuerte es una relacin de +1 como de -1. En el primer
caso la relacin es perfecta positiva y en el segundo perfecta
negativa. Pasamos a continuacin a desarrollar algo ms estos
conceptos.

Decimos que la correlacin entre dos variables X e Y es perfecta


positiva cuando exactamente en la medida que aumenta una de
ellas aumenta la otra. Esto sucede cuando la relacin entre ambas
variables es funcionalmente exacta. Difcilmente ocurrir en
psicologa, pero es frecuente en las ciencias fsicas donde los
fenmenos se ajustan a leyes conocidas, Por ejemplo, la relacin
entre espacio y tiempo para un mvil que se desplaza a velocidad
constante.
Se dan a continuacin las propiedades de coeficiente de
correlacin r.

Propiedades del coeficiente de correlacin r de Pearson.


a). El valor de r es independiente de las unidades en que se midan x y y.
b). r 1 si y slo si todos los pares de puntos de la muestra estn en una
recta con pendiente positiva y r 1 si y slo si todos los pares de
puntos de la muestra estn en una recta con pendiente negativa.
c). El rango de valores de r est dado por el intervalo 1 r 1.
d). Simetra: El valor de r no depende de cul de las dos variables bajo
estudio se designe como x y cul como y.
e). r mide la fuerza de una relacin lineal. No est diseado para medir la
fuerza de una relacin que no sea lineal

1.1.1 FRMULA UTILIZADA


El coeficiente de correlacin de Pearson viene definido por la
siguiente expresin:
Ingeniera Geofsica

Esto es, el coeficiente de correlacin de Pearson hace


referencia a la media de los productos cruzados de las
puntuaciones estandarizadas de X y de Y. Esta frmula rene
algunas propiedades que la hacen preferible a otras. A operar

13
METODOS DE MODELIZACION GEOFISICA
con puntuaciones estandarizadas es un ndice libre de escala
de medida. Por otro lado, su valor oscila, como ya se ha
indicado, en trminos absolutos, entre 0 y 1.
Tngase en cuenta que las puntuaciones estandarizadas
muestran, precisamente, la posicin en desviaciones tipo de
un individuo respecto a su media. Reflejan la medida en que
dicho individuo se separa de la media. En este sentido,
supongamos que para cada individuo tomamos dos medidas
en X e Y. La correlacin entre estas dos variables ser
perfecta positiva cuando cada individuo manifieste la misma
superioridad o inferioridad en cada una de ellas. Esto se
cumple cuando su posicin relativa sea la misma, es decir,
cuando sus puntuaciones tipo sean iguales (Zx = Zy). En este
caso la frmula de la correlacin se transforma en:

Ya que tal expresin equivale a la varianza de Zx , que como


se sabe vale la unidad.
Cuando la correlacin es perfecta negativa los valores de Zx
y Zy son exactamente iguales pero de signo contrario,
resultando los productos cruzados de Zx y Zy negativos. En
este caso, el valor de la correlacin es el mismo que
anteriormente pero de signo negativo:

Cuando la correlacin es nula, para un valor obtenido de X se


podr obtener cualquier valor de Y; es decir, para un valor
determinado de Zx la misma cantidad de valores positivos y
negativos de Zy. De todo ello resulta que la suma de
productos cruzados valdr cero ya que habr tantos
productos positivos como negativos. As pues:
Ingeniera Geofsica

14
METODOS DE MODELIZACION GEOFISICA
La frmula anterior (1.5) puede expresarse de forma ms
sencilla de la siguiente manera:

Efectivamente:

Esta frmula es especialmente til cuando se conocen las


medias de X e Y as como sus desviaciones tipo, lo cual es
relativamente frecuente. Si por cualquier circunstancia no
dispusiramos de la informacin de estos estadsticos
podramos calcular rxy recurriendo a la expresin en
puntuaciones directas:

Podemos expresar, igualmente, el coeficiente de correlacin


de Pearson en puntuaciones diferenciales o centradas
mediante la siguiente formula:
Ingeniera Geofsica

Donde x = X - X e y = Y - Y.

15
METODOS DE MODELIZACION GEOFISICA
Para su demostracin partamos de (1.5):

1.1.2 SIGNIFICACIN DEL COEFICIENTE DE CORRELACIN

Una vez calculado el valor del coeficiente de correlacin


interesa determinar si tal valor obtenido muestra que las
variables X e Y estn relacionadas en realidad o tan solo
presentan dicha relacin como consecuencia del azar. En
otras palabras, nos preguntamos por la significacin de dicho
coeficiente de correlacin.
Un coeficiente de correlacin se dice que es significativo si se
puede afirmar, con una cierta probabilidad, que es diferente
de cero. Ms estrictamente, en trminos estadsticos,
preguntarse por la significacin de un cierto coeficiente de
correlacin no es otra cosa que preguntarse por la
probabilidad de que tal coeficiente proceda de una poblacin
cuyo valor sea de cero. A este respecto, como siempre,
tendremos dos hiptesis posibles:
H0:rxy = 0 El coeficiente de correlacin obtenido
procede de una poblacin cuya correlacin es cero ( =
0 ).
H1 : rxy = 0 El coeficiente de correlacin obtenido
procede de una poblacin cuyo coeficiente de
correlacin es distinto de cero ( 0 ).
Un ejemplo aplicado a las ciencias de la tierra se le denomina
autocorrelacion o autovarianza. La auto correlacin, tambin
conocido como la correlacin en serie, es la correlacin de
una seal con una copia retardada de s mismo como una
funcin de retardo. De manera informal, es la similitud entre
Ingeniera Geofsica

las observaciones en funcin del tiempo que transcurre entre


ellos. El anlisis de autocorrelacin es una herramienta
matemtica para encontrar patrones que se repiten, como la
presencia de una seal peridica oscurecida por el ruido, o la
identificacin de la frecuencia fundamental faltante en una

16
METODOS DE MODELIZACION GEOFISICA
seal implcita en sus armnicos frecuencias. A menudo se
utiliza en el procesamiento de seales para el anlisis de
funciones o serie de valores, tales como el dominio del tiempo
seales.
Unidad de raz procesos estacionarios tendencia procesos,
procesos autor regresivos, y en movimiento procesos medias
son formas especficas de procesos con autocorrelacin.

Figura 10 Correlacin lineal de una seal

Ingeniera Geofsica

17
METODOS DE MODELIZACION GEOFISICA
2. DIAGRAMA DE DISPERSIN
2.1. Definicin
Los Diagramas de Dispersin o Grficos de Correlacin permiten
estudiar la relacin entre 2 variables. Dadas 2 variables X e Y, se
dice que existe una correlacin entre ambas si cada vez que
aumenta el valor de X aumenta proporcionalmente el valor de Y
(Correlacin positiva) o si cada vez que aumenta el valor de X
disminuye en igual proporcin el valor de Y (Correlacin negativa).
Se utiliza para conocer si efectivamente existe una correlacin
entre dos magnitudes o parmetros de un problema y, en caso
positivo, de qu tipo es la correlacin. Figura 10
En un grfico de correlacin representamos cada par X, Y como un
punto donde se cortan las coordenadas de X e Y:

Figura10 Ejemplo de diagrama de dispersin

2.2. Caractersticas principales

A continuacin se comentan una serie de caractersticas que


ayudan a comprender la naturaleza de la herramienta.

Impacto visual:
Un Diagrama de Dispersin muestra la posibilidad de la
existencia de correlacin entre dos variables de un vistazo.

Comunicacin:
Simplifica el anlisis de situaciones numricas complejas.

Gua en la investigacin:
El anlisis de datos mediante esta herramienta proporciona
mayor informacin que el simple anlisis matemtico de
correlacin, sugiriendo posibilidades y alternativas de estudio,
Ingeniera Geofsica

basadas en la necesidad de conjugar datos y procesos en


su utilizacin.

18
METODOS DE MODELIZACION GEOFISICA
2.3. Construccin
2.3.1. PASOS PREVIOS A LA CONSTRUCCIN DE UN DIAGRAMA DE DISPERSIN

Paso 1: Elaborar una teora admisible y relevante sobre la


supuesta relacin entre dos variables.
Este paso previo es de gran importancia, puesto que el
anlisis de un Diagrama de Dispersin permite obtener
conclusiones sobre la existencia de una relacin entre dos
variables, no sobre la naturaleza de dicha relacin.
Paso 2: Obtener los pares de datos correspondientes a las
dos variables
Al igual que en cualquier otra herramienta de anlisis de
datos, stos son la base de las conclusiones obtenidas, por
tanto cumplirn las siguientes condiciones:
En cantidad suficiente: Se consideran necesarios al
menos 40 pares de datos para construir un Diagrama
de Dispersin.
Datos correctamente emparejados: Se estudiar la
relacin entre ambos.
Datos exactos: Las inexactitudes afectan a su situacin
en el diagrama desvirtuando su apariencia visual.
Datos representativos: Asegrese de que cubren todas
las condiciones operativas del proceso.
Informacin completa: Anotar las condiciones en que
han sido obtenidos los datos.

Paso 3: Determinar los valores mximo y mnimo para cada


una de las variables.
Paso 4: Decidir sobre qu eje representar a cada una de
las variables.
Si se est estudiando una posible relacin causa-efecto, el
eje horizontal representar la supuesta causa.
Paso 5: Trazar y rotular los ejes horizontal y vertical.
La construccin de los ejes afecta al aspecto y a la
consiguiente interpretacin del diagrama.
Ingeniera Geofsica

1. Los ejes han de ser aproximadamente de la misma


longitud, determinando un rea cuadrada.
2. La numeracin de los ejes ha de ir desde un valor
ligeramente menor que el valor mnimo de cada
variable hasta un valor ligeramente superior al valor

19
METODOS DE MODELIZACION GEOFISICA
mximo de las mismas. Esto permite que los puntos
abarquen toda el rea de registro de los datos.
3. Numerar los ejes a intervalos iguales y con
incrementos de la variable constantes.
4. Los valores crecientes han de ir de abajo a arriba y de
izquierda a derecha en los ejes vertical y horizontal
respectivamente.
5. Rotular cada eje con la descripcin de la variable
correspondiente y con su unidad de medida.

Paso 6: Marcar sobre el diagrama los pares de datos

1. Para cada par de datos localizar la interseccin de las


lecturas de los ejes correspondientes y sealarlo con
un punto o smbolo.
Si algn punto coincide con otro ya existente, se traza
un crculo concntrico a este ltimo.
2. Cuando coinciden muchos pares de puntos, el
Diagrama de Dispersin puede hacerse confuso. En
este caso es recomendable utilizar una "Tabla de
Correlacin" para representar la correlacin.
3. En el caso en que se construye un Diagrama de
Dispersin estratificado separando los pares de datos,
por ejemplo, segn el turno de trabajo, lote de materia
prima, etc.), deben escogerse smbolos que pongan de
manifiesto los diferentes grupos de puntos de forma
clara.

Paso 7: Rotular el grfico.


Se rotula el ttulo del grfico y toda aquella informacin
necesaria para su correcta comprensin.
En general, es conveniente incluir una descripcin adicional
del objeto de las medidas y de las condiciones en que se han
realizado, ya que esta informacin puede ayudar en la
interpretacin del diagrama.

2.3.2. EJEMPLO:
Veamos un ejemplo. Supongamos que tenemos un grupo de
personas adultas de sexo masculino. Para cada persona se mide
la altura en metros (Variable X) y el peso en kilogramos (Variable
Y). Es decir, para cada persona tendremos un par de valores X, Y
Ingeniera Geofsica

que son la altura y el peso de dicha persona ver tabla 2.3

20
METODOS DE MODELIZACION GEOFISICA

Ingeniera Geofsica

21
METODOS DE MODELIZACION GEOFISICA

Entonces, para cada persona representamos su altura y su


peso con un punto en un grfico: Una vez que
representamos a las 50 personas quedar un grfico como
el siguiente, ver figura 11. (a) y figura 11. (b)

Figura 11 (a) Persona representada por su altura y su peso.


Ingeniera Geofsica

22
METODOS DE MODELIZACION GEOFISICA

Figura 11 (b). Personas representadas por su altura y su peso.

Qu nos muestra este grfico? En primer lugar podemos observar


que las personas de mayor altura tienen mayor peso, es decir
parece haber una correlacin positiva entre altura y peso. Pero un
hombre bajito y gordo puede pesar ms que otro alto y flaco. Esto
es as porque no hay una correlacin total y absoluta entre las
variables altura y peso. Para cada altura hay personas de distinto
peso, figura 11 (c)

Ingeniera Geofsica

Figura 11 (c) Para cada altura hay personas de distinto peso.

Sin embargo podemos afirmar que existe cierto grado de


correlacin entre la altura y el peso de las personas.

23
METODOS DE MODELIZACION GEOFISICA
2.4. Tipos de diagrama
El resultado de un diagrama de dispersin puede ser de diversos
tipos. Si los puntos trazados en el diagrama estn dispersos al azar,
sin un patrn discernible, significa que los dos conjuntos de
mediciones no tienen relacin entre s. Si los puntos forman algn
patrn, se denota la existencia de relacin entre los dos grupos de
mediciones.
Generalmente, el diagrama de dispersin mostrar los siguientes
posibles tipos de relacin (Ver figura 12):
Ingeniera Geofsica

Figura 12 Tipos de relacin en diagramas de dispersin

24
METODOS DE MODELIZACION GEOFISICA
2.5. Utilizacin

El Diagrama de Dispersin es una herramienta til para comprobar


(aceptar o rechazar) teoras respecto a la supuesta existencia de
una relacin entre dos variables.

Hay tres puntos de dicho proceso en los que el Diagrama de


Dispersin puede ser una herramienta til:

Durante la fase de diagnstico, para ensayar teoras sobre las


causas e identificar las causas raz.
Durante la fase de correccin, en el diseo de soluciones.
Para el diseo de un sistema de control que mantenga los
resultados de una accin de mejora de la calidad.

2.5.1. UTILIZACIN DEL DIAGRAMA DE DISPERSIN EN MINERALOGA


MAGNTICA DE SUELOS VOLCNICOS EN UNA TOPO SECUENCIA DEL
VALLE DE TEOTIHUACN

Relaciones entre parmetros magnticos de los suelos


Los grficos entre parmetros magnticos en diagramas de
dispersin son de gran utilidad, ya que permiten comparar
las caractersticas de las propiedades magnticas de todos
los perfiles en su conjunto (Figura 13). La relacin vs.
MRIS1T es til para determinar la concentracin de minerales
ferrimagnticos y evaluar la presencia de minerales
paramagnticos o antiferrimagnticos y las mezclas de
tamaos (Thompson y Oldfield, 1986). En este diagrama, las
concentraciones crecientes de (Ti-) magnetita se ubican
hacia el extremo superior derecho. Los minerales
paramagnticos contribuyen de manera moderada a la
pero no a MRIS1T, mientras que los minerales de alta
coercitividad (hematita/ goethita) tienden a ubicarse en la
parte baja y derecha del diagrama. Las magnetitas DS
tienden a describir la diagonal de mayor pendiente y las
mezclas con altas concentraciones de partculas MD y SP
tienden a situarse por debajo de sta, debido a que
contribuyen a la pero en menor medida a MRIS1T (Figura
13a). En esta figura, los suelos analizados se distribuyen a
lo largo de una diagonal en la que el perfil CGBE presenta la
Ingeniera Geofsica

mayor concentracin de minerales ferrimagnticos de todos


los suelos analizados. Por el contrario, las muestras del perfil
CED, que se distribuyen en dos grupos, presentan las
menores concentraciones. SNP y OTM se ubican entre los
anteriores. El perfil MAS y un grupo de CED se sitan por

25
METODOS DE MODELIZACION GEOFISICA
debajo de la diagonal, lo que se puede interpretar de forma
diferente. Los bajos valores en ambos parmetros en CED
sugieren poca presencia de ferrimagnticos y
probablemente mayor contribucin de minerales para- y
antiferrimagnticos, mientras que el comportamiento de las
muestras de MAS (bajo MRIS1T y alto ) indican una mayor
abundancia de minerales paramagnticos. La relacin entre
la concentracin magntica y el tamao de partcula DS se
ilustra en el diagrama vs. MRA/MRI100 (Figura 13b). En
general, los suelos presentan una relacin inversa, en donde
los suelos con mayor concentracin (CGBE, CGN)
presentan tambin la menor abundancia de partculas finas
DS, en tanto que el suelo con menor concentracin (OTM)
presenta una mayor abundancia de DS (MRA/MRI100 >
0.05). Esta relacin inversa sugiere que un posible
enriquecimiento en la concentracin no est asociado a un
aumento en partculas finas. Los suelos MAS y CGN
presentan la mayor dispersin, entre los valores extremos,
lo que indica la mayor variabilidad en el tamao de partculas
en ellos. CED presenta valores bajos e intermedios en
MRA/MRI100, lo que sugiere variaciones menores en el
contenido de DS. El diagrama fd% vs. MRA/MRI100 permite
analizar las variaciones en las fracciones de partculas ms
finas, SP y DS, respectivamente (Figura 13c). Aunque con
cierta dispersin, se observa una relacin directa entre
ambos parmetros, lo que sugiere que aquellos suelos con
la mayor abundancia de partculas DS tambin presentan la
mayor abundancia de partculas ultrafinas SP (OTM). En
este diagrama, las muestras de CGN se distribuyen
mayormente a lo largo de la diagonal; sin embargo, aunque
CGBE y un grupo de MAS contienen de manera moderada
partculas SP, tienen una abundancia baja y alta,
respectivamente, de partculas DS. Por otro lado, la relacin
entre la concentracin absoluta y relativa de minerales de
alta coercitividad (hematita/ goethita) se muestra en el
diagrama S300 vs. MRIA300 (Figura 13d). En general, se
presenta una relacin inversa entre ellos, en la que las
muestras de suelos analizados describen dos trayectorias.
MAS, OTM y SNP se agrupan en una diagonal de menor
pendiente, con valores relativamente bajos de MRIA300 y
altos de S300, lo que indica bajas concentraciones de
hematita/goethita. Por arriba de ellos, a lo largo de una
Ingeniera Geofsica

diagonal de mayor pendiente se agrupan CGBE y CGN; sin


embargo, stos presentan altos valores en S 300 y en
MRIA300. Ya que en estos suelos se presenta la mayor
concentracin absoluta tanto de hematita/goethita como de
ferrimagnticos, es posible que la importancia de los

26
METODOS DE MODELIZACION GEOFISICA
minerales de alta coercitividad decrezca debido a un
aumento an mayor en los ferrimagnticos de baja
coercitividad. Por otra parte, en CED las bajas
concentraciones de minerales ferrimagnticos permiten que
las moderadas concentraciones de antiferrimagnticos
resalten en S300.

Figura 13 Diagramas de dispersin de algunos parmetros magnticos. a) vs. MRIS1T


muestra principalmente la concentracin de minerales ferrimagnticos; las
concentraciones crecientes de (Ti-) magnetita se ubican hacia el extremo superior
derecho; los minerales paramagnticos contribuyen a la pero no a MRIS1T; los
minerales de alta coercitividad (hematita y goethita) tienden a ubicarse en la parte baja
y derecha del diagrama. b) vs. MRA/MRI100 ilustra la relacin entre la concentracin
magntica y el tamao de partcula DS-PDS. c) fd% vs. MRA/MRI100 permite analizar
las variaciones en las fracciones de partculas ms finas, SP y DS, respectivamente d)
S300 vs. MRIA300 muestra la relacin entre la concentracin absoluta y relativa de
minerales de alta coercitividad (hematita y goethita).
Ingeniera Geofsica

27
METODOS DE MODELIZACION GEOFISICA
3. REGRESIN LINEAL CON ERRORES DE REDONDEO

El paso siguiente en el anlisis de dos variables aleatorias X y Y consiste


en encontrar la funcin lineal y a0 a1x que sirve para modelar la relacin
entre ellas. Este proceso es llamado regresin lineal y la lnea resultante recta
de regresin.
Cuando los datos tienen errores sustanciales, la interpolacin polinomial
es inapropiada y puede dar resultados poco satisfactorios cuando se
utiliza para predecir valores intermedios. Con frecuencia los datos
experimentales son de este tipo. Por ejemplo, en la figura 14a se muestran
siete datos obtenidos experimentalmente que presentan una variabilidad
significativa. Una inspeccin visual de esos datos sugiere una posible
relacin entre y y x. Es decir, la tendencia general indica que valores altos
de y estn asociados con valores altos de x. Ahora, si un polinomio de
interpolacin de sexto grado se ajusta a estos datos (figura 14b), pasar
exactamente a travs de todos los puntos. Sin embargo, a causa de la
variabilidad en los datos, la curva oscila mucho en el intervalo entre los
puntos. En particular, los valores interpolados para x = 1.5 y x = 6.5
parecen estar bastante ms all del rango sugerido por los datos.
Una estrategia ms apropiada en tales casos consiste en obtener una
funcin de aproximacin que se ajuste a la forma o a la tendencia general
de los datos, sin coincidir necesariamente en todos los puntos. La figura
14c ilustra cmo se utiliza una lnea recta para caracterizar de manera
general la tendencia de los datos sin pasar a travs de algn punto
especfico.
Una manera para determinar la lnea de la figura 14c es inspeccionar en
forma visual los datos graficados y despus trazar una mejor lnea a
travs de los puntos. Aunque tales procedimientos a ojo apelan al
sentido comn y son vlidos para clculos superficiales, resultan
deficientes por ser arbitrarios. Es decir, a menos que los puntos definan
una lnea recta perfecta (en cuyo caso la interpolacin resultara
apropiada), diferentes analistas dibujaran lneas distintas.
Para dejar a un lado dicha subjetividad se debe encontrar algn criterio
para establecer una base para el ajuste. Una forma de hacerlo es obtener
una curva que minimice la discrepancia entre los puntos y la curva. Una
tcnica para lograr tal objetivo, llamada regresin por mnimos cuadrados.
Ingeniera Geofsica

28
METODOS DE MODELIZACION GEOFISICA

FIGURA 14: a) Datos que muestran un error significativo. b) Ajuste polinomial oscilando
ms all del rango de los datos. c) Resultados ms satisfactorios mediante el ajuste por
mnimos cuadrados.

El ejemplo ms simple de una aproximacin por mnimos cuadrados


es ajutar una lnea recta a un conjunto de observaciones definidas por
puntos: (x1, y1), (x2, y2),, (xn, yn). La expresin matemtica para
la lnea recta es

y = a0 + a1x + e (2)
donde a0 y a1 son coeficientes que representan la interseccin con el eje
Y y la pendiente, respectivamente, e es el error, o diferencia, entre el
modelo y las observaciones, el cual se representa al reordenar la
ecuacin (2) como:
e = y a0 a1x

As, el error o residuo es la discrepancia entre el valor verdadero de Y y


el valor aproximado, a0 + a1x, que predijo la ecuacin lineal.

3.1. Criterio para un mejor ajuste


La finalidad de la recta es representar algebraicamente a los datos,
es decir, con una ecuacin del tipo y a0 a1x. se deseara
entonces que la recta trazada representara los datos muestrales de
la mejor manera posible.
Uno de los criterios formales ms ampliamente usado es el del
ajuste por mnimos cuadrados. Se presenta a continuacin el
criterio de ajuste por mnimos cuadrados, mediante una serie de
pasos grficos:
Con una relacin de datos plasmada en un diagrama de dispersin,
se trazan lneas verticales desde cada uno de los puntos a la recta
Ingeniera Geofsica

trazada arbitrariamente (ver figura 15). Se dan las distancias


verticales de algunos de estos puntos a la recta (el clculo de tales
distancias en este momento es irrelevante ya que solo tiene fines
ilustrativos del mtodo).

29
METODOS DE MODELIZACION GEOFISICA

Figura 15 Trazo de lneas verticales de los puntos a la recta

Luego se toma cada una de las verticales trazadas como el lado de


un cuadrado. A cada cuadrado le corresponde un rea igual a lado
x lado; por ejemplo, la distancia del punto correspondiente a Now
(1, 1.5) a la recta es 2.94 y su rea es 8.64, mientras que la
distancia de Salem Ultra (4.5, 4.9) es 1.62 y su rea es 2.62. en el
caso de la marca Bull Durham el rea es 5.52 como se ve en la
figura 16.

Figura 16 Construccin de los cuadrados y calculo de sus reas.

El siguiente paso consiste en sumar las reas de los cuadrados


generados por cada uno de los 25 puntos.
Si se traza arbitrariamente otra recta por entre los puntos se
generara otro juego de 25 cuadrados, cuya suma dara un rea
Ingeniera Geofsica

total seguramente distinta a la del caso inicial. Con estas


consideraciones el escenario queda listo para enunciar el criterio
para seleccionar una recta de ajuste:

30
METODOS DE MODELIZACION GEOFISICA
La recta de ajuste por mnimos cuadrados es aquella que pasa por
entre los puntos de la muestra, de tal modo que produce el rea
total mnima.
El criterio as establecido da lugar a una recta nica. Su deduccin
o, dicho de otra forma, la deduccin del clculo de la ordenada al
origen a0 y la pendiente a1 es un proceso tcnico que minimizan la
ecuacin:

(3)

3.2. Ajuste de una lnea recta por mnimos cuadrados


Para determinar los valores de a0 y a1, la ecuacin (3) se deriva
con respecto a cada uno de los coeficientes:

Observe que hemos simplificado los smbolos de la sumatoria; a


menos que se indique otra cosa, todas las sumatorias van desde
i=1 hasta n. Al igualar estas derivadas a cero, se dar como
resultado un Sr mnimo. Si se hace esto, las ecuaciones se
expresan como:

Ahora, si observamos que a0 = na0, expresamos las ecuaciones


como un conjunto de dos ecuaciones lineales simultneas, con dos
incgnitas (a0 y a1):

. (4)

. (5)
stas se llaman ecuaciones normales, y se resuelven en forma
simultnea
Ingeniera Geofsica

. (6)
Este resultado se utiliza conjuntamente con la ecuacin (4) para
obtener

31
METODOS DE MODELIZACION GEOFISICA

(7)
Donde y son las medias de y y x, respectivamente.

3.2.1. EJEMPLO APLICATIVO

Ajuste a una lnea recta los valores x y y en las dos primeras


columnas de la tabla 2.

Tabla 2 Clculos para el anlisis de error en el ajuste lineal

Se calculan las siguientes cantidades:

Mediante las ecuaciones (6) y (7)

Por lo tanto, el ajuste por mnimos cuadrados es


y = 0.07142857 + 0.8392857x

3.3. CUANTIFICACIN DEL ERROR EN LA REGRESIN LINEAL


Varias propiedades de este ajuste se observan al examinar ms de
cerca la forma en que se calcularon los residuos. Recuerde que la
suma de los cuadrados se define como:
Ingeniera Geofsica

32
METODOS DE MODELIZACION GEOFISICA
En la ecuacin (8), el cuadrado del residuo representa el cuadrado
de la distancia vertical entre el dato y otra medida de tendencia
central: la lnea recta (figura 17).

Figura 17 El residuo en la regresin lineal representa la distancia vertical


entre un dato y la lnea recta.

Una desviacin estndar para la lnea de regresin se determina


como sigue:

(9)
donde a Sy/x se le llama error estndar del estimado. El subndice
y/x designa que el error es para un valor predicho de y
correspondiente a un valor particular de x. Tambin observamos
que ahora dividimos entre n 2 debido a que se usaron dos datos
estimados (a0 y a1), para calcular Sr.
As como en el caso de la desviacin estndar, el error estndar
del estimado cuantifica la dispersin de los datos. Aunque, Sy/x
cuantifica la dispersin alrededor de la lnea de regresin, como se
muestra en la figura 18b, a diferencia de la desviacin estndar
original Sy que cuantifica la dispersin alrededor de la media (figura
18a).
Ingeniera Geofsica

33
METODOS DE MODELIZACION GEOFISICA
Figura 18 Datos de regresin que muestran a) la dispersin de los datos
alrededor de la media de la variable dependiente y b) la dispersin de los
datos alrededor de la lnea de mejor ajuste. La reduccin en la dispersin
al ir de a) a b), como lo indican las curvas en forma de campana a la
derecha, representa la mejora debida a la regresin lineal.

Los conceptos anteriores se utilizan para cuantificar la bondad de


nuestro ajuste. Esto es en particular til para comparar diferentes
regresiones (figura 19). Para hacerlo, regresamos a los datos
originales y determinamos la suma total de los cuadrados alrededor
de la media para la variable dependiente (en nuestro caso, y).

Figura 19 Ejemplos de regresin lineal con errores residuales a)


pequeos y b) grandes.

Los valores estimados i no coinciden con los valores observados


Yi correspondientes. Con el fin de analizar estas desviaciones,
considrese un diagrama de dispersin y la correspondiente lnea
de regresin (ver figura 20). se ha adicionado al diagrama una lnea
horizontal y = , a la que se llamara lnea base; su finalidad es
servir de referente para el anlisis de las desviaciones. A fin de
cuentas es el valor representativo de los valores de esa variable.
Ingeniera Geofsica

Figura 20 Anlisis de la desviacin total

34
METODOS DE MODELIZACION GEOFISICA
Considere un punto cualquiera (Xi, Yi). La desviacin (o diferencia) del
valor Yi respecto a la linea base se representa por Yi - y se conoce
como desviacin total.
La desviacin total puede dividirse en dos partes:

La desviacin explicada i - que expresa la desviacin del


valor i a la lnea base. Podra decirse que la lnea de regresin
explica esa parte de la desviacin: imagine un punto que
puede desplazarse sobre la lnea base (ver figura 21), al mover
el punto a la derecha, la desviacin, representada por las lneas
en gris, aumenta (tome en cuenta que son valores negativos);
llega a cero en la interseccin con la recta de regresin y sigue
aumentando al avanzar a la derecha.

Figura 21 Desviacin explicada i -

La desviacin no explicada Yi - i que indica la desviacin del


valor yi de la lnea de regresin. Suponga ahora un punto mvil
que se desplaza sobre la recta de regresin (ver figura 22). Al
desplazarse sobre esta, la desviacin de los puntos de la
muestra a la recta de regresin no sigue un patrn ya que su
distribucin es aleatoria: su posicin (arriba o debajo de la
recta) asi como su magnitud son aleatorios. En resumen, hay
factores aleatorios y de otro tipo que la recta no explica en
forma alguna.
Ingeniera Geofsica

35
METODOS DE MODELIZACION GEOFISICA

Figura 22 Aleatoriedad de los puntos respecto a la recta de


regresin.

Para analizar algebraicamente las desviaciones considrese la


siguiente relacin:

Elevando al cuadrado ambos miembros y sumando sobre todos los


puntos:

Desarrollando algebraicamente el lado derecho:

Como se incluye a todos los puntos de la muestra, el termino


variacin resulta ms apropiado que el de desviacin.
Ingeniera Geofsica

(10)
Dividiendo entre la variacin total ambos lados de la ecuacin 10

36
METODOS DE MODELIZACION GEOFISICA

Simplificando:

(11)

El primer trmino del lado derecho es denotado como r2 ya que la


raz cuadrada es equivalente al coeficiente de correlacin de
Pearson r. Se conoce como el coeficiente de determinacin y suele
manejarse as:

(12)

La expresin 12 da pie a continuar el anlisis iniciado con el


coeficiente de correlacin de Pearson, pero tomando ahora en
cuenta la recta de regresin. Para ellos se da primero un resumen y
despus su aplicacin.
El valor de r2 es la razn de la variacin explicada sobre la
variacin total. Es decir, r2 es la fraccin de la variacin total en
Y que puede explicarse usando el modelo lineal
= b0 + b1x.
1 r2 es la fraccin de la variacin total en y debida al azar o a
la posibilidad de variables ocultas (desconocidas) que influyen
en y.
En el caso de la tabla 2 se tiene r = 0.932 con lo que el coeficiente
de determinacin es r2 = 0.868. Puede decirse entonces, de acuerdo
al primer punto, que alrededor de 87% del comportamiento
(variacin) de la variable Y, puede explicarse por medio del
Ingeniera Geofsica

correspondiente comportamiento (variacin) de la variable X


mediante la ecuacin de regresin.
Como r2 = 0.87, 1 - r2 = 0.13. De acuerdo al segundo punto, el
comportamiento (variacin) de alrededor de 13% de la variable Y se

37
METODOS DE MODELIZACION GEOFISICA
debe al azar o a posibles variables, desconocidas para el
investigador, que influencian Y.

3.4. Linealizacin de relaciones no lineales

La regresin lineal ofrece una poderosa tcnica para ajustar una


mejor lnea a los datos. Sin embargo, se considera el hecho de que
la relacin entre las variables dependiente e independiente es lineal.
ste no es siempre el caso, y el primer paso en cualquier anlisis de
regresin deber ser graficar e inspeccionar los datos en forma
visual, para asegurarnos que sea posible usar un modelo lineal. Por
ejemplo, la figura 23 muestra algunos datos que obviamente son
curvilneos. En algunos casos, las tcnicas como la regresin
polinomial son apropiadas. En otros, se pueden utilizar
transformaciones para expresar los datos en una forma que sea
compatible con la regresin lineal.

Figura 23 a) Datos inadecuados para la regresin lineal por mnimos


cuadrados. b) Indicacin de que es preferible una parbola.

Si bien el diagrama es importante, no lo es menos la teora o


experiencia de la situacin en estudio. Conjuntando estos elementos
se puede advertir que la relacin entre dos variables de inters sea
curvilnea, algunos ejemplos tpicos son las reacciones qumicas, el
crecimiento poblacional, la relaciones entre gasto en publicidad y
ventas, etctera.
En tales casos, es importante analizar la posibilidad de usar un
modelo matemtico cuyos parmetros por las funciones
intrnsecamente lineales. Un ejemplo tpico de ellas es el de la
funcin exponencial

(13)

Para ver el significado de la expresin intrnsecamente lineal, se


Ingeniera Geofsica

toman logaritmos base e en ambos lados de la ecuacin 13,


quedando:

38
METODOS DE MODELIZACION GEOFISICA
Aplicando las propiedades de los logaritmos se llega a

(14)
Como Y es una variable, tambin lo es In(y), de modo que puede
llamarse ya esta nueva variable. Por otro lado, dado que b 0 es una
constante, tambin lo es In (b0) y puede denotarse como b0a la
nueva constante. Sustituyendo en la ecuacin anterior:
Y= b0+ b1 X . (15)
La exponencial 13 se ha transformado en una nueva funcin 15
cuya relevancia consiste en que es lineal y por tanto el que sus
parmetros b0 y b1 se puedan calcular en la forma vista en la seccin
anterior.
Una funcin y= f(x) que relaciona a Y con X es intrnsecamente lineal,
si por medio de una transformacin en X o en Y o en ambas, la
funcin se puede expresar en general como una funcin lineal
Y= b0+ b1 x, con x= variable predictiva transformada, y= variable
respuesta transformada y parmetros b0+ b1.
Cuatro de las funciones intrnsecamente lineales ms empleadas se
dan en la tabla 3. En los incisos a) y b) la transformacin apropiada
es logartmica y en los incisos c) y d) es simplemente un cambio de
variable.
Tabla 3 Funciones intrnsecamente lineales ms comunes *.

*cuando aparece log(*), se puede usar ya sea el logaritmo base 10


o el logaritmo base e .

Las grficas representativas de las cuatro funciones se ilustran en la


figura 24. Tales graficas corresponderan a correlaciones perfectas,
por lo que sirven de modelos para comparar los diagramas de
dispersin con que se trabaje.
Ingeniera Geofsica

39
METODOS DE MODELIZACION GEOFISICA
Ingeniera Geofsica

Figura 24 Correlaciones perfectas de funciones intrnsecamente lineales

40
METODOS DE MODELIZACION GEOFISICA
3.5. Ejemplos en ingeniera geofsica

METODO DE REFRACCION SISMICA


La construccin de las domocronas desde los registros de
campo requiere de un proceso matemtico conocido como
regresin lineal. Como los puntos no estn alineados, debe
encontrarse la recta que mejor se ajusta a ellos. Esto porque
que el suelo donde se clava cada gefono generalmente no
es siempre el mismo, ni tampoco el anclaje ni la fijacin.
Cuando se presenta una interfaz inclinada la determinacin
se complica ms, pero no lo suficiente como para que sea
resuelto tambin sencillamente.

Figura 25 Construccin de las domocronas en relacin al terreno

Resulta interesante analizar las domocronas para una interfaz


horizontal y una inclinada ascendente hacia la derecha (Ver
figura 26 y 27), manteniendo los contrastes de velocidad y la
profundidad en un extremo. En la grfica vemos que la
pendiente de la segunda recta (refractada) disminuye, o lo que
Ingeniera Geofsica

es lo mismo, la velocidad aumenta. Quiere decir que la


inclinacin del estrato distorsiona el valor verdadero de la
velocidad, razn por la que se la llama velocidad aparente.
Concretamente, si la interfaz se inclina ascendente hacia la

41
METODOS DE MODELIZACION GEOFISICA
derecha la velocidad aparente es mayor, y si se inclina
ascendente a la izquierda la velocidad aparente disminuye.
Pareciera entonces que el mtodo falla, es decir que no
sabremos si estamos en presencia de un estrato horizontal o
inclinado y por lo tanto obtendremos el valor de una velocidad
que tampoco sabremos si es verdadera. Afortunadamente a
alguien se le ocurri realizar lo que se conoce como
contraperfil. Esto implica colocar la fuente en el otro extremo
de la ristra. En la prctica esto es sencillo, porque la ristra de
gefonos se coloca una sola vez y solo debe generarse la
perturbacin en los dos extremos del perfil.

Figura 26 Construccin de las domocronas en relacin al terreno


horizontal
Ingeniera Geofsica

Figura 27 Construccin de las domocronas en relacin al terreno


inclinado ascendente hacia la derecha

42
METODOS DE MODELIZACION GEOFISICA
Primero analicemos las domocronas con perfil y contraperfil
para estratos horizontales. Vemos que son totalmente
simtricas o espejadas, y las pendientes de las rectas son
idnticas tanto de ida como de vuelta. Cuando el estrato est
inclinado notamos que el primer tramo o recta de propagacin
directa es idntico y espejado como en el caso horizontal, pero
el segundo tramo presenta algo interesante: las pendientes no
son iguales, aunque los tiempos totales de ida y de vuelta
llamados tiempos recprocos s son iguales. Esto porque el
camino que recorre la onda de ida o de vuelta es el mismo. Lo
que cambia en cada caso es la longitud de los caminos
parciales que componen el camino total. Un detalle importante
que simplifica an ms el proceso es que, si la pendiente de la
interfaz es menor del 10%, la velocidad verdadera resulta bien
determinada al promediar las velocidades aparentes de ida y
de vuelta, tambin llamadas descendente y ascendente.
La ecuacin de tiempo de viaje con una capa inclinada es
esencialmente la misma que para capa horizontal, aunque
inicialmente tiene ms trminos y pasos algebraicos para llegar
al resultado final. Entonces:

t = EM/V1 + MN/V2 + NGV1 ...(16)

Figura 28 Variables usadas en la ecuacin 16

El mtodo de Refraccin tambin permite detectar cambios


laterales de material en superficie, incluso cuando este cambio
Ingeniera Geofsica

est cubierto o tapado por otro material (Ver figura 29).

43
METODOS DE MODELIZACION GEOFISICA

Figura 29 Cambios laterales de material en superficie

Otro caso particular se presenta cuando existe un salto o


escaln por falla. Como se ve en la figura 30, es lgico que la
recta correspondiente al estrato fallado est cortada y que el
tramo de la parte inferior se retarde respecto del superior.
Ingeniera Geofsica

44
METODOS DE MODELIZACION GEOFISICA

Figura 30 Salto o escaln por falla

Ingeniera Geofsica

45
METODOS DE MODELIZACION GEOFISICA
4. REGRESIN POR MNIMOS CUADRADOS
Es una tcnica de Anlisis Numrico en la que, dados un conjunto de
pares (o ternas, etc.), se intenta encontrar la funcin que mejor se
aproxime a los datos (un mejor ajuste).
En su forma ms simple, intenta minimizar la suma de cuadrados de las
diferencias ordenadas (llamadas residuos) entre los puntos generados por
la funcin y los correspondientes en los datos.

4.1. Ajuste
Para estudiar el comportamiento de una serie de datos obtenidos
empricamente, constituidos por puntos dados mediante pares
ordenados de nmeros, asociados con los valores de dos
variables, es necesario contar con una funcin, que exprese
analticamente la relacin funcional que guardan las variables en
cuestin.

4.2. Interpolacin y ajuste

La interpolacin se caracteriza por suponer que los datos que


intervienen en el problema son exactos; por lo cual en la
construccin de la FUNCION DE INTERPOLACION se exige que
la misma satisfaga todos y cada uno de los valores que constituyen
los datos.
El ajuste supone que los datos ingresados estn afectados en
cierto grado de errores debido al modelado, por lo que, no resulta
indispensable que la CURVA DE AJUSTE correspondiente, pase
exactamente por los puntos que representan los datos, sino que,
en promedio la aproximacin sea ptima de acuerdo a un cierto y
determinado criterio, denominado CRITERIO DE AJUSTE. El
iniciador de estos procedimientos fue Gauss, quien desarrollo el
tan conocido METODO DE LOS MINIMOS CUADRADOS.
Se le conoce tambin bajo el nombre de Regresin. Con el tiempo
se le han dado otros nombres como Lineal o Cuadrtica
dependiendo de la curva que se desea aproximar (Figura 31). Para
este caso en particular, se comenzar con la regresin lineal.
Luego se generalizar para cualquier curva que se desee.
Ingeniera Geofsica

46
METODOS DE MODELIZACION GEOFISICA

Figura 31 Regresin Lineal y Cuadrtica.

4.3. Proyecciones
Una proyeccin no es ms que la representacin de un elemento
de un espacio vectorial a un sub espacio del mismo. Con esto se
quiere decir que un vector a de un conjunto W es representado por
otro vector de un conjunto V ms pequeo, cuando el conjunto V
est contenido en el conjunto W. (Figura 32)

Figura 32 Proyeccin de un vector de un espacio a un sub espacio.

Los casos ms comunes que se utilizan para ejemplificar esto, es


el de un vector sobre una recta y el de un vector sobre un plano. La
generalizacin de ambos casos termina siendo una matriz que
realiza la proyeccin de un especio a otro. La matriz es particular
para cada proyeccin, sin embargo, el concepto es el mismo en
todos los casos. A esta matriz se le llama matriz de proyeccin.

4.4. Caso de una recta


Se comenzar asumiendo que se tiene una cantidad n de puntos
en el plano. Cada punto tendr una coordenada xi y una
coordenada yi. Se quiere aproximar la tendencia de estos mediante
una recta de la forma:
Ingeniera Geofsica

g(x) = a + bx

47
METODOS DE MODELIZACION GEOFISICA
Se intentar hacer que todos los puntos pasen por la recta, por lo
que se tendr n ecuaciones de una recta expresadas de la
siguiente forma:

Donde es una aproximacin de la coordenada en y de cada


punto. Esto se puede reescribir de forma matricial de la siguiente
manera:

Que, reescribindolo, es lo mismo que:

..(16)

La matriz que contiene a los xi se la ha identificado como A, al


vector de incgnitas (a y b) como x y al vector que contiene a las
como v. Pero para todo xi habr un diferente de yi ya que la
recta no pasar realmente por todos los puntos. Entonces se
cuenta con cierto error para cada punto (Figura 33).
Ingeniera Geofsica

Figura 33 Distancia de las que se compone el error.

48
METODOS DE MODELIZACION GEOFISICA
El error se medir en forma de distancias entre yi y . Ntese que
en este caso se utilizar la forma vista con anterioridad. El error
para cada xi estar dado por:

Y entonces, el error total en todo el mtodo se puede expresar


de la siguiente forma:

4.5. Generalizacin
En esta seccin se intentar generalizar el concepto que se vio en
la seccin anterior. Para ello se considerar que la curva que
describe la tendencia de la coleccin de puntos es un polinomio P
de grado m. Entonces la ecuacin ser la siguiente:

Entonces las n ecuaciones para los puntos dados se vern de la


siguiente forma:

..(17)

Ntese que la ecuacin (01) y ecuacin (02) terminan de la misma


forma. Por lo que el procedimiento a partir de estas ser el mismo.
Ahora, se proceder a ver el error generalizado a polinomios. Para
ello la ecuacin principal ser de la forma:

Entonces el error total se puede expresar de la siguiente forma:

Una manera ms metdica y aplicativa para entender el mtodo


Ingeniera Geofsica

de mnimos cuadros tenemos:

49
METODOS DE MODELIZACION GEOFISICA
Ajuste de curvas
Para determinar una ecuacin que relacione variables, un
primer paso es recolectar datos que muestran los valores
correspondientes de las variables en consideracin.
El siguiente paso es graficar los puntos (x1, y1), (x2, y2),..., (xn,
yn) en un sistema rectangular de coordenadas. El conjunto de
puntos resultante suele denominarse diagrama de dispersin.
A partir del diagrama de dispersin es posible visualizar una
curva suave que se aproxima a los datos. Tal curva se
denomina curva de aproximacin.
El problema general para encontrar ecuaciones de curvas de
aproximacin que se ajusten a conjuntos de datos se denomina
ajuste de curvas.

Ecuaciones de Curvas de Aproximacin


A continuacin se presenta una lista de varios tipos de curvas
de aproximacin y sus ecuaciones, con el propsito de tener
una referencia. Todas las letras, excepto X y Y representan
constantes. Las variables X y Y se conocen como variable
independiente y variable dependiente, respectivamente,
aunque estos papeles pueden intercambiarse.

Las partes derechas de las ecuaciones se denominan


polinomios de primero, segundo, tercero, cuarto y n-simo
grados, respectivamente. Las funciones definidas por las
primeras cuatro ecuaciones se llaman funciones lineal,
cuadrtica, cbica y cuartica, en ese orden.
Las siguientes son algunas otras de las muchas ecuaciones
usadas en la prctica con frecuencia:
Ingeniera Geofsica

50
METODOS DE MODELIZACION GEOFISICA

Para decidir qu curva debe utilizarse es necesario obtener


diagramas de dispersin de variables transformadas. Por
ejemplo, si un diagrama de dispersin de log Y contra X
muestra una relacin lineal, la ecuacin tiene la forma (7),
mientras que si logY contra log X indica una relacin lineal la
ecuacin es de la forma (8). A menudo se usa papel milimtrico
para facilitar la decisin sobre cul curva utilizar. El papel para
graficar que contiene una escala dividida en forma logartmica
se conoce como papel grfico semilogartmico (o semilog), y
aquel con las dos escalas divididas en forma logartmica se
llama papel grfico log-log.

Mtodo de Ajuste de Curvas a Mano


Con frecuencia puede utilizarse el juicio personal para dibujar
una curva de aproximacin que ajuste un conjunto de datos.
ste se denomina mtodo de ajuste de curvas a mano. Si se
conoce el tipo de ecuacin de esta curva, es posible obtener
las constantes de la ecuaciones eligiendo tantos puntos de la
curva como constantes haya en la ecuacin. Por ejemplo si la
curva es una lnea recta, se requieren dos puntos; si es una
parbola, se necesitan tres puntos. El mtodo tiene la
desventaja de que distintos observadores obtendrn diferentes
y ecuaciones.

Aplicacin del Mtodo de Mnimos Cuadrados


Ingeniera Geofsica

Para evitar el juicio personal en la construccin de rectas,


parbolas u otras curvas de aproximacin para ajustar los
conjuntos de datos, es necesario tener una definicin de una
"recta de mejor ajuste", "parbola de mejor ajuste", etctera.
Para lograr tal definicin, considrese la figura 34, en donde los

51
METODOS DE MODELIZACION GEOFISICA
datos estn dados por los puntos (X1 ,Y1), (X2 ,Y2),..., (XN ,YN).
Para un valor determinado de X por ejemplo X1, habr una
diferencia entre el valor Y1 y el valor correspondiente deducido
a partir de la curva C. Como se muestra en la figura, esta
diferencia se simboliza con D, y se conoce como una
desviacin, un error o un residual, y puede ser positiva,
negativa o cero. De manera similar, se obtienen las
desviaciones D2,..., Dn correspondientes a los valores X2,..., Xn
. Una medida de la "bondad de ajuste" de la curva C de los
datos est proporcionada por la cantidad D + D + + Dn.
Si sta es pequea, el ajuste es bueno; si es grande, el ajuste
es malo. Por lo tanto, se tiene la siguiente definicin:
De todas las curvas que se aproximan a un conjunto de datos
definidos por puntos, la curva que tiene la propiedad de que D
+ D + + Dn es un mnimo se denomina curva de ajuste
ptimo.
Se dice que una curva con esta propiedad se ajusta a los datos
en el sentido de mnimos cuadrados y se le llama curva de
mnimos cuadrados. Entonces, una recta con esta propiedad
se denomina recta de mnimos cuadrados, una parbola con
esta propiedad se denomina parbola de mnimos cuadrados,
etctera

.
Figura 34 Distancia de las que se compone el error.

Es habitual emplear la definicin anterior cuando X es la


variable independiente Y y es la variable dependiente. Si X es
Ingeniera Geofsica

la variable dependiente, la definicin se modifica pues en este


caso se consideran desviaciones horizontales en lugar de
desviaciones verticales, que es lo mismo que intercambiar los
ejes X y Y. Estas dos definiciones generalmente conducen a

52
METODOS DE MODELIZACION GEOFISICA
curvas diferentes de mnimos cuadrados. A menos que se
especifique lo contrario, se debe considerar Y como la variable
dependiente y X como la variable independiente. Es posible
definir otra curva de mnimos cuadrados si se toman en cuenta
distancias perpendiculares a partir de cada uno de los puntos
de la curva, en lugar de distancias horizontales o verticales; sin
embargo, esto no suele utilizarse.

4.6. Recta de mnimos cuadrados


La recta de mnimos cuadrados que se aproxima al conjunto de
puntos (X1, Y1), (X2 ,Y2),..., (XN , YN) tiene por ecuacin:

Donde las constantes a y a se determinan resolviendo


simultneamente las ecuaciones

Denominadas ecuaciones normales para la recta de mnimos


cuadrados. Las constantes a y a de estas ecuaciones pueden
calcularse a partir de las frmulas:

4.7. La parbola de los mnimos cuadrados


La parbola de mnimos cuadrados que se aproxima al conjunto de
puntos (X1, Y1), (X2,Y2) (XN ,YN) tiene por ecuacin

Donde las constantes a, a y a se determinan resolviendo


simultneamente las ecuaciones.

Denominadas ecuaciones normales de la parbola de mnimos


Ingeniera Geofsica

cuadrados.

53
METODOS DE MODELIZACION GEOFISICA
CONCLUSIONES

La observacin de relaciones claras y estables entre variables ayuda a


comprender los fenmenos y a encontrar explicaciones de los mismos e
indica las vas probablemente ms eficaces para intervenir sobre las
situaciones.

El diagrama de dispersin es una herramienta muy til para la


determinacin de causas, diseo de soluciones y controles, priorizacin
de Causas

La regresin lineal muestra la relacin entre las variable independiente y


dependiente, las cuales deben ser ajustadas por mnimos cuadrados con
el fin de que la recta represente los datos muestrales de la mejor manera
posible

En la prctica los datos no siempre se ajustan a una relacin lineal


netamente, sin embargo, se puede realizar transformaciones para
expresar los datos en una forma que sea compatible con la regresin
lineal.

Para evitar el juicio personal en la construccin de rectas, parbolas u


otras curvas de aproximacin para ajustar los datos proporcionados, es
necesario tener una definicin de una "recta de mejor ajuste", "parbola
de mejor ajuste", etctera, y estos sern proporcionados por el mtodo de
Mnimos Cuadrados.

El Mtodo de los Mnimos Cuadrados nos permite ver el porcentaje de


relacin de los datos y un modelo matemtico de ajuste.
Ingeniera Geofsica

54
METODOS DE MODELIZACION GEOFISICA
BIBLIOGRAFIA

Mtodos Numricos para Ingenieros, Steven C. Chapra Raymond P.


Canale, 5ta Edicion, Pag. 466
Mtodo de Mnimos Cuadrados, Universidad de San Carlos de Guatemala
Anlisis Numrico y Mtodos Numricos
Ajuste de Datos Por Mnimos Cuadrados, Escuela de Ingeniera
Aeronutica y del espacio, Laboratorio Fisica II
Ajuste de Curvas y el Mtodo de Mnimos Cuadrados, Pag. 284
Anlisis de correlacin y regresin Lineal , Annimo.
Estudios de Refraccin Ssmica, Ensayos de MASW, Lima- Per

PAGINAS WEB

http://curso.unach.mx/~rarceo/docs/Chapra.pdf
file:///C:/Users/RUBBY/Downloads/4024-20078-1-PB.pdf
https://catedras.facet.unt.edu.ar/geofisica/wp-
content/uploads/sites/4/2014/02/Sismica-para-Geologos.pdf
http://www.geofisica.cl/English/pics3/FUM6.htm
http://www.ingenieria.unam.mx/~revistafi/ejemplaresHTML/V13N4/V13N
4_art07.php
http://www.ugm.org.mx/publicaciones/geos/pdf/geos06-
1/sesiones_regulares/EG.pdf
https://www.aiteco.com/diagrama-de-dispersion/
http://walker.dgf.uchile.cl/Explorador/Marino/info/Documentacion_Explor
ador_Marino.pdf
http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S1026-
87742015000100009
Ingeniera Geofsica

55
METODOS DE MODELIZACION GEOFISICA
ANEXOS
ANEXO N01

n X Y X.Y X Y* (Y*-Y) (Y-Y)


1 5 8 40 25 5.92 2770.50 2555.86
2 10 20 200 100 16.92 1733.52 1486.53
3 20 33 660 400 38.92 385.56 653.09
4 25 45 1125 625 49.92 74.57 183.75
5 30 58 1740 900 60.92 5.59 0.31
6 35 79 2765 1225 71.92 178.61 417.98
7 40 85 3400 1600 82.92 593.63 699.31
8 45 99 4455 2025 93.92 1250.64 1635.75
9 50 100 5000 2500 104.92 2149.66 1717.64
260 527 19385 9400 9142.28 9350.22

Y*: terico ....Y*=a+bX


9a + 260b = 527 CORRELACIN
260a + 9400b = 19385
((.))
S = [Y Y*]=min a=-5.08 r = ((.))
siendo Y*: valor terico b= 2.20
9142.28
Y: valor experimental =
9350.22
SOLUCIN.
Entonces....Y*=-3.27+2.25X r %= 0.98x100% = 98%
= [Y (a + bX)] = 0

na + bX = Y
aX + b X = YX

Mtodo de Mnimos Cuadrados


120
y = 2,2026x - 5,0765
100 R = 0,9801
COORDENADA Y

80

60
Y
40 Lineal (Y)

20

0
Ingeniera Geofsica

0 10 20 30 40 50 60
COORDENADA X

56

Potrebbero piacerti anche