Sei sulla pagina 1di 11

Análisis Numérico. Proyecto 4.

Mı́nimos cuadrados.
Profesor: Javier de Jesús Cortés Aguirre.
Ayudantes: Leticia Angelica Ramı́rez Galicia.
Citlali Edith Ramı́rez Galicia.
Facultad de Ciencias, UNAM
3 de mayo de 2017

1. Dados los siguientes vectores:


 
  2
4
α= , β= 1 
3
2

Encuentre la matriz de rotación G y el reflector de Householder F tales


que:  
  −3
5
Gα = , Fβ =  0 
0
0

2. Dada la matriz  
1 0 1
A= 1 1 0 
0 1 1
Calcule su factorización QR (a mano) utilizando los métodos de Gram-
Schmidt, reflexiones de Householder y rotaciones de Givens.
3. Las siguientes cifras muestran la evolución de las tasas de interés mensuales
a lo largo de un año:
M es T asa
Enero 5.75 %
F ebrero 6.3 %
M arzo 6.12 %
Abril 5.97 %
M ayo 5.52 %
Junio 4.87 %

1
a) Utilizando el método de ecuaciones normales elabore un programa
que ajuste los datos a polinomios de la forma:

p(x) = c1 + c2 x + ... + cn+1 xn

para n = 1 : 5.
b) Suponga que utilizando solo estos datos, se buscan estimar las tasas
de interés para los siguientes meses. Utilice su programa para graficar
el polinomio de mı́nimos cuadrados hasta el mes de diciembre. ¿Cómo
son las graficas obtenidas, modelan de manera adecuada el proble-
ma?,
c) ¿Cuál es el valor del número de condición de la matriz del sistema
obtenida por ecuaciones normales para cada n, que tanto afecta el
no tener información previa de los siguientes meses?

4. El siguiente problema consiste en determinar la curva de crecimiento de


una población de bacterias. Los datos a utilizar son, el número de individ-
uos de una especie particular de bacterias (yi ) en el tiempo (ti ).

t = [0, 4, 7.5, 25, 31, 48.75, 52, 58.5, 72.7, 78, 95, 96, 108, 112, 133, 136.75, 143, 156.5, 166.7, 181]

y = [8, 6, 6, 7, 8, 10, 13, 18, 33, 38, 76, 78, 164, 175, 280, 300, 320, 405, 385, 450]
a) Realize un programa en Matlab que calcule el polinomio de ajuste
de grado n (con n dada por el usuario) mediante el método de Ecua-
ciones normales.
b) ¿Qué pasa cuando el valor de n crece?, ¿es mejor el ajuste?, ¿tiene
sentido para el fenómeno real?
5. Considere los siguientes datos, obtenidos de un experimento a intervalos
de un segundo, con la primera observación en el tiempo t = 1.0:

t: 1 - 9 t: 10 -18 t: 19 - 25
5.0291 7.5677 14.5701
6.5009 7.2920 17.0440
5.3666 10.0357 17.0398
4.1272 11.0708 15.9069
4.2948 13.4045 15.4850
6.1261 12.8415 15.5112
12.5140 11.9666 17.6572
10.0502 11.0765
9.1614 11.7774

a) Utilizando ecuaciones normales, ajuste los datos por una lı́nea recta
y(t) = β1 + β2 t y grafique los residuales y(tk ) − yk . Observe que uno
de los datos tiene un residual mucho mayor que el resto. Sospechamos
que no encaja con el resto de los datos, es decir, es un valor atı́pico.

2
b) Deseche el valor atı́pico, y ajuste nuevametne los datos con una lı́nea
recta. Una vez más, grafique los residuales. ¿Qué patrón se observa
en la gráfica de residuales? ¿Los residuos parecen azarosos?
c) Para deshacerse de las tendencias de los residuos, ajustar los datos
(ya sin el valor atı́pico) con un nuevo modelo

y(t) = β1 + β2 t + β3 sen(t)

Grafica los resuduales. ¿parecen azarosos ahora?

6. Un fenómeno que puede presentarse al utilizar el método de Gram-Schmidt


es la pérdida de ortogonalidad. En una A.P.F. de 5 dı́gitos con redondeo,
considere la siguiente matriz
 
0.70001 0.70711
A=
0.70002 0.70711

Observe que la matriz es cercana a una de rango deficiente.


a) Calcule el primer paso de Gram-Schmidt (es decir j = 1) para obtener
r11 y q1.
b) Calcule el segundo paso y obtenga r12, r22 y q2 .
c) Utilizando los incisos anteriores, dé la forma de las matrices Q y R
de la factorización QR de A.
d) ¿Las columnas de Q son ortogonales?, ¿cómo afecta el rango defi-
ciente de A a las columnas que se obtuvieron de Q? Concluya.

Hint: Recuerde que:


(
qit aj i 6= j
rij = Pj−1
||aj − k=1 rkj qk ||2 i=j

7. Para matrices que son de rango deficiente es natural observar una pérdida
de ortogonalidad en la matriz Q de la factorización QR, por ejemplo para
la matriz:  
1 1 1
A= 1 1 1 
1 1 1

Un experimento interesante consiste en perturbar ligeramente la matriz


de tal forma que  
1 1 1+ 
à =  1+  1 1 
1 1+  1
con  pequeño. Tomando esta matriz perturbada, realice lo siguiente para
valores de  = 10−n con n = 0, 1, ..., 15.

3
a) La factorización QR de la matriz por el método de Gram-Schmidt
y verifique la ortogonalidad de la matriz Q resultante calculando la
norma ||QtQ − I||.
b) El mismo proceso pero mediante el método de reflexiones de House-
holder.
c) El mismo proceso pero mediante el método de rotaciones de Givens.
Elabore una tabla donde ilustre y pueda comparar los resultados, ¿qué puede
concluir acerca de los métodos de factorización QR para matrices cercanas
a una de rango deficiente?, ¿ cuál preserva mejor la ortogonalidad?
8. Los datos que sigue la trayectoria de un nuevo planeta detectado por la
Agencia Espacial Mexicana (AEM) son:
 
x 1.02 0.95 0.87 0.77 0.67 0.56 0.44 0.30 0.16 0.01
y 0.39 0.32 0.27 0.22 0.18 0.15 0.13 0.12 0.13 0.15

Con el fin de predecir la ubicación del planeta en determinado tiempo es


necesario encontrar una buena aproximación a su órbita. Por ello la AEM
recurre a usted con el fin de encontrar tal órbita. Tomando la ecuación:

ay2 + bxy + cx + dy + e = x2

a) Encuentre la órbita elı́ptica que mejor se ajuste utilizando el método


de ecuaciones normales para encontrar los coeficientes de la cuadrática
y grafique la órbita calculada junto con las observaciones. Calcule el
valor del residual para este ajuste.
b) Encuentre ahora la órbita elı́ptica que mejor se ajuste utilizando
el método de Gram-Schmidt para encontrar los coeficientes de la
cuadrática y grafique la órbita calculada junto con las observaciones.
Calcule también el valor del residual para este ajuste.
c) ¿Compare las graficas y residuales producidas por ambos métodos y
concluya?
De hacerlo satisfactoriamente la AEM dará tu nombre (o el nombre de tu
elección) al nuevo planeta.
9. En un trabajo relacionado con el estudio de la eficiencia de la utilización de
la energı́a por las larvas de la polilla modesta (Pachysphinx modesta), L.
Schroeder [Schrl] utilizó los siguientes datos para determinar una relación
entre W , el peso de las larvas vivas en gramos, y R, el consumo de oxı́geno
de las larvas en mililitros/hora. Por razones biológicas, se supone que entre
W y R existe una relación de la forma R = bW a .

4
W R W R W R W R
0.017 0.154 0.211 0.366 3.040 3.590 0.233 0.537
0.087 0.296 0.999 0.771 4.290 3.600 0.783 1.470
0.174 0.363 3.020 2.010 5.300 3.880 1.350 2.480
1.110 0.531 4.280 3.280 0.020 0.180 1.690 1.440
1.740 2.230 4.580 2.960 0.119 0.299 2.750 1.840
4.090 3.580 4.680 5.100 0.210 0.428 4.830 4.660
5.450 3.520 0.020 0.181 1.320 1.150 5.530 6.940
5.960 2.400 0.085 0.260 3.340 2.830
0.025 0.23 0.171 0.334 5.480 4.150
0.111 0.257 1.290 0.870 0.025 0.234

a) Encuentre el polinomio logarı́tmico lineal de mı́nimos cuadrados


ln R = ln b + a ln W
utilizando el método de rotaciones de Givens.
b) Calcule el error asociado a la aproximación en la parte (a):
X
37
E= (Ri − bWia )2.
i=1

c) Modifique la ecuación logarı́tmica de mı́nimos cuadrados de la parte


2
(a) agregando el término cuadrático c (ln Wi ) , y después determine el
polinomio logarı́tmico de mı́nimos cuadrados, use de nuevo el método
de rotaciones de Givens. Calcule el error asociado a la aproximación.
d) Agregue ahora un término cúbico a la ecuación logaritmica y deter-
mine el polinomio logarı́tmico de mı́nimos cuadrados con rotaciones
de Givens. Calcule también el error y concluya.

10. El tema de los riesgos inherentes a una perdida, de cualquier tipo, en


especial hablando de los recursos monetarios es un tema que preocupa a
todos. Por lo que tener una evaluación de los riesgos de una cartera, ya
sea de una institución o de un inversionista, es de sumo interés.
Un modelo que resulta en una estructura relativamente simple para re-
alizar esta evaluación de riesgos es el de Nelson y Siegel, el cual nos permite
generar curvas de tasas.
El modelo supone que la tasa instantánea Forwart es la solución a una
ecuación diferencial de segundo grado con dos raı́ces iguales, donde la
función f(m) es la tasa al tiempo m:
h mi m h mi
f(m) = β0 + β1 exp − + β2 exp −
τ τ τ
Dentro del cual (β0 , β1, β2 , τ ) son los parámetros a estimar, donde β0 de-
nota el peso del modelo a largo plazo, β1 denota el peso en el largo plazo

5
y β2 en el mediano plazo; el parámetro τ que interviene en el mediano y
largo plazo indica que tan rápido estos se aproximan a su lı́mite.
a) Tomandos los siguientes datos de Cetes del 28 de enero de 2002
obtenidos de un artı́culo del Banco de México, y un valor de τ = 64.59
calcule los valores de las βi ’s del modelo de Nelson-Siegel utilizando
el método de Ecuaciones Normales
P lazo T asa simple
28 0.07222
91 0.07679
182 0.08250
364 0.09176
b) Encuentre la grafica del modelo hasta un plaza de 500 dias y observe
que pasarı́a a plazos mas grandes de los ilustrados en la tabla, calcule
la condición de la matriz de ecuaciones normales.
c) Repita lo realizado en los incisios a) y b) pero utilizando el méto-
do de Reflexiones de Householder, ¿hay cambios significativos en la
solución?
d) Observe que el modelo es en realidad un problema de mı́nimos cuadra-
dos no lineal, ya que el valor de τ también busca estimarse. Para ello
se utilizan métodos de optimización, en partı́cular, el artı́culo del
Banco de México utiliza el método de la sección dorada. Investigue
en que consiste este método de optimización y sus ventajas y desven-
tajas numéricas.
11. Los siguientes datos representan las tasas de mortalidad (por cien mil)
para las personas de edad 20-45, en Inglaterra durante el siglo XX :
20 − 26 27 − 33 34 − 40 41 − 45
431 499 746 956
409 526 760 1014
429 563 778 1076
422 587 828 1134
530 595 846 1024
505 647 836
459 669 916
a) Usando ecuaciones normales, ajusta una lı́nea a los datos y graficala
junto con los datos. ¿Crees que los datos están bien representados
por una lı́nea recta?
b) El argumento sugiere que los datos pueden ser representados por
diferentes lı́neas en los intervalos de edad [20,28], [28,39] y [39,45].
Ajuste tres lineas, es decir, para los datos de cada intervalo, y colócalas
en el mismo gráfico. Se pueden determinar los ajustes de los datos
de cada subrango con plena independencia ya que no hemos hecho
ninguna hipótesis sobre las relaciones entre estas lı́neas.

6
c) El ajuste en (b) puede no ser continuo en 28 o en 39. Una manera
de forzar la continuidad es elegir que la función del modelo tenga
esta propiedad, para ello es necesario definir funciones básicas que
garanticen la continuidad. Las cuatro funciones que sugerimos que
se utilicen están representandas en la figura 1 y se nombran li (x),
i = 1, .., 4. Cada una de estas es definida y continua en 20 ≤ x ≤ 45,
por lo que cualquier combinación lineal de estas debe serlo. Utilizando
estas funciones básicas resuelve el problema de mı́nimos cuadrados.
Grafica la solución junto a los ajustes realizados en (a) y (b). ¿Cuál
de estos tres produce el mejor ajuste?

Figura 1: Funciones base.

12. En los laboratorios de fı́sica de partı́culas de la UNAM se hacen bom-


bardeos con rayos laser sobre cierto tipo de particulas para determinar su
posición en un cierto espacio. Al hacer el bombardeo, el laser despliega un
haz de luz cuando hace contacto con la partı́cula, sin embargo, debido a
las unidades tan pequeñas que se manejena, en ocasiones hay errores en la
medición. Un equipo de estudio recolecto los siguientes datos de las posi-
ciones de los haces de luz al hacer el bombardeo sobre una determinada

7
partı́cula (los datos están dados en micras):

x y z
0.26 1.9 3.6
0.23 1.92 7
0.255 4.5 3.52
0.27 4.42 7.1
2.74 1.92 3.53
2.75 1.92 6.99
2.77 4.4 3.56
2.74 4.45 7.056
0.25 3.3 5.9
2.7 3.2 5.82
1.6 1.93 5.8
1.5 4.5 5.75

Con el fin de encontrar las coordenadas de la particula requerida se re-


quiere ajustarla a una forma esférica.
a) Dada la ecuación de una esfera:

(x − a)2 + (y − b)2 + (z − c)2 = r2

expanda la expresión, de tal forma que le quede un polinomio cuadrático


en x, y, z.
b) Con el fin de que ajuste los datos proporcionados a una esfera, uti-
lice la expansión encontrada para plantear el sistema a ecuaciones a
resolver de tal forma que las incógnitas del sistema sean los valores
a, b, c y d (d será un valor que combine a r y a los otros 3 valores).
c) Resuelva el problema de mı́nimos cuadrados utilizando refelxiones de
Householder y obtenga los los valores de a, b, c y r. ¿Cómo queda la
ecuación de la esfera calculada?
d) Grafique los puntos utilizando la instrucción plot3d y grafique la es-
fera del ajuste de mı́nimos cuadrados utilizando la instrucción sphere.
Hint: para aplicar transparencia a la esfera y poder visualizar si al-
gunos datos quedan dentro de ella utilice la función alpha.
13. Utilizando las funciones plantilla y Ginput2 de la página del curso elabore
una GUI de Matlab que genere ajustes sobre una nube de puntos dada
por el usuario. Los ajustes que deben hacerse son los siguientes:
a) Regresión lineal (utilizando una recta de ajuste).
b) Regresión polinomial (utilizando un polinomio de grado n, con n dado
por el usuario.
c) Cónica de ajuste. Su gráfica puede hacerse con los comandos contour
o ezplot

8
14. El Estadio Panathinaikó, también conocido como el Kallimarmaro es un
estadio de atletismo en Atenas, que acogió la primera edición de los Juegos
Olı́mpicos Modernos en 1896. El estadio fué reconstruido a partir de los
restos de un antiguo estadio griego y está realizado enteramente de mármol
blanco (de Monte Penteli). Una forma para hacer la reconstrucción de un
estadio de este tipo es mediante los restos encontrados de una antigua
pista de atletismo, el objetivo es ajustar los datos a las dimensiones de
una pista actual utilizando mı́nimos cuadrados.

Una pista de atletismo está conformada por dos segmentos de recta para-
lelos de 100m de longitud y por dos semicircunferencias que los unen de
radio 100m/π. Tomando un eje de referencia, los arqueólogos junto con los
arquitectos encargados de la reconstrucción han clasificado las muestras
que han tomado de la siguiente forma:
Recta 1 Recta 2 Semicircunferencia 1 Semicircunferencia 2
(11.5, −0.03) (5.7, 63.66) (102, 0.063) (−7, 62.92)
(25, 0.004) (36, 63.652) (115.3, 59.747) (−13.2, 2.787)
(63, 0.0025) (52.5, 63.667) (125, 12.15) (−28.7, 45.63)
(78.3, −0.001) (81, 63.665) (130.8, 39.9) (−26, 13.472)

a) Plantee los 4 subproblemas de mı́nimos cuadrados que deben ser


resueltos de forma analı́tica, es decir, los 4 sistemas de ecuaciones
que corresponden a las 2 rectas y a las 2 semicircunferencias que
conforman la pista. Para las rectas utilice la ecuación:

x + ay + b = 0

y para las semicircunferencias utilice la ecuación para una circunfe-


rencia:
(x − h)2 + (y − k)2 = r2
El objetivo es estimar los parámetros a, b, h y k respectivemente.
b) Elabore un programa que genere los 4 sistemas de ecuaciones y que
encuentre los valores a, b, h y k estimados mediante el método de
Householder.
c) Realice una gráfica aproximada de la pista graficando las 2 rectas y las
2 circunferencias calculadas. Grafique también las muestras tomadas
por los arqueólogos. Para el gráfico de las circunferencias puede usar
coordenadas polares o utilizar el comando ezplot.

15. Reconocimiento de patrones.


Generalmente cuando una persona pasa por un aeropuerto o algún paso
fronterizo se trata de hacer un reconocimiento facial de la persona, sin
embargo, es imposible tener a alguien que conozca a todo mundo para
decir quien es la persona que está en la cámara o el mostrador. Un proceso
muy utilizado es el reconocimiento de patrones que consiste en cotejar la

9
imagen o fotografı́a de esa persona con información existente en una base
de datos. El siguiente ejercicio le permitirá construir una GUI básica de
reconocimiento facial basado en la solución de un problema de mı́nimos
cuadrados.

a) Utilizando la cámara de su celular o una cámara digital, tome 3 fotos,


una suya y 2 más de parientes, amigos suyos u objetos que tengan
una forma diferente. Las 3 imagenes deben tener el mismo tamaño.
b) A cualquier imagen digital le corresponde una matriz de pixeles, en
Matlab puede cargarse la imagen en una matriz haciendo uso de la
instrucción imread, la matriz debe ser rectángular por lo que si no
lo es deberá rotar la imagen 90◦ en algún programa de edición de
imagenes (Corel, GIMP, Photoshop,...).
c) Cambie la imagen a escala de grises utilizando la instrucción rgb2gray.
La matriz tendrá un formato binario; para cambiar el formato binario
a un formato doble puede utilizar la instrucción double.
d) Observe que serı́a muy costoso tener guardado en una base de datos
las imagenes completas de cada persona, por lo que por lo general se
utiliza solo una cierta cantidad de información. Una forma de hacer
esto es mediante un vector de control guardado en la base de datos
que contiene la información acerca de la persona en la fotografı́a. Ası́,
podemos definir el sistema Ax = v, con A la matriz de la imagen en
formato doble y v el vector de control. Una elección muy sencilla (que
no siempre es utilizada en la práctica) es suponer que la solución x
del sistema es un vector de unos, de tal forma que
 P 
P a1i
 a2i 
 
 . 
v= 


 . 
 
P.
ani

es decir, cada componente de v será la suma de las entradas del


renglón correspondiente de la matriz A. Observe que el problema a
resolver es un problema de mı́nimos cuadrados, donde la solución es
el vector de unos.
e) Imagine que usted es el agente de aduanas, elabore un programa prin-
cipal que pida el nombre de la imagen de la persona (u objeto) que
esta pasando por la cámara de vigilancia, con ella que genere A y
resuelva el problema de mı́nimos cuadrados para los 3 v’s que corre-
sponden a cada imagen de su base de datos (los v’s deberán generarse
en una función independiente), utilice el comando qr de Matlab. Por
último, en función de que x calculada sea más cercana al vector de
unos, indique que persona (u objeto) es la que está pasando por su

10
aduana. Incorpore este algoritmo a una GUI que realice el proceso de
reconocimiento de patrones (puede utilizar la GUI de imagenes del
proyecto 3).
f ) Piense en una forma de ampliar la base de datos, es decir, que el
programa reconozca si se introduce una foto diferente a las que se
tienen en la base y la añada a la misma.

11

Potrebbero piacerti anche