Sei sulla pagina 1di 107

Derivacin Matricial

Fernando Lara
Fundacin Universitaria Konrad Lorenz
Director: Leonardo Jimnez Moscovitz
Matemtico
Fundacin Universitaria Konrad Lorenz
11 de junio de 2007
Resumen
En este trabajo se hace una presentacin de algunos aspectos tericos
y prcticos acerca de la derivacin matricial. Este tema es especialmente
importante, ya que las matrices no solo proveen una notacin muy com-
pacta para algunos desarrollos matemticos, sino que adems permiten
una mayor generalizacin. Despus de la presentacin terica, se expone
un caso de aplicacin a las redes neuronales, y se exponen algunas lineas
de cdigo en Matlab para la resolucin de problemas que involucren la
derivacin matricial.
This work develops a presentation of some theorical and practical top-
ics about matrix derivation. This area is specially important because ma-
trix theory not only provides a compact notation for some mathematical
developments, it also provides a greater generalization. After the theoric
presentation, this paper exposes an application to neural networks, and
some code in Matlab to help in the solutions of problems involving matrix
derivation.
1
ndice
Introduccin 3
1. Preliminares 5
1.1. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Conceptos Bsicos . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1. Operaciones con Matrices . . . . . . . . . . . . . . . . . . 10
1.3.2. Matrices Especiales. . . . . . . . . . . . . . . . . . . . . . 14
2. Derivacin. 23
2.0.3. Interpretacin de la derivada como la pendiente de una
tangente. . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.0.4. Reglas de Derivacion. . . . . . . . . . . . . . . . . . . . . 25
2.0.5. Derivacin Parcial . . . . . . . . . . . . . . . . . . . . . . 33
3. Derivacin Matricial 35
3.1. Funciones Matriciales . . . . . . . . . . . . . . . . . . . . . . . . 35
3.1.1. Funciones de Variable Escalar . . . . . . . . . . . . . . . . 35
3.1.2. Funciones de Variable Vectorial . . . . . . . . . . . . . . . 36
3.1.3. Funciones de Variable Matricial . . . . . . . . . . . . . . . 37
3.2. Otras Matrices Especiales . . . . . . . . . . . . . . . . . . . . . . 37
3.3. Producto de Kronecker . . . . . . . . . . . . . . . . . . . . . . . . 39
3.4. Frmulas de Derivacin Matricial. . . . . . . . . . . . . . . . . . 49
3.5. Reglas de Derivacin. . . . . . . . . . . . . . . . . . . . . . . . . 60
3.6. Propiedades de Derivacin de Funciones Matriciales. . . . . . . . 70
4. Aplicacines 87
4.1. Redes Neuronales . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.1.1. Caractersticas del Algoritmo . . . . . . . . . . . . . . . . 87
4.1.2. Propagacin hacia adelante. . . . . . . . . . . . . . . 88
4.1.3. Propagacin hacia atrs. . . . . . . . . . . . . . . . . . . . 89
4.1.4. Resumen (Algoritmo) . . . . . . . . . . . . . . . . . . . . 96
4.1.5. Propagacin hacia adelante. . . . . . . . . . . . . . . . . . 97
4.1.6. Propagacin hacia atrs. . . . . . . . . . . . . . . . . . . . 97
4.1.7. Propagacin hacia atrs. . . . . . . . . . . . . . . . . . . . 100
4.2. Derivadas Matriciales en Matlab. . . . . . . . . . . . . . . . . . . 101
5. Conclusiones 106
2
Introduccin
El lgebra matricial se ha convertido en los ltimos aos en una parte esen-
cial de los conocimientos de matemticas, necesarios en campos tan diversos
como la ingeniera, la fsica, la pedagoga, la qumica, la sociologa y en el cam-
po cientco, as como la estadstica y la matemtica pura. Este requerimiento
reeja la importancia y la amplitud de sus aplicaciones.
Muchos de los temas tratados en los campos mencionados comparten mto-
dos comunes para resolver algunos de los problemas especcos. Los programas
de las materias de matemticas han ido evolucionando para facilitar que el pro-
fesional domine las tcnicas empleadas en el tratamiento de los problemas. Sin
embargo, por razones obvias, la mayora de los textos de matemticas se han
centrado en lo que es el ncleo bsico de los programas de clculo y lgebra. Por
otra parte, asignaturas de corte matemtico dirigidos a dotar de conocimientos
adecuados para abordar problemas, con un nivel ms riguroso, tienen carc-
ter optativo. Con respecto a esas asignaturas, no es fcil encontrar manuales
adecuados a sus contenidos especcos, lo que signica que un estudiante ha
de conar en las referencias bibliogrcas recomendadas, que en mltiples oca-
siones no se ajustan a sus necesidades de rigor de planteamiento, o bien, apuntes
tomados en clase, con los conocidos inconvenientes que esta prctica conlleva.
Como ejemplos, pensemos en temas como derivadas de vectores y matrices y
derivadas de funciones matriciales.
Basado en la importancia que ha adquirido el clculo matricial, el compendio
que se ha proyectado, se presentar como suplemento a los textos sobre clculo
matricial, que entre otros, son bastante exiguos en nuestro medio.
El objetivo fundamental es jar un criterio de derivacin, indicar su relacin
con las aproximaciones vectoriales a la derivada y, a partir de ello, obtener
resultados que permitan enfrentarse formalmente y con mayor comodidad al
estudio de variables matriciales.
Antes de abordar el proceso de derivacin matricial, se presenta un compen-
dio con los elementos bsicos del lgebra lineal, especcamente sobre matri-
ces, y un compendio que incluye las propiedades bsicas del clculo diferencial,
necesarios para comprender la manera como se aborda el estudio sobre clculo
matricial.
De la misma forma, dada la complejidad del problema, se hizo preciso incluir
algunas nuevas operaciones entre matrices que completan el clculo matricial
tradicional; para estas nuevas operaciones, se incluyen conceptos y propiedades
sobre producto de Kronecker, vectorizacin de matrices y se denen las matrices
de permutacin que se utilizan en algunos desarrollos.
En el presente trabajo se ha utilizado extensivamente la presentacin de
[Bar98]; este excelente libro es uno de los pocos escritos en espaol que tratan
el tema de la derivacin matricial. En particular, se ha utilizado mucho en la
seccin 3, donde se expone la presentacin terica y de las propiedades. Otros
escritos que se han podido disponer tienen una presentacin algo diferente; en
particular, muchos de ellos utilizan el concepto de diferencial al trabajar con
derivadas matriciales, lo que implica entre otros aspectos, cambios en la no-
3
tacin.
En el captulo 4, se presenta el desarrollo de un problema de redes neuronales
que en su forma original es un aporte del Ing. Pervys Rengifo, profesor de la
F.U.K.L., a quien se le agradece su amable colaboracin. En este ejemplo se
observa la aplicacin de la derivacin matricial en la solucin de un problema
de este tipo. Finalmente, se exponen algunas lneas de cdigo en Matlab para
ayudar en la resolucin de problemas de derivacin matricial o vectorial.
4
1. Preliminares
En este captulo se exponen los conceptos y reglas ms importantes que
sirven de base a la comprensin de la diferenciacin matricial, as como de los
conceptos y procesos asociados. Por ello, se explican en primera instancia las
deniciones y los conceptos bsicos de matrices, as como las operaciones a las
que se pueden someter estos objetos. Luego se presentan los tipos de matrices
ms importantes y las propiedades que stos poseen.
1.1. Matrices
Aqu se introducir el concepto de matriz y se presentarn ciertas operacio-
nes algebricas denidas sobre ellas. Las nociones expuestas sern la base para
comprender los conceptos relativos al clculo vectorial y matricial en general.
De la manera ms general posible, se puede denir una matriz como una
tabla o arreglo rectangular de objetos matemticos que pueden someterse a las
operaciones de suma y producto. Esto requiere por una parte, detallar cuales
son esos objetos o elementos de la matriz que son de inters primordial para el
matemtico, y por otra parte especicar algunas de las propiedades asociadas
con las operaciones sobre dichos elementos: stos, junto con las operaciones de
suma y producto, deben formar un cuerpo k [Her86].
Los elementos de una matriz pueden ser o bien los nmeros reales (k = R) o
bien los nmeros complejos (k = C); en estos caso, los elementos se llaman es-
calares. Pero los elementos de una matriz tambin pueden ser funciones denidas
en los nmeros reales o los complejos. En el presente trabajo se tratarn las ma-
trices denidas sobre los reales, se denir posteriormente la matriz de funciones.
El otro caso en que se considerarn las matrices y vectores es en la propia
denicin de las funciones. Para el presente trabajo el inters no radica en
funciones de variable real por ejemplo, sino que la funcin puede ser de variable
vectorial, o matricial y por otra parte su salida puede ser a su vez un valor
escalar, vectorial o matricial.
1.2. Conceptos Bsicos
En esta seccin se expondrn los principales conceptos relacionados con la
temtica a tratar. Por una parte, se hace referencia a algunos conceptos del lge-
bra abstracta como es el concepto de cuerpo, y por otra parte se hace referencia
al concepto de espacio vectorial. A travs del concepto de cuerpo se describe el
comportamiento de los elementos que conforman una matriz al realizar sobre
ellos ciertas operaciones; el concepto de espacio vectorial es una generalizacin
tanto de vectores en R
n
como del propio concepto de matriz.
Denicin 1.1 (Campo o Cuerpo) Un campo o cuerpo k es una estructura
algebraica conformada por un conjunto y dos operaciones denidas sobre los ele-
mentos del conjunto, < K, +, > que se comportan como un anillo conmutativo
en el cual todo elemento diferente de 0 tiene inverso multiplicativo. [Her86].
5
Denicin 1.2 (Espacio Vectorial) Un espacio vectorial denido sobre un
cuerpo k, es un conjunto V de objetos llamados vectores, junto con las opera-
ciones cerradas de suma y producto por escalar, que cumplen ocho propiedades
[San94]:
Si u, v, w V y , son escalares cualesquiera, entonces
1. (u +v) +w = u + (v +w)
2. u +v = v +u
3. Existe 0 V tal que v + 0 = 0 +v = v
4. Para cada v existe un vector v tal que v + (v) = (v) +v = 0
5. (u +v) = u +v
6. ( +)u = u +u
7. ()u = (u)
8. 1 v = v
Denicin 1.3 (Subespacios Vectoriales) Un subespacio U de un espacio
vectorial V es un subconjunto de V que es en s mismo, un espacio vectorial
sobre el mismo cuerpo.
Dentro de los espacios vectoriales ms importantes, se tienen los espacios
k = R
n
as como k = C
n
. Un vector en R
n
se puede expresar como v
1
=

1
x
1
+
2
x
2
+... +
n
x
n
. Esto se puede generalizar a continuacin.
Denicin 1.4 (Combinacin Lineal) Sea V un espacio vectorial, y U =
u
1
, u
2
, ...u
r
un conjunto nito de vectores de V. Entonces un vector de la
forma:
v =
1
u
1
+
2
u
2
+... +
r
u
r
=

r
i=1

i
u
i
se llama una combinacin lineal de vectores en U.
Es importante considerar el caso en el que se generan todas las posibles
combinaciones lineales con elementos de U, y con todos los posibles escalares

i
k.
Denicin 1.5 (Subespacio Generado) Sea V un espacio vectorial, y U =
u
1
, u
2
, ...u
r
un conjunto nito de vectores de V. El conjunto de todas las posi-
bles combinaciones lineales de elementos de U se llama el subespacio generado
por U, y se denota:
S (U) = v[v =

n
i=1

k
u
i
,
k
k
6
Un concepto muy importante relacionado con estos vectores es el de depen-
dencia o independencia lineal.
Denicin 1.6 (Dependencia Lineal) Sea V un espacio vectorial, y U =
u
1
, u
2
, ...u
r
un conjunto nito de vectores de V. Entonces, U es linealmente
dependiente o ligado si y solo si existen escalares
1
, , ...
r
no todos ceros,
tal que:

1
u
1
+
2
u
2
+... +
r
u
r
= 0
Se dice que U es linealmente independiente o libre si no es dependiente.
Un conjunto U linealmente independiente y de especial importancia, se dene
a continuacin.
Denicin 1.7 (Base) Sea V un espacio vectorial sobre k. Si en V existe un
subconjunto nito U de vectores linealmente independientes, tal que S(U) = V, o
en otras palabras, que todo vector v V puede ser expresado como combinacin
lineal de vectores en U, entonces se dice que U es una base de V .
Si una base consiste de una cantidad nita de elementos, entoces se puede
demostrar que toda base de un espacio vectorial V tiene la misma cantidad de
elementos:
Denicin 1.8 (Dimensin) Sea V un espacio vectorial con una base B con
n elementos. Entonces, se dene a n como la dimensin del espacio vectorial V,
y se expresa como dim(V ) = n.
Para el caso V = R
n
con n = 3 se tiene la dimensin del conjunto de vectores
en el espacio.
Es necesario en muchos casos considerar funciones o morsmos entre espacios
vectoriales diferentes, esto es, f : V W donde V, W son espacios vectoriales
sobre el mismo cuerpo k. Estas funciones, cuya descripcin se puede encontrar
en libros de lgebra abstracta tales como [Her86] son de especial importancia si
poseen ciertas propiedades, tal como se observa en la siguiente denicin.
Denicin 1.9 (Isomorsmo) Sean V, W son espacios vectoriales sobre el
mismo cuerpo k, y sea f una funcin f : V W que cumple con las siguientes
propiedades que para todo x
i
V y para todo a, b k:
1. f
1
existe. Esto es, f es invertible
2. f(ax
1
+bx
2
) = f(ax
1
) +f(bx
2
) = af(x
1
) +bf(x
2
)
A los espacios vectoriales V, W se les llama espacios isomorfos, es decir,
que tienen la misma estructura.
7
Denicin 1.10 (Transformacin Lineal) Sea U un espacio vectorial
n-dimensional y sea V un espacio vectorial m-dimensional, ambos sobre el mis-
mo cuerpo k. Sea B
U
una base de U y B
V
una base de V. Una transformacin
lineal es una funcin T : U V tal que, para escalares arbitrarios a, b k y
vectores x
1
, x
2
U:
T(ax
1
+bx
2
) = T(ax
1
) +T(bx
2
) = aT(x
1
) +bT(x
2
)
Una transformacin lineal es entonces, una operacin entre dos espacios vec-
toriales que preserva las operaciones. Son de especial importancia tambin las
transformaciones lineales T : V V que reciben el nombre de endomorsmos.
1.3. Matrices
En esta seccin se establecern las condiciones para denir adecuadamente
el concepto de matriz, sus diferentes tipos y examinar luego algunas de sus
propiedades.
En el presente trabajo, las matrices se establecern con referencia al espacio
vectorial denido por M
mn
, el conjunto de todas las matrices de tamao mn,
as:
Denicin 1.11 (Matriz) Sea k un cuerpo, y sea M
mn
el espacio vectorial
de todas las matrices de tamao mn denidas sobre k. Se dene una matriz
A M
mn
con elementos en k, y se expresa diciendo que A es una matriz
sobre k, a un arreglo de mn elementos a
ij
k, ordenados de manera rectangular
con m las y n columnas encerrados entre corchetes, donde 1 i m y
1 j n :
_

_
a
11
a
12
... a
1n
a
21
... ... a
2n
... ... ... ...
a
m1
a
m2
... a
mn
_

_
Las lneas horizontales en una matriz se denominan las y las lneas verti-
cales se denominan columnas. El primero de los coecientes indica la la y el
segundo la columna en que est ubicado el elemento. A una matriz con m las
y n columnas se le denomina matriz m-por-n (escrito mn), siendo los valores
m y n sus dimensiones. La matriz anterior se denota tambin por (a
ij
).
Bajo esta denicin, entonces sobre las matrices se pueden denir dos ope-
raciones: suma y producto por escalar, que deben cumplir con las propiedades
mencionadas en la denicin 1.2.
Denicin 1.12 (Matriz como Transformacin Lineal) Sean V, W espa-
cios vectoriales de dimensin nita. Si se han determinado las bases B
V
del
espacio V con dimensin n, y B
W
del espacio W con dimensin m, entonces
cada transformacin lineal T : V W puede ser representada por una matriz
A.
8
Ejemplo 1.1 Sean V, W espacios vectoriales. Sea v
1
, v
2
, ...v
n
una base de V
y w
1
, w
2
, ...w
m
una base de W. Cada vector v V puede ser representado de
manera nica mediante los escalares
1
, , ...
n
k. mediante la combinacin
lineal
1
v
1
+
2
v
2
+... +
r
v
n
Si f : V W es una aplicacin lineal, entonces
f(a
1
v
1
+a
2
v
2
+... +a
r
v
n
) = a
1
f(v
1
) +a
1
f(v
2
) +...a
r
f(v
n
)
La funcin queda completamente determinada por los valores f(v
1
) + ... +
f(v
n
). Como w
1
, w
2
, ...w
m
es una base de W, entonces cada f(v
j
) puede re-
presentarse como:
f(v
j
) = a
1j
f(w
1
) +a
2j
f(w
2
) +...a
nj
f(w
m
)
Luego la funcin queda completamente determinada por los valores a
ij
. Si
estos valores se utilizan para construir una matriz A de tamao mn, Entonces
la matriz A se puede utilizar para calcular el valor de f(v) para todo vector en
V.
Otra manera de representar la interpretacin de una matriz como una apli-
cacin lineal es tomando x k
n
, y k
m
, luego el morsmo f : k
n
k
m
puede
ser representado por y = Ax.
Las dimensiones de una matriz siempre se dan con el nmero de las primero
y el nmero de columnas despus. La entrada de una matriz A que se encuentra
en la la i-sima y la columna j-sima se le llama entrada i, j o entrada (i, j)-
sima de A. Esto se escribe como A
i,j
o A[i, j]. Entonces, el primero de los
subndices indica la la y el segundo la columna a las que pertenece dicho
elemento. Las las de la matriz son las m n-plas horizontales:
_
a
11
a
12
a
1n
_
,
_
a
21
a
22
a
2n
_
, ,
_
a
m1
a
m2
a
mn
_
y las columnas de la matriz son las n m-plas verticales:
_
_
_
_
_
a
11
a
21
.
.
.
a
m1
_
_
_
_
_
,
_
_
_
_
_
a
12
a
22
.
.
.
a
m2
_
_
_
_
_
, ,
_
_
_
_
_
a
1n
a
2n
.
.
.
a
mn
_
_
_
_
_
Ntese que el elemento a
ij
llamado entrada ij, aparece en la la i-sima y en
la columna j-sima. Una matriz con m las y n columnas se denomina matriz m
por n, o matriz mn; el par de nmeros (m, n) se llama su tamao o forma.
Las matrices se denotan usualmente por letras maysculas A, B, . . . y los
elementos del cuerpo k por minsculas, a, b, . . . con sus respectivos subndices.
Una matriz con una sola columna o una sola la se denomina a menudo
vector, y se interpreta como un elemento del espacio eucldeo [Her86].
9
Denicin 1.13 (Vector) Un vector es una matriz que posee una sola la o
una sola columna. Una matriz 1 n (una la y n columnas) se denomina vector
la, y una matriz m 1 (una columna y m las) se denomina vector columna.
En general, dada una matriz A, al vector (a
i1
, a
i2
, ...a
in
) que forma la i-sima
la de A se le llama un vector la, mientras que al vector (a
1j
, a
2j
, ...a
mj
) que
forma la j-sima columna de A se le llama vector columna. Ntese que en
particular, un elemento del cuerpo k puede verse como una matriz o vector de
tamao 1 1.
Ejemplo 1.2 Se tiene la matriz A
23
:
_
1 3 4
0 5 2
_
Sus las son
_
1 3 4
_
y
_
0 5 2
_
y cada una de ellas es un vector
la, mientras que
sus columnas son
_
1
0
_
,
_
3
5
_
,
_
4
2
_
y cada una de ellas es un vector
columna.
Ejemplo 1.3 La asercin
_
x +y 2z +w
x y z w
_
=
_
3 5
1 4
_
es equivalente al sigui-
ente sistema de ecuaciones:
x +y = 3
x y = 1
2z +w = 5
z w = 4
Denicin 1.14 (Igualdad de Matrices) La condicin necesaria y suciente
para que dos matrices A = (a
ij
) y B = (b
ij
) sean iguales (A = B) es que tengan
el mismo orden y que cada uno de los elementos de una de ellas sea igual al
correspondiente de la otra. Esto es
a
ij
= b
ij
(i = 1, 2, ..., m; j = 1, 2, ..., n)
En otras palabras, dos matrices son iguales solo cuando una es copia de la
otra.
1.3.1. Operaciones con Matrices
Las matrices se han denido dentro del espacio vectorial que se ha llamado
el espacio vectorial M
mn
de las matrices de tamao m n. Por tanto, las dos
primeras operaciones que son de inters son la suma y el producto por escalar.
Dichas operaciones deben dar como resultado otra matriz del mismo tamao.
Adems, para estas operaciones, ms adelante,(def 1.19) se denir la matriz
0
mn
tal que para cualquier matriz A
mn
, A + 0 = 0 + A = A y obviamente,
se tendr un escalar 1 tal que 1A = A
10
Denicin 1.15 (Suma de Matrices) Sean A = (a
ij
) y B = (b
ij
) dos ma-
trices del espacio vectorial M
mn
, ambas de igual tamao m n. La suma (o
diferencia) de ellas, denotada como A B, es otra matriz C = (c
ij
) de orden
mn, en la cual cada elemento de C es la suma (o diferencia) de los elementos
correspondientes de A y B. Esto es, (c
ij
) = (a
ij
+b
ij
)
A =
_

_
a
11
a
12
a
1n
a
21
a
22
a
2n
.
.
.
.
.
.
.
.
.
.
.
.
a
m1
a
m2
a
mn
_

_
; B =
_

_
b
11
b
12
b
1n
b
21
b
22
b
2n
.
.
.
.
.
.
.
.
.
.
.
.
b
m1
b
m2
b
mn
_

_
C = A+B =
_

_
a
11
+b
11
a
21
+b
21
a
1n
+b
1n
a
21
+b
21
a
22
+b
22
a
2n
+b
2n
.
.
.
.
.
.
.
.
.
.
.
.
a
m1
+b
m1
a
m2
+b
m2
a
mn
+b
mn
_

_
Dos matrices del mismo rden se llaman conformes respecto de
la suma algebraica. La suma de matrices no est denida para
matrices no conformes.
Denicin 1.16 (Producto por Escalar) Sea A una matriz del espacio vec-
torial M
mn
, y k k un escalar. El producto del escalar k por la matriz A, escrito
kA es la matriz C obtenida multiplicando cada entrada de A por k:
C = kA =
_

_
ka
11
ka
21
ka
1n
ka
21
ka
22
ka
2n
.
.
.
.
.
.
.
.
.
.
.
.
ka
m1
ka
m2
ka
mn
_

_
Obsrvese que A+B y kA son tambin matrices de tamao mn. Adems
se dene:
A = 1 A y AB = A+ (B)
Ejemplo 1.4 Sean A =
_
1 2 3
4 5 6
_
, B =
_
3 0 2
7 1 8
_
entonces
A+B =
_
1 + 3 2 + 0 3 + 2
4 7 5 + 1 6 + 8
_
=
_
4 2 5
3 6 2
_
3A =
_
3x1 3x(2) 3x3
3x4 3x5 3x(6)
_
=
_
3 6 9
12 15 18
_
2A3B =
_
2 4 6
8 10 12
_
+
_
9 0 6
21 3 24
_
=
_
7 4 0
29 7 36
_
11
Proposicin 1.1 (Propiedades de la Suma y el Producto por Escalar)
Sea V el conjunto de todas las matrices mn sobre un campo k. En tal caso,
para matrices arbitrarias A, B, C, 0 V y escalares cualesquiera k
1
, k
2
k y los
valores 0, 1 k se cumple:
1. (A+B) +C = A+ (B +C)
2. A+ 0 = A
3. A+ (A) = 0
4. A+B = B +A
5. k
1
(A+B) = k
1
A+k
1
B
6. (k
1
+k
2
)A = k
1
A+k
2
A
7. (k
1
k
2
)A = k
1
(k
2
A)
8. 1 A = A y 0 A = 0
Estas propiedades son de esperarse, dado que las matrices pertenecen a un
espacio vectorial, y k es un escalar.
Si se supone que los vectores en R
n
se representan por vectores la se tiene
u =
_
a
1
a
2
a
n

v =
_
b
1
b
2
b
n

Entonces, vistos como matrices, la suma u + v y el producto ku son las


siguientes:
u +v =
_
a
1
+b
1
a
2
+b
2
a
n
+b
n

ku =
_
ka
1
ka
2
ka
n

Denicin 1.17 (Producto de vector la por vector columna) Sea A =


(a
i
) un vector la, y B = (b
i
) un vector columna con el mismo nmero de ele-
mentos. El producto de estos vectores A y B, escrito A B es un vector c de
tamao 1 1 denido como:
_
a
1
a
2
a
n

_
b
1
b
2
.
.
.
b
n
_

_
= a
1
b
1
+a
2
b
2
+ +a
n
b
n
=
n

k=1
a
k
b
k
= c
12
Ntese que para este caso, el producto de vectores se puede ver como un
escalar c k. El producto A B no est denido si los vectores A y B tienen
diferente cantidad de elementos.
Ejemplo 1.5
_
8 4 5

_
_
3
2
1
_
_
= 8 3 + (4) 2 + 5 (1) = 24 8 5 = 11
Ahora se puede ampliar este procedimiento para realizar el producto de
matrices de tamao mn en general.
Denicin 1.18 (Producto de Matrices) Sean A = (a
ij
) y B = (b
ij
) ma-
trices tales que el nmero de las columnas de A coincide con el mismo nmero
de las de B; esto es, A es una matriz mp y B es una matriz pn. Entonces
el producto de las dos matrices AB, en este orden, es otra matriz C de tamao
m n cuya entrada ij se obtiene multiplicando la la i-sima A
i
de A por la
columna j-sima B
j
de B (cada elemento de la la se multiplica por el corre-
spondiente de la columna y a continuacin se suman los productos obtenidos
segn la denicin 1.17):
C = A
mp
B
pn
=
_

_
A
1
B
1
A
1
B
2
A
1
B
n
A
2
B
1
A
1
B
2
A
1
B
n
.
.
.
.
.
.
.
.
.
.
.
.
A
m
B
1
A
m
B
2
A
m
B
n
_

_
mn
Donde c
ij
= a
i1
b
1j
+ a
i2
b
2j
+ + a
ip
b
pj
=
p

k=1
a
ik
b
kj
para todo i, j en C.
Se observa que en general, el producto de matrices no es conmutativo.
Dos matrices en las cuales el nmero de columnas de A es igual al nmero
de las de B se llaman matrices conformes respecto de la multiplicacin.
Se debe tener en cuenta el hecho de que el producto AB slo est denido para
matrices conformes. Esto es, no est denido si A es una matriz mp y B una
matriz q n con p ,= q.
Ejemplo 1.6
_
r s
t u
__
a
1
a
2
a
3
b
1
b
2
b
3
_
=
_
ra
1
+sb
1
ra
2
+sb
2
ra
3
+sb
3
ta
1
+ub
1
ta
2
+ub
2
ta
3
+ub
3
_
_
1 2
3 4
_ _
1 1
0 2
_
=
_
1 1 + 2x0 1 1 + 2 2
3 1 + 4 0 3 1 + 4 2
_
=
_
1 5
3 11
_
_
1 1
0 2
_ _
1 2
3 4
_
=
_
1 1 + 1 3 1 2 + 1 4
0 1 + 2 3 0 2 + 2 4
_
=
_
4 6
6 8
_
13
Lo anterior muestra que el producto de matrices no es conmutativo, es decir
los productos AB y BA de matrices no son necesariamente iguales.
Proposicin 1.2 (Propiedades del Producto de Matrices) Sean A, B, C
matrices conformes para la multiplicacin o para la suma, segn corresponda, y
k un escalar. Entonces, se cumplen las siguientes propiedades:
1. (AB)C = A(BC)
2. A(B +C) = AB +AC
3. (B +C)A = BA+CA
4. k(AB) = (kA)B = A(kB)
5. 0A = 0 y B0 = 0 donde 0 es la matriz nula conforme
1.3.2. Matrices Especiales.
Denicin 1.19 (Matriz Nula) Una matriz que tenga nulos todos sus ele-
mentos se llama matriz nula o matriz cero y se denota por 0
m,n
. En el caso
de que una matriz A sea nula y no haya lugar a confusiones con respecto a su
orden, se escribe simplemente A = 0 en lugar de la disposicin m n con sus
elementos iguales a cero.
Ejemplo 1.7 La matriz cero de tamao 2 3 es: 0
23
=
_
0 0 0
0 0 0
_
Para cualquier matriz A
m,n
y 0
m,n
, se tiene que A+0 = 0 +A = A. Esto es
de esperarse, ya que 0 cumple la funcin de vector nulo en el espacio vectorial
M
mn
.
Denicin 1.20 (Matriz Traspuesta) La matriz traspuesta de una matriz
A de orden m n es la matriz A/ de orden n m llamada la traspuesta de
A que se obtiene permutando las las por las columnas. Por tanto, el elemento
a
ij
de A corresponde al elemento a
ji
de A/
Ejemplo 1.8 La traspuesta de la matriz A =
_
1 2 3
4 5 6
_
es A/ =
_
_
1 4
2 5
3 6
_
_
Obsrvese que el elemento a
ij
de A (la i, columna j) es a
ji
de A/ (la j,
columna i).
Proposicin 1.3 Sean A/ y B/, respectivamente, las traspuestas de las matrices
A y B, y sea k k un escalar; en estas condiciones se cumple que:
1. (A/) / = A
14
2. (kA/) / = kA
3. (A+B)/ = A/ +B/
4. (AB)/ = B/ A/
Ejemplo 1.9 A =
_
_
4 3 6
2 5 1
1 0 3
_
_
, B =
_
_
7 8 9
3 2 1
5 6 4
_
_
A+B =
_
_
11 5 15
1 7 0
4 6 1
_
_
, (A+B) / =
_
_
11 1 4
5 7 6
15 0 1
_
_
A/ =
_
_
4 2 1
3 5 0
6 1 3
_
_
, B/ =
_
_
7 3 5
8 2 6
9 1 4
_
_
, A/ +B/ =
_
_
11 1 4
5 7 6
15 0 1
_
_
Por tanto (A+B) / =
_
_
11 1 4
5 7 6
15 0 1
_
_
= A/ +B/ =
_
_
11 1 4
5 7 6
15 0 1
_
_
Matrices Cuadradas. Dentro de las matrices ms utilizadas en lgebra, se
encuentran las matrices cuadradas.
Denicin 1.21 (Matriz Cuadrada) Una matriz A se llama matriz cuadra-
da si el nmero de las es igual al nmero columnas. Es decir n = m. Se dice
que una matriz cuadrada nn es de orden n y se le asigna el nombre de matriz
n-cuadrada:
_

_
a
11
a
12
a
1n
a
21
a
22
a
2n
.
.
.
.
.
.
.
.
.
a
n1
a
n2
a
nn
_

_
Las matrices cuadradas son de especial importancia. Es en estas matrices
donde surge el concepto de determinante y de traza. Adems poseen algunas
propiedades interesantes, por ejemplo toda matriz cuadrada se puede descom-
poner en la suma de una matriz simtrica y una matriz antisimtrica. Adems,
si A y B son matrices del mismo orden, entonces se pueden sumar entre s y
sus productos son vlidos en ambos sentidos, esto es, tanto AB como BA estn
denidos.
15
Denicin 1.22 (Traza de una Matriz Cuadrada) Sea A una matriz
cuadrada de orden n. La diagonal principal es la lnea formada por los elementos
a
11
, a
22
, ..., a
nn
. La suma de los elementos de la diagonal principal de una matriz
cuadrada A, se llama traza de la misma, y se denota como tr(A) =

n
i=1
a
ii
.
Ejemplo 1.10 Sean A =
_
_
1 2 3
4 4 4
5 6 7
_
_
B =
_
_
2 5 1
0 3 2
1 2 4
_
_
Entonces A y B son matrices cuadradas de orden 3, y sus trazas son tr(A) =
4 y tr(B) = 1.
Denicin 1.23 (Matriz Triangular) Una matriz cuadrada A cuyos elemen-
tos a
ij
= 0 para i j se llama triangular superior; una matriz cuadrada cuyos
elementos a
ij
= 0 para i j se denomina triangular inferior. As, pues
_

_
a
11
a
12
a
13
a
1n
0 a
22
a
23
a
2n
0 0 a
33
a
3n
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 a
nn
_

_
es una matriz triangular superior
_

_
a
11
0 0 0
a
21
a
22
0 0
a
31
a
32
a
33
0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
a
n1
a
n2
a
n3
a
nn
_

_
es una matriz triangular inferior.
Denicin 1.24 (Matriz Diagonal) La matriz D que es triangular supe-
rior e inferior, se llama matriz diagonal. Se representa por:
D = diag
_
a
11
a
22
a
33
a
nn

=
_

_
a
11
0 0 0
0 a
22
0 0
0 0 a
33
0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 a
nn
_

_
El producto AB de una matriz diagonal cuadrada de orden m,
A = diag (a
11
, a
22
, ...a
mm
) por otra matriz cualquiera B de orden n m se
obtiene multiplicando la primera la de B por a
11
, la segunda de B por a
22
y
as sucesivamente. Esto es:
16
_

_
a
11
0 0
0 a
22
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 a
nn
_

_
_

_
b
11
b
12
b
1n
b
21
b
22
b
2n
.
.
.
.
.
.
.
.
.
.
.
.
b
n1
b
n2
b
3n
_

_
=
_

_
a
11
b
11
a
11
b
12
a
11
b
1n
a
22
b
21
a
22
b
22
a
22
b
2n
.
.
.
.
.
.
.
.
.
.
.
.
a
mm
b
m1
a
mm
b
m2
a
mm
b
mn
_

_
Denicin 1.25 (Matriz Escalar y Matriz Unidad) Si en una matriz dia-
gonal D se verica que a
11
= a
22
= . . . = a
nn
= k, entonces D recibe el nombre
de matriz escalar. Si adems k = 1, la matriz se denomina unidad o identica
y se representa por I
n
.
Las matrices unitarias tienen algunas de las propiedades del entero 1. En
todo caso, se verica que:
I
m
A
mn
= A
mn
I
n
= I
m
A
mn
I
n
= A
Ejemplo 1.11 I
2
=
_
1 0
0 1
_
I
3
=
_
_
1 0 0
0 1 0
0 0 1
_
_
Denicin 1.26 (Matrices Conmutativas y Anticonmutativas) Si A y B
son dos matrices cuadradas y se verica que AB = BA dichas matrices se lla-
man permutables, conmutativas o que conmutan. Es fcil demostrar que si
A es una matriz cuadrada de orden n, conmuta consigo misma y tambin con
I
n
.
En las condiciones anteriores, si A y B son tales que AB = BA, las
matrices A y B se llaman antipermutables o anticonmutativas
Ejemplo 1.12 Demostrar que las matrices
_
a b
b a
_
y
_
c d
d c
_
son permutables
para todos los valores de a, b, c, d. Esto se deduce de:
_
a b
b a
_

_
c d
d c
_
=
_
ac +bd ad +bd
bc +ad bc +ad
_
=
_
ca +db da +db
cb +da cb +da
_
=
_
c d
d c
_

_
a b
b a
_
17
Denicin 1.27 (Matriz Idempotente) Una matriz A de manera que
A
k+1
= A, se llama matriz idempotente de grado k la matriz A. Al grado
k tambin se le llama periodo.
Ejemplo 1.13 A =
_
_
2 2 4
1 3 4
1 2 3
_
_
Vericar si la matriz A es idempotente:
A
2
=
_
_
2 2 4
1 3 4
1 2 3
_
_

_
_
2 2 4
1 3 4
1 2 3
_
_
=
_
_
2 2 4
1 3 4
1 2 3
_
_
= A
Denicin 1.28 (Matriz Nilpotente) Una matriz A tal que A
P
= 0, siendo
p un nmero entero y positivo, se llama nilpotente. Si p es el menor nmero
entero y positivo para la cual A
P
= 0, la matriz A se llama nilpotente de
ndice p.
Ejemplo 1.14 A =
_
_
1 1 3
5 2 6
2 1 3
_
_
Demostrar que A es una matriz nilpotente
de ndice 3.
A
2
=
_
_
1 1 3
5 2 6
2 1 3
_
_

_
_
1 1 3
5 2 6
2 1 3
_
_
=
_
_
0 0 0
3 3 9
1 1 3
_
_
A
3
= A
2
A =
_
_
0 0 0
3 3 9
1 1 3
_
_

_
_
1 1 3
5 2 6
2 1 3
_
_
= 0
Denicin 1.29 (Matriz Involutiva) Una matriz cuadrada A tal que A
2
= I
se llama involutiva. Una matriz unidad, por ejemplo, es involutiva. La inversa
de una matriz involutiva es ella misma.
Proposicin 1.4 La condicin necesaria y suciente para que una matriz A
sea involutiva es que (I A)(I +A) = 0
Demostracin. Supngase (I A)(I +A) = I A
2
= 0; luego A
2
= I y A
es involutiva.
Supngase que A es involutiva; entonces A
2
= I y (I A)(I + A) =
I A
2
= I I = 0
Denicin 1.30 (Matriz Simtrica) Una matriz cuadrada A tal que
A/ = A se llama simtrica. Por tanto, en una matriz cuadrada A = [a
ij
]simtrica
se verica que a
ij
= a
ji
para todos los valores de i y de j.
18
Ejemplo 1.15 A =
_
_
1 2 3
2 4 5
3 5 6
_
_
es simtrica y tambin kA para cualquier
k k
Si A es una matriz cuadrada de orden n, la matriz A+A/ es simtrica.
A =
_
_
1 2 3
2 4 5
3 5 6
_
_
, A/ =
_
_
1 2 3
2 4 5
3 5 6
_
_
entonces
A+A/ =
_
_
2 4 6
4 8 10
6 10 12
_
_
Denicin 1.31 (Matriz Antisimtrica) Una matriz cuadrada A tal que
A/ = A se llama hemisimtrica o antisimtrica. Por tanto, en una matriz
cuadrada A hemisimtrica se verica que a
ij
= a
ji
para todos los valores de i
y de j . Evidentemente, los elementos de la diagonal principal deben ser nulos.
Ejemplo 1.16 A =
_
_
0 2 3
2 0 4
3 4 0
_
_
A/ =
_
_
0 2 3
2 0 4
3 4 0
_
_
= A =
_
_
0 2 3
2 0 4
3 4 0
_
_
La anterior es una matriz hemisimtrica, as como kA, cualquiera que sea el
escalar k k.
Proposicin 1.5 Toda matriz cuadrada A se puede descomponer en la
suma de una matriz simtrica B =
1
2
(A+A/) y otra matriz antisimtrica
C =
1
2
(AA/).
La inversa de una matriz juega un papl muy importante en el desarrollo
de diferentes procedimientos algebraicos y de clculo matricial. As como en R ,
para todo a R con a ,= 0, existe un b R que es el inverso multiplicativo, para
el caso de una matriz A anlogamente se plantea la posibilidad de que exista
una matriz B conformable, tal que AB = I.
Denicin 1.32 (Matriz Inversa) Sean A y B dos matrices cuadradas del
mismo orden, para las cuales se cumple que AB = BA = I. A la matriz B se
llama inversa de A y se escribe B = A
1
(B igual a inversa de A), Recproca-
mente, la matriz A es la inversa de B, y se puede escribir A = B
1
.
Ejemplo 1.17 Como
_
_
1 2 3
1 3 3
1 2 4
_
_

_
_
6 2 3
1 1 0
1 0 1
_
_
=
_
_
1 0 0
0 1 0
0 0 1
_
_
= I
Cada una de las matrices del producto es inversa de la otra.
19
No todas las matrices poseen inversa. Se puede demostrar, sin embargo, que
si A posee matriz inversa, sta es nica.
Proposicin 1.6 (Propiedades de la Inversa) La inversa de una matriz
cumple con las siguientes propiedades
1. Si A es una matriz que tiene inversa, sta es nica
Demostracin. Sean A, B, C tres matrices cuadradas de forma que
AB = BA = I y CA = AC = I. En estas condiciones, (CA)B = C(AB)
y por tanto B = C. En otra forma, B = C = A
1
es la nica inversa de
A.
2. (AB)
1
= B
1
A
1
Demostracin. Por denicin (AB)
1
(AB) = (AB)(AB)
1
= I. Ahora
bien:
(B
1
A
1
)AB = B
1
(A
1
A)B = B
1
IB = B
1
B = I
AB(B
1
A
1
) = A(BB
1
)A
1
= AA
1
= I
Como (AB)
1
es nica, luego (AB)
1
= B
1
A
1
Una matriz que posee inversa se llama invertible o no singular.
Denicin 1.33 (Matriz Ortogonal) Se dice que una matriz A denida so-
bre un cuerpo k, es ortogonal si AA
T
= A
T
A = I. Una matriz ortogonal A es
necesariamente cuadrada e invertible, con una inversa A
1
= A
T
Sea A =
_
_
a
1
a
2
a
3
b
1
b
2
b
3
c
1
c
2
c
3
_
_
Si A es ortogonal, entonces se debe cumplir:
AA
T
=
_
_
a
1
a
2
a
3
b
1
b
2
b
3
c
1
c
2
c
3
_
_
_
_
a
1
b
1
c
1
a
2
b
2
c
2
a
3
b
3
c
3
_
_
=
_
_
1 0 0
0 1 0
0 0 1
_
_
Esto proporciona el siguiente conjunto de ecuaciones:
a
2
1
+a
2
2
+a
2
3
= 1 a
1
b
1
+a
2
b
2
+a
3
b
3
= 0 a
1
c
1
+a
2
c
2
+a
3
c
3
= 0
b
1
a
1
+b
2
a
2
+b
3
a
3
= 0 b
2
1
+b
2
2
+b
2
3
= 1 b
1
c
1
+b
2
c
2
+b
3
c
3
= 0
c
1
a
1
+c
2
a
2
+c
3
a
3
= 0 c
1
b
1
+c
1
b
1
+c
1
b
1
= 0 c
2
1
+c
2
2
+c
2
3
= 1
o en otras palabras:
u
1
u
1
= 1 u
1
u
2
= 0 u
1
u
3
= 0
u
2
u
1
= 0 u
2
u
2
= 1 u
2
u
3
= 0
u
3
u
1
= 0 u
3
u
2
= 0 u
3
u
3
= 1
20
donde u
1
= (a
1
, a
2
, a
3
) , u
2
= (b
1
, b
2
, b
3
) , u
3
= (c
1
, c
2
, c
3
) son las las de A.
As las las u
1
, u
2
y u
3
son ortogonales entre s y tienen longitudes unidad o,
dicho de otro modo, forman un conjunto ortonormal de vectores
Denicin 1.34 (Matriz Escalonada) Sean
_
A
1
A
2
A
S

matri-
ces cuadradas de rdenes
_
m
1
m
2
m
S

, respectivamente.
La generalizacin A =
_

_
A
1
0 0
0 A
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 A
S
_

_
= diag
_
A
1
A
2
A
S

de la matriz diagonal se llama suma directa o matriz escalonada de las


matrices .A
i
Ejemplo 1.18 Sean A
1
=
_
2

, A
2
=
_
1 2
3 4
_
, A
3
=
_
_
1 2 1
2 0 3
4 1 2
_
_
La suma directa de A
1,
A
2
, A
3
es la matriz escalonada:
diag (A
1,
A
2
, A
3
) =
_

_
2 0 0 0 0 0
0 1 2 0 0 0
0 3 4 0 0 0
0 0 0 1 2 1
0 0 0 2 0 3
0 0 0 0 1 2
_

_
Tambien se puede ver a la matriz escalonada como una matriz particionada o
una matriz de bloques en la cual las submatrices no nulas estn sobre la diagonal
.
Denicin 1.35 (Determinante de una Matriz Cuadrada) El de-
terminante de una matriz cuadrada se puede denir recursivamente mediante
desarrollos por columnas o por las. Sea A = (a
ij
) una matriz n n, donde i
es el ndice de la la y j es el ndice de la columna. Se nota por Aij la matriz
(n 1) (n 1) que se obtiene al quitar la la i y la columna j de la matriz
A. Entonces
Desarrollo por la la i : detA = [A[ =

n
j=1
(1)
i+j
a
ij
det(Aij).
Desarrollo por la columna j : detA = [A[ =

n
i=1
(1)
i+j
a
ij
det(Aij).
Aplicando repetidamente estas frmulas, se va reduciendo el orden de las
determinantes hasta llegar a determinantes de rdenes uno, dos o tres que se
pueden calcular usando las reglas de Sarrus:
21
[a
11
[ = a
11
_
a
11
a
12
a
21
a
22
_
= a
11
a
22
a
12
a
21
_
_
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
_
_
= a
11
a
22
a
33
+a
12
a
23
a
31
+a
21
a
32
a
13
a
13
a
22
a
31
a
23
a
32
a
11
a
21
a
12
a
33
El valor del determinante no depende de las las o columnas escogidas,
mientras que la dicultad del clculo probablemente s.
Proposicin 1.7 (Propiedades del Determinante) Las principales propie-
dades de los determinantes de matrices cuadradas son las siguientes.
1. Si una columna es cero, el determinante es cero.
2. Si hay dos columnas iguales, el determinante es cero.
3. Si las columnas son ld, el determinante es cero.
4. El determinante cambia de signo al permutar dos columnas.
5. El determinante no cambia si a una columna se le suma una columna de
las restantes.
6. El determinante es lineal respecto a cada columna:
det(..., c
i
+c/
i
, ...) = det(..., c
i
, ...) +det(..., c/
i
, ...).
det(..., c
i
, ...) = det(..., c
i
, ...).
7. Las las tambin cumplen las anteriores propiedades.
8. det(A) =
n
det(A).
9. El determinante del producto es igual al producto de determinantes:
det(AB) = detAdetB.
10. Una matriz A es invertible si y solo si detA ,= 0. Adems, det(A
1
) =
(detA)
1
.
11. Una matriz y su traspuesta tienen el mismo determinante: det(A
T
) =
detA.
12. El determinante de una matriz triangular es igual al producto de los ele-
mentos diagonales.
13. El determinante de una matriz triangular por bloques es igual al producto
de los determinantes de los bloques diagonales.
22
2. Derivacin.
En esta seccin se exponen los conceptos fundamentales de la derivacin de
funciones reales, y algunas de las reglas principales. Se consideran principal-
mente las funciones algebraicas, y al nal de la seccin se exponen las frmulas
de algunas funciones trigonomtricas y logartmicas que podrn ser utilizadas
posteriormente.
Denicin 2.1 (Pendiente) Se dene la pendiente, en el punto donde x = a,
de la tangente a una curva cuya ecuacin es y = f (x), como
m = lm
h0
f (a h) f (a)
h
De hecho, los lmites con esta forma surgen siempre al calcular una rapidez de
cambio en cualquier ciencia o rama de la ingeniera, como la rapidez de reaccin
en qumica o un costo marginal en economa. Dado que este tipo de lmite se
presenta con suma frecuencia, se le da un nombre y una notacin especial.
Denicin 2.2 (Derivada) La derivada de la funcin f en un nmero a rep-
resentada por f/ (a) es
f/ (a) = lm
h0
f (a +h) f (a)
h
dado el caso de que el lmite exista.
Si se escribe x = a + h, entonces h = x a y h 0 si y solo si x
a; por consiguiente de acuerdo con la determinacin de las tangentes, un modo
equivalente de enunciar la denicin de derivada, es
f/ (a) = lm
xa
f (x) f (a)
x a
Ejemplo 2.1 Determinar la derivada de la funcin f (x) = x
2
8x + 9 en el
nmero a.
f/ (a) lm
h0
f (a +h) f (a)
h
f/ (a) lm
h0
[(a+h)
2
8(a+h)+9][a
2
8a+9]
h
f/ (a) lm
h0
a
2
+2ah+h
2
8a8h+9a
2
+8a9
h
f/ (a) lm
h0
2ah+h
2
8h
h
= lm
h0
(2a +h 8)
f/ (a) = 2a 8
El proceso de calcular la derivada de una funcin se llama derivacin.
23
Figura 1:
Notacin 2.1 (Derivada) Si se emplea la notacin tradicional y = f (x) para
indicar que la variable independiente es x y que la dependiente es y , hay otras
notaciones alternativas comunes de la derivada:
f/ (x) = y/ =
dy
dx
=
df
dx
=
d
dx
f (x) = Df (x) = D
x
f (x)
Los smbolos D y
d
dx
se denominan operadores de diferenciacin porque in-
dican la operacin de diferenciacin, que es el proceso de calcular una derivada.
El smbolo
d
dx
fue introducido por Leibniz y no se debe considerar como una
relacin, solo es un smbolo de f/ (x). No obstante, es una notacin muy til y
sugerente, en especial cuando se usa con la notacin de incrementos.
2.0.3. Interpretacin de la derivada como la pendiente de una tan-
gente.
Si se parte de la denicin de que la lnea tangente o recta tangente a la curva
y = f (x) en el punto P (a, f (a)) es la lnea que pasa por P cuya pendiente es
m = lm
xa
f (x) f (a)
x a
siempre que exista ese lmite
Como, segn la denicin 2.2 es la misma que la derivada f/ (a) ahora se
puede decir que la recta tangente a y = f (x) en (a, f (a)) es la lnea que pasa
por (a, f (a)) cuya pendiente es igual a f/ (a) la derivada de f en a As, la
interpretacin geomtrica de una derivada (como se tiene en la denicin 2.2)
es lo que registra la gura ??.
24
f/ (a) = lm
h0
f (a +h) f (a)
h
, b) f/ (a) = lm
xa
f (x) f (a)
x a
= pendiente de tangente en P, =pendiente de tangente en P
Al emplear la forma punto-pendiente de la ecuacin de la recta, se llega a:
Si existe f/ (a) entonces una ecuacin de la recta tangente a la curva y = f (x)
en el punto (a, f (a)) es la siguiente:
y f (a) = f/ (a) (x a)
Ejemplo 2.2 Deducir una ecuacin de la tangente a la parbola y = x
2
8x+9
en el punto (3, 6).
De acuerdo con el ejemplo anterior se sabe que la derivada de f (x) = x
2

8x+9, en el nmero a es f/ (a) = 2a 8 . Entonces la pendiente de la tangente


en (3, 6) es f/ (3) = 2 (3) 8 = 2. As, la ecuacin de la recta tangente
y (6) = (2) (x 3) o sea y = 2x.
2.0.4. Reglas de Derivacion.
Una funcin se dice diferenciable en un intervalo si lo es en cada uno de sus
puntos. Las funciones del clculo elemental son diferenciables, excepto posible-
mente en puntos aislados, en sus intervalos de denicin.
Si siempre fuera necesario determinar las derivadas directamente a partir
de la denicin, las operaciones seran tediosas y se requerira mucho ingenio
para evaluar algunos lmites. Por fortuna, se han desarrollado varias reglas para
hallar derivadas que obvian ese proceso y simplican mucho la diferenciacin.
Las reglas siguientes suponen que se trabaja con funciones diferenciables.
Regla 2.1 (Derivada de una Constante) Si f es una funcin constante,
f (x) = c, entonces f/ (x) = 0
Este resultado es geomtricamente evidente porque la grca de una fun-
cin constante es una recta horizontal con pendiente 0; la demostracin formal
tambin es simple.
f/ (x) = lm
h0
f (x +h) f (x)
h
= lm
h0
c c
h
= lm
h0
0 = 0
En notacin de Leibniz, se escribe:
d
dx
c = 0
Regla 2.2 (Regla de Potencias) Si f (x) = x
n
en donde n es un entero po-
sitivo, f/ (x) = nx
n1
En la notacin de Leibniz la regla de potencias se expresa como:
d
dx
(x
n
) =
nx
n1
25
Demostracin. La frmula
x
n
a
n
= (x a)
_
x
n1
+x
n2
a +. . . +xa
n2
+a
n1
_
Se comprueba multiplicando el lado derecho, o sumando el segundo factor
como una serie geomtrica. As, si se usa la ecuacin 2.2 para f/ (a) y despus
se utiliza la expresin de arriba, se obtiene:
f/ (a) = lm
xa
f (x) f (a)
x a
= lm
xa
x
n
a
n
x a
f/ (a) = lm
xa
_
x
n1
+x
n2
a +... +xa
n2
+a
n1
_
f/ (a) = a
n1
+a
n2
+... +xaa
n2
+a
n1
Demostracin. f/ (a) = na
n1
f/ (x) = lm
h0
f (x +h) f (x)
h
= lm
h0
(x +h)
n
x
n
h
Al desarrollar (x +h)
n
de acuerdo con el teorema del binomio, se llega a:
f/ (x) = lm
h0
_
x
n
+nx
n1
h +
n(n1)
2
x
n2
h
2
+... +nxh
n1
+h
n
_
x
n
h
/ (x) = lm
h0
_
nx
n1
+
n(n1)
2
x
n2
h +... +nxh
n2
+h
n1
_
f/ (x) = nx
n1
Por cuanto todos los trminos excepto el primero, tienen a h como factor;
por consiguiente, tienden a 0.
Ejemplo 2.3 Los siguientes ejemplos
Si y = t
5
entonces
dy
dt
= 5t
4
D
u
(u
m
) = mu
m1
Si y = x
20
, entonces y/ = 20x
19
d
dr
_
r
6
_
= 6r
5
26
d
dx

x =
d
dx
_
x
1
2
_
=
1
2
x
(
1
2
)1
=
1
2

x
Sea y =
1
3

x
2
Entonces
dy
dx
=
d
dx
_
x

2
3
_
=
2
3
x
(
2
3
)1
=
2
3
x

5
3
Derivar la funcin f (t) =

t (1 t) .
Aplicando la regla del producto se tiene:
f/ (t) =

t
d
dt
(1 t) + (1 t)
d
dt

t
f/ (t) =

t (1) + (1 t)
1
2
t

1
2
f/ (t) =

t +
1t
2

t
=
13t
2

t
Si se utilizan primero las leyes de los exponentes, despus se podr proceder
directamente, sin recurrir a la regla del producto.
f (t) =

t t

t = t
1
2
t
3
2
f/ (t) =
1
2
t

1
2

3
2
t
1
2
que equivale a la respuesta en la solucin anterior
Las frmulas de diferenciacin que siguen indican que la derivada de una
constante multiplicada por una funcin es igual a la constante multiplicada por
la derivada de la funcin, y que la derivada de una suma (o resta) de funciones
es igual a la suma (o resta) de las derivadas, siempre y cuando las derivadas
existan.
Para denir las siguientes reglas, se supone que c es una constante y que
tanto f/ (x) como g/ (x) existen.
Regla 2.3 Si g (x) = cf (x), entonces f/ (x) existe y g (x) = cf/ (x)
Tambin se escribe:
d
dx
(cf) = c
df
dx
27
Demostracin. g/ (x) = lm
h0
f (x +h) f (x)
h
= lm
h0
cf (x +h) cf (x)
h
g/ (x) = lm
h0
c
_
f (x +h) f (x)
h
_
g/ (x) = c lm
h0
f (x +h) f (x)
h
g/ (x) = cf/ (x)
Regla 2.4 Si H(x) = f (x) g (x) , entonces H/ (x) existe, y
H/ (x) = f/ (x) g/ (x)
Tambin se escribe:
d
dx
(f g) =
df
dx

dg
dx
Este resultado se puede ampliar para la suma de cualquier nmero de fun-
ciones.
Demostracin. H/ (x) = lm
h0
H (x_h) H(x)
h
H/ (x) = lm
h0
[f (x +h) g (x +h)] [f (x) g (x)]
h
H/ (x) = lm
h0
_
f (x +h) f (x)
h

g (x +h) g (x)
h
_
H/ (x) = lm
h0
f (x +h) f (x)
h
lm
h0
g (x +h) g (x)
h
H/ (x) = f/ (x) g/ (x)
De manera resumida, las dos reglas anteriores se pueden expresar como:
(cf) / = cf/
(f g) / = f/ g/
Ejemplo 2.4
d
dx
_
x
8
+ 12x
5
4x
4
+ 10x
3
6x + 5
_
=
d
dx
_
x
8
_
+ 12
d
dx
_
x
5
_
4
d
dx
_
x
4
_
+ 10
d
dx
_
x
3
_
6
d
dx
(x) +
d
dx
(5)
= 8x
7
+ 12
_
5x
4
_
4
_
4x
3
_
+ 10
_
3x
2
_
6 (1) + 0
= 8x
7
+ 60x
4
16x
3
+ 30x
2
6
28
Ejemplo 2.5 Si f (x) = x
4
x
3
+x
2
x+1, deducir la ecuacin de la tangente
a la grca de f en el punto (1, 1).
La pendiente de f/ (1) que se calculara como sigue:
f/ (x) = 4x
3
3x
2
+ 2x 1
f/ (1) = 4 3 + 2 1 = 2
Por tanto, la ecuacin de la tangente en (1, 1) es
y 1 = 2 (x 1) o bien 2x y 1 = 0
A continuacin se necesita una frmula para la derivada de un producto de
dos funciones; es posible sentirse inclinado a suponer, como lo hizo Leibniz hace
tres siglos, que la derivada de un producto es igual al producto de las derivadas;
pero se puede ver que tal hiptesis no es correcta si se considera un ejemplo
en particular. Sean f (x) = x y g (x) = x
2
. Entonces, la regla de potencias
establece que f/ (x) = 1 y g/ (x) = 2x y se tendra f/ g/ = 2x. Sin embargo,
si se toma h = f g = x
3
y, por consiguiente, h
l
= (f g) / = 3x
2
. Entonces
(f g) / , = f/ g/ . Leibniz descubri la frmula correcta, la cual se llama regla
del producto.
Regla 2.5 (Regla del Producto) Si H(x) = f (x) g (x) y tanto f/ (x) como
g/ (x) existen a la vez, entonces
H (x) = f (x) g/ (x) +f/ (x) g (x)
Tambin se puede expresar como:
d
dx
(fg) = f
dg
dx
+g
df
dx
y de manera abreviada: (fg) / = fg/ +f/g
Demostracin. H/ (x) = lm
h0
H (x +h) H(x)
h
H/ (x) = lm
h0
f (x +h) g (x +h) f (x) g (x)
h
Para evaluar este lmite, se van a separar las funciones f y g sumando y
restando el trmino f (x +h) g (x) en el numerador
H/ (x) =
= lm
h0
f (x +h) g (x +h) f (x +h) g (x) +f (x +h) g (x) f (x) g (x)
h
= lm
h0
_
f (x +h)
g (x +h) g (x)
h
+g (x)
f (x +h) f (x)
h
_
29
= lm
h0
f (x +h) lm
h0
g (x +h) g (x)
h
+
+lm
h0
g (x) lm
h0
f (x +h) f (x)
h
H/ (x) = f (x) g/ (x) +f/ (x) g (x)
Ejemplo 2.6 Determinar F/ (x) si F (x) =
_
6x
3
_ _
7x
4
_
Segn la regla del producto:
F/ (x) =
_
6x
3
_
d
dx
_
7x
4
_
+
_
7x
4
_
d
dx
_
6x
3
_
F/ (x) =
_
6x
3
_ _
28x
3
_
+
_
7x
4
_ _
18x
2
_
F/ (x) = 168x
6
+ 126x
6
= 294x
6
Se podra comprobar la respuesta a este ejemplo en forma directa multipli-
cando primero los factores:
F (x) =
_
6x
3
_ _
7x
4
_
= 42x
7
F/ (x) = 42
_
7x
6
_
= 294x
6
Regla 2.6 (Regla del Cociente) Si F (x) =
f(x)
g(x)
y existen f/ (x) y g/ (x) a
la vez, entonces existe F/ (x) y F/ (x) =
g (x) f/ (x) f (x) g/ (x)
[g (x)]
2
En la notacin de Leibniz:
d
dx
_
f (x)
g (x)
_
=
g (x)
d
dx
f (x) f (x)
d
dx
g (x)
[g (x)]
2
y de manera abreviada:
_
f
g
_
/ =
gf/ fg/
g
2
Demostracin. F/ (x) lm
h0
F (x +h) F (x)
h
= lm
h0
f(x+h)
g(x+h)

f(x)
g(x)
h
F/ (x) lm
h0
f (x +h) g (x) f (x) g (x +h)
hg (x +h) g (x)
Para separar f y g en esta expresin se suma y resta el trmino f (x) g (x)
al numerador:
F/ (x) lm
h0
f (x +h) g (x) f (x) g (x) +f (x) g (x) f (x) g (x +h)
hg (x +h) g (x)
30
F/ (x) lm
h0
g (x)
f(x+h)f(x)
h
f (x)
g(x+h)g(x)
h
g (x +h) g (x)
F/ (x)
lm
h0
g (x) lm
h0
f(x+h)f(x)
h
lm
h0
f (x) lm
h0
g(x+h)g(x)
h
lm
h0
g (x +h) lm
h0
g (x)
F/ (x) =
g (x) f/ (x) f (x) g/ (x)
[g (x)]
2
En palabras, la derivada de un cociente es igual al denominador multiplicado
por la derivada del numerador, menos el numerador multiplicado por la derivada
del denominador, y todo ello se divide entre el cuadrado del denominador.
Ejemplo 2.7 Sea y =
x
2
x2
x
3
+6
Entonces y/ =
(x
3
+6)D(x
2
+x2)(x
2
+x2)D(x
3
+6)
(x
3
+6)
2
y/ =
(x
3
+6)(2x+1)(x
2
+x2)(3x
2
)
(x
3
+6)
2
y/ =
(2x
4
+x
3
+12x+6)(3x
4
+3x
3
6x
2
)
(x
3
+6)
2
y/ =
x
4
2x
3
+6x
2
+12x+6
(x
3
+6)
2
Tambin se puede emplear la regla del cociente para ampliar la regla de
potencias al caso en que el exponente es un entero negativo.
Regla 2.7 Si f (x) = x
n
, donde n es un entero positivo, f/ (x) = nx
n1
Demostracin. f/ (x) =
d
dx
(x
n
) =
d
dx
_
1
x
n
_
f/ (x) =
x
n
D(1)1D(x
n
)
(x
n
)
2
f/ (x) =
nx
n1
x
2n
= nx
n12n
= nx
n1
Ejemplo 2.8 Si y =
1
x
Entonces,
dy
dx
=
d
dx
_
x
1
_
= x
2
=
1
x
2
Ejemplo 2.9
d
dt
_
6
t
3
_
= 6
d
dt
_
t
3
_
= 6 (3) t
4
=
18
t
4
31
Ejemplo 2.10 Derivar la funcin f (t) =

t (1 t) Aplicando la regla del pro-
ducto se tiene:
f/ (t) =

t
d
dt
(1 t) + (1 t)
d
dt

t
f/ (t) =

t (1) + (1 t)
1
2
t

1
2
f/ (t) =

t +
1t
2

t
=
13t
2

t
Si se utilizan primero las leyes de los exponentes, despus se podr proceder
directamente, sin recurrir a la regla del producto.
f (t) =

t t

t = t
1
2
t
3
2
f/ (t) =
1
2
t

1
2

3
2
t
1
2
que equivale a la respuesta en la solucin anterior
Ejemplo 2.11 En qu puntos de la hiprbola xy = 12 la tangente es paralela a
la recta 3x +y = 0?
Como xy = 12 se puede escribir en la forma y =
12
x
dy
dx
= 12
d
dy
_
x
1
_
= 12
_
x
2
_
=
12
x
2
Sea a la abscisa de uno de los puntos en cuestin. Entonces, la pendiente de
la tangente en ese punto es
12
a
2
. Esa tangente ser paralela a la recta 3x+y = 0
o y = 3x, si tiene la misma pendiente, que es 3. Al igualar las pendientes se
llega a
12
a
2
= 3 , o sea a
2
= 4 , o sea a = 2 Por consiguiente, los puntos
buscados son(2, 6) y (2, 6).
Regla 2.8 (Regla de la Cadena) Sean f, g dos funciones. Si existen a la vez
las derivadas g/ y f/ y si H = f g es la funcin compuesta denida por
H(x) = f (g (x)) , entonces H/(x) existe y est dada por el producto H/ (x) =
f/ (g (x)) g/ (x)
En la notacin de Leibnitz, si y = f (u) y u = g(x) son dos funciones
diferenciables, entonces
dy
dx
=
dy
du
du
dx
Demostracin. Se desarrollar mediante el examen de dos casos.
du
dx
,= 0
Aqu u ,= 0 si x es sucientemente pequea (porque si no du/dx sera
0)pero en este caso se puede dividir entre y multiplicar por u en
32
1.
dy
dx
= lm
x0
y
x
por tanto
dy
dx
= lm
x0
y
u
u
x
dy
dx
= lm
x0
y
u
lm
x0
u
x
u 0 cuando x 0
porque g es contnua
dy
dx
= lm
u0
y
u
lm
x0
u
x
dy
dx
=
dy
du
du
dx
2.
du
dx
= 0
Aqu u = 0 para algunos casos de x, y u ,= 0 para otros valores
de x. Si se tiene x 0 pasando por valores tales que u ,= 0 ,
podemos escribir
y
x
=
y
u

u
x

dy
du

du
dx
=
dy
du
0 = 0
Si x 0 pasando por valores tales que u = 0 , entonces
y = f (u + u) f (u) = f (u) f (u) = 0
y as
y
x
= 0
En ambos casos
y
x
0,
y entonces
dy
dx
= 0 =
dy
du
du
dx
En estas circunstancias se comprueba la regla de la cadena, porque ambos
lados son 0.
2.0.5. Derivacin Parcial
Los casos expuestos anteriormente se aplican para funciones de una sola
variable. Cuando se trabaja con funciones de varias variables f(x, y, z, ...) el
proceso es similar, teniendo en cuenta que se puede derivar de manera separada
la funcin f con respecto a cada una de sus variables independientes. Para
simplicar la presentacin, se considerar en las lneas siguientes el caso de una
funcin de dos variables, pero cada caso se puede llevar por analoga a funciones
de tres o ms variables.
33
Denicin 2.3 Sea z = f(x, y) una funcin de dos variables independientes
x, y. Entonces, las derivadas parciales de z son las funciones f
x
y f
y
que se
denen como:
f
x
(x, y) = lm
h0
f(x +h, y) f(x, y)
h
f
y
(x, y) = lm
h0
f(x, y +h) f(x, y)
h
Donde f
x
se denomina la primera derivada parcial de f(x, y) con respecto a
x, y f
y
se denomina la primera derivada parcial de f(x, y) con respecto a y.
Por tanto, f
x
permite calcular la variacin de f a medida que cambia x, con
todas las dems variables jas, y equivalentemente para f
y
.
Notacin 2.2 Sea z = f(x, y). Entonces, las derivadas parciales de esta fun-
cin con respecto a x y con respecto a y son:
f
x
(x, y) = f
x
=
f
x
=

x
f(x, y) =
z
x
= f
1
= D
1
f = D
x
f
f
y
(x, y) = f
y
=
f
y
=

y
f(x, y) =
z
y
= f
2
= D
2
f = D
y
f
34
3. Derivacin Matricial
El clculo matricial es en gran manera una ampliacin de la notacin tradi-
cional del clculo univariado, que permite una notacin ms compacta a la hora
de realizar clculo multivariado, en el cual las funciones pueden ser de un tipo
ms amplio, ya que la variable puede ser vectorial o matricial. En general, el
clculo matricial trabaja sobre espacios de matrices M(m, n) de tamao mn
denidas sobre k = R.
Antes de abordar el proceso de la derivacin matricial dada la complejidad
tcnica del problema, es preciso incorporar algunas nuevas operaciones entre
matrices que completan el clculo matricial tradicional. Por ello, se denen las
matrices de permutacin y los conceptos de producto Kronecker y vectorizacin
junto con sus propiedades.
Primero se exponen nuevos tipos de matrices que son de especial inters para
desarrollos del clculo matricial.
Nota 3.1 Es importante resaltar en todo caso, que en este escrito se identi-
carn explcitamente los espacios de matrices M
pn
con R
pn
y M
mq
con R
mq
,
respectivamente.
3.1. Funciones Matriciales
Dentro de esta seccin se presentarn los diversos casos de funciones de
acuerdo con su variable, hasta llegar al caso general de las funciones de variable
matricial.
Para ello, sea M
mn
el espacio vectorial de las matrices de tamao mn, en
el cual se denen las matrices X, Y. Dentro del espacio vectorial M
1n
se denen
los vectores la A, B. Adems se denen los escalares x, y k. Se dene adems
una funcin f.
3.1.1. Funciones de Variable Escalar
Sea M
mn
el espacio vectorial de las matrices de tamao m n, y X, Y
matrices de M
mn
. Sea M
1n
el espacio vectorial de los vectores la de tamao n,
y sean A, B vectores de M
1n
. Sean x, y k escalares reales. Entonces se pueden
dar los siguientes casos:
Caso 3.1 f : R R
f(x) = y
Este es el caso usual, cuya derivacin y propiedades de la derivacin se ha
expuesto en la seccin 2.
Ejemplo 3.1 f(x) = x + 1
35
Caso 3.2 f : R M
1n
f(x) = A
Es el caso de una funcin de variable escalar, cuya salida es un vector.
Ejemplo 3.2 f(x) = (2x, x
2
)
Caso 3.3 f : R M
mn
f(x) = Y
Ejemplo 3.3 f(x) =
_
1 x
x + 1 x
2
_
3.1.2. Funciones de Variable Vectorial
Sea M
mn
el espacio vectorial de las matrices de tamao m n, y X, Y
matrices de M
mn
. Sea M
1n
el espacio vectorial de los vectores la de tamao n,
y sean A, B vectores de M
1n
. Sean x, y k escalares reales. Entonces se pueden
dar los siguientes casos:
Caso 3.4 f : M
1n
R
f(A) = y
Caso 3.5 f : M
1n
M
1n
f(A) = B
Es el caso de una funcin de variable vectorial, cuya salida es un vector.
Caso 3.6 f : M
1n
M
mn
f(A) = Y
36
3.1.3. Funciones de Variable Matricial
Sea M
mn
el espacio vectorial de las matrices de tamao m n, y X, Y
matrices de M
mn
. Sea M
1n
el espacio vectorial de los vectores la de tamao n,
y sean A, B vectores de M
1n
. Sean x, y k escalares reales. Entonces se pueden
dar los siguientes casos:
Caso 3.7 f : M
mn
R
f(X) = y
Caso 3.8 f : M
mn
M
1n
f(X) = B
Es el caso de una funcin de variable vectorial, cuya salida es un vector.
Caso 3.9 f : M
mn
M
mn
f(X) = Y
3.2. Otras Matrices Especiales
Se denen las siguientes matrices:
Denicin 3.1 (Particin de una Matriz) Una matriz es particionada, si
es subdividida en matrices ms pequeas llamadas submatrices o bloques me-
diante lineas horizontales y verticales que demarcan las y columnas completas:
_

_
a
11
a
12
a
1n
a
21
a
2n
.
.
.
.
.
.
.
.
.
.
.
.
a
m1
a
m2
a
mn
_

_
Una matriz A
mn
se puede particionar de 2
m+n2
1 maneras distintas,
con al menos una lnea de particin.
Denicin 3.2 (Matriz de Bloques) Una matriz a la que se ha realizado
una particin se llama matriz de bloques o Matriz Particionada..
Ejemplo 3.4 Dada la matriz A
34
,, se le pueden realizar 2
5
1 = 31 parti-
ciones diferentes. Una de ellas puede ser:
A
34
=
_
_
a
11
a
12
a
13
a
14
a
21
a
22
a
23
a
24
a
31
a
32
a
33
a
34
_
_
=
_
B C
D E
_
37
Donde a las submatrices o bloques se les ha denominado B, C, D, E y corres-
ponden a:
B =
_
a
11
a
12
a
13
a
21
a
22
a
23
_
, C =
_
a
14
a
24
_
, D =
_
a
31
a
32
a
33

, E =
_
a
34

Denicin 3.3 (Matriz de Permutacin) Una matriz de permutacin P es
una matriz cuadrada de rden n, donde todos los elementos son 0, a excepcin
de uno cualquiera por cada la y columna que tiene el valor 1
Existen n! matrices de permutacin de tamao n n. Las matrices de con-
mutacin de orden n forman un grupo [Her86], cuyo elemento neutro es la
matriz identidad de orden n, mientras que el elemento inverso es la transpuesta
de la matriz dada.
Ejemplo 3.5 Para n = 3 se tienen las siguientes matrices de permutacin:
_
_
1 0 0
0 1 0
0 0 1
_
_
_
_
1 0 0
0 0 1
0 1 0
_
_
_
_
0 1 0
1 0 0
0 0 1
_
_
_
_
0 1 0
0 0 1
1 0 0
_
_
_
_
0 0 1
1 0 0
0 1 0
_
_
_
_
0 0 1
0 1 0
1 0 0
_
_
Se les llama matrices de permutacin por cuanto al multiplicar por P otra
matriz conforme A, da como resultado una matriz con los mismos elementos
de la matriz original A, pero con sus posiciones permutadas de acuerdo con la
ubicacin de los elementos con valor 1 de P.
Denicin 3.4 (Matrices de Permutacin Par e Impar) A una matriz de
permutacin P que tiene determinante igual a 1 se le denomina matriz de per-
mutacin par, y a la que tiene determinante igual a 1 se le denomina matriz de
conmutacin impar. La mitad de las matrices de permutacin de tamao n n
son matrices de permutacin pares, y la otra mitad son impares.
Denicin 3.5 (Matrices de Permutacin en Bloques) Una matriz de per-
mutacin por bloques de orden mn, que se denota por P
m,n
, es una matriz
cuadrada de orden mn, dividida en n m bloques o cajas cada una de ellas
de orden m n, de manera que el bloque (i, j) , i = 1, ..., n, j = 1, ..., m tiene
todos sus elementos nulos salvo el que est situado en su j-sima la e i-sima
columna que es igual a la unidad
Esta denicin muestra que tanto el primer elemento como el ltimo ele-
mento de una matriz de permutacin por bloques es 1.
38
Proposicin 3.1 (Propiedades Matrices de Permutacin por Bloques)
Las matrices de permutacin en bloques cumplen las siguientes propiedades:
1. P
m,1
= P
1,m
= I
m
2. P

m,n
= P
n,m
3. P
m,n
P
n,m
= I
nm
4. La matriz P
m,n
es ortogonal
Demostracin. Se va a demostrar la propiedad 4; la demostracin de las
dems propiedades se hacen de manera anloga. Las demostraciones se pueden
consultar en [Bar98].
P

m,n
= P
n,m
entonces de (3)., resulta
P
m,n
P
n,m
= P
n,m
P

m,n
= I
n,m
de donde se deduce que P
m,n
es ortogonal ya que P
1
m,n
= P

m,n
3.3. Producto de Kronecker
En ocasiones el producto de matrices que se asocia a la composicin de
aplicaciones lineales es insuciente. El producto de Kronecker que a continuacin
se dene, en cierto sentido lo generaliza.
Denicin 3.6 (Producto de Kronecker) Sea A una matriz mn y B una
una matriz p q. El producto de Kronecker de la matriz A por la matriz B,
denotado como AB, es la matriz bloque C de tamao mpnq denida como:
C = AB =
_

_
a
11
B a
1n
B
.
.
.
.
.
.
.
.
.
a
m1
B a
mn
B
_

_
y desarrollando las operaciones implcitas en cada bloque a
ij
B, se tiene para
C = AB que
C =
_

_
a
11
b
11
a
11
b
12
a
11
b
1q
a
1n
b
11
a
1n
b
12
a
1n
b
1q
a
11
b
21
a
11
b
21
a
11
b
2q
a
1n
b
21
a
1n
b
22
a
1n
b
2q
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
a
11
b
p1
a
11
b
p2
a
11
b
pq
a
1n
b
p1
a
1n
b
p2
a
1n
b
pq
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
a
m1
b
11
a
m1
b
12
a
m1
b
1q
a
mn
b
11
a
mn
b
12
a
mn
b
1q
a
m1
b
21
a
m1
b
22
a
m1
b
2q
a
mn
b
22
a
m1
b
21
a
mn
b
2q
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
a
m1
b
p1
a
m1
b
p2
a
m1
b
pq
a
mn
b
p1
a
mn
b
p2
a
mn
b
pq
_

_
El producto de Kronecker tambin recibe el nombre de Producto Tensorial
o Producto Directo.
39
Se llama producto de Kronecker, denotado con , a una operacin sobre
dos matrices de tamao arbitrario que da como resultado una matriz bloque. El
producto de Kronecker no debe confundirse con el producto de matrices habi-
tual, que es una operacin totalmente diferente. Debe su nombre al matemtico
alemn Leopold Kronecker.
Ejemplo 3.6
_
_
a
11
a
12
a
21
a
22
a
31
a
32
_
_

_
b
11
b
12
b
13
b
21
b
22
b
23
_
=
_

_
a
11
b
11
a
11
b
12
a
11
b
13
a
12
b
11
a
12
b
12
a
12
b
13
a
11
b
21
a
11
b
22
a
11
b
23
a
12
b
21
a
12
b
22
a
12
b
23
a
21
b
11
a
21
b
12
a
21
b
13
a
22
b
11
a
22
b
12
a
22
b
13
a
21
b
21
a
21
b
22
a
21
b
23
a
22
b
21
a
22
b
22
a
22
b
23
a
31
b
11
a
31
b
12
a
31
b
13
a
32
b
11
a
32
b
12
a
32
b
13
a
31
b
21
a
31
b
22
a
31
b
23
a
32
b
21
a
32
b
22
a
32
b
23
_

_
Ejemplo 3.7
_
1 2
3 4
_

_
5 6
7 8
_
=
_

_
1,5 1,6 2,5 2,6
1,7 1,8 2,7 2,8
3,5 3,6 4,5 4,6
3,7 3,8 4,7 4,8
_

_
=
_

_
5 6 10 12
7 8 14 16
15 18 20 24
21 24 28 32
_

_
Ejemplo 3.8
_
5 6
7 8
_

_
1 2
3 4
_
=
_

_
5,1 5,2 6,1 6,2
5,3 5,4 6,3 6,4
7,1 7,2 8,1 8,2
7,3 7,4 8,3 8,4
_

_
=
_

_
5 10 6 12
15 20 18 24
7 14 8 16
21 28 24 32
_

_
Con el ejemplo 3.8 se muestra que el producto de Kronecker no es conmuta-
tivo. En general, AB y BA son matrices diferentes. Sin embargo disfruta de
otras propiedades, algunas de las cuales se recogen en la siguiente proposicin.
Proposicin 3.2 (Propiedades del Producto Kronecker) Sean, A
1
, A
2

M
mn
y B
1
, B
2
M
pq
. Para el producto Kronecker se verican las siguientes
propiedades:
40
1. (A
1
B
1
) + (A
2
B
1
) = (A
1
+A
2
) B
1
(A
1
B
1
) + (A
1
B
2
) = A
1
(B
1
+B
2
) .
2. Dadas A
mn
, B
pq
y R, se verica (AB) = (AB) = (AB) .
3. Dadas las matrices A
mn
, B
pq
, C
rs
, se verica que [(AB) C] =
[A(B C)] .
4. Dadas A
1
M
mn
, A
2
M
mp
, B
1
M
qr
, B
2
M
rs
, si se consideran
las matrices
C
1
= A
1
B
1
y C
2
= A
2
B
2
de ordenes mqnr y nrps respectivamente,
entonces
C
1
C
2
= (A
1
B
1
) (A
2
B
2
) = A
1
A
2
B
1
B
2
.
5. Dadas A y B matrices de ordenes m n y p q, respectivamente, en
general AB ,= B A.
Esto quiere decir, el producto de Kronecker no es conmutativo, si bien se
verica que P
m,p
(AB) P
q,n
= (B A)
6. Si A M
n
y B M
m
son dos matrices invertibles, entonces se verica
que AB es invertible y su inversa
(AB)
1
= A
1
B
1
.
7. Supuestas A y B dos matrices cualesquiera, se verica que (AB) / =
A/ B/.
8. Dadas A y B dos matrices cuadradas de rdenes m y n, respectivamente,
se verica que tr (AB) = tr (A) tr (B) .
9. Sean, A M
nn
y B M
mm
entonces se verica que [AB[ =
[A
m
[ [B
n
[ .
10. Dadas A y B matrices cualesquiera, se tiene que rg (AB) = rg (A)
rg (B) .
41
11. Si A es una matriz m n particionada en cuatro bloques A
ij
, i, j = 1, 2
de dimensiones m
i
n
j
, i, j = 1, 2 con m
1
+m
2
= m y n
1
+n
2
= n y B
es una matriz de orden p q, entonces
AB =
_
A
11
B A
12
B
A
21
B A
22
B
_
Se presenta ahora la demostracin de algunas de las anteriores proposiciones.
Demostracin. Si para k = 1, 2 se tiene A
k
=
_
a
k
ij
_
, i = 1, ..., m,
j = 1, ..., n, B
k
=
_
b
k
ij
_
, i = 1, ..., p, j = 1, ..., q entonces como
A
1
B
1
=
_
a
1
ij
B
1
_
ij
,
A
2
B
1
=
_
a
2
ij
B
1
_
ij
resulta que
(A
1
B
1
) + (A
2
B
1
) =
__
a
1
ij
+a
2
ij
_
B
1
_
ij
= (A
1
+A
2
) B
1
Anlogamente se comprueba la otra igualdad.
Demostracin. Dado que
AB =
_

_
a
11
B a
11
B
a
11
B a
11
B
.
.
.
.
.
.
a
11
B a
11
B
_

_
,
por denicin de matriz traspuesta y producto de Kronecker resulta que
(AB) / =
_

_
a
11
B/ a
21
B/ a
m1
B/
.
.
.
.
.
.
.
.
.
a
1n
B/ a
2n
B/ a
mn
B/
_

_,
tal como se quera probar.
Nota 3.2 Si se comparan las propiedades del producto ordinario de matrices y
del producto Kronecker se tiene:
Producto Matricial Producto Kronecker
(AB) / = B/A/ (AB) / = A/ B/
(AB)
1
= B
1
A
1
(AB)
1
= A
1
B
1
tr (AB) ,= tr (A) tr (B) tr (AB) = tr (A) tr (B)
[AB[ = [A[ [B[ [AB[ = [A
m
[ [B
n
[
rg (AB) mnrg (A) , rg (A) rg (AB) = rg (A) rg (B)
42
Ejemplo 3.9 Las matrices:
A =
_
1 1
2 1
_
B =
_
_
1 1 1
1 0 1
0 2 4
_
_
son tales que tr (A) = 2, tr (B) = 3; rg (A) = 2, rg (B) = 3; [A[ = 3, [B[ = 4
Entonces para la matriz:
AB =
_

_
1 1 1 1 1 1
1 0 1 1 0 1
0 2 4 0 2 4
2 2 2 1 1 1
2 0 2 1 0 1
0 4 8 0 2 4
_

_
Sin necesidad de trabajar con ella directamente, en virtud de las propiedades
del producto de Kronecker se pueden calcular los siguientes valores:
tr (AB) = tr (A) tr (B) = 6
rg (AB) = rg (A) rgB = 6
[AB[ = [A[
3
[B[
2
= 3
2
(4)
2
= 432
Adems como rg (AB) = 6, la matriz A B es invertible, siendo su
inversa, de acuerdo con la propiedad 6:
(AB)
1
= A
1
B
1
por tanto, como:
A
1
=
_
1
3
1
3

2
3
1
3
_
y B
1
=
_
_

1
2
1
2
1
4
1 1 0

1
2

1
2
1
4
_
_
se tiene que:
(AB)
1
=
_

1
6
1
6
1
12

1
6
1
6
1
12
1
3
1
3
0
1
3
1
3
0

1
6

1
6
1
12

1
6

1
6
1
12
1
3

1
3

1
6

1
6
1
6
1
12

2
3

2
3
0
1
3
1
3
0
1
3
1
3

1
6

1
6

1
6
1
12
_

_
43
Un mbito en el que puede resultar til expresar una matriz como un vector
columna es el de la derivacin de matrices o expresiones matriciales. Por ello, a
continuacin se dene lo que se entiende por vectorizacin de una matriz y se
analizan algunas de sus propiedades.
Denicin 3.7 (Vectorizacin de una Matriz) La vectorizacin de una ma-
triz es una transformacin lineal que convierte una matriz en un vector columna.
Dada una matriz A de orden mn, la vectorizacin de A es el vector columna de
mn elementos que se obtiene escribiendo las columnas de A una a continuacin
de otra y se denota por vec (A) . Entonces:
vec (A) =
_
_
_
_
_
a
1
a
2
.
.
.
a
n
_
_
_
_
_
, con a
1
=
_
_
_
_
_
a
1j
a
2j
.
.
.
a
nj
_
_
_
_
_
, j = 1, ..., n.
Ejemplo 3.10 Dada la matriz
A =
_
_
1 2 1
5 1 0
3 0 2
_
_
se tiene que vec (A) =
_
_
_
_
_
_
_
_
_
_
_
_
_
_
1
5
3
2
1
0
1
0
2
_
_
_
_
_
_
_
_
_
_
_
_
_
_
Proposicin 3.3 (Propiedades de la Vectorizacin) La vectorizacin
de matrices verica las siguientes propiedades:
1. Sean A, B M
mn
dos matrices cualesquiera, y sea R. Se verica las
siguientes propiedades: vec (A+B) = vec (A) +vec (B)
vec (A) = vec (A)
2. Dadas las matrices A
mn
y B
nq
se verica que:
vec (AB) = (B/ I
m
) vec (A) = (I
p
A) vec (B) = (B/ A) vec (I
n
)
3. Dada la matriz A de orden mn, se verica que:
vec (A) = (I
n
A) vec (I
n
) = (A/ I
m
) vec (I
m
)
44
4. Dadas las matrices A
mn
, B
np
y C
pq
, se verica que:
vec (ABC) = (C/ A) vec (B) = (I
q
AB) vec (C) = (C/B/ I
m
) vec (A)
5. Dada la matriz A de orden mn, se verica:
vec (A) = P
m,n
vec (A/) , vec (A/) = P
n,m
vec (A)
6. Dada la matriz A de orden mn, se verica:
[(vecI
n
) / I
m
] [I
n
vec (A)] = A
[vec (A) / I
m
] [I
n
vec (I
m
)] = A
[I
m
(vec (A/)) /] [vec (I
m
) I
n
] = A. [I
m
(vec (I
n
)) /] [vec (A/) I
n
] =
A
7. Dadas las matrices A y B de orden mn y C, D de orden mp, se tiene
que:
vec [(A+B) (C +D)] = [(I
p
A) + (I
p
B)] [vec (C) +vec (D)]
vec [(A+B) (C +D)] = [(C/ I
m
) + (D/ I
m
)] [vec (A) +vec (B)]
8. Sean las matrices A
mn
y B
nm
, entonces se tiene que
tr (AB) = (vec (A/)) /vec (B) = (vec (B)) /vec (A)
En particular si n = m y B = I
n
:
tr (A) = (vec (A/)) /vec (I
n
) = (vec (I
n
)) /vec (A)
Demostracin. La j-sima columna del producto AB es Ab
j
, entonces por
denicin de vectorizacin y el producto de matrices particionadas de tiene
vecAB =
_
_
_
_
_
Ab
1
Ab
2
.
.
.
Ab
p
_
_
_
_
_
=
_
_
_
_
_
A 0
mXn
0
0 A 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 A
_
_
_
_
_
_
_
_
_
_
b
1
b
2
.
.
.
b
p
_
_
_
_
_
Ahora bien, teniendo en cuenta el producto Kronecker de matrices, esto se
puede expresar como
45
vec (AB) = (I
p
A) vec (B)
Por otra parte, la j-sima columna de AB es
n

i=1
a
i
b
ij
pues la componenete k-sima de este vector coincide con el elemento de la
k-sima la y la j-sima columna de AB que es

n
i=1
a
ki
b
ij
Por tanto:
vec (AB) =
_
_
_
_
_
_
_
_
_
_
_
n

i=1
a
i
b
i1
n

i=1
a
i
b
i2
.
.
.
n

i=1
a
i
b
ip
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
B/ 0
pXn
0
0 B/ 0
.
.
.
.
.
.
.
.
.
0 0 B/
_
_
_
_
_
_
_
_
_
_
a
1
a
2
.
.
.
a
n
_
_
_
_
_
y por denicin de producto de Kronecker y vectorizacin, resulta:
vec (AB) = (B/ I) vec (A)
Demostracin. Como A = I
m
A por la proposicin 3.3,2:
vec (A) = vec (I
m
A) = (A/ I
m
) vec (I
m
)
Anlogamente, como A = AI
n
, de nuevo por la proposicin 3.3,2:
vec (A) = vec (AI
n
) = (I
n
A) vec (I
n
)
Demostracin. De acuerdo con la proposicin 3.3,2 se verica que:
vec (ABC) = vec [(AB) C] = (I
q
AB) vec (C)
vec (ABC) = vec [(AB) C] = ((BC) / I
m
) vec (A)
vec (ABC) = vec [(AB) C] = (C/B/ I
m
) vec (A)
Adems, como en virtud de la proposicin 3.3, 1, se tiene tambin que
vec (ABC) = vec [(AB) C] = (C/ AB) vec (I
p
)
entonces por la proposicin 3.3, 4 del producto de Kronecker,
(C/ AB) = (C/ A) (I
p
B)
46
y, teniendo en cuenta la proposicin 3.3, 3, se obtiene nalmente
vec (ABC) = (C/ A) (I
p
B) vec (I
p
) = (C/ A) vec (B)
Las proposicines 3.3, 2 y 8 pueden generalizarse para el producto de un
nmero nito de matrices. As, para matrices A
1
, A
2
, A
3
y A
4
de dimensiones
adecuadas, se tiene que:
vec (A
1
A
2
A
3
A
4
) = (I A
1
A
2
A
3
) vec (A
4
)
vec (A
1
A
2
A
3
A
4
) = (A/
4
A
1
A
2
) vec (A
3
)
vec (A
1
A
2
A
3
A
4
) = (A
4
A
3
A
1
) vec (A
2
)
vec (A
1
A
2
A
3
A
4
) = (A
4
A
3
A
2
I) vec (A
1
)
y
tr (A
1
A
2
A
3
) = (vec (A/
1
)) / (A/
3
I) vec (A
2
)
tr (A
1
A
2
A
3
) = (vec (A/
1
)) / (I A
2
) vec (A
3
)
tr (A
1
A
2
A
3
) = (vec (A/
2
)) / (I A
3
) vec (A
1
)
tr (A
1
A
2
A
3
) = (vec (A/
2
)) / (A/
1
I) vec (A
3
)
tr (A
1
A
2
A
3
) = (vec (A/
3
)) / (A/
2
I) vec (A
1
)
tr (A
1
A
2
A
3
) = (vec (A/
3
)) / (I A
1
) vec (A
2
)
que se pueden demostrar fcilmente, pues son consecuencia de la vectoriza-
cin y traza del producto de dos matrices y de las propiedades del producto de
Kronecker. Resultados anlogos existen para el producto de un nmero nito
de matrices.
En algunas ocasiones, cuando se vectoriza una matriz, conviene hacerlo a
partir de sus las.
Denicin 3.8 (Vectorizacin por Filas) Dada A una matriz de orden m
n, se dene:
vec (A) =
_
_
_
_
_
a/
1
a/
2
.
.
.
a/
m
_
_
_
_
_
con a
i
(a
i1
, ..., a
in
) , i = 1, ..., m
Es obvio y fcil de vericar que vec (A) = vec (A/) . Por tanto, pueden enun-
ciarse las propiedades de vec (A) . Por ejemplo:
vec (AB) = vec ((AB) /) = vec (B/A/) = [(AI) vec (B/)]
vec (AB) = (AI) vec (B)
y
47
tr (AB) = (vec (A/)) /vec (B) = (vec (A)) /vec (B/)
tr (AB) = (vec (A/)) / vec (B)
Denicin 3.9 ( vec) Dada una matriz simtrica A de orden n, puede denirse
una vectorizacin diferente de las ya indicadas de manera que en dicha vecto-
rizacin, solo se recojan los elementos distintos de la matriz A. As, se denota
por vec (A) el vector columna de orden r =
n(n + 1)
2
dado por:
vec (A) =
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
a
11
a
12
a
22
a
13
a
23
a
33
.
.
.
a
1n
a
2n
.
.
.
a
nn
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
En vec (A) se incluyen los elementos situados por encima de la diagonal
principal de cada una de las columnas de A. Por otra parte, la relacin entre
esta vectorizacin y la indicada en la dencin 3.7 se establece por la igualdad
vec (A) = Qvec (A) , (donde Q es la matriz diagonal por bloques de orden rn):
Q =
_

_
Q
1
Q
2
.
.
.
Q
n
_

_
donde i = 1, ..., n, y el bloque Q
i
una matriz de orden i n dada por
Q
i
=
_

_
1 0 0 0
0 1 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 1 0
_

_
i-sima columna
48
Nota 3.3 La vectorizacin se utiliza en conjunto con el producto Kronecker
para expresar la multiplicacin de matrices como una transformacin lineal sobre
las matrices. Por ejemplo, si A, B, X son matrices conformes:
vec(AXB) = (B
T
A)vec(X)
3.4. Frmulas de Derivacin Matricial.
La derivada de una funcin matricial de variable matricial no diere sus-
tancialmente del concepto de derivada habitual. La diferencia y dicultad se
presenta cuando es preciso manipular estas derivadas matriciales, debido a su
dimensin y la ubicacin de sus elementos [Bar98].
En esta seccin se indican las deniciones de funciones escalares, vectoriales
y matriciales de variable escalar, vectorial o matricial, adoptando un criterio
comn para la colocacin de los distintos elementos que componen cada una
de estas derivadas. En las deniciones de las derivadas de funciones escalar o
vectorial, bien sean de variable escalar o vectorial, existe casi unanimidad en la
literatura en cuanto a su ordenacin.
Se acostumbra usar la variable en negrilla cuando se trata de una variable de
tipo vectorial o matricial; sin embargo, en las siguientes secciones no se utilizar
esta notacin ya que el contexto har claridad. As, si x R
n
e y R
m
, entonces
se puede observar que una notacin bastante usual se expone as:
Si y = y (x
1
, ..., x
n
) su derivada es
y
x
=
_
y
x
1
...
y
x
n
_
, que es el caso de
las funciones escalares de variable vectorial.
Si y = y (x) =
_
_
_
y
1
(x)
.
.
.
y
n
(x)
_
_
_ su derivada es
y
x
=
_
_
_
y1(x)
x
.
.
.
ym(x)
x
_
_
_, . que es el caso
de las funciones vectoriales de variable escalar.
Si y = y (x) =
_
_
_
y
1
(x
1
, ..., x
n
)
.
.
.
y
n
(x
1
, ..., x
n
)
_
_
_su derivada es
y
x
=
_
_
_
y
1
x1

y
1
xn
.
.
.
.
.
.
ym
x1

ym
xn
_
_
_,
que es el caso de las funciones matriciales de variable vectorial
Cuando se ha de calcular el gradiente de y = f (x) , se respeta la ordenacin
del vector la x = (x
1
, ..., x
n
) de las variables explicativas; luego parece lgico
que este mismo criterio de ubicacin de elementos se adopte para denir la
derivada de una funcin escalar de variable matricial.[Bar98]. Siguiendo este
acuerdo se exponen las siguientes deniciones.
49
Denicin 3.10 Sea y = y (x) una funcin real de variable vectorial, es decir,
y es una funcin denida de R
n
en R. La derivada de y respecto de x es el
vector la
y (x)
x
=
_
y (x)
x
1
, ...,
y (x)
x
n
_
Se adopta esta notacin ya que se est derivando un escalar y (x) con respecto
a un vector la x = (x
1
, ..., x
n
). Obsrvese que
y (x)
x
es el vector gradiente de
la funcin y (x) .
Si se precisa que el vector de variables x respecto a las que se efecta la
derivada de y se toma como columna, entonces se denotar por
y (x)
x
=
_
y (x)
x
_
/
es decir, este vector coincide con el traspuesto del vector gradiente de y.
Denicin 3.11 Sea y = y (x) una funcin vectorial de variable real, es decir
y (x) =
_
_
_
y
1
(x)
.
.
.
y
n
(x)
_
_
_
es una funcin denida de R en R
m
. La derivada de y respecto del escalar
x es el vector columna
y (x)
x
=
_
_
_
y1(x)
x
.
.
.
ym(x)
x
_
_
_
Denicin 3.12 Sea y = y (x) una funcin vectorial de variable vectorial, es
decir, una funcin denida de R
n
en R
m
. Como
y (x) =
_
_
_
y
1
(x)
.
.
.
y
m
(x)
_
_
_ entonces:
y(x)
x
=
_
_
_
y1(x)
x
.
.
.
ym(x)
x
_
_
_ =
_
_
_
_
y1(x)
x1

y1(x)
xn
.
.
.
.
.
.
ym(x)
x
1

ym(x)
x
n|
_
_
_
_
50
Obsrvese que esta matriz de orden mn es el Jacobiano de la funcin y(x),
ya que cada una de sus las es el gradiente de las funciones y
1
(x) , ..., y
n
(x) ,
que son las componentes de y(x).
Denicin 3.13 Sea y = y (X) una funcin real de variable matricial, es decir,
la funcin y est denida de M
pn
en R. La derivada de y respecto de la matriz
X de orden p n, es la matriz del mismo orden dada por
y (X)
X
=
_
_
_
_
y(X)
x11

y(X)
x1n
.
.
.
.
.
.
y(X)
xp1

y(X)
xpn
_
_
_
_
=
_
y (X)
x
ij
_
i=1,...,p
j=1,...,n
Denicin 3.14 Sea Y = Y (x) una funcin matricial de variable escalar, es
decir la funcin Y est denida de R en M
mq
. La derivada de Y = Y (x) respecto
de la variable x est dada por la matriz de orden mq
Y (x)
x
=
_
_
_
y
11
(x)
x

y1q(x)
x
.
.
.
ym1(x)
x

ymq(x)
x
_
_
_ =
_
y
ij
(x)
x
_
i=1,...,m
j=1,...,q
Denicin 3.15 Sea y = y(X) una funcin vectorial de variable matricial
denida de M
pn
en R. La derivada de y(X) respecto de la matriz A de orden
p n es la matriz de orden pmn dada por
y (X)
X
=
_
_
_
y
1
(X)
X
.
.
.
ym(X)
X
_
_
_ ,
ya que, de acuerdo con la denicin 3.13, para cada k = 1, ..., m
y
k
(X)
X
=
_
y
k
(X)
x
ij
_
i=1,...,p
j=1,...,n
Denicin 3.16 Sea Y = Y (x) una funcin matricial de variable vectorial
denida de R
n
en M
mq
. La derivada de Y (x) respecto del vector x es la matriz
de orden mqn cuya expresin es
Y (x)
x
=
_
_
_
y11(x)
x

y
1q
(x)
x
.
.
.
.
.
.
ym1(x)
x

ymq(x)
x
_
_
_
51
donde, teniendo en cuenta la denicin 3.10,
y
ij
(x)
x
=
_
y
ij
(x)
x
1
, ...,
y
ij
(x)
x
n
_
con i = 1, ..., m, j = 1, ..., q
Denicin 3.17 (Derivada Funcion Matricial de Variable Matricial)
Sea Y = Y (X) una funcin matricial de variable matricial, es decir, denida
de M
pn
en M
mq
. La derivada de Y (X) respecto de la matriz X est dada por
la matriz de orden pmnq
Y (X)
X
=
_
_
_
y11(X)
X

y1q(X)
X
.
.
.
.
.
.
ym1(X)
X

y
mq
(X)
X
_
_
_
ya que, teniendo en cuenta la denicin 3.14, para cada i 1, ..., m, j =
1, ..., q
y
ij
(X)
X
=
_
y
ij
(X)
x
k
_
k=1,...,p
=1,...,n
La denicin 3.17 hace referencia al caso general que se puede tratar en el
caso de la derivacin matricial. Este caso se convierte en los casos particulares de
las deniciones 3.10 hasta la denicin 3.16 si se dan las siguientes condiciones:
1. p = q = m = q se obtiene la denicin 3.10
2. p = n = q = 1 se obtiene la denicin 3.11
3. p = q = 1 se obtiene la denicin 3.12
4. q = m = 1 se obtiene la denicin 3.13
5. p = n = 1 se obtiene la denicin 3.14
6. q = 1 se obtiene la denicin 3.15
7. p = 1 se obtiene la denicin 3.16
Existen mltiples formas de dar la expresin de derivadas matriciales, ya
que pueden considerarse distintas ordenaciones de los elementos de la matriz
nal que se obtiene al derivar una matriz respecto de otra. Algunas derivadas
matriciales se pueden denir a travs de la vectorizacin de la matriz de variables
dependientes e incluso de la de variables independientes.
52
1. En el presente trabajo, empleando el concepto de vectorizacin de una ma-
triz, pueden obtenerse las siguientes expresiones alternativas de las deni-
ciones 3.13, 3.14, 3.15, 3.16 y 3.17 en trminos de vectorizacin:

y (X)
vec(X)
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
y(X)
x11
.
.
.
y(X)
xp1
.
.
.
y(X)
x
1n
.
.
.
y(X)
xpn
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
= vec
_
y (X)
(X)
_

vecY (x)
x
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
y11(x)
x11
.
.
.
y
1m
(x)
x
.
.
.
y1q(x)
x
.
.
.
ymq(x)
x
_
_
_
_
_
_
_
_
_
_
_
_
_
_
= vec
_
Y (x)
x
_

y (X)
vec(X)
=
_
_
_
_
y1(X)
vec(X)
.
.
.
ym(X)
vec(X)
_
_
_
_
,
siendo
y
i
(X)
vec(X)
para i = 1, ..., m lo indicado en la primera expresin alter-
nativa.
El vector columna
y (X)
vec(X)
de orden mnp, teniendo en cuenta propiedades
del producto de Kronecker y de la vectorizacin, se puede expresar tambin
como
y (X)
vec(X)
=
_
y (X)
X/
I
p
_
(vecI
p
) ,siendo
y (X)
X/
=
_
y (X) /
X
_
/.
53
Ntese que en este caso
y (X)
vec(X)
,= vec
_
y (X)
X
_

vecY (x)
x
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
y11(x)
x
.
.
.
y
m1
(x)
x
.
.
.
y1q(x)
x
.
.
.
ymq(x)
x
_
_
_
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
y11(x)
x1

y11(x)
xn
.
.
.
.
.
.
y
m1
(x)
x
1

y
m1
(x)
x
n
.
.
.
.
.
.
y1q(x)
x1

y1q(x)
xn
.
.
.
.
.
.
ymq(x)
x
1

ymq(x)
x
n
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
Se observa que
vec (Y (x))
x
es una matriz de orden mq n, mientras que
Y (x)
x
es de orden mqn. Entre estas dos matrices puede establecerse la sigui-
ente relacin:
vec (Y (x))
x
=
_
I
q

Y (x)
x
_
(vec (I
q
) I
n
)
Mediante las deniciones anteriores y las expresiones en trminos de la vec-
torizacin y las propiedades del producto de Kronecker se obtienen las siguientes
formas alternativas para el clculo de
Y (X)
X
:

vec (Y (X))
X
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
y11(X)
X
.
.
.
y
m1
(X)
X
.
.
.
y1q(X)
X
.
.
.
y
mq
(X)
X
_
_
_
_
_
_
_
_
_
_
_
_
_
_
=
_
I
q

Y (X)
X
_
(vec (I
q
) I
n
)

Y (X)
vecX
=
_
_
_
_
y11(X)
vec(X)

y1q(X)
vec(X)
.
.
.
.
.
.
y
m1
(X)
vec(X)

ymq(X)
vec(X)
_
_
_
_
=
_
Y (X)
X/
I
p
_
(I
q
vec (I
p
))
54

vec (Y (X))
vec(X)
= vec
_
Y (X)
vecX
_
=
_
I
q

Y (X)
X/
I
p
_
(vec (I
q
) vec (I
p
))
Alternativamente, es posible otra formulacin para la derivada de expresiones
matriciales. Para ello, es necesario considerar para cualquier m, n, p, q N y
cualquier funcin:
Y (X) : M
pn
M
mq
la denicin
Y (X)
X

[Y (X))]
(vecX) /
Retomando lo expresado anteriormente, en este trabajo se identicarn ex-
plcitamente los espacios de matrices M
pn
y M
mq
con R
pn
y R
mq
, respectiva-
mente.Lo que se est considerando generalmente es Y (X) como funcin vectorial
de variable vectorial denida de R
pn
en R
mq
, por lo que la expresin
vec [Y (X))]
(vecX) /
es el Jacobiano de dicha funcin vectorial. La eleccin de esta denicin
de derivada puede resultar til para aplicar a funciones matriciales resultados
matemticos relativos a funciones vectoriales.
Ejemplo 3.11 Dada la funcin y = y (x) de R
2
en R
2
denida por
y (x) =
_
y
1
(x
1
, x
2
)
y
2
(x
1
, x
2
)
_
=
_
x
2
1
+x
3
2
2x
1
x
2
_
,
de acuerdo con la Denicin 3.12 se tiene que
y (x)
x
=
_
_
_
_
y
1
(x)
x
y
2
(x)
x
_
_
_
_
=
_
_
y1(x)
x1
y1(x)
x2
y
2
(x)
x
1
y
2
(x)
x
2
_
_
=
_
2x
1
3x
2
2
2x
2
2x
1
_
Por otra parte, teniendo en cuenta la Denicin 3.16

x
=
_
y (x)
x
_
=
_
2 0 0 6x
2
0 2 2 0
_
55
Observese que el resultado anterior diere de

_
vec
_
y(x)
x
__
x
=

x
_

_
_
_
_
_
2x
1
2x
2
3x
2
2
2x
1
_
_
_
_
_

_
=
_
_
_
_
2 0
0 2
0 6x
2
2 0
_
_
_
_
Ejemplo 3.12 Dada la matriz A = (a
ij
) , i = 1, ..., m, j = 1, ..., q, se verica
que la derivada de A respecto del primer vector la que se denota por a
1
es la
matriz de orden mq
2
A
a
1
=
_
_
_
_
a11
a
1
...
a1q
a
1
.
.
.
.
.
.
.
.
.
am1
a1
...
amq
a1
_
_
_
_
=
_
_
_
_
_
1 0 0 0 1 0 0 0 1
0 0 0 0 0 0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0 0 0 0 0 0
_
_
_
_
_
Haciendo uso de la expresin alternativa se obtiene
vec (A)
a
1
=
_
I
q

A
a
1
_
(vec (I
q
) I
q
) =
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
1 0 0 0
0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0
0 1 0 0
0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 1
0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
La derivada de la matriz A respecto de s misma viene dada por la matriz
de orden m
2
q
2
56
A
A
=
_
_
_
a
11
A

a
1q
A
.
.
.
.
.
.
am1
A

amq
A
_
_
_= (vecI
m
) (vecI
q
) /
para cada i = 1, ..., m, j = 1, ..., q se tiene que
a
ij
A
=
_
_
_
_
_
_
_
_
0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 1 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0
_
_
_
_
_
_
_
_
i esima la

y j-sima columna.
La derivada de la matriz A/ respecto de A es una matriz cuadrada de orden
mq denida como
A/
A
=
_
_
_
a
11
A
...
a
m1
A
.
.
.
.
.
.
.
.
.
a
1q
A
...
a
mq
A
_
_
_= P, m, q,
para cada i = 1, ..., m, j = 1, ..., q
a
ij
A
=
_
_
_
_
_
_
_
_
0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 1 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0
_
_
_
_
_
_
_
_
j-sima la

y la j-sima columna
Ejemplo 3.13 Sea y = y(A) una funcin denida de M
22
en R
2
dada por
y = y(A) =
_
y
1
(A)
y
2
(A)
_
=
_
a
2
11
+ 2a
12
a
2
22
(a
11
+a
22
)
2
2a
12
a
21
_
donde A =
_
a
11
a
12
a
21
a
22
_
La derivada de la funcin y = y(A) respecto de la matriz A de variables
independientes, de acuerdo con la denicin 3.15 es
57
y(A)
A
=
_
y
1
(A)
A
y2(A)
A
_
=
_
_
_
_
_
_
_
y1(A)
a
11
y1(A)
a
12
y
1
(A)
a21
y
1
(A)
a22
y
2
(A)
a
11
y
2
(A)
a
12
y2(A)
a21
y2(A)
a22
_
_
_
_
_
_
_
=
_
_
_
_
_
2a
11
2
0 2a
22
2a
11
+ 2a
22
2a
21
2a
12
2a
11
+ 2a
22
_
_
_
_
_
,
y la derivada de y(A) respecto a la vectorizacin de A, teniendo en cuenta
la denicin 3.17, tiene la expresin
y(A)
vec (A)
=
_
_
y1(A)
vec(A)
y
2
(A)
vec(A)
_
_
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
y1(A)
a11
y
1
(A)
a
21
y1(A)
a12
y1(A)
a22
y
2
(A)
a
11
y2(A)
a21
y2(A)
a12
y2(A)
a
22
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
2a
11
0
2
2a
22
2a
11
+ 2a
22
2a
12
2a
21
2a
11
+ 2a
22
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
_
_
2a
11
0 0 0
0 2a
11
0 0
2 0 2a
22
0
0 2 0 2a
22
2a
11
+ 2a
22
0 2a
12
0
0 2a
11
+ 2a
22
0 2a
12
2a
21
0 2a
11
+ 2a
22
0
0 2a
21
0 2a
11
+ 2a
22
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
1
0
0
1
_
_
_
_
=
_

_
_
_
_
_
_
2a
11
0
2 2a
22
2a
11
+ 2a
22
2a
21
2a
21
2a
11
+ 2a
22
_
_
_
_
_

_
1 0
0 1
_
_

_
_
_
_
_
1
0
0
1
_
_
_
_
=
__
y(A)
A
I
2
__
vec (I
2
)
58
Ejemplo 3.14 Sea la funcin Y = Y (X) denida de M
22
en M
32
por
Y = Y (X) =
_
_
y
11
(X) y
12
(X)
y
21
(X) y
22
(X)
y
31
(X) y
32
(X)
_
_
=
_
_
x
11
+x
12
2x
12
x
2
22
e
x
21
x
11
+x
12
x
21
x
12
_
_
,
siendo
X =
_
_
_
_
y
11
(X)
X
y
12
(X)
X
y21(X)
X
y22(X)
X
y31(X)
X
y32(X)
X
_
_
_
_
=
_
_
_
_
_
_
_
_
1 1 0 2
0 0 0 0
0 0 0 0
0 2x
22
e
x21
0
x
22
0 0 x
21
0 x
11
x
12
0
_
_
_
_
_
_
_
_
.
Ahora bien, de acuerdo con la expresin alternativa
vecY (X)
X
=
_
I
2

Y (X)
X
_
(vec (I
2
) I
2
)
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
1 1 0 2 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 2x
22
e
x
21
0 0 0 0 0
x
22
0 0 x
21
0 0 0 0
0 x
11
x
12
0 0 0 0 0
0 0 0 0 1 1 0 2
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 2x
22
e
x21
0
0 0 0 0 x
22
0 0 x
21
0 0 0 0 0 x
11
x
12
0
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
1 0
0 1
0 0
0 0
0 0
0 0
1 0
0 1
_
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
1 1
0 0
0 0
0 2x
22
x
22
0
0 x
11
0 2
0 0
0 0
e
x
21
0
0 x
21
x
12
0
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
59
3.5. Reglas de Derivacin.
La derivada de un vector o de una matriz respecto de un escalar, vector o
matriz, no diere sustancialmente de la derivacin habitual de funciones. Sin
embargo esto no conlleva que sean vlidas, en general las reglas usuales para
derivar, por ejemplo, las de suma, el producto o la composicin de funciones.
Ahora bien, como se ver a continuacin, si se hace uso del producto Kro-
necker en lugar del producto matricial estandar, en algunos casos es posible
obtener reglas de derivacin anlogas a las habituales para funciones.
Proposicin 3.4 Sea C una matriz de variables independientes de orden pn
, esto es, C M
pn
:
1. Derivada del Producto por Escalar. Sea A una matriz de orden mq cuyos
elementos dependen de los de la matriz C de orden p n. Entonces, para
cualquier R, se verica que
(A)
C
=
A
C
2. Derivada de la Suma. Sean A y B dos matrices de orden m q, cuyos
elementos dependen de los de la matriz C de orden p n. Se verica que
(A+B)
C
=
A
C
+
B
C
.
3. Derivada de Producto. Sean A, B y C matrices de ordenes m q, q r,
p n, respectivamente, tales que los elementos de A y B son funciones de
los elementos de la matriz C. Entonces se verica que
a) Si p = n = 1 m = q = 1
AB
C
=
A
C
B +A
B
C
b) Si p = 1, es decir, C es un vector la de R
n
, entonces
AB
C
=
A
C
(B I
n
) +A
B
C
c) Si p ,= 1 y n ,= 1
AB
C
=
A
C
(B I
n
) + (AI
p
)
B
C
60
4. Derivada del Producto de Kronecker. Sean A, B y C matrices de ordenes
mq, t r, p n,respectivamente, tales que los elementos de A y B son
funcin de los elementos de la matriz C.Entonces se verica que
AB
C
=
_
A
B
C
_
+ (I
m
B I
p
)
(AI
r
)
C
donde
(AI
r
)
C
= (P
r,m
I
p
) /
_
I
r

A
C
_
(P
q,r
I
n
)
5. Regla de la Cadena. Sea y = y (A) uma funcin real de variable matri-
cial, donde A es una matriz de orden t r cuyos elementos a su vez son
funciones de la matriz C de orden p n. Se verica
y (A)
C
=
_
y (A)
vec (A)
I
p
_
/
_
vec (A)
C
_
o tambin
y (A)
C
= [(vec (I
t
)) / I
p
]
_
y (A)
A

A
C
_
(vec (I
r
) I
n
) .
Demostracin. La derivada
A
C
de acuerdo con la denicin 3.17 es una
matriz de orden mp nq dada por
A
C
=
_
a
ij
C
_
i=1,...,m
j=1,...,q
y como para cada i = 1, ...m ; j = 1, ..., q, segn la denicin 3.10,
a
ij
C
=
a
ij
c
k
=
_
a
ij
c
k
_
k=1,...,p
=1,...,n
se obtiene que
A
C
=
_
A
C
_
.
Demostracin. La derivada
(A+B)
C
segn la denicin 3.17, es la matriz
de orden mp qn
61
(A+B)
C
=
_
(a
ij
+b
ij
)
C
_
i=1,...,m
j=1,...,q
Ahora bien, para cada i = 1, ...m ; j = 1, ..., q, a partir de la denicin 3.13
se obtiene
(a
ij
+b
ij
)
C
=
a
ij
C
+
b
ij
C
y sumando por bloques se puede concluir
(A+B)
C
=
A
C
+
B
C
Demostracin.
a) Si p = n = 1, entonces
AB
C
=
A
C
B +A
B
C
,
ya que para cada i = 1, ...m ; j = 1, ..., r la derivada del elemento d
ij
de la
matriz D = AB es
d
ij
(C)
C
=

C
_
q

k=1
a
ik
(C) b
kj
(C)
_
d
ij
(C)
C
=
q

k=1
a
ik
(C)
C
b
kj
(C) +
q

k=1
a
ik
(C)
b
kj
(C)
C
b) En el caso en que n = q = r = 1, segn la denicin 3.13 se tiene
AB
C
=
_
_
_
AB
c11

AB
c1n
.
.
.
.
.
.
AB
cp1

AB
cpn
_
_
_
AB
C
=
_
_
_
A
c11

A
c1n
.
.
.
.
.
.
A
c
p1

A
c
pn
_
_
_B +A
_
_
_
B
c11

B
c1n
.
.
.
.
.
.
B
c
p1

B
c
pn
_
_
_,
62
dado que para cada i = 1, ...p ; j = 1, ..., n
(AB)
c
ij
=
A
c
ij
B +A
B
c
ij
,
y por tanto,
(AB)
C
=
A
C
B +A
B
C
c) Ahora, si p ,= 1, n ,= 1 y D = AB = (d
ij
) i = 1, ...m ; j = 1, ..., r, se tiene
que
d
ij
(C)
C
=
q

k=1
a
ik
(C)
C
b
kj
(C) +
q

k=1
a
ik
(C)
b
kj
(C)
C
,
de donde
d
ij
(C)
C
=
_
a
i1
C
...
a
iq
C
_
b
ij
(C) I
n
_
_
_
_
_
b
ij
(C) I
n
b
2j
(C) I
n
.
.
.
b
qj
(C) I
n
_
_
_
_
_
+(a
i1
(C) I
p
...a
in
(C) I
p
)
_
_
_
b1j(C)
C
.
.
.
bqj(C)
C
_
_
_
y por la denicin de producto Kronecker y la denicin 3.12, resulta
d
ij
(C)
C
=
a
i
C
(b
j
(C) I
n
) + (a
i
(C) I
p
)
b
j
(C)
C
,
y, por consiguiente,
D
C
=
(AB)
C
=
A
C
(B I
n
) + (AI
p
)
B
C
.
Si p = 1 como I
p
= 1, la expresin anterior se transforma en
(AB)
C
=
A
C
(B I
n
) +A
B
C
Demostracin. Atendiendo a la denicin de producto Kronecker
63
(AB)
C
=
a
ij
B
C
,
i=1,...,m
j=1,...,q
,
y por la denicin 3.17, para cada i = 1, ...m ; j = 1, ..., q se tiene que
a
ij
B
C
=
(a
ij
b
k
)
c
k=1,...,t
=1,...,r
.
Ahora bien, en virtud del apartado anterior,
a
ij
b
k
c
=
a
ij
C
b
k
+a
ij
b
k
C
.
As pues,
a
ij
B
C
=
_
_
_
a
ij
C
b
11
+a
ij
b
11
C

a
ij
C
b
1r
+a
ij
b
1r
C
.
.
.
.
.
.
a
ij
C
b
t1
+a
ij
bt1
C

a
ij
C
b
tr
+a
ij
btr
C
_
_
_
o lo que es equivalente
a
ij
B
C
=
_
B
aij
C
_
+a
ij
B
C
.
Por tanto,
(AB)
C
=
_
_
_
_
_
_
_
_
B
a
11
C
_
+a
11
B
C

_
B
a
1q
C
_
+a
1q
B
C
.
.
.
.
.
.
_
B
a
m1
C
_
+a
m1
B
C

_
B
a
mq
C
_
+a
mq
B
C
_
_
_
_
_
_
_
(AB)
C
=
_
A
B
C
_
+
_
_
_
_
_
_
B
a
11
C
B
a
1q
C
.
.
.
.
.
.
B
a
m1
C
B
a
mq
C
_
_
_
_
_
_
(AB)
C
Solucin 3.1 =
_
A
B
C
_
+ (I
m
B I
q
)
(AI
r
)
C
64
Ahora bien, a partir de la propiedad 5 del producto de Kronecker, se tiene
AI
r
= P
r,m
(I
r
A) P
q,r
y aplicando dos veces la regla de derivacin del producto indicada en la
proposicin 3.4,3 se obtiene
(AI
r
)
C
= (P
r,m
I
p
)
(I
r
A)
C
(P
q,r
I
n
) ,
lo que de acuerdo con la solucin 3.1, tomando A = I
r
y B = A conduce a
(AI
r
)
C
= (P
r,m
I
p
)
_
I
r

A
C
_
(P
q,r
I
n
) .
Demostracin. Teniendo en cuenta la denicin 3.13,
y (A)
C
=
y (A)
c
ij
,
i=1,...,p
j=1,...,n
y por la regla de la cadena para el caso unidimensional
y (A)
c
ij
=
t

k=1
r

t=1
y(A)
a
kl
a
kl
(C)
c
ij
.
Por tanto,
y (A)
C
=
_
_
_
_
y
a
11

y
a
1n
.
.
.
.
.
.
y
ap1

y
apn
_
_
_
_
=
t

k=1
r

t=1
_

_
y (A)
a
kl
_
_
_
_
akl(C)
c
11

akl(C)
c
1n
.
.
.
.
.
.
a
kl
(C)
cp1

a
kl
(C)
cpn
_
_
_
_
_

_
de donde
y (A)
C
=
t

k=1
r

t=1
y (A)
a
kl

a
kl
(C)
C
ahora bien, como
_
y (A)
vec (A)
_
/ =
_
y
a
11
, ...,
y
a
t1
, ...,
y
a
1r
, ...,
y
a
tr
_
y
65
vec (A)
C
=
_
_
_
_
_
_
_
_
_
_
_
_
_
a
11
C
.
.
.
at1
C
.
.
.
a1r
C
.
.
.
atr
C
_
_
_
_
_
_
_
_
_
_
_
_
_
resulta
y (A)
C
=
__
y (A)
vec (A)
_
/ I
p
_

vec (A)
C
Solucin 3.2 =
_
y (A)
vec (A)
I
p
_
/
vec (A)
C
Para obtener la expresin alternativa de la regla de la cadena que se indica
en el enunciado, hasta tener en cuenta, que de acuerdo con la propiedad 3 de la
vectorizacin
y (A)
vec (A)
= vec
_
y (A)
A
_
=
__
y (A)
C
_
/ I
t
_
vec (I
t
) ,
lo que sustituido en la solucin 3.2 permite obtener
y (A)
C
=
_
vec
_
y (A)
A
_
I
p
_
/
_
vec (A)
C
_
y (A)
C
=
____
y (A)
A
_
/ I
t
_
vec (I
t
)
_
I
p
_
/
vec (A)
C
y (A)
C
=
____
y(A)
A
_
/ I
t
_
vec (I
t
)
_
/ I
p
_

vec (A)
C
y (A)
C
=
__
(vec (I
t
)) /
_
y (A)
A
I
t
__
I
p
_

vec (A)
C
,
y tomando B
2
= I
p
en la propiedad 4 del producto de Kronecker se tiene
y (A)
C
= ((vec (I
t
)) / I
p
)
_
y (A)
A
I
tp
_

vec (A)
C
.
Finalmente de acuerdo con las formas alternativas, como
vec (A)
C
=
_
I
r

A
C
_
(vec (I
r
) I
n
)
66
sustituyendo en
vec (A)
C
y haciendo uso de nuevo de la propiedad 4 del
producto de Kronecker se tiene
vec (A)
C
= ((vec (I
t
)) / I
p
)
_
y (A)
A

A
C
_
(vec (I
r
) I
n
)
Ejemplo 3.15 Dadas las matrices
A =
_
x
2
y xy
x + 1 y
3
e
x
_
, B =
_
(y + 1)
2
2y x +y
e
x+y
0 1
_
y
C =
_
x z
w y
_
como
A
C
=
_
_
_
_
_
_
_
x
2
x
x
2
z
y
x
y
z
xy
x
xy
z
x
2
w
x
2
y
y
w
y
y
xy
w
xy
y
(x+1)
x
(x+1)
z
y
3
x
y
3
z
e
z
x
e
z
z
(x+1)
w
(x+1)
y
y
3
w
y
3
y
e
z
w
e
z
y
_
_
_
_
_
_
_
=
_
_
_
_
2x 0 0 0 y 0
0 0 0 1 0 x
1 0 0 0 e
x
0
0 0 0 3y
2
0 0
_
_
_
_
y
B
C
=
_
_
_
_
0 0 0 0 1 0
0 2 (y + 1) 0 2 0 1
e
x+y
0 0 0 0 0
0 e
x+y
0 0 0 0
_
_
_
_
se tiene
(A+B)
C
=
A
C
+
B
C
=
_
_
_
_
2x 0 0 0 1 +y 0
0 2 (y + 1) 0 3 0 1 +x
1 +e
x+y
0 0 0 e
x
0
0 e
x+y
0 3y
2
0 0
_
_
_
_
Asi mismo se verica que
(3A)
C
= 3
_
A
C
_
=
_
_
_
_
6x 0 0 0 3y 0
0 0 0 3 0 3x
3 0 0 0 3e
x
0
0 0 0 9y
2
0 0
_
_
_
_
67
Ejemplo 3.16 Dadas las matrices A y C del ejemplo anterior y el vector
b =
_
_
x +y
2x
yz
_
_
teniendo en cuenta
Ab
C
=
A
C
(b I
2
) + (AI
2
)
b
C
como ya se conoce
A
C
y,
B
C
=
_
_
_
_
_
_
_
_
1 0
0 1
2 0
0 0
0 y
0 z
_
_
_
_
_
_
_
_
sustituyendo en la expresin inicial resulta
Ab
C
=
_
_
_
_
2x 0 0 0 y 0
0 0 0 1 0 x
1 0 0 0 e
x
0
0 0 0 3y
2
0 0
_
_
_
_
_
_
_
_
_
_
_
_
x +y 0
0 x +y
2x 0
0 2x
yz 0
0 yz
_
_
_
_
_
_
_
_
+
_
_
_
_
x
2
0 y 0 xy 0
0 x
2
0 y 0 xy
x + 1 0 y
3
0 e
x
0
0 x + 1 0 y
3
0 e
x
_
_
_
_
_
_
_
_
_
_
_
_
1 0
0 1
2 0
0 0
0 y
0 z
_
_
_
_
_
_
_
_
=
_
_
_
_
3x
2
+ 2xy +y
2
z + 2y xy
2
0 x
2
+ 2xyz + 2x
2x +y + 2y
3
+yze
x
+ 1 ye
x
0 6y
2
x +x +ze
x
+ 1
_
_
_
_
Este resultado coincide con:
Ab
C
=

C
_
x
3
+x
2
y + 2xy +xy
2
z
x
2
+xy +x +y + 2xy
3
+yze
x
_
68
Ejemplo 3.17 Dadas las matrices A, B y C denidas por
A =
_
_
x +y 2z
xy x +z
e
x
y
3
_
_
, B =
_
2y z
2
1 3z
_
, C =
_
_
x
y
z
_
_
se verica, de acuerdo con el apartado cuarto de la proposicin anterior
(AB)
C
=
_
A
B
C
_
+ (I
3
B I
3
)
(AI
2
)
C
siendo en este caso
B
C
=
_
_
_
_
_
_
_
_
0 0
2 0
0 2z
0 0
0 0
0 3
_
_
_
_
_
_
_
_
(AI
2
)
C
= (P
2,3
I
3
)
_
I
2

A
C
_
P
2,2
donde
P
2,3
=
_
_
_
_
_
_
_
_
1 0 0 0 0 0
0 0 0 1 0 0
0 1 0 0 0 0
0 0 0 0 1 0
0 0 1 0 0 0
0 0 0 0 0 1
_
_
_
_
_
_
_
_
, P
2,2
=
_
_
_
_
1 0 0 0
0 0 1 0
0 1 0 0
0 0 0 1
_
_
_
_
A
C
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
1 0
1 0
0 2
y 1
x 0
0 1
e
x
1
0 3y
2
0 0
_
_
_
_
_
_
_
_
_
_
_
_
_
_
As pues
69
(AB)
C
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
2y z
2
0 0
2x + 4y z
2
4z 0
0 2xz + 2yz 4y 6z
2
1 3z 0 0
1 3z 0 0
0 3x + 3y 2 12z
2y
2
yz
2
2y z
2
4xy xz
2
2x + 2z 0
0 2xyz 2y 2xz + 3z
2
y 3yz 1 3z
x 3xz 0 0
0 3xy 1 3x + 6z
2ye
x
z
2
e
x
0 0
2e
x
0 8y
3
3y
2
z
2
0 2ze
x
0 2y
3
z
e
x
3ze
x
0 0
0 0 3y
2
9y
2
z
0 3e
x
0 3y
3
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
Ejemplo 3.18 Si y = y (A) = [A[ = xy zw donde A =
_
x w
z y
_
y cada
elemento de A es funcin del vector c = (t, u) en la forma x = t + u, y = tu,
z = t
2
+u, w = 2u, se verica que
y (A)
c
=
_
u
2
2ut, 2ut t
2
4u
_
, pues por la regla de la cadena, y las
proposiciones 3.4 y 5
y (A)
c
=
_
y (A)
vec (A)
I
1
_
/
_
vec (A)
c
_
=
_
y (A)
vec (A)
_
/
_
vec (A)
c
_
=
_
y z w x
_
_
_
_
_
1 1
0 2
2t 1
u t
_
_
_
_
=
_
y 2tw +xu y 2x w +xt
_
3.6. Propiedades de Derivacin de Funciones Matriciales.
En esta seccin se recogen algunas de las que aparecen con mayor frecuencia.
Los resultados que se indican se obtienen utilizando las deniciones propuestas
en este trabajo, las reglas de derivacin y las diferentes propiedades tanto del
producto de Kronecker como de la vectorizacin de matrices.
70
Proposicin 3.5 Sea A una matriz mn y sean x y z vectores de R
n
y R
m
,
respectivamente. Entonces
1. Si y (x) = Ax se verica que
y (x)
x
= A.
2. Si y (x, z) = z/Ax se verica que
y
x
= z/A
y
z
= x/A/.
3. Si m = n e y (x) = x/Ax, se verica que
y (x)
x
= x/ (A+A/) ,

2
y (x)
xx
= (A+A/) ,
y si adems A es una matriz simtrica se tiene que
y (x)
x
= 2x/A,

2
y (x)
xx
= 2A.
4. Si m = n, A es simtrica, X es una matriz de orden np e Y (X) = X/AX,
se verica que
Y (X)
X
= P
n,p
(AX I
p
) + (vec (AX)) (vecI
p
) /.
Demostracin. Si y(x) = Ax entonces
y(x) = Ax =
_
_
_
_
_
_
_
_
_
_
_
_
_
n

j=1
a
1j
x
j
n

j=1
a
2j
x
j
.
.
.
n

j=1
a
mj
x
j
_
_
_
_
_
_
_
_
_
_
_
_
_
y teniendo en cuenta la denicin 3.12
71
y(x)
x
=
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_

x
_
n

j=1
a
1j
x
j
_

x
_
_
n

j=1
a
2j
x
j
_
_
.
.
.

x
_
_
n

j=1
a
mj
x
j
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
a
11
a
12
a
1n
a
21
a
22
a
2n
.
.
.
.
.
.
.
.
.
a
m1
a
m2
a
mn
_
_
_
_
_
= A
Demostracin. Dado que y (x, z) = z/Ax = (z/A) x, por la proposicin 3.5,
1 resulta
y
x
=
(z/A) x
x
= z/A
Por otra parte, como y = z/Ax = y/ = (x/A/) z, razonando de forma anloga
se tiene que
y
x
= x/A/.
Demostracin. Si y(x) = x/Ax dado que y =
n

j=1
n

i=1
x
i
x
j
a
ij
, entonces,
como para cada k = 1, ..., n, se tiene que
y
x
k
=
n

kj=1
a
kj
x
j
+
n

i=1
a
ik
x
i
= x/a/
k
+x/a
k
aplicando la denicin 3.10 resulta
y (x)
x
=
_
y
x
1

y
x
n
_
= x/A/ +x/A = x/ (A/ +A)
teniendo en cuenta esta expresin y la proposicin 3.5, 1, se deduce que

2
y (x)
xx
=

x
_
y (x)
x
_
=

x
[x/ (A/ +A)] = (A/ +A) / = A+A/
lo que coincide con

2
y (x)
xx/
=

x/
_
y (x)
x
_
=

x
__
y (x)
x
_
/
_
=

x
[(A+A/) x] = A+A/
Si A es una matriz simtrica, los resultados son inmediatos.
72
Demostracin. Si Y (X) = X/AX = X/ (AX) aplicando la regla de deriva-
cin de un producto 3, se tiene
X/ (AX)
X
=
X/
X
(AX I
p
) + (X/ I
n
)
AX
X
y aplicndola nuevamente al producto AX resulta
X/ (AX)
X
= P
n,p
(AX I
p
) + (X/ I
n
) + (AI
n
)
X
X/
ya que
X
X/
= P
n,p
y
A
X
es la matriz nula.
Finalmente a partir de las propiedades 4 del producto de Kronecker y la
propiedad 2 de la vectorizacin, se concluye
X/ (AX)
X
= P
n,p
(AX I
p
) + (X/ I
n
) (vecI
n
) (vecI
p
) /
X/ (AX)
X
= P
n,p
(AX I
p
) + (vec(AX)) (vecI
p
) /,
ya que vec(A/X) = vec(AX) por se A una matriz simtrica.
Proposicin 3.6 Sea A una matriz regular de orden m. Entonces se verica
1.
A
1
A
= vec
_
A
1
_
vec
_
A
1
_
/.
2.
vec
_
A
1
_
(vecA) /
=
__
A
1
_
/ A
1
_
.
Si adems se supone que los elementos de la matriz A son funciones del
vector x R
n
, entonces
3.
A
1
(x)
x
=
_
(I
m
(vecI
m
) /)
_
A
1
A
I
m
__

(vecA)
x
4.
vec
_
A
1
(x)
_
x
=
_
(A/)
1
A
1
_
(vecA)
x
73
Demostracin. Si A es una matriz regular, entonces existe A
1
vericando
AA
1
= I
m
,
y aplicando en esta expresin la regla de derivacin de un producto resulta
0
m
2 =
AA
1
A
=
A
A
_
A
1
I
m
_
+ (AI
m
)
A
1
A
,
de donde
A
1
A
= (AI
m
)
1
A
A
_
A
1
I
m
_
.
Ahora bien como
A
A
= (vecI
m
) (vecI
m
) /
a partir de las propiedades 6, 7 del producto de Kronecker y la propiedad 3
de la vectorizacin se obtiene
A
1
A
=
_
A
1
I
m
_
(vecI
m
) (vecI
m
) /
_
A
1
I
m
_
A
1
A
=
_
A
1
I
m
_
(vecI
m
)
___
A
1
_
/ I
m
_
vecI
m

/
A
1
A
= vec
_
A
1
_
/
_
vec
_
A
1
_
/
Demostracin. Dado que AA
1
= I
m
, aplicando el resultado 3a de la
Proposicin 3.4 para cada i, j = 1, ..., m se tiene que

_
AA
1
_
a
ij
= 0
m
=
A
a
ij
A
1
+A
A
1
a
ij
y, por tanto,
A
1
a
ij
= A
1
A
a
ij
A
1
.
Como
j

74
A
1
a
ij
=
_
_
_
_
_
_
_
_
0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 1 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0
_
_
_
_
_
_
_
_
i
si se denota por a
i
y a
j
la la i esima y la columna j esima de A
1
,
respectivamente, se obtiene
A
1
a
ij
=
_
_
_
_
_
a
1

a
2

.
.
.
a
m

_
_
_
_
_
_
_
_
_
_
_
_
_
0 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 1 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0
_
_
_
_
_
_
_
_
_
_
[ [
a
1
a
m
[ [
_
_
=
a
i
a
j
.
que de acuerdo con la segunda expresin alternativa y la propiedad 2 de la
vectorizacin de matrices, resulta
vec
_
A
1
_
a
ij
= vec (a
i
a
j
) = (I
m
a
i
) veca
j
= (a/
j
a
i
)
de donde
vec
_
A
1
_
a/
j
=
_
vec
_
A
1
_
a
1j
,
vec
_
A
1
_
a
2j
, ...,
vec
_
A
1
_
a
mj
_
= [a/
j
a
1
, a/
j
a
2
, ..., a/
j
a
m
] =
_
a/
j
A
1
_
,
y por tanto
vec
_
A
1
_
vec (A) /
=
_
a/
1
A
1
, a/
2
A
1
, ..., a/
m
A
1

__
A
1
_
/ A
1

Demostracin. Si los elementos de la matriz A son funcin del vector x


R
n
, entonces, para cada i, j = 1, ..., m, la derivada del elemento a
ij
de A
1
respecto de x, en virtud de la regla de la cadena (Proposicin 3.4, 5) es
a
ij
x
=
_
a
ij
vec (A)
_
/
vec (A)
x
=
a
ij
(vecA) /
vec (A)
x
,
y por tanto
75
A
1
x
=
_
A
1
(vecA) /

vec (A)
x
_
.
Ahora bien, como
A
1
(vecA) /
=
_

_
A
1
_
/
vec (A)
_
/
y

_
A
1
_
/
A/
=
_
A
1
A
_
/
de acuerdo con las formas alternativas

_
A
1
_
/
vec (A)
=
_

_
A
1
_
/
A/
I
m
_
(I
m
vec (I
m
)) =
__
A
1
A
_
/ I
m
_
(I
m
vec (I
m
)) ,
de donde
A
1
x
=
___
A
1
A
_
/ I
m
_
(I
m
vec (I
m
))
_
/
vec (A)
x
,
o lo que es igual
A
1
x
=
_
(I
m
vec (I
m
) /)
_
A
1
A
I
m
__

vec (A)
x
.
Pero como de acuerdo con las expresiones alternativas
vec (A)
x
=
_
I
m

A
x
_
(vec (I
m
) I
n
)
se obtiene nalmente
A
1
(x)
x
=
_
(I
m
(vecI
m
) /)
_
A
1
A
I
m
__

__
I
m

A
x
_
(vec (I
m
) I
n
)
_
.
Demostracin. Como ya se indic antes
a
ij
x
=
_
a
ij
(vecA) /
__
vec (A)
x
_
,
76
as pues, de acuerdo con la proposicin 3.6, 2 resulta
vec
_
A
1
_
x
=
vec
_
A
1
_
(vecA) /
vec (A)
x
=
__
A
1
_
/ A
1

vec (A)
x
.
Proposicin 3.7 sean A, B y X matrices de ordenes mm , mn , y nm
respectivamente. Entonces
1. Si y (A) = tr (A) , se tiene que
y (A)
A
=
tr (A)
A
= I
m
2. Si y (X) = tr (BX) , se tiene que
y (X)
X
=
tr (BX)
X
= B/
3. Si y (X) = tr (BXA) , se tiene que
y (X)
X
=
tr (BXA)
X
= B/A/
4. Si C es una matriz de orden n e y (X) = tr (AX/CX) , se tiene que
y (X)
X
=
tr (AX/CX)
X
= C/XA/ +CXA
y si adems C es una matriz simetrica y A = / I
m
, entonces
y (X)
X
= 2CX
Demostracin. Dado que tr (A) =

m
i=1
a
ii
, de acuerdo con la Denicin
3.13, es trivial obtener
y (A)
A
=
tr (A)
A
= I
m
Demostracin. Si y (X) = tr (BX) , entonces y (X) =

m
i=1

n
k=1
b
ik
x
ki
y por tanto,
tr (BX)
X
=

X
_
m

i=1
n

k=1
b
ik
x
ki
_
=
_
_
_
_
_
_
_
_
_

x1.
_
m

i=1
n

k=1
b
ik
x
ki
_
.
.
.

x
n.
_
m

i=1
n

k=1
b
ik
x
ki
_
_
_
_
_
_
_
_
_
_
=
77
_
_
_
b/.
1
.
.
.
b/.
n
_
_
_= B/
Demostracin. Teniendo en cuenta que tr (BXA) = tr (ABX) , aplicando
la proposicin 3.7, 2 , resulta
y (X)
X
=
tr (ABX)
X
= (AB) / = B/A/
Demostracin. De acuerdo con las propiedades 8 y 2 de la vectorizacin
de una matriz y la propiedad 4 del producto de Kronecker se tiene
tr (AX/CX) = [vec (AX/) /] /vec (CX) = [vec (XA/)] /vec (CX)
= [(AI
n
) vec (X)] / (I
m
C) vec (X)
= [vec (X)] / (AC) vec (X)
La derivada de esta expresin respecto a vec (X) es, en virtud de la Proposi-
cin 3.5,3
tr (AX/CX)
vec (X)
=
_
tr (AX/CX)
[vec (X)]
_
/ = ((vec (X)) / [(A/ C) + (AC/)]) /
= [(AC/) vec (X)] + [(A/ C) vec (X)]
= vec (C/XA/) +V EC (CXA) = vec (C/XA/ +CXA)
Por ultimo, teniendo en cuenta la primera expresin alternativa, como
vec
_
tr (AX/CX)
X
_
=
tr (AX/CX)
vec (X)
= vec (C/XA/ +CXA)
se concluye que
tr (AX/CX)
X
= C/XA/ +CXA
y, en caso de ser C simetrica y A = I
m
, es inmediato que
tr (X/CX)
X
= 2CX
Proposicin 3.8 Sea A una matriz cuadrada de orden m y X una matriz de
orden mp . Entonces
78
1. Si y (A) = [A[ , se tiene que
y (A)
A
=
[A[
A
= Adj (A) /
2. Si A es simetrica e y (X) = [X/AX[ , se tiene que
y (X)
X
= 2AX Adj (X/AX)
3. Si A es simetrica e y (X) = In[X/AX[ con X/AX no singular, se tiene
que
y (X)
X
=
2
[X/AX[
AX Adj (X/AX) = 2AX (X/AX)
1
Si se supone que los elementos de la matirz A son funciones de x R
n
,
entonces
4. Si y (x) = [A(x)[ , se tiene que
y (x)
x
= [vec (Adj (A) /)] /
_
I
m

A(x)
x
_
(vec (I
m
) I
n
)
vericandose tambien que si A(x) es no singular
In[A(x)[
x
=
_
tr
_
(A
1
)/
A(x)
x
i
__
i=l,...,n
Demostracin. Dada A matriz cuadrada de orden m, si para cada elemento
a
ij
i, j = 1, ..., n se denota por A
ij
su cofactor correspondiente, se tiene que
[A[ =
n

k=1
a
ik
A
ik
Entonces
[A[
a
ij
=

a
ij
_
n

k=1
a
ik
A
ik
_
= A
ij
Teniendo en cuenta la Denicin 3.12 resulta
[A[
a
ij
=
_
_
_
A
11
A
12
A
1n
.
.
.
.
.
.
.
.
.
A
n1
A
n2
A
nn
_
_
_ = Adj (A) /
79
Demostracin. Si se denota por b
ij
i, j = 1, ..., p a los elementos de la matriz
B = X/AX , aplicando la regla de la cadena, resulta para cada k = 1, ..., m,
= 1, ..., p
y (X)
x
k
=
p

i=1
p

j=1
[B[
b
ij
b
ij
x
k
Como para cada i, j = 1, ..., p
[B[
b
ij
es el cofactor correspondiente B
ij
, se
tiene
y (X)
x
k
=
[X/AX[
x
k
=
p

i=1
p

j=1
B
ij
b
ij
x
k
=
[vec (Adj (X/AX))] /vec
_
X/AX
x
k
_
que de acuerdo con la propiedad 8 de la vectorizacin se puede reducir a
[X/AX[
x
k
= tr
_
Adj (X/AX)
X/AX
x
k
_
Teniendo en cuenta la derivada de un producto (Proposicin 3, 3a), para
cada k = 1, ..., m , = 1, ..., p , se verica
X/AX
x
k
=
X/
x
k
AX +X/A
X
x
k
donde
X/
x
k
= e
m

e
p
k
y
X
x
k
= e
m
k
e

k
adems, e
m
k
y e
p
k
representan dos vectores columna de m y p elementos todos
ellos nulos salvo el k-simo y el -esimo, respectivamente, que son iguales a la
unidad. En virtud de esto y teniendo en cuenta las propiedades de la traza,
[X/AX[
x
k
= tr
_
Adj (X/AX)
_
e
m

e
p
k
AX +X/Ae
m
k
e
p

_
=
_
Adj (X/AX) e
m

e
p
k
AX
_
+tr
_
X/Ae
m
k
e
p

Adj (X/AX)
_
= tr (b

a
k
X) +tr (X/a
k
b

)
= tr (a
k
Xb

) +tr (a

k
Xb

)
= a
k
Xb

+a

k
Xb

80
siendo b

y b

la -sima columna y la, respectivamente, de la matriz


Adj (B) = Adj (X/AX) y a
k
y a
k
la k-sima columna y la, respectivamente,
de la matriz A
De acuerdo con la Denicin 3.13,
x(X)
X
=
[X/AX[
X
= AX Adj (X/AX) +A/X (Adj (X/AX)) / =
2AXAdj (X/AX)
ya que tanto A como X/AX y, por consiguiente, Adj (X/AX) , son matrices
simtricas
Demostracin. Aplicando la regla de la cadena y teniendo en cuenta el
apartado anterior, resulta
x(X)
X
=
In[X/AX[
[X/AX[
[X/AX[
X
=
1
[X/AX[
2AXAdj (X/AX)
= 2AX (X/AX)
1
pues por hiptesis, X/AX es simtrica y no singular
Demostracin. Si y (x) = [A(x)[ con x R
n
, por la regla de la cadena,
[A(x)[
x
=
_
[A(x)[
vecA(x)
_
/
vecA(x)
x
=
_
vec
_
[A(x)[
A(x)
__
/
vecA(x)
x
de donde, en virtud de la demostracin 3.6 se obtiene
[A(x)[
x
= [vec (Adj (A(x)) /)] /
_
I
m

A(x)
x
_
(vecI
m
I
n
)
considerando ahora que A(x) es una matriz no singular para cada x R
n
,
por denicin se tiene que
In[A(x)[
x
=
_
In[A(x)[
x
1
, ,
In[A(x)[
x
n
_
Para cada i = 1, ..., n
In[A(x)[
x
i
=
In[A(x)[
[A(x)[
[A(x)[
x
i
=
1
[A(x)[
[A(x)[
x
i
81
y segn la regla de la cadena
[A(x)[
x
i
=
_
[A(x)[
vec (A(x))
_
/
vec (A(x))
x
i
= [vec (Adj (A(x)) /)] /
vec (A(x))
x
i
se tiene
In[A(x)[
x
i
=
_
vec
_
1
[A(x)[
Adj (A(x)) /
__
/
vec (A(x))
x
i
=
_
vec
_
A
1
__
/vec
_
A(x)
x
i
_
y utilizando la propiedad 8 de la vectorizacin, se obtiene
In[A(x)[
x
i
= tr
_
A(x)
x
i
_
A
1
_
/
_
= tr
_
_
A
1
_
/
A(x)
x
i
_
Por tanto
In[A(x)[
x
=
_
tr
_
_
A
1
_
/
A(x)
x
1
_
, ..., tr
_
_
A
1
_
/
A(x)
x
n
__
Ejemplo 3.19 Sea la funcin y (x) = x/ Ax con A matriz simtrica y no singu-
lar de orden n. Supngase que se desea conocer si y (x) tiene mximo o mnimo
global en algn punto x R
n
. para ello habr que estudiar si y (x) tiene puntos
crticos, lo que presupone resolver el sistema de ecuaciones
y (x)
x
= 0
es decir, de acuerdo con la Proposicin 3.5, 3
y (x)
x
= 2x/A = 0
Cuya solucin es x

= 0 por ser A no singular.


Si y (x) tiene mximo, mnimo o punto de silla lo alcanzar en x

= 0. Para
poder decidir el comportamiento de y (x) en x

bastar utilizar condiciones de


segundo orden, y como en este caso

2
y (x)
xx
= 2A
para todo x R
n
se vericar que
x

= 0 es mnimo global si A es denida o semidenida positiva


x

= 0 es mximo global si A es denida o semidenida negativa


x

= 0 es punto de silla si A es indenida


82
Ejemplo 3.20 Sea la matriz
A =
_
a
11
a
12
a
21
a
22
_
cuyos elementos dependen de x = (x
1
, x
2
, x
3
) de forma que
a
11
= a
22
= x
1
+x
3
a
12
= x
1
+x
2
a
21
= x
1
x
2
De acuerdo con las proposiciones 3.6 y 3, se verica que para todo x R
3
++
A
1
(x)
x
=
_
(I
2
(vecI
2
) /)
_
A
1
A
I
2
__

vec [A(x)]
x
dado que
a
1
=
1
[A[
_
a
22
a
12
a
21
a
11
_
resulta
A
1
A
= vec
__
A
1
_
/
_ _
vecA
1
_
/ =

_
1
[A[
_
2
_
_
_
_
a
22
a
12
a
21
a
11
_
_
_
_
_
a
22
a
21
a
12
a
11
_
=
1
[A[
_
_
_
_
a
2
22
a
21
a
22
a
12
a
22
a
22
a
11
a
12
a
22
a
12
a
21
a
2
12
a
12
a
11
a
21
a
22
a
2
21
a
12
a
21
a
21
a
11
a
11
a
22
a
11
a
21
a
12
a
11
a
2
11
_
_
_
_
Por otra parte se obtiene que
vec [A(x)]
x
_
_
_
_
_
_
a11(x)
x
a
21
(x)
x
a12(x)
x
a22(x)
x
_
_
_
_
_
_
=
_
_
_
_
1 0 1
1 1 0
1 1 0
1 0 1
_
_
_
_
Por tanto, efectuando los correspondientes productos y teniendo en cuenta
la propiedad 2 del producto de Kronecker, se tiene que
A
1
(x)
x
=
tr (A)
[A[
2
83
_

_
_
a
22
0 a
21
0 a
12
0 a
11
0
0 a
22
0 a
21
0 a
12
0 a
11
_

_
_
_
_
1 0 1
1 1 0
1 1 0
1 0 1
_
_
_
_
_

_
Ejemplo 3.21 Sea la funcin y (x) = tr (AX) donde
A =
_
_
1 3
2 0
1 1
_
_
y X =
_
x
11
x
12
x
13
x
21
x
22
x
23
_
como tr (AX) = x
11
+ 3x
21
+ 2x
12
x
13
+x
23
entonces
tr (AX)
X
=
_
1 2 1
3 0 1
_
= A/
tal como se indica en la Proposicin 3.7, 2
Ejemplo 3.22 Sea A una matriz no singular de orden n , entonces aplicando
la regla de la cadena
In[A[
A
=
1
[A[
[A[
A
y, de acuerdo con la Proposicin 3.8, 1, se tiene
In[A[
A
=
1
[A[
Adj (A) / = A
1
es decir, en virtud de la Denicin 3.13, para cada i, j = 1, ..., n
In[A[
a
ij
=
1
[A[
A
ji
Ejemplo 3.23 Dada A =
_
a
11
a
12
a
21
a
22
_
cuyos elementos dependen de x = (x
1
, x
2
) de forma que a
ij
= ix
1
+jx
2
con
x
1
~ 0 y x
2
0 , i , j = 1, 2, se verica que
In[A(x)[
x
=
In(a
11
(x) a
22
(x) a
21
(x) a
12
(x))
x
=
1
[A[
_
(a
11
(x) a
22
(x) a
21
(x) a
12
(x))
x
1
,
(a
11
(x) a
22
(x) a
21
(x) a
12
(x))
x
2
_
84
=
_
1
x
1
,
1
x
2
_
que coincide con lo que se seala en la Proposicin 3.8, 4
In[A(x)[
x
=
_
tr
_
_
A
1
_
/
A(x)
x
1
_
, tr
_
_
A
1
_
/
A(x)
x
2
__
pues como
A(x) =
_
x
1
+x
2
x
1
+ 2x
2
2x
1
+x
2
2x
1
+ 2x
2
_
entonces
A
1
=
1
x
1
+x
2
_
2 (x
1
+x
2
) x
1
+ 2x
2
2x
1
+x
2
(x
1
+x
2
)
_
y
A(x)
x
1
=
_
1 1
2 2
_
,
A(x)
x
2
=
_
1 2
1 2
_
y, por tanto
tr
_
_
A
1
_
/
A(x)
x
1
_
=
1
x
1
x
2
(2x
2
x
2
) =
1
x
1
tr
_
_
A
1
_
/
A(x)
x
2
_
=
1
x
1
x
2
(2x
1
x
1
) =
1
x
2
Cuando la matriz respecto de la que se deriva es simtrica, debe de tenerse en
cuenta esta caracterstica pues, en caso contrario, pueden obtenerse resultados
aparentemente contradictorios [Bar98]. Por ejemplo si
y (A) = a
2
11
+a
2
22
+a
2
12
, donde
A =
_
a
11
a
21
a
12
a
22
_
y cada elemento de la matriz A es funcin del vector x = (x
1
, x
2
) en la forma:
a
11
= x
1
+ 2x
2
, a
22
= x
1
, a
12
= x
1
x
2
al aplicar la regla de la cadena (Proposiciones 3.4, 4) resulta
y (A)
x
=
_
y (A)
vec (A)
_
/
vec (A(x))
x
85
=
_
2a
11
2a
12
2a
12
2a
22
_
_
_
_
_
1 2
x
2
x
1
x
2
x
1
1 0
_
_
_
_
=
_
4x
1
+ 4x
2
+ 4xs
1
x
2
2
4x
1
+ 8x
2
+ 4x
2
1
x
2
_
sustituyendo directamente y considerando que
y (A(x)) = (x
1
+ 2x
2
)
2
+x
2
1
+ (x
1
x
2
)
2
= 2x
2
1
+ 4x
2
2
+ 4x
1
x
2
+x
2
1
x
2
2
al calcular el gradiente se obtiene un resultado diferente, debido a que
y =
_
4x
1
+ 4x
2
+ 2x
1
x
2
2
, 8x
2
+ 4x
1
+ 2x
2
1
x
2
_
Hay una aparente contradiccin, que se debe a que tras sustituir se ha consi-
derado y (A) como una funcin de tres variables a
11
, a
12
, a
22
cuando en realidad
es una funcin de R
4
R, la cual est denida en puntos cuyas componentes
segunda y tercera son iguales. Al tener esto en cuenta, los calculos de la derivada
coinciden. Para manejar esta aparente disparidad en los resultados al calcular la
derivada respecto de una matriz simtrica A , usualmente se deriva nicamente
respecto de los elementos distintos de A, utilizando la vec (A) cuya descripcin
se encuentra en la denicin 3.9.
86
APLICACINA REDESNEURONALES

CAPA0 CAPA1 CAPA2


0 . 1
0
1
y
0
2
y
1
1
b
1
2
b
1
3
b
1
11
W
1
12
W
1
21
W
1
22
W
1
31
W
1
32
W
1
1
S
1
2
S
1
3
S
( )
1
1
1
S f
( )
1
2
1
S f
( )
1
3
1
S f
1
1
y
1
2
y
1
3
y
2
1
b
2
2
b
2
11
W
2
21
W
2
12
W
2
22
W
2
13
W
2
23
W
2
1
S
2
2
S
( )
2
1
2
S f
( )
2
2
2
S f
2
1
y
2
2
y
1
d
2
d
1
e
2
e
2
1
e
2
2
e

Figura 2:
4. Aplicacines
4.1. Redes Neuronales
A continuacin se expone el desarrollo completo de una aplicacin tpica de
la derivacin de funciones vectoriales y matriciales, que es el caso de la solucin
de problemas mediante las redes neuronales articiales.Esta aplicacin es un
trabajo realizado por [Per07]
Utilizando notacin matricial, es fcil comprobar que una red multicapa
cuyas funciones de activacin son lineales se pueden reducir a una red de una
capa lineal; por ello es preciso utilizar funciones de activacin no lineales. El
algoritmo Backpropagation es un algoritmo iterativo que permite entrenarredes
multicapa. La gura ?? muestra una red neuronal tpica, donde y son las en-
tradas, S las salidas, W los pesos, e el error y f (s) la salida deseada
4.1.1. Caractersticas del Algoritmo
1. Busca el mnimo de la funcin error a partir de un conjunto de patrones
de entrenamiento.
2. Precisa que la funcin de activacin sea diferenciable (fcilmente).
3. Entrenar consiste en modicar los pesos de la red.
87
4. Los pesos se modican hacia la direcci descendente de la funcin error.
5. La red entrenada es capaz de generalizar, clasicando correctamente pa-
trones ruidosos o incompletos.
6. indica cunto cambian los pesos.
7. Si es muy pequeo, la velocidad de aprendizaje es muy lenta. Si es
muy grande aparecen efectos oscilatorios.
b
1
=
_
_
b
1
1
b
1
2
b
1
3
_
_
nn(1)x1
, b
2
=
_
b
2
1
b
2
2
_
nn(2)x1
, y
1
=
_
_
y
1
1
y
1
2
y
1
3
_
_
nn(1)x1
, e =
_
e
1
e
2
_
S
1
=
_
_
S
1
1
S
1
2
S
1
3
_
_
nn(1)x1
, S
2
=
_
S
2
1
S
2
2
_
nn(2)x1
, y
2
=
_
y
2
1
y
2
2
_
nn(2)x1
W
1
=
_
_
W
1
11
W
1
12
W
1
21
W
1
22
W
1
31
W
1
32
_
_
nn(1)nn(0)
, W
2
=
_
_
W
2
11
W
2
12
W
2
21
W
2
22
W
2
31
W
2
32
_
_
nn(2)nn(1)
nn(k) = nmero de neuronas de la capa k, nc = ndice de la ltima capa
En general
_
S
k

nn(k)x1
,
_
y
k

nn(k)x1
,
_
b
k

nn(k)x1
,
_
W
k

nn(k)xnn(k1)
,
_
e

nn(nc)x1
4.1.2. Propagacin hacia adelante.
Clculo
S
1
1
= W
1
11
y
0
1
+W
1
12
y
0
2
+b
1
1
S
1
2
= W
1
21
y
0
1
+W
1
22
y
0
2
+b
1
2
S
1
3
= W
1
31
y
0
1
+W
1
32
y
0
2
+b
1
3
Matricialmente S
1
=
_
_
W
1
11
W
1
12
W
1
21
W
1
22
W
1
31
W
1
32
_
_
_
y
0
1
y
0
2
_
+
_
_
b
1
1
b
1
2
b
1
3
_
_
Por lo tanto, S
1
= W
1
y
0
+b
1
, y en general, S
k
= W
k
y
k1
+b
k
y
1
1
= f
1
1
_
S
1
1
_
, y
1
2
= f
1
2
_
S
1
2
_
, y
1
3
= f
1
3
_
S
1
3
_
88
_
_
y
1
1
y
1
2
y
1
3
_
_
=
_
_
f
1
1
_
S
1
1
_
f
1
2
_
S
1
2
_
f
1
3
_
S
1
3
_
_
_
, haciendo F
1
_
S
1
_
=
_
_
f
1
1
_
S
1
1
_
f
1
2
_
S
1
2
_
f
1
3
_
S
1
3
_
_
_
, queda y
1
= F
1
_
S
1
_
En general:
y
k
= F
k
_
S
k
_
e
1
= d
1
y
2
1
e
2
= d
2
y
2
2
_
e
1
e
2
_
=
_
d
1
d
2
_

_
y
2
1
y
2
2
_
e = d y
2
, en general e = d y
nc
donde nc = ndice de la ltima capa
El error cuadrtico = e
2
1
+e
2
2
=
_
e
1
e
2

_
e
1
e
2
_
= e
T
e
4.1.3. Propagacin hacia atrs.
Escalarmente
W
2
ij
(n + 1) = W
2
ij
(n)
(n)
W
2
ij
(n)
b
2
i
(n + 1) = b
2
i
(n)
(n)
b
2
i
(n)
donde n indica el nmero de iteracin
_
W
2
11
(n + 1) W
2
12
(n + 1) W
2
13
(n + 1)
W
2
21
(n + 1) W
2
22
(n + 1) W
2
23
(n + 1)
_
=
_
W
2
11
(n) W
2
12
(n) W
2
13
(n)
W
2
21
(n) W
2
22
(n) W
2
23
(n)
_

_
(n)
W
2
11
(n)
(n)
W
2
12
(n)
(n)
W
2
13
(n)
(n)
W
2
21
(n)
(n)
W
2
22
(n)
(n)
W
2
23
(n)
_
Es decir, W
2
(n + 1) = W
2
(n)
(n)
W
2
(n)
y escalarmente:

W
2
ij
=

e
i
e
i
y
2
i
y
2
i
S
2
i
S
2
i
W
2
ij
=

S
2
i
S
2
i
W
2
ij
89
Matricialmente

W
2
=

S
2
S
2
W
2

S
2
= derivada de una funcin escalar con respecto a un vector
S
2
W
2
= derivada de una funcin vectorial de argumento matricial con res-
pecto a una matriz
Escalarmente

S
2
i
=

e
i
e
i
y
2
i
y
2
i
S
2
i
Matricialmente se debe tener en cuenta que si z es una funcin de p, la
cual es una funcin de y, que a su vez es una funcin del vector x, entonces
dz
dx
=
dy
dx
p
y
z
p
Teniendo en cuenta lo anterior

S
2
=
y
2
S
2
e
y
2

e


W
2
=
y
2
S
2
e
y
2

e

S
2
W
2
Teniendo en cuenta que
dAx
dA
= x
T

S
2
W
2
=

W
2
_
W
2
y
1
+b
2
_
=
_
y
1
_
T
En general,
S
k
W
k
=
_
y
k1
_
T
y
2
S
2
=
_
_
y
2
1
S
2
1
y
2
2
S
2
1
y
2
1
S
2
2
y
2
2
S
2
2
_
_
, ya que y
2
i
= f
2
i
_
S
2
i
_
, entonces,
y
2
i
S
2
j
= 0, para
i ,= j y
y
2
i
S
2
j
= f
2
i
/
_
S
2
i
_
y
2
S
2
=
_
_
y
2
1
S
2
1
0
0
y
2
2
S
2
2
_
_
, como y
2
i
= f
2
i
_
S
2
i
_

y
2
i
S
2
i
= f
2
i
/
_
S
2
i
_
90
y
2
= F
2
_
S
2
_
se puede hacer F
2
/
_
S
2
_
=
y
2
S
2
e
y
2
=
_
e1
y
2
1
e2
y
2
1
e1
y
2
2
e2
y
2
2
_
, ya que e
i
= d
i
y
2
i
, entonces
e
i
y
2
j
= 0, para i ,= j
y
e
i
y
2
i
= 1
e
y
2
=
_
e
1
y
2
1
0
0
e2
y
2
2
_
=
_
1 0
0 1
_

e
=

e
_
e
T
e
_
= 2e = 2
_
e
1
e
2
_
Acoplando todos estos resultados

W
2
=
_
_
y
2
1
S
2
1
0
0
y
2
2
S
2
2
_
_
_
e1
y
2
1
0
0
e2
y
2
2
_
2
_
e
1
e
2
_

_
y
1
1
y
1
2
y
1
3

W
2
= 2
_
_
y
2
1
S
2
1
0
0
y
2
2
S
2
2
_
_
_
1 0
0 1
_ _
e
1
e
2
_
_
y
1
1
y
1
2
y
1
3

W
2
= 2
_

y
2
1
S
2
1
0
0
y
2
2
S
2
2
_

_
_
e
1
e
2
_
_
y
1
1
y
1
2
y
1
3

W
2
= 2
_
_

y
2
1
S
2
1
e
1

y
2
2
S
2
2
e
2
_
_
_
y
1
1
y
1
2
y
1
3

=
_
_
2e
1
y
2
1
S
2
1
y
1
1
2e
1
y
2
1
S
2
1
y
1
2
2e
1
y
2
1
S
2
1
y
1
3
2e
2
y
2
2
S
2
2
y
1
1
2e
2
y
2
2
S
2
2
y
1
2
2e
2
y
2
2
S
2
2
y
1
3
_
_
Si se hace

2
=

S
2
= 2
_
_

y
2
1
S
2
1
0
0
y
2
2
S
2
2
_
_
_
e
1
e
2
_
=
_
_
2
y
2
1
S
2
1
e
1
2
y
2
2
S
2
2
e
2
_
_
=
_
2f
2
1
/
_
S
2
1
_
e
1
2f
2
2
/
_
S
2
2
_
e
2
_
=
_

2
1

2
2
_
Matricialmente
91

2
= 2F
2
/
_
S
2
_
e donde F
2
/
_
S
2
_
=
_
f
2
1
/
_
S
2
1
_
0
0 f
2
2
/
_
S
2
2
_
_
Entonces,

W
2
=
2
_
y
1
_
T
recordando que
W
2
(n + 1) = W
2
(n)
(n)
W
2
(n)
donde n es el contador de iteraciones
W
2
(n + 1) = W
2
(n) +
2
(n)
_
y
1
(n)
_
T
Ahora
b
2
(n + 1) = b
2
(n)
(n)
b
2
(n)

b
2
=
S
2
b
2

S
2
=
S
2
b
2

2
pero S
2
= W
2
y
1
+b
2
recurdese que y
k+1
= W
k
S
K
+b
k
S
2
b
2
=
_
_
S
2
1
b
2
1
S
2
2
b
2
1
S
2
1
b
2
2
S
2
2
b
2
2
_
_
=
_
1 0
0 1
_

b
2
=
_
1 0
0 1
__

2
1

2
2
_
=
_

2
1

2
2
_
=
2
Por lo tanto
b
2
(n + 1) = b
2
(n) +
2
En general, para los pesos y el B/AS de la ltima capa se tiene

nc
= 2F
nc
/ (S
nc
) e

W
nc
=
nc
_
y
nc1
_
T
W
nc
(n + 1) = W
nc
(n) +
2
(n)
_
y
nc1
(n)
_
T
92

b
nc
=
nc
y b
nc
(n + 1) = b
nc
(n) +
nc
(n)
donde nc es el nmero de capas
de la red
Ahora es necesario hallar la frmula para la actualizacin de W
1
y b
1
W
1
(n + 1) = W
1
(n)
(n)
W
1
(n)

W
1
=

S
1
S
1
W
1
y

S
1
=
y
1
S
1
S
2
y
1
y
2
S
2

y
2

e
=
y
1
S
1
S
2
y
1

S
2
=
S
2
S
1

S
2
y
1
S
1
=
_

_
y
1
1
S
1
1
y
1
2
S
1
1
y
1
3
S
1
1
y
1
1
S
1
2
y
1
2
S
1
2
y
1
3
S
1
2
y
1
1
S
1
3
y
1
2
S
1
3
y
1
3
S
1
3
_

_
Recordando que y
1
i
= f
1
i
_
S
1
i
_

y
1
i
S
1
j
= 0, i ,= j
y
1
i
S
1
i
= f
1
/
_
S
1
i
_
y
1
S
1
=
_

_
y
1
1
S
1
1
0 0
0
y
1
2
S
1
2
0
0 0
y
1
3
S
1
3
_

_
=
_
_
f
1
1
/
_
S
1
1
_
0 0
0 f
1
2
/
_
S
1
2
_
0
0 0 f
1
3
/
_
S
1
3
_
_
_
= F
1
/
_
S
1
_
S
2
y
1
=

y
1
_
W
2
y
1
+b
2
_
=
_
W
2
_
T
Es decir
S
2
y
1
=
_

_
S
2
1
y
1
1
S
2
2
y
1
1
S
2
1
y
1
2
S
2
2
y
1
2
S
2
1
y
1
3
S
2
2
y
1
3
_

_
recordando que
S
2
1
= W
2
i1
y
1
1
+W
2
i2
y
1
2
+W
2
i3
y
1
3
+b
2
i

S
2
i
y
1
j
= W
2
ij
S
2
y
1
=
_
_
W
2
11
W
2
21
W
2
12
W
2
22
W
2
13
W
2
23
_
_
=
_
W
2
_
T
Recordando que

S
2
=
2
93

S
1
=
_

_
y
1
1
S
1
1
0 0
0
y
1
2
S
1
2
0
0 0
y
1
3
S
1
3
_

_
_
_
W
2
11
W
2
21
W
2
12
W
2
22
W
2
13
W
2
23
_
_
_

2
1

2
2
_

S
1
= F
1
/
_
S
1
_ _
W
2
_
T

2
haciendo
1
= F
1
/
_
S
1
_ _
W
2
_
T

S
1
=
1
S
1
W
1
=

_
W
1
y
0
+b
1
_
W
1
=
_
y
0
_
T
en general
S
k
W
k
=
_
y
k1
_
T

W
1
=

S
1
S
1
W
1
=
1
_
y
0
_
T
En general

W
k
=

S
k
S
k
W
k

S
k
=
S
k+1
S
k

S
k+1
S
k+1
S
k
=
y
k
S
k
S
k+1
y
k

y
k
S
k
= F
k
/
_
S
k
_
S
k+1
y
k
=

_
W
k+1
y
k
+b
k+1
_
y
k

S
k+1
y
k
=
_
W
k+1
_
T
S
k+1
y
k
= F
k
/
_
S
k
_ _
W
k+1
_
T

S
k+1
=
k+1


S
k
= F
k
/
_
S
k
_ _
W
k+1
_
T

k+1
Si se generaliza

k
=

S
k

k
= F
k
/
_
S
k
_ _
W
k+1
_
T

k+1

k
=
_
W
k+1
F
k
/
_
S
k
__
T

k+1
ya que F
k
/
_
S
k
_
es simtrica
94

W
k
=

S
k
S
k
W
k
=
k
_
y
k1
_
T
W
1
(n + 1) = W
1
(n) +
1
(n)
_
y
0
(n)
_
T
y, en general
W
k
(n + 1) = W
k
(n) +
k
(n)
_
y
k1
(n)
_
T
Ahora se determina la frmula de actualizacin para b
1
b
1
(n + 1) = b
1
(n)
(n)
b
1
(n)

b
1
=
S
1
b
1

S
1

S
1
=
1
S
1
b
1
=
_

_
S
1
1
b
1
1
S
1
2
b
1
1
S
1
3
b
1
1
S
1
1
b
1
2
S
1
2
b
1
2
S
1
3
b
1
2
S
1
1
b
1
3
S
1
2
b
1
3
S
1
3
b
1
3
_

_
=
_
_
1 0 0
0 1 0
0 0 1
_
_
=
_
I

nn(1)
En general,
S
k
b
k
=
_
I

nn(k)

b
1
=
_
_
1 0 0
0 1 0
0 0 1
_
_

1
=
1
En general,

b
k
=
_
I

nn(k)

k
=
k
b
1
(n + 1) = b
1
(n) +
1
(n)
b
k
(n + 1) = b
k
(n) +
k
(n)
95
4.1.4. Resumen (Algoritmo)
Datos de Entrada
Patrones de entrenamiento X con su salida deseada.
_
X

nn(0)Xnp
donde np = nmero de patrones.
_
d

nn(c)Xnp
donde nc = nmero de capas de la red (recuerde que la capa
de entrada no se considera como una capa de la red).
Nmero mximo de iteraciones: NUMIT
Valor de la tasa de aprendizaje:
Valor de la tolerancia: TOL
Inicializar:
W
1
(1)
, W
2
(1)
, ..., W
nc
(1)
b
1
(1)
, b
2
(1)
, ..., b
nc
(1)
con valores aleatorios pequeos,
_
W
k
ij

nn(k)Xnn(k1)
[0,5, 0,5]
_
b
k
i

nn(k)
[0,5, 0,5]
n = 0, = 0
Mientras que n <= NUMIT < TOL
y
0
(n)
= X
(n)
, donde X
(n)
es un vector de entrada escogido aleatoriamente
96
4.1.5. Propagacin hacia adelante.
Para k = 1 hasta nc
S
k
(n)
= W
k
(n)
y
k1
(n)
+b
k
(n)
y
k
(n)
= F
k
_
S
k
(n)
_
Fin para k.
e(n) = d(n) y
nc
(n)
(n) = e(n)
T
e(n)
4.1.6. Propagacin hacia atrs.

nc
(n) = 2F
nc
/ (S
nc
(n)) e (n)
W
nc
(n + 1) = W
nc
(n) +
nc
(n)
_
y
nc1
(n)
_
T
b
nc
(n + 1) = b
nc
(n) +
nc
(n)
Para k = nc 1 hasta 1

k
(n) = F
k
/
_
S
k
(n)
_ _
W
k+1
(n)
_
T

k+1
(n)
W
k
(n + 1) = W
k
(n) +
k
(n)
_
y
k1
(n)
_
T
b
k
(n + 1) = b
k
(n) +
k
(n)
Fin para k
97
APLICACIN A REDES NEURONALES

1
1
1
1
S
e

+
1
2
1
1
S
e

+
1
3
1
1
S
e

+
1
1
S
1
2
S
1
3
S

0
2
y
0
1
y
0 . 1
1
1
y
1
2
y
1
3
y
2
1
S
2
2
S
2
1
y
2
2
y
) tanh(
2
1
S
) tanh(
2
2
S
Figura 3:
Ejemplo 4.1 Entrenar una red neuronal para aprender los siguientes patrones
n x
1
x
2
d
1
d
2
1 1 1 1 1
2 1 1 1 1
3 1 1 1 1
4 1 1 1 1
Utilice una red 2-3-2 (2 entradas, 3 neuronas en la capa oculta y dos neuronas
en la capa de salida.
Utilice funcin logstica como funcin de activacin para todas las neuronas
de la capa oculta (capa 1) y tanh para todas las neuronas de la capa de salida
(capa 2).
Se va a trabajar con = 0,5
La gura ?? muestra la red propuesta.
Primer Patrn n = 0
Inicializacin:
W
1
(1) =
_
_
0,7826 0,609
1,4372 1,6513
2,713 2,8013
_
_
, W
2
(1) =
_
0,0636 0,6596 2,0639
0,582 1,8127 2,2377
_
b
1
(1) =
_
_
0,437
1,298
2,2137
_
_
, b
2
(1) =
_
0,7279
1,9579
_
98
y
0
(1) = X
(1)
=
_
x
1
(1)
x
2
(1)
_
=
_
1
1
_
S
1
(1) = W
1
(1) y
0
(1) +b
1
(1)
S
1
(1) =
_
_
0,7826 0,609
1,4372 1,6513
2,713 2,8013
_
_
_
1
1
_
+
_
_
0,437
1,298
2,2137
_
_
S
1
(1) =
_
_
0,9576
1,7905
7,728
_
_
y
1
(1) =
_
_
f
1
1
_
S
1
1
(1)
_
f
1
2
_
S
1
2
(1)
_
f
1
3
_
S
1
3
(1)
_
_
_
=
_

_
1
1+e
S
1
1
1
1+e
S
1
2
1
1+e
S
1
3
_

_
=
_
_
0,27796067
0,85698857
0,99955987
_
_
S
2
(1) = W
2
(1) y
1
(1) +b
2
(1)
S
2
(1) =
_
0,0636 0,6596 2,0639
0,582 1,8127 2,2377
_
_
_
0,27796067
0,85698857
0,99955987
_
_
+
_
0,7279
1,9579
_
S
2
(1) =
_
3,33848298
1,11287495
_
y
2
(1) =
_
f
2
1
_
S
2
1
(1)
_
f
2
2
_
S
2
2
(1)
_
_
=
_
tanh
_
S
2
1
(1)
_
tanh
_
S
2
2
(1)
_
_
=
_
tanh(3,33848298)
tanh(1,11287495)
_
y
2
(1) =
_
0,99748398
0,80507629
_
e (1) = d (1) y
2
(1)
e (1) =
_
1
1
_

_
0,99748398
0,80507629
_
=
_
0,00251602
0,19492371
_
99
4.1.7. Propagacin hacia atrs.
Ejemplo 4.2 1.
2
(1) = 2F
2
/
_
S
2
(1)
_
e (1)
Recuerde que:
f
2
1
_
S
2
1
(1)
_
= tanh
_
S
2
2
(1)
_
= y
2
1
(1)
f
2
1
/
_
S
2
1
(1)
_
= 1
_
y
2
1
(1)
_
2
f
2
2
_
S
2
2
(1)
_
= tanh
_
S
2
2
(1)
_
= y
2
2
(1)
f
2
2
/
_
S
2
2
(1)
_
= 1
_
y
2
2
(1)
_
2
2F
2
/
_
S
2
(1)
_
=
_
f
2
1
/
_
S
2
1
(1)
_
0
0 f
2
2
/
_
S
2
2
(1)
_
_
=
_
1
_
y
2
1
(1)
_
2
0
0 1
_
y
2
2
(1)
_
2
_

2
(1) = 2
_
1 (0,99748398) 0
0 1 (0,80507629)
_ _
0,00251602
0,19492371
_

2
(1) =
_
2,52896 X 10
5
0,13716866
_
W
2
(2) = W
2
(1) +
2
(1)
_
y
1
(1)
_
T
W
2
(2) =
_
0,0636 0,6596 2,0639
0,582 1,8127 2,2377
_
+
0,5
_
2,52896 X 10
5
0,13716866
_
_
0,27796067 0,85698857 0,99955987

W
2
(2) =
_
0,0636 0,6596 2,0639
0,582 1,8127 2,2377
_
+
_
3,514775 X 10
6
1,08364 X 10
5
1,2639 X 10
5
0,019063746 0,0587755987 0,06855414
_
W
2
(2) =
_
0,063596485 0,659610836 2,063912639
0,562936254 1,871475987 2,169145856
_
b
2
(2) = b
2
(1) +
2
(1)
b
2
(2) =
_
0,7279
1,9579
_
+ 0,5

1
(1) = F
1
/
_
S
1
(1)
_ _
W
2
(1)
_
T

2
(1)

1
(1) =
_
_
y
1
1
(1)
_
1 y
1
1
(1)
_
0 0
0 y
1
2
(1)
_
1 y
1
2
(1)
_
0
0 0 y
1
3
(1)
_
1 y
1
3
(1)
_
_
_

100
_
_
0,0636 0,582
0,6596 1,8127
2,0639 2,2377
_
_
_
2,52896 X 10
5
0,13716866
_

1
(1) =
_
_
0,01602252
0,03047584
0,00013501
_
_
W
1
(2) = W
1
(1) +
1
(1)
_
y
0
(1)
_
T
W
1
(2) =
_
_
0,7826 0,609
1,4372 1,6513
2,713 2,8013
_
_
+ 0,5
_
_
0,01602252
0,03047584
0,00013501
_
_
_
1 1

W
1
(2) =
_
_
0,7826 0,609
1,4372 1,6513
2,713 2,8013
_
_
+
_
_
0,00801126 0,00801126
0,01523792 0,01523792
6,7506 X 10
5
6,7506 X 10
5
_
_
W
1
(2) =
_
_
0,79061126 0,61701126
1,45243792 1,66653792
2,71293249 2,80123249
_
_
b
1
(2) = b
1
(1) +
1
(1)
b
1
(2) =
_
_
0,437
1,298
2,2137
_
_
+ 0,5
_
_
0,01602252
0,03047584
0,00013501
_
_
b
1
(2) =
_
_
0,42898874
1,28276208
2,21363249
_
_
4.2. Derivadas Matriciales en Matlab.
Aprovechando las funciones bsicas y las operaciones que con respecto a ma-
trices se pueden utilizar en Matlab, se disearon unas pequeas funciones que
permiten a travs de la utilizacin de las propiedades de la derivacin matricial,
empleando la vectorizacin y el producto de Kronecker, resolver derivadas ma-
triciales. Se adjuntan los cdigos fuente de las mismas, las cuales son solo un
ejemplo, teniendo en cuenta que las funciones f1, f2 y dems que se presentan,
pueden ser modicadas de acuerdo con la necesidad de solucin.
Un exmen previo de las guras 4 hasta la 8 puede facilitar la lectura de
esta seccin, ya que el lenguaje Matlab es bastante intuitivo. Inicialmente se
han creado dos funciones vec() que realiza la vectorizacin de una matriz por
columnas, tal como se observa en la gura 4 y vecf() que realiza la vectorizacin
por las de una matriz, tal como se observa en la gura 5.
En primera instancia, se debe tener claro que es posible denir funciones
nuevas y archivos de sencuencia de comandos (script) en Matlab. De hecho, las
101
function [vec] = vec(mat) function [vec] = vec(mat) function [vec] = vec(mat) function [vec] = vec(mat)
%vectorizacion (columna) %vectorizacion (columna) %vectorizacion (columna) %vectorizacion (columna)

%CAPTURA TAMAO %CAPTURA TAMAO %CAPTURA TAMAO %CAPTURA TAMAO
[m,n] = size(mat); [m,n] = size(mat); [m,n] = size(mat); [m,n] = size(mat);
%LEE ELEMENTOS Y REUBICA %LEE ELEMENTOS Y REUBICA %LEE ELEMENTOS Y REUBICA %LEE ELEMENTOS Y REUBICA
for I = 1:m, for I = 1:m, for I = 1:m, for I = 1:m,
for J = 1:n, for J = 1:n, for J = 1:n, for J = 1:n,
pos=n*(I pos=n*(I pos=n*(I pos=n*(I- -- -1)+J; 1)+J; 1)+J; 1)+J;
vecf(pos) = mat(I,J); vecf(pos) = mat(I,J); vecf(pos) = mat(I,J); vecf(pos) = mat(I,J);
end end end end
end end end end
%TRANSPONE %TRANSPONE %TRANSPONE %TRANSPONE
vec=vecf.'; vec=vecf.'; vec=vecf.'; vec=vecf.';
en en en end dd d
Figura 4: Vectorizacin de una matriz.
function [vecf] = vecf(mat) function [vecf] = vecf(mat) function [vecf] = vecf(mat) function [vecf] = vecf(mat)
%CAPTURA TAMAO %CAPTURA TAMAO %CAPTURA TAMAO %CAPTURA TAMAO
[m,n] = size(mat); [m,n] = size(mat); [m,n] = size(mat); [m,n] = size(mat);
%LEE ELEMENTOS Y REUBICA %LEE ELEMENTOS Y REUBICA %LEE ELEMENTOS Y REUBICA %LEE ELEMENTOS Y REUBICA
for I = 1:m, for I = 1:m, for I = 1:m, for I = 1:m,
for J = 1:n, for J = 1:n, for J = 1:n, for J = 1:n,
pos=n*(I pos=n*(I pos=n*(I pos=n*(I- -- -1)+J; 1)+J; 1)+J; 1)+J;
vecf(pos) = mat(I,J); vecf(pos) = mat(I,J); vecf(pos) = mat(I,J); vecf(pos) = mat(I,J);
end end end end
end end end end
end end end end
Figura 5: Vectorizacin por las de una matriz.
% CREA VARIABLES % CREA VARIABLES % CREA VARIABLES % CREA VARIABLES
syms v syms v syms v syms v
syms w syms w syms w syms w
syms x syms x syms x syms x
syms y syms y syms y syms y
syms z syms z syms z syms z

%CREA MATRICES IDENTICAS DE ORDEN 1 HASTA 5 %CREA MATRICES IDENTICAS DE ORDEN 1 HASTA 5 %CREA MATRICES IDENTICAS DE ORDEN 1 HASTA 5 %CREA MATRICES IDENTICAS DE ORDEN 1 HASTA 5
I1=eye(1); I1=eye(1); I1=eye(1); I1=eye(1);
I2=eye(2); I2=eye(2); I2=eye(2); I2=eye(2);
I3=eye(3); I3=eye(3); I3=eye(3); I3=eye(3);
I4=eye(4); I4=eye(4); I4=eye(4); I4=eye(4);
I5=eye(5); I5=eye(5); I5=eye(5); I5=eye(5);

return return return return
Figura 6: Inicializacin, crea variables simblicas y matrices idnticas.
102
% CASO: % CASO: % CASO: % CASO:
% DERIVACIN DE f(x,y,z,...) RESPECTO DE CADA VARIABLE INDEPENDIENTE % DERIVACIN DE f(x,y,z,...) RESPECTO DE CADA VARIABLE INDEPENDIENTE % DERIVACIN DE f(x,y,z,...) RESPECTO DE CADA VARIABLE INDEPENDIENTE % DERIVACIN DE f(x,y,z,...) RESPECTO DE CADA VARIABLE INDEPENDIENTE

% BORRA VARIABLES DE LA MEMORIA % BORRA VARIABLES DE LA MEMORIA % BORRA VARIABLES DE LA MEMORIA % BORRA VARIABLES DE LA MEMORIA
clear clear clear clear
% INICIALIZA VARIABLES Y CREA MATRICES UTILITARIAS % INICIALIZA VARIABLES Y CREA MATRICES UTILITARIAS % INICIALIZA VARIABLES Y CREA MATRICES UTILITARIAS % INICIALIZA VARIABLES Y CREA MATRICES UTILITARIAS
ini ini ini ini

% USUARIO: SE DEFINEN FUNCIONES % USUARIO: SE DEFINEN FUNCIONES % USUARIO: SE DEFINEN FUNCIONES % USUARIO: SE DEFINEN FUNCIONES
%EJEMPLO: %EJEMPLO: %EJEMPLO: %EJEMPLO:
f1=x^2+y^3; f1=x^2+y^3; f1=x^2+y^3; f1=x^2+y^3;
f2=2*x*y; f2=2*x*y; f2=2*x*y; f2=2*x*y;
%Fn=... %Fn=... %Fn=... %Fn=...

% USUARIO: % USUARIO: % USUARIO: % USUARIO: SE DEFINEN VECTORES O MATRICES SE DEFINEN VECTORES O MATRICES SE DEFINEN VECTORES O MATRICES SE DEFINEN VECTORES O MATRICES
% EJEMPLO: % EJEMPLO: % EJEMPLO: % EJEMPLO:
Y=[f1 ; f2]; Y=[f1 ; f2]; Y=[f1 ; f2]; Y=[f1 ; f2];
X=[x y]; X=[x y]; X=[x y]; X=[x y];

%%% PROCESANDO... %%% %%% PROCESANDO... %%% %%% PROCESANDO... %%% %%% PROCESANDO... %%%

% EXTRAE EL TAMAO DE LOS VECTORES O MATRICES: % EXTRAE EL TAMAO DE LOS VECTORES O MATRICES: % EXTRAE EL TAMAO DE LOS VECTORES O MATRICES: % EXTRAE EL TAMAO DE LOS VECTORES O MATRICES:
[P,N]=size(X); [P,N]=size(X); [P,N]=size(X); [P,N]=size(X);
[M,Q]=size(Y); [M,Q]=size(Y); [M,Q]=size(Y); [M,Q]=size(Y);

% EXPANSION: % EXPANSION: % EXPANSION: % EXPANSION:
for I = 1:M, for I = 1:M, for I = 1:M, for I = 1:M,
for J = 1:Q, for J = 1:Q, for J = 1:Q, for J = 1:Q,
%DERIVAR CADA ELEMENTO DE Y RESPECTO A MAT %DERIVAR CADA ELEMENTO DE Y RESPECTO A MAT %DERIVAR CADA ELEMENTO DE Y RESPECTO A MAT %DERIVAR CADA ELEMENTO DE Y RESPECTO A MATRIZ X: RIZ X: RIZ X: RIZ X:
for K=1:P, for K=1:P, for K=1:P, for K=1:P,
for L=1:N, for L=1:N, for L=1:N, for L=1:N,
%DERIVACIN INDIVIDUAL: %DERIVACIN INDIVIDUAL: %DERIVACIN INDIVIDUAL: %DERIVACIN INDIVIDUAL:
R(P*(I R(P*(I R(P*(I R(P*(I- -- -1)+K,N*(J 1)+K,N*(J 1)+K,N*(J 1)+K,N*(J- -- -1)+L)=diff(Y(I,J),X(K,L)); 1)+L)=diff(Y(I,J),X(K,L)); 1)+L)=diff(Y(I,J),X(K,L)); 1)+L)=diff(Y(I,J),X(K,L));
end end end end
end end end end
end end end end
end end end end
R RR R
Figura 7: Codigo completo para realizar una derivacin matricial simple.
guras referenciadas muestran cdigo de cada uno de ellos. Tanto las funciones
como los scripts pueden utilizar funciones de control de ujo para detallar la
forma como se desea ejecutar una secuencia de procesos. Por ejemplo, en Matlab
se dispone de los comandos: for, if, else, elseif, while, return, break, con un uso
bastante similar al de otros programas ms conocidos, aunque con una sintaxis
ligeramente diferente.
De inters particular para este trabajo, se encuentran las funciones para la
generacin, manipulacin de matrices y operaciones con matrices. Algunas de
ellas son:
trace(M): calcula la traza de una matriz.M
kron(M, N) : desarrolla el producto de kronecker de las matrices M y N.
eye(M, N): devuelve una matrz idntica de tamao M N.
ones(M, N): devuelve una matrz de unos de tamao M N.
103
%BORRA VARIABLES DE LA MEMORIA %BORRA VARIABLES DE LA MEMORIA %BORRA VARIABLES DE LA MEMORIA %BORRA VARIABLES DE LA MEMORIA
clear clear clear clear
%INICIALIZA VARIABLES Y CREA IDENTICAS %INICIALIZA VARIABLES Y CREA IDENTICAS %INICIALIZA VARIABLES Y CREA IDENTICAS %INICIALIZA VARIABLES Y CREA IDENTICAS
ini ini ini ini

%SE DEFINEN FUNCIONES %SE DEFINEN FUNCIONES %SE DEFINEN FUNCIONES %SE DEFINEN FUNCIONES
f1=2*x+3*y; f1=2*x+3*y; f1=2*x+3*y; f1=2*x+3*y;
f2=x^2+2*y; f2=x^2+2*y; f2=x^2+2*y; f2=x^2+2*y;
f3=exp(x); f3=exp(x); f3=exp(x); f3=exp(x);
f4=2*x*y; f4=2*x*y; f4=2*x*y; f4=2*x*y;
f5=1/x; f5=1/x; f5=1/x; f5=1/x;
f6=4*y f6=4*y f6=4*y f6=4*y- -- -x^2; x^2; x^2; x^2;

%SE DEFINEN MATRICES %SE DEFINEN MATRICES %SE DEFINEN MATRICES %SE DEFINEN MATRICES
X=[f1 f2 ; f3 f4; f5 f6]; X=[f1 f2 ; f3 f4; f5 f6]; X=[f1 f2 ; f3 f4; f5 f6]; X=[f1 f2 ; f3 f4; f5 f6];

[filas,col]=size(X); [filas,col]=size(X); [filas,col]=size(X); [filas,col]=size(X);

dXrX=(vec(eye(f dXrX=(vec(eye(f dXrX=(vec(eye(f dXrX=(vec(eye(filas))*vecf(eye(col))) ilas))*vecf(eye(col))) ilas))*vecf(eye(col))) ilas))*vecf(eye(col)))

R=kron(eye(col),dXrX)*kron(vec(eye(col)),eye(col)) R=kron(eye(col),dXrX)*kron(vec(eye(col)),eye(col)) R=kron(eye(col),dXrX)*kron(vec(eye(col)),eye(col)) R=kron(eye(col),dXrX)*kron(vec(eye(col)),eye(col))
Figura 8: Desarrollo de
vec(X)
X
utilizando las propiedades.
zeros(n): devuelve una matrz idntica de tamao M N.
: (dos puntos) crea un vector espaciado regularmente.
linspace: crea un vector espaciado linealmente.
logspace: crea un vector espaciado logartmicamente.
diag: crea o extrae diagonales.
reshape: cambia la dimensin de la matriz.
tril: extrae la matriz triangular inferior.
triu: extrae la matriz triangular superior.
det: calcula el determinante de una matriz.
eig: calcula los autovalores y autovectores.
expm: calcula la exponencial de una matriz.
logm: calcula el logaritmo de una matriz.
Se pueden consultar funciones adicionales mediante el men de ayuda del
programa o mediante el comando help de Matlab.
El cdigo que muestra la gura 6 tiene por objeto crear variables simblicas,
con el n de poder utilizarlas dentro de expresiones ms complejas. Adems,
crea un conjunto de matrices idnticas, para utilizar cuando se necesiten.
104
En la gura 7, se expone el cdigo necesario para derivar una funcin ma-
tricial de variable matricial, aunque se ha desarrollado como primer ejemplo el
caso particular en que tanto la funcin como la variable son vectoriales.
En el ejemplo de la gura 8 se muestra como resolver el problema de
vec(X)
X
.
Para ello, despus de observar las propiedades que cumple este desarrollo, se
ha planteado la solucin como lo indica el cdigo all expuesto. Al utilizar las
propiedades de la derivacin, el proceso se hace ms simple y menos costoso
computacionalmente.
Los resultados de la ejecucin de los ejercicios expuestos coinciden plena-
mente con los desarrollos mediante otros paquetes o tcnicas,siempre y cuando
se denan correctamente los tipos de datos (entero, real, etc).
Mediante la aplicacin iterativa de las frmulas presentadas, se pueden ob-
tener las derivadas de orden superior o la aplicacin de la regla de la cadena. En
primera instancia, hay una gran cantidad de opciones para desarrollar en este
caso, cada una de las cuales requiere que se denan correctamente las variables
dependientes e independientes, la relacin funcional, y las matrices o vectores
que intervienen.
Matlab es un lenguaje de programacin que facilita el trabajo con matri-
ces. Dado que la representacin interna de Matlab es en forma matricial, los
programas nales son compactos y relativamente sencillos.
105
5. Conclusiones
Al nalizar el trabajo, es necesario presentar algunos puntos importantes,
considerados como vitales en la comprensin y realizacin del mismo.
Al iniciar el estudio de la derivacin matricial es fundamental tener claridad
en conceptos y deniciones de la teora bsica del lgebra lineal y del clculo
diferencial.
Antes de introducirse directamente en el tema, es necesario comprender las
operaciones que complementan el lgebra lineal y que son el soporte de la deriva-
cin matricial, tales como la permutacin de matrices por bloques, el producto
de Kronecker y la vectorizacin de matrices por la y por columna.
Al abordar la derivacin matricial es fundamental analizar las propiedades
del producto de Kronecker, de la vectorizacin de matrices, las reglas de deriva-
cin matricial y las formas alternativas de derivacin con el n de minimizar la
solucin de problemas, teniendo en cuenta que en algunos casos la expansin de
las matyrices es bastante amplia y utilizando adecuadamnte la o las reglas enu-
meradas anteriormente, el procedimiento de solucin es ms gil, ms eciente
y esposible que la expansin de las matrices sea ms reducida.
A nivel personal puedo concluir que adquir el conocimiento de nuevas ope-
raciones del lgebra lineal y el del tema central: el clculo matricial, lo que
signica un avance personal muy interesante, que aunque mnimo si se tiene en
cuenta la amplitud del campo matemtico, si muy importante en el desarrollo
y el conocimiento de nuevos temas relacionados con la matemtica.
A nivel profesional, es como haber dado el primer paso en la profundizacin
de conceptos y conocimientos, los cuales se logran solo a travs del tiempo y con
la dedicacin necesaria que permiten realmente formar al verdadero matemtico.
Por ltimo, espero que el trabajo haya respondido a las expectativas de las
directivas y docentes de la Fundacin y que sirva como un aporte interesante no
solo para los matemticos, sino para los profesionales que de una u otra forma
en sus aplicaciones requieren de la derivacin matricial.
106
Referencias
[Her86] I. Herstein, lgebra Abstracta. Mxico: Grupo Editorial Iberoamericano
(1985).
[Bar98] R. Barbolla, P. Sans, lgebra Lineal y Teora de Matrices. Madrid:
Prentice-Hall (1998).
[San94] R. Snchez, A. Velasco, Curso Bsico de Algebra Lineal. Bogot: Ed
Trillas (1994).
[Mey07] C. Meyer, Matrix Analysis and Applied Linear Algebra.
http://www.matrixanalysis.com/ (2007)
[Rad99] C. Radhakrishna, H. Toutenburg, Linear Models: Least Squares and
Alternatives. New York: Springer (1999).
[Per07] P Rengifo. Borradores de Trabajo y Notas de Clase Sistemas Basados
en el Conocimiento. FUKL. (2007)
[Mag06] J. Magnus, Matrix Calculus and Econometrics. Tilburg University
(2006)
107

Potrebbero piacerti anche