CS 229 - Repaso de Álgebra Lineal y Cálculo PDF

26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo
CS 229 - Machine Learning (https://stanford.edu/%7Eshervine/teaching/cs-229) Español
Probabilidades y Estadísticas Álgebra Lineal y Cálculo
Repaso de Álgebra Lineal y Cálculo Star 8,535
Contenido original por Afshine Amidi (https://twitter.com/afshinea) y Shervine Amidi

(https://twitter.com/shervinea)
Traducido por Fernando González-Herrera. Revisado por Fernando Diaz, Gustavo Velasco-Hernández y Juan P. Chavat.
Notaciones Generales
Definiciones
Vector ― Sea x un vector con n entradas, donde x es la i-ésima entrada:
n
∈ R i ∈ R
https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 1/13
x1
⎛ ⎞
x2
⎜ ⎟ n
x = ⎜ ⎟ ∈ R
⎜ ⎟
⎜ ⋮ ⎟
⎝ ⎠
xn
Matriz ― Sea A una matriz con m filas y n columnas; donde A es el valor

m×n
∈ R i,j ∈ R
ubicado en la i-ésima fila y la j-ésima columna:
A1,1 ⋯ A1,n
⎛ ⎞
m×n
A = ⎜ ⋮ ⋮
⎟ ∈ R
⎜ ⎟
⎝ ⎠
Am,1 ⋯ Am,n
Observación: el vector x definido arriba puede ser visto como una matriz n × 1 y es
particularmente llamado vector-columna.
Matrices principales
Matriz identidad ― La matriz identidad I es una matriz cuadrada con valores 1 en su

n×n
∈ R
diagonal y ceros en el resto:
1 0 ⋯ 0
⎛ ⎞
⎜ ⎟
⎜0 ⋱ ⋱ ⋮ ⎟
I = ⎜ ⎟
⎜ ⎟
⎜ ⎟
⎜ ⋮ ⋱ ⋱ 0⎟
⎝ ⎠
0 ⋯ 0 1
Observación: para todas las matrices A , se cumple que A × I .

n×n
∈ R = I × A = A
Matriz diagonal ― Una matriz diagonal D ∈ R es una matriz cuadrada con valores
n×n
diferentes de zero en su diagonal y cero en el resto:
d1 0 ⋯ 0
⎛ ⎞
⎜ ⎟
⎜ 0 ⋱ ⋱ ⋮⎟
D = ⎜ ⎟
⎜ ⎟
⎜ ⎟
⎜ ⋮ ⋱ ⋱ 0 ⎟
⎝ ⎠
0 ⋯ 0 dn
Observación: también se denota D como diag(d 1, . . . , dn ) .
Operaciones de matrices
Multiplicación
Vector-vector ― Hay dos tipos de multiplicaciones vector-vector:
- Producto interno: para x, y , se tiene que:

n
∈ R
T
x y = ∑ x i yi ∈ R
i=1
- Producto diádico : para x ∈ R

m
,y ∈ R
n
, se tiene que:
x 1 y1 ⋯ x 1 yn
⎛ ⎞
T m×n
xy = ⎜
⎜ ⋮ ⋮
⎟ ∈ R
⎟
⎝ ⎠
x m y1 ⋯ x m yn
Matriz-vector ― El producto de la matriz A ∈ R

m×n
y el vector x ∈ R
n
, es un vector de
tamaño R ; tal que:
m
T
a x
⎛ r,1 ⎞
n
⎜ ⎟ m
Ax = ⎜ ⎟ = ∑ ac,i xi ∈ R
⎜ ⋮ ⎟
i=1
⎝ T ⎠
ar,m x
donde a T
r,i
son los vectores fila y a c,j son los vectores columna de A, y x son las entradas de i
x .
Matriz-matriz ― El producto de las matrices A yB es una matriz de

m×n n×p
∈ R ∈ R
tamaño R , tal que:

n×p
T T
a bc,1 ⋯ a bc,p
⎛ r,1 r,1 ⎞
n
⎜ ⎟ T n×p
AB = ⎜ ⎟ = ∑ ac,i br,i ∈ R
⎜ ⋮ ⋮ ⎟
i=1
⎝ T T ⎠
ar,m bc,1 ⋯ ar,m bc,p
donde a T
r,i
,b
T
r,i
son los vectores fila y a c,j , bc,j son los vectores columna de A y B
respectivamente.
Otras operaciones
Transpuesta ― La transpuesta de una matriz A ∈ R
m×n
, denotada A , es tal que sus
T
entradas se intercambian de la siguiente forma:
T
∀i, j, A = Aj,i
i,j
Observación: dadas las matrices A, B, se cumple que (AB) T

= B
T
A
T
.
Inversa ― La inversa de una matriz cuadrada invertible A es denotada como A −1

y es la única
matriz tal que:
−1 −1
AA = A A = I
Observación: no todas las matrices cuadradas son invertibles. Además, para las matrices A, B, se
cumple que (AB) = B A . −1 −1 −1
Traza ― La traza de una matriz cuadrada A, denotada tr(A), es la suma de los elementos en
su diagonal:
tr(A) = ∑ Ai,i
i=1
Observación: dadas las matrices A, B, se cumple que tr(A T

) = tr(A) y tr(AB) = tr(BA) .
Determinante ― El determinante de una matriz cuadrada A , denotado |A| o det(A),

n×n
∈ R
es expresado recursivamente en términos de A ∖i,∖j

, que es la matriz A sin su i-ésima fila ni su
j -ésima columna, de la siguiente forma:
i+j
det(A) = |A| = ∑ (−1) Ai,j |A∖i,∖j |
j=1
Observación: A es invertible si y solo si |A| ≠ 0 . Además, |AB| = |A||B| y |A T

| = |A| .
Propiedades de matrices
Definiciones
Descomposición simétrica ― Una matriz dada A puede ser expresada en términos de sus
partes simétricas y antisimétricas de la siguiente forma:
T T
A + A A − A
A = +
2 2
 
é
Sim trica é
Antisim tricas
Norma ― Una norma (o módulo) es una función N : V ⟶ [0, +∞[ donde V es un vector
espacial tal que para todo x, y ∈ V , se cumple que:
- N (x + y) ⩽ N (x) + N (y)
- N (ax) = |a|N (x) siendo a un escalar

- si N (x) = 0 , entonces x = 0
Para x ∈ V , las normas comúnmente utilizadas se resumen en la siguiente tabla:
Norma Notación Definición Caso de uso

n
Manhattan, L 1
||x||
1
∑ |xi | LASSO
i=1
 n

Euclidean, L 2
||x||
2
∑ x 2
i
Ridge
⎷
i=1
n p
p -norma, L p
||x||
p (∑ x )
p
i
Desigualdad de Hölder
i=1
Infinito, L ∞
||x||
∞
max |xi | Convergencia
i
Dependencia lineal ― Un conjunto de vectores se dice que es linealmente dependiente si

uno de los vectores del conjunto puede ser definido como una combinación lineal de los
restantes.
Observación: si ningún vector puede ser escrito de esta forma, entonces se dice que los vectores
son linealmente independientes.
Rango matricial ― El rango de una matriz dada A es denotado rank(A) y es la dimensión

del espacio vectorial generado por sus columnas. Esto es equivalente al máximo número de
columnas linealmente independientes de A.
Matriz semi-definida positiva ― Una matriz A ∈ R

n×n
es semi-defininda positiva (PSD), lo
cual se denota como A ⪰ 0 , si se cumple que:
T n T
A = A y ∀x ∈ R , x Ax ⩾ 0
Observación: de igual forma, una matriz A se dice definida positiva, lo cual se denota con A ≻ 0
, si es una matriz PSD que satisface para todos los vectores x diferentes de cero, x Ax > 0. T
Valor propio, vector propio ― Dada una matriz A ∈ R

n×n
, λ se dice que es un valor propio
(eigenvalue, en inglés) de A si existe un vector z ∈ R ∖{0}
n
, llamado vector propio
(eigenvector, en inglés), tal que:
Az = λz
Teorema espectral ― Sea A ∈ R

n×n
. Si A es simétrica, entonces A es diagonalizable a través
de una matriz real ortogonal U ∈ R
n×n
. Denotando Λ = diag(λ1 , . . . , λn ) , se tiene que:
T
∃Λ diagonal, A = U ΛU
Descomposición en valores singulares ― Para una matriz dada A de dimensiones m × n, la

descomposición en valores singulares (SVD, por sus siglas en inglés de Singular-Value
Decomposition) es una técnica de factorización que garantiza la existencia de las matrices U
m × m unitaria, Σ m × n diagonal y V n × n unitaria, tal que:
T
A = U ΣV
Cálculo de matrices
Gradiente ― Sea f : R
m×n
→ R una función y A ∈ R
m×n
una matriz. El gradiente de f con
respecto a A es una matriz de m × n, denotada por ∇ A f (A) , tal que:
∂f (A)
(∇A f (A)) =
i,j ∂Ai,j
Observación: el gradiente de f se define únicamente cuando f es una función que retorna un

escalar.
Hessiana ― Sea f : R → R una función y x ∈ R un vector. La hessiana de f con recpecto

n n
a x es una matriz simétrica n × n, denotada ∇ f (x), tal que: 2

x
2
∂ f (x)
2
(∇x f (x)) =
i,j ∂xi ∂xj
Observación: la matriz hessiana de f se define únicamente cuando f es una función que

devuelve un escalar.
Operaciones de gradiente ― Dadas las matrices A, B, C , las siguientes propiedades de

gradiente merecen ser tenidas en cuenta:
T T
∇A tr(AB) = B ∇AT f (A) = (∇A f (A))
T T T −1 T
∇A tr(ABA C) = CAB + C AB ∇A |A| = |A|(A )
 (https://twitter.com/shervinea)  (https://linkedin.com/in/shervineamidi) 
(https://github.com/shervinea)  (https://scholar.google.com/citations?user=nMnMTm8AAAAJ)

CS 229 - Repaso de Álgebra Lineal y Cálculo PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

CS 229 - Repaso de Álgebra Lineal y Cálculo PDF

Caricato da

Copyright:

Formati disponibili

26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

CS 229 - Machine Learning (https://stanford.edu/%7Eshervine/teaching/cs-229) Español

Probabilidades y Estadísticas Álgebra Lineal y Cálculo

Repaso de Álgebra Lineal y Cálculo Star 8,535

Contenido original por Afshine Amidi (https://twitter.com/afshinea) y Shervine Amidi

Matriz ― Sea A una matriz con m filas y n columnas; donde A es el valor

ubicado en la i-ésima fila y la j-ésima columna:

Matriz identidad ― La matriz identidad I es una matriz cuadrada con valores 1 en su

diagonal y ceros en el resto:

Observación: para todas las matrices A , se cumple que A × I .

diferentes de zero en su diagonal y cero en el resto:

Observación: también se denota D como diag(d 1, . . . , dn ) .

- Producto interno: para x, y , se tiene que:

- Producto diádico : para x ∈ R

Matriz-vector ― El producto de la matriz A ∈ R

Matriz-matriz ― El producto de las matrices A yB es una matriz de

tamaño R , tal que:

entradas se intercambian de la siguiente forma:

Observación: dadas las matrices A, B, se cumple que (AB) T

Inversa ― La inversa de una matriz cuadrada invertible A es denotada como A −1

Observación: dadas las matrices A, B, se cumple que tr(A T

Determinante ― El determinante de una matriz cuadrada A , denotado |A| o det(A),

es expresado recursivamente en términos de A ∖i,∖j

Observación: A es invertible si y solo si |A| ≠ 0 . Además, |AB| = |A||B| y |A T

- N (ax) = |a|N (x) siendo a un escalar

Para x ∈ V , las normas comúnmente utilizadas se resumen en la siguiente tabla:

Norma Notación Definición Caso de uso

Dependencia lineal ― Un conjunto de vectores se dice que es linealmente dependiente si

Rango matricial ― El rango de una matriz dada A es denotado rank(A) y es la dimensión

Matriz semi-definida positiva ― Una matriz A ∈ R

Valor propio, vector propio ― Dada una matriz A ∈ R

Teorema espectral ― Sea A ∈ R

Descomposición en valores singulares ― Para una matriz dada A de dimensiones m × n, la

Observación: el gradiente de f se define únicamente cuando f es una función que retorna un

Hessiana ― Sea f : R → R una función y x ∈ R un vector. La hessiana de f con recpecto

a x es una matriz simétrica n × n, denotada ∇ f (x), tal que: 2

Observación: la matriz hessiana de f se define únicamente cuando f es una función que

Operaciones de gradiente ― Dadas las matrices A, B, C , las siguientes propiedades de

Potrebbero piacerti anche