Sei sulla pagina 1di 13

26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

CS 229 - Machine Learning (https://stanford.edu/%7Eshervine/teaching/cs-229) Español

Probabilidades y Estadísticas Álgebra Lineal y Cálculo

Repaso de Álgebra Lineal y Cálculo Star 8,535

Contenido original por Afshine Amidi (https://twitter.com/afshinea) y Shervine Amidi


(https://twitter.com/shervinea)
Traducido por Fernando González-Herrera. Revisado por Fernando Diaz, Gustavo Velasco-Hernández y Juan P. Chavat.

Notaciones Generales

Definiciones
Vector ― Sea x un vector con n entradas, donde x es la i-ésima entrada:
n
∈ R i ∈ R

https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 1/13
26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

x1
⎛ ⎞
x2
⎜ ⎟ n
x = ⎜ ⎟ ∈ R
⎜ ⎟
⎜ ⋮ ⎟

⎝ ⎠
xn

Matriz ― Sea A una matriz con m filas y n columnas; donde A es el valor


m×n
∈ R i,j ∈ R

ubicado en la i-ésima fila y la j-ésima columna:

A1,1 ⋯ A1,n
⎛ ⎞
m×n
A = ⎜ ⋮ ⋮
⎟ ∈ R
⎜ ⎟

⎝ ⎠
Am,1 ⋯ Am,n

Observación: el vector x definido arriba puede ser visto como una matriz n × 1 y es
particularmente llamado vector-columna.

Matrices principales

https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 2/13
26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

Matriz identidad ― La matriz identidad I es una matriz cuadrada con valores 1 en su


n×n
∈ R

diagonal y ceros en el resto:

1 0 ⋯ 0
⎛ ⎞

⎜ ⎟
⎜0 ⋱ ⋱ ⋮ ⎟
I = ⎜ ⎟
⎜ ⎟
⎜ ⎟
⎜ ⋮ ⋱ ⋱ 0⎟
⎝ ⎠
0 ⋯ 0 1

Observación: para todas las matrices A , se cumple que A × I .


n×n
∈ R = I × A = A

Matriz diagonal ― Una matriz diagonal D ∈ R es una matriz cuadrada con valores
n×n

diferentes de zero en su diagonal y cero en el resto:

d1 0 ⋯ 0
⎛ ⎞

⎜ ⎟
⎜ 0 ⋱ ⋱ ⋮⎟
D = ⎜ ⎟
⎜ ⎟
⎜ ⎟
⎜ ⋮ ⋱ ⋱ 0 ⎟
⎝ ⎠
0 ⋯ 0 dn

https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 3/13
26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

Observación: también se denota D como diag(d 1, . . . , dn ) .

Operaciones de matrices

Multiplicación
Vector-vector ― Hay dos tipos de multiplicaciones vector-vector:

- Producto interno: para x, y , se tiene que:


n
∈ R

T
x y = ∑ x i yi ∈ R

i=1

- Producto diádico : para x ∈ R


m
,y ∈ R
n
, se tiene que:

https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 4/13
26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

x 1 y1 ⋯ x 1 yn
⎛ ⎞
T m×n
xy = ⎜
⎜ ⋮ ⋮
⎟ ∈ R

⎝ ⎠
x m y1 ⋯ x m yn

Matriz-vector ― El producto de la matriz A ∈ R


m×n
y el vector x ∈ R
n
, es un vector de
tamaño R ; tal que:
m

T
a x
⎛ r,1 ⎞
n

⎜ ⎟ m
Ax = ⎜ ⎟ = ∑ ac,i xi ∈ R
⎜ ⋮ ⎟
i=1
⎝ T ⎠
ar,m x

donde a T

r,i
son los vectores fila y a c,j son los vectores columna de A, y x son las entradas de i

x .

Matriz-matriz ― El producto de las matrices A yB es una matriz de


m×n n×p
∈ R ∈ R

tamaño R , tal que:


n×p

https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 5/13
26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

T T
a bc,1 ⋯ a bc,p
⎛ r,1 r,1 ⎞
n

⎜ ⎟ T n×p
AB = ⎜ ⎟ = ∑ ac,i br,i ∈ R
⎜ ⋮ ⋮ ⎟
i=1
⎝ T T ⎠
ar,m bc,1 ⋯ ar,m bc,p

donde a T

r,i
,b
T

r,i
son los vectores fila y a c,j , bc,j son los vectores columna de A y B
respectivamente.

Otras operaciones
Transpuesta ― La transpuesta de una matriz A ∈ R
m×n
, denotada A , es tal que sus
T

entradas se intercambian de la siguiente forma:

T
∀i, j, A = Aj,i
i,j

Observación: dadas las matrices A, B, se cumple que (AB) T


= B
T
A
T
.

https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 6/13
26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

Inversa ― La inversa de una matriz cuadrada invertible A es denotada como A −1


y es la única
matriz tal que:

−1 −1
AA = A A = I

Observación: no todas las matrices cuadradas son invertibles. Además, para las matrices A, B, se
cumple que (AB) = B A . −1 −1 −1

Traza ― La traza de una matriz cuadrada A, denotada tr(A), es la suma de los elementos en
su diagonal:

tr(A) = ∑ Ai,i

i=1

Observación: dadas las matrices A, B, se cumple que tr(A T


) = tr(A) y tr(AB) = tr(BA) .

Determinante ― El determinante de una matriz cuadrada A , denotado |A| o det(A),


n×n
∈ R

es expresado recursivamente en términos de A ∖i,∖j


, que es la matriz A sin su i-ésima fila ni su
j -ésima columna, de la siguiente forma:

https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 7/13
26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

i+j
det(A) = |A| = ∑ (−1) Ai,j |A∖i,∖j |

j=1

Observación: A es invertible si y solo si |A| ≠ 0 . Además, |AB| = |A||B| y |A T


| = |A| .

Propiedades de matrices

Definiciones
Descomposición simétrica ― Una matriz dada A puede ser expresada en términos de sus
partes simétricas y antisimétricas de la siguiente forma:

T T
A + A A − A
A = +
2 2
 

é
Sim trica é
Antisim tricas

Norma ― Una norma (o módulo) es una función N : V ⟶ [0, +∞[ donde V es un vector
espacial tal que para todo x, y ∈ V , se cumple que:
https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 8/13
26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

- N (x + y) ⩽ N (x) + N (y)

- N (ax) = |a|N (x) siendo a un escalar


- si N (x) = 0 , entonces x = 0

Para x ∈ V , las normas comúnmente utilizadas se resumen en la siguiente tabla:

Norma Notación Definición Caso de uso


n

Manhattan, L 1
||x||
1
∑ |xi | LASSO
i=1

 n

Euclidean, L 2
||x||
2
∑ x 2
i
Ridge

i=1

n p

p -norma, L p
||x||
p (∑ x )
p

i
Desigualdad de Hölder
i=1

Infinito, L ∞
||x||

max  |xi | Convergencia
i

https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 9/13
26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

Dependencia lineal ― Un conjunto de vectores se dice que es linealmente dependiente si


uno de los vectores del conjunto puede ser definido como una combinación lineal de los
restantes.

Observación: si ningún vector puede ser escrito de esta forma, entonces se dice que los vectores
son linealmente independientes.

Rango matricial ― El rango de una matriz dada A es denotado rank(A) y es la dimensión


del espacio vectorial generado por sus columnas. Esto es equivalente al máximo número de
columnas linealmente independientes de A.

Matriz semi-definida positiva ― Una matriz A ∈ R


n×n
es semi-defininda positiva (PSD), lo
cual se denota como A ⪰ 0 , si se cumple que:

T n T
A = A  y  ∀x ∈ R , x Ax ⩾ 0

Observación: de igual forma, una matriz A se dice definida positiva, lo cual se denota con A ≻ 0

, si es una matriz PSD que satisface para todos los vectores x diferentes de cero, x Ax > 0. T

https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 10/13
26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

Valor propio, vector propio ― Dada una matriz A ∈ R


n×n
, λ se dice que es un valor propio
(eigenvalue, en inglés) de A si existe un vector z ∈ R ∖{0}
n
, llamado vector propio
(eigenvector, en inglés), tal que:

Az = λz

Teorema espectral ― Sea A ∈ R


n×n
. Si A es simétrica, entonces A es diagonalizable a través
de una matriz real ortogonal U ∈ R
n×n
. Denotando Λ = diag(λ1 , . . . , λn ) , se tiene que:

T
∃Λ diagonal, A = U ΛU

Descomposición en valores singulares ― Para una matriz dada A de dimensiones m × n, la


descomposición en valores singulares (SVD, por sus siglas en inglés de Singular-Value
Decomposition) es una técnica de factorización que garantiza la existencia de las matrices U
m × m unitaria, Σ m × n diagonal y V n × n unitaria, tal que:

T
A = U ΣV

https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 11/13
26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

Cálculo de matrices
Gradiente ― Sea f : R
m×n
→ R una función y A ∈ R
m×n
una matriz. El gradiente de f con
respecto a A es una matriz de m × n, denotada por ∇ A f (A) , tal que:

∂f (A)
(∇A f (A)) =
i,j ∂Ai,j

Observación: el gradiente de f se define únicamente cuando f es una función que retorna un


escalar.

Hessiana ― Sea f : R → R una función y x ∈ R un vector. La hessiana de f con recpecto


n n

a x es una matriz simétrica n × n, denotada ∇ f (x), tal que: 2


x

2
∂ f (x)
2
(∇x f (x)) =
i,j ∂xi ∂xj

Observación: la matriz hessiana de f se define únicamente cuando f es una función que


devuelve un escalar.

https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 12/13
26/6/2019 CS 229 - Repaso de Álgebra Lineal y Cálculo

Operaciones de gradiente ― Dadas las matrices A, B, C , las siguientes propiedades de


gradiente merecen ser tenidas en cuenta:

T T
∇A tr(AB) = B ∇AT f (A) = (∇A f (A))

T T T −1 T
∇A tr(ABA C) = CAB + C AB ∇A |A| = |A|(A )

 (https://twitter.com/shervinea)  (https://linkedin.com/in/shervineamidi) 
(https://github.com/shervinea)  (https://scholar.google.com/citations?user=nMnMTm8AAAAJ)

https://stanford.edu/~shervine/l/es/teaching/cs-229/repaso-algebra-lineal-calculo 13/13

Potrebbero piacerti anche