Algebra Conr

ÁLGEBRA LINEAL
CON
A.E. Darghan
Estas notas tienen dos objetivos: 1) Introducir al álgebra lineal (vectores y
matrices) y 2) manipular estos conceptos en el entorno R.
Fueron escritas con el propósito de utilizar del entorno R las operaciones
matriciales necesarias para el curso de Métodos Multivariados, por lo
que no pueden ser consideradas adecuadas para un curso de álgebra
Lineal
Un vector columna es una lista de números apilados uno encima del otro,
por ejemplo:
Un vector fila es una lista de números apilados uno encima del otro, por
ejemplo:
En ambos casos, la lista está ordenada, es decir,

De ahora en adelante se hará la siguiente convención:
• En lo que sigue todos los vectores son vectores columna a menos que se
indique lo contrario.
• Sin embargo, como escribir vectores columna ocupa más espacio que
escribir los vectores fila, escribiremos con frecuencia vectores como
vectores fila, pero con el entendimiento de que realmente es un vector
columna.
En general, un n-vector tiene la forma:
donde a1,a2,…,an suelen ser números. Este vector puede escribirse como:
Una representación gráfica de 2-vectores se muestra la Figura 1. Tenga en
cuenta que vectores fila y columna se dibujan del mismo modo.
Figura 1, Dos vectores

Script
Consola
Figura 2, Un vector en R-Studio
Se escribió el código en el Script de R y el resultado se ilustra en consola
El vector aparece impreso "en formato de fila", pero en realidad puede ser
considerado como un vector columna, por la convención anterior.

Transpone
r
La transposición de un vector significa convertir un vector columna (fila) en un
vector fila(columna).
La transposición se denota con “T“ como superíndice.
De ahí que la doble transposición nos lleva de vuelta al punto de partida:

Transpone
r
Script
Consola
Figura 3, Transposición de un vector en R-Studio

Multiplicar un escalar (número) por un vector
Si a es un vector y α (alfa) es un número, se tiene que aα es el vector:
Ejemplo 1
Figura 4, Multiplicación por un escalar en R-Studio

Multiplicar un escalar (número) por un vector
Figura 5, Un vector multiplicado por el escalar 2.

Sean a y b sea n-vectores (vectores de n elementos). La suma a + b es también un
n-vector. No olviden que se pueden sumar vectores de la misma dimensión. Es
decir, del mismo número de filas o de columnas.
Ejemplo 2
Figura 6, Suma de dos Vectores en R-Studio
Sean a = (a1, . . . , an) y b = (b1, . . . , bn). El producto punto de dos vectores
a y b se define como:
El producto punto de dos vectores de igual dimensión genera un

escalar
Ejemplo 3
Note que en R el solo uso

del asterisco para la
multiplicación rinde otro
vector, pues multiplica
elemento por
elemento, por lo que es
necesario usar la función
sum para que genere el
resultado deseado.
Figura 7, Producto de dos Vectores en R-Studio

La longitud de un vector (módulo o norma) se expresa como:
Esta notación puede resultar confusa, pues si el vector “a “ es un vector
columna, no podrían multiplicarse ambos vectores pues se necesitaría
transponer el Primero y luego sí multiplicar por el segundo, sin embargo, la no
Distinción de vector Fila o columna permite esto en R, además de otras formas.

Figura 7, Módulo de un Vector en R-Studio
A medida que avancemos recortaremos las líneas de código en R para
lograr estas operaciones, pues habrán otras que requerirán más
elaboradas estrategias.
Ejemplo 4 En R podemos dibujar vectores y su suma
Script
Figura 8, Suma de vectores

Gráficos
Programado en R-Studio
Entendiendo las líneas para el generar el gráfico R
• La función NA indica que no se hará gráfico alguno

• xlim=c(0,5) rendirá el rango de oscilación de la coordenada x
• ylim=c(0,5) rendirá el rango de oscilación de la coordenada y
• xlab=“x” mostrará el texto asociado a la coordenada x
• ylab=“y” mostrará el texto asociado a la coordenada y
• lwd=2 rinde el ancho de la línea
La primera línea de programación genera

El cuadrante donde serán dibujados
Los vectores
Figura 9, Cuadrante para el gráfico en R-Studio

• La función with es una función genérica para evaluar expresiones, la cual se

une a la sentencia anterior, la que generó el cuadrante
• vecs será el nombre que se dará a las flechas que indicarán los vectores.
• mapply genera una lista multivariante con las funciones o argumentos dados,
en este caso se desean flechas con color de cierto ancho.
• lwd=2 rinde el ancho de las flechas
Figura 10, Vectores en R-Studio

• La última línea agrega las etiquetas a los vectores en las posiciones deseadas,
de modo que no se solapen con las flechas.
Figura 11, Vectores en R-Studio ( el vector suma se genera por defecto)

El 0-vector y el 1-vector son vectores con entradas todas nulas o todos
unos respectivamente. El vector nulo usualmente se escribe como 0 y con
1 (a veces J) al vector unitario. En ocasiones se usa el subíndice n para
indicar las filas del vector.
La función rep indica cuantas veces
Se repetirá el primer argumento
Figura 11, Vectores nulo y unitario en R-Studio

Dos vectores v1 y v2 son ortogonales si su producto interno es cero, lo que
se escribe como:
Tenga en cuenta que cualquier vector es ortogonal al vector nulo.
Para entrar ya en la creación de funciones en R , se introducirá una función
que permite calcular el ángulo entre dos vectores.

Figura 12, Cálculo del ángulo entre dos vectores
Se creó la función “angulo” , la cual pide como parámetros a los vectores u y v.
Una mirada a la ecuación previa, notará que se requiere del producto punto de
Los vectores y de las longitudes de ellos (normas)
En la variable phi se guardará el arco-coseno del cociente del producto punto
Y el producto de las normas como un valor númerico.
Cerrada la función se Introducen el par de vectores y se pide el ángulo usando la
función creada. En consola aparece el valor aproximadamente cero.
(son ortogonales).
Una matriz A de dimensión m × n (m filas y n columnas) es un arreglo con
entradas en las m filas y las n columnas.
Una entrada en la fila i y columna j puede denotarse con aij . En la matriz A,
i=1,2,…,m y J=1,2,…, n, es decir, posee m filas y n columnas
Tenga en cuenta que se puede considerar la matriz como un conjunto de n
vectores columna uno tras otro.

Para crear la matriz en R
hacemos:
Figura 13, Creación de una matriz
Note que se introdujeron los números en forma lineal pero se pidieron tres
columnas, esto obliga automáticamente a tener dos filas, por lo que va leyendo de
dos en dos para ponerlos en columnas. Para leerlos por fila hacemos:
Figura 14, Creación de una matriz
por sus filas.
Para algunas personas es más fácil crear (pequeñas) matrices usando la
función rbind porque se introducen los números que aparecen en la matriz del
Modo como se va leyendo.
Noten el signo “+” en el script, esto se
usa
cuando se corta una sentencia para
escribirla en la siguiente línea.

Figura 14, Creación de una matriz con rbind
multiplicadas por un número
Para un número α (alfa) y una matriz A, el producto α A es una matriz que se
obtiene multiplicando cada elemento de A por el escalar α.
Ejemplo 5
Figura 15, Producto escalar y matriz en R

Transpuestas
Al igual que en los vectores, la transposición en este caso cambiará filas por
columnas. Se denotará del mismo modo, a saber con la letra T como
superíndice.
Ejemplo 6
Figura 16, Matriz transpuesta en R

Suma de Matrices
Sean A y B dos matrices de dimensión m×n. La suma de A + B es la matriz de
dimensión m × n obtenida se sumar elemento por elemento de una misma
posición, entre matrices diferentes.
Ejemplo 7
Suma de Matrices
Se creó una matriz C de dimensión

diferente para conocer un error común
en muchos paquetes de estadística
“arreglos no conformables”
La matriz C no puede sumarse con A,
pues la primera es de dimensión 2 ×2
y la segunda 3×2.
Figura 17, Suma de matrices en R

Multiplicación de matriz con vector
Sea A una matriz r × c, y sea b un vector columna c dimensional. El producto es la
matriz Ab , la cual es conformable, pues A tiene c filas y el vector también. No
podría obtenerse bA por no ser conformables.
La multiplicación se desarrolla tal como se indica a continuación:

Multiplicación de matriz con vector
Ejemplo 8
Note que se dieron una matriz

D y un vector e, al pedir D*e,
no coincide con el resultado del
ejemplo 8. Se debe al operador, ahora
debe usarse %*% y no solo asterisco.
El resultado aunque no es erróneo,
genera la multiplicación de cada fila
de D por los elementos (elemento a
elemento) del vector e. Este
resultado
es igual si se conmuta el vector por la
matriz con solo asterisco.
Finalmente, la multiplicación con el
nuevo operador introducido
conmutando el vector con la matriz
genera error por lo no conformable de
la operación.
Figura 18, Producto matriz con vector en R
Multiplicación de matrices
Sea A una matriz r × c y B una matriz de dimensión c × t , A. B es la matriz de
dimensión r × t dada por:
Note como A se multiplica por todos los vectores columna de B tal como se explicó
anteriormente.
Ejemplo 9
La multiplicación es comformable si la primera matríz tiene igual cantidad de

columnas que filas en la segunda matriz. La matriz resultante es de dimensión
Igual a las filas de la primera con las columnas de la segunda.
Multiplicación de matrices
Figura 18, Producto de matrices en R
Los vectores se pueden manipular como matrices de una sola columna

Matrices Especiales
Cuadrada Igual cantidad de filas

como de columnas
Matriz cuya transpuesta

es igual a la original
Simétrica
Nula Matriz con todas las

entradas cero (0)
Unitaria Matriz con todas las

entradas cero (1)
Matrices Especiales
Diagonal No nulos solo en la

diagonal principal
Matriz diagonal con solo

Identidad unos en la diagonal
principal.
Definida Positiva
Matriz A (m ×n) que premultiplicada por un vector de m filas y

postmultiplicada por el mismo vector, rinde un escalar mayor que
cero.
Matrices Especiales en R
Script
Traza de una matriz
Algunos operadores para usar en matrices requieren de librerias que facilitan

su obtención. Uno de estos es la traza de una matriz, la cual requiere de la
Librería {psych} la cual se debe instalar del siguiente modo (así con todas las
Otras).
Figura 19, Instalación de librerías o paquetes

Traza de una matriz
Continuando, ahora cuando se empieza a escribir el nombre de

la librería, aparecen otras que inician sus nombres con las mismas
letras . En este caso seleccionamos
{psych} y hacemos clic al botón de
instalar y empieza el proceso. el
sistema genera al final un mensaje
del éxito de la instalación.
Figura 20, Seleeción de la librería de interés

Traza de una matriz
Nos movemos al ambiente
donde aparecen los paquetes
instalados, allí activamos
la de interés, o lo hacemos
directamente en el script. Figura 21, Activando librería {psych}
Con la librería activa, procedemos al cálculo de la traza,
la cual es la suma de los elementos de la diagonal principal.

Traza de una matriz
Aquí usamos una secuencia de números
de1 1 al 16, pero al pedir cuatro columnas
rinde una matriz cuadrada a la cual sí
podemos calcular la traza.
Se aprovechó la matriz para introducir
dos funciones que permiten calcular la
dimensión de la matriz pidiendo el
número de filas (nrow) y el número de

Figura 22, Traza de la matriz
columnas (ncol), con lo que se verificó que
la matriz es cuadrada 4 ×4.

Aspectos sobre Inversas de matrices
En el caso de una matriz 2 × 2 , la inversa resulta sencilla. Cuando:
la inversa viene dada por:
De hecho, aplicando algunas reglas antes mencionadas, se tiene que:
Siempre que ab – ac ≠ 0. El número ab - bc se llama el determinante de A, a

veces escrito | A | o det (A). Una matriz A tiene una inversa si y sólo si | A | ≠ 0.
Si | A | = 0, entonces A no tiene inversa, lo que ocurre si y sólo si las columnas de
A son linealmente dependientes.
Aspectos sobre Inversas de matrices
Ambos operadores, rango y determinante de una matriz se pueden calcular en R.

El rango requiere de la librería {Matrixcalc} y el determinante requiere de la
función det .
Figura 22, Rango y
Determinante de una matriz.
A pesar de ser una matriz de 4 × 4, su rango es dos, por lo que su determinante

será nulo, pues el rango debe dar 4, igual al número de columnas Independientes.
Como puede verse, el determiante es nulo.
Inversa de una matriz
Se creó una matriz D cuadrada,
se pidió su inversa.
Finalmente se multiplicó la
inversa por la matriz original
para verificar que rinde una
matriz identidad.
Figura 23, Inversa de una matriz

Inversa Generalizada de una matriz
En estadística es relativamente No todas las matrices cuadradas tienen
frecuente encontrar que no es una inversa - sólo los de rango completo.
posible invertir una matriz por Sin embargo todas las matrices (no solo
el método usual, por lo que se cuadradas) tienen un número infinito de
requiere de otro tipo de inversa, inversas generalizadas. Una inversa
conocida como inversa generalizada (G-inversa) de una matriz A
generalizada. es una matriz que satisface:

Inversa Generalizada de una matriz
Con la función ginv dentro de la librería
{MASS} obtenemos la inversa deseada.
Con la operación de triple multiplicación
se verifica que:
Figura 24, Inversa generalizada de una matriz

Organización de los DATOS
Vectores y Matrices Usuales en Métodos Multivariados
Vector de Medias
Muestrales
Matriz de Varianza y Covarianzas

Muestrales
Matriz de Correlaciones
Muestrales
Propiedades de Matrices
Valores y Vectores propios de una Matriz
Considere una matriz A de dimensión p × p . Si existe un escalar λ escalar y

un vector γ tal que:
entonces
λ es llamado el valor propio de A
γ es llamado el vector propio de A
Se puede demostrar que un valor propio λ es una raíz del p-ésimo orden del
polinomio | A - λIp | = 0. Por lo tanto, hay hasta p autovalores λ1, λ2,. . . , λp de A.
Para cada valor propio hay un vector propio correspondiente .
Valores y Vectores propios de una Matriz
El determinante | A | y la traza de A se pueden reescribir en términos de los

valores propios:
Otras Propiedades de Matrices

Otras Propiedades de Matrices
Obteniendo a partir de Matrices y Vectores
Los vectores de Medias, Matrices de Covarianzas y
Matrices de Correlaciones
Es una matriz diagonal con elementos

Cálculos en R
Matriz de datos: 10 mediciones de 4 variables medidas en el suelo
Guardado de la matriz de datos en Excel: Escritorio de Mi PC
El archivo se llamó suelos.txt

Se guardó en el escritorio de
Mi PC, como texto delimitado
por tabulaciones.
Puede usarse una carpeta

Para todo el curso si se desea.
Cálculos en R
Importando el archivo desde excel
En el ambiente aparece un botón para importar conjuntos de datos, en este caso

despliego “como archivo de texto”
Figura 25, Importando datos de
Excel a R
Como los datos tienen rótulos se

activa el botón “Heading”, se verifica
el separador de decimales y se hace
clic al botón de importar.
Cálculos en R
Importando el archivo desde excel
Ya en R la matriz se visualiza del siguiente modo:
Figura 25, Matriz de datos en R
Podemos ahora utilizar esta matriz para nuestros cálculos sin tener que introducirla
necesariamente con comandos.
Se puede abrir ahora un script para introducir las líneas que permitirán calcular
El vector de medias, las matrices de varianzas y covarianzas y la de correlaciones.
Cálculos en R
Figura 26, Vector de Medias y
Matrices S y R en R
Cálculos en R
Matriz de Covarianza Insesgada y la Función Cov
Cuando querramos usar funciones que calculen matrices de varianzas y covarianzas

podemos usar la función cov , por ejemplo con el método Pearson, para obtener la
matriz de varianzas y covarianzas insesgada (en lugar de dividir por n se divide por
n-1 la matriz S obtenida en los pasos anteriores de modo matricial. Aquí presento
la equivalencia de resultados en R.
Figura 27. Matriz de Varianzas
y covarianzas insesgada y su
equivalente en R usando la
función cov
Cálculos en R
Invertir la Matriz de covarianzas con la función solve
Es muy frecuente la necesidad de invertir la matriz de varianzas y covarianzas,

Por lo que recomiendo el uso de la función solve para obtener resultados rápidos
Figura 28. Matriz de Varianzas de Pearson Invertida

Cálculos en R
Particionando Matrices
También es muy frecuente la necesidad de particionar una matriz , ya que
pudiera tenerse que cierta cantidad de los datos pertenecen a una muestra
y el remanente a otra muestra.
Suponga que en la matriz X que hemos estado trabajando, las primeras 5
filas se corresponden con muestras en el primer horizonte del suelo (0 a 10 cm)
y el resto provienen de una profundidad de (10 a 20 cm).
Aquí resultaría de interés tener todas las estadísticas calculadas para cada
profundidad, por lo que usando las funciones solve y cov podemos calcular
Nuevamente las estadísticas multivariadas para cada profundidad haciendo
la partición respectiva.
Cálculos en R
Figura 29. Partición de la Matriz X

Cálculos en R
Esta partición involucra dos

variables en cada parte.
la que necesitamos involucra
las 4, pero en dos muestras.
Figura 30. Partición de la Matriz de Covarianzas (COVAR)

Cálculos en R
La partición que necesitamos es entre muestras, es decir, las 5 primeras

filas y las restantes con las cuatro variables, para que rinda dos matrices
De varianzas y covarianzas S1 y S2 , una para cada muestra.
Agregando una nueva columna de datos
Para generar la partición necesitamos agregar una columna que codifique

las muestras, es decir, que actúe como factor con dos niveles, algo como
Un vector de la siguiente forma:
(1,1,1,1,1,2,2,2,2,2)
Este lo llamaremos “Muestra”
Los pasos siguiente sirven para realizar esta operación
Cálculos en R
Incoporación de una columna
Figura 31. Creación de una nueva columna a la matriz de datos llamada suelos.txt
Así luce nuestra nueva matriz de datos
Tenemos una nueva columna, pero

la obtención de las dos submatrices
de varianzas y covarianzas (una por
Muestra) requiere de la elección solo
de las variables x1 hasta x4, lo cual se
Logra como se explica a continuación
Figura 32. Matriz de datos suelos.txt
actualizada
Cálculos en R
Selección de variables de datos mediante niveles de un factor
En estadística es importante realizar estadísticas por grupo o por muestra, y no
para todo el conjunto de datos. En este caso se obtendrán las estadísticas por
muestra , lo que incluye a las Matrices de varianzas y covarianzas para cada
muestra, algo que usualmente se necesita en métodos multivariados.
Figura 32. submatrices de datos

Cálculos en R
Submatrices de varianzas y covarianzas
Figura 33. submatrices de varianzas y covarianza

Cálculos en R
Probando la igualdad de las matrices de varianzas y covarianzas
La prueba anterior suele ser un supuesto importante en el contexto

inferencial multivariable, y aunque parece obvia la diferencia, resulta
Importante aprender a ejecutar la prueba, usando como información de
Entrada, las dos matrices de varianzas y covarianzas muestrales, el
Número de variables y el número de observaciones por variable.
Figura 33. submatrices de varianzas y covarianza

Ejercicios para desarrollar en R- parte I
Investigue lo que
significa la palabra
indica con signo de
interrogacción y
usando R haga el
cálculo respectivo.
El símbolo ρ representa al coeficiente de correlación poblacional

Un cuadro de datos es más general que una matriz, en
que las diferentes columnas pueden tener diferentes
modos (numérico, carácter, factores, etc.). Esto es
similar a los conjuntos de datos SAS .
Lista: colección ordenada de objetos (componentes). Una lista permite

reunir una variedad de objetos (posiblemente no relacionados) bajo un
mismo nombre.
El factor almacena los valores
nominales
como un vector de enteros en
el intervalo
[1 ... k]. Si se ordena se
maneja en escala ordinal.
Eliminar elementos (hasta filas y columnas)
A continuación se da la matriz A combinando dos columnas, la primera con números del 1 al 3 y
la segunda con números del 4 al 6, con la matriz de dos columnas con números del 7 al 12,
Luego mediante índices de fila y columna,

se eliminan la primera y segunda fila, con la
tercera y cuarta columna, usando el código:
Para eliminar solo filas o columnas se deja vacío el índice de fila o columna, según sea el caso.
Podemos eliminar filas o columnas usando índices negativos

ELIMINAR UN ELEMENTO
Podemos eliminar solo un elemento y no filas o columnas completas. Esto se logra convirtiendo
la matriz en vector.
Reemplazar valores
Crear arreglos
En ocasiones tenemos datos matriciales a los que debemos incorporar una tarcera
dimensión, por ejemplo, la matriz de datos tenía 4 mediciones de N,P y K, sin embargo,
queremos ver estos datos en dos localidades, por lo que pudiera crear un arreglo que me
Permitiera incorporar las mediciones de N,P y K de una segunda localidad.
Se pidieron 24 números aleatorios

de la distribución normal con
media 5 y desviación estándar 1.
con “dim “ se pidió que se
arreglaran en 3 filas, 4 columnas
ydos tablas.
CONVERTIR EL VECTOR EN UN ARREGLO
Se tenía un vector de 24 mediciones de nitrógeno, con media 6 y desviación típica 1,

luego
Se redimensionó el vector con dim(N) de modo que tuviera 3 filas, cuatro columnas y dos
tablas.
Crear un data frame con vectores
Se crearon los 3 vectores

Uno para localidad, uno para
Las horas de trabajo y otro
Para las fechas. Con la
Variable asesoria.data se creó
el data.frame. Con “str” se
notó la nueva estructura de
los datos y con View se pudo
Viasualizar la tabla generada.
Crear un data frame con vectores
Se crearon los 3 vectores

Uno para localidad, uno para
Las horas de trabajo y otro
Para las fechas. Con la
Variable asesoria.data se creó
el data.frame. Con “str” se
notó la nueva estructura de
los datos y con View se pudo
Viasualizar la tabla generada.
Agregar una columna al data frame y eliminarla al final
Se agregó el vector de los días de trabajo llamado “dias”. Se combino en columnas con el
data frame previo con cbind y al viasualizarlo rindió el data frame que aparece al con una
nueva columna de días. Finalmente con la última fila de código se vuelve a eliminar la
columna agregada para que quede como al principio.
Agregar una columna al data frame y eliminarla al final
Ejecutar el código hasta la línea 8 rinde la matriz completa inicial. La línea 9 elimina la
variable dias y se pide en la diez para confirmar.
La mayoría de las tareas se realizan llamando a una función en R. De hecho, casi
todo lo que hemos hecho hasta ahora está llamando a una función existente que a su
vez lleva a cabo una tarea determinada que resulta en
algún tipo de salida.
Una función puede considerarse como una colección de sentencias y es un de la
clase "función". Uno de los puntos fuertes de R es la capacidad de escribir nuevas
funciones. La forma general de una función viene dada por:

Una función tiene dos ventajas muy agradables en comparación con las
secuencias de comandos (scripts):
• Trabaja con variables de entrada, por lo que pueden usarse diferentes datos.
• Devuelve la salida como un objeto, por lo que puede volver a trabajarse con el
resultado de la función.
Ejemplo: Suponga que se quiere probar la hipótesis Nula de que la media
poblacional normal toma cierto valor μ0 con cierto nivel de confianza. En
otras palabras, verificaremos la plausibilidad de que μ0 sea la media de una
población Normal.
Ordenando la información para realizar la prueba de Hipótesis Ho: μ =μ0
• Se proporcionan los valores que toma la variable de interés en la muestra seleccionada

• Se calculan la media muestral y el error estándar de la media
• Se fija el nivel de confianza para la prueba
• Se calcula el valor crítico para la distribución t-Student
• Se pueden calcular las probabilidades del valor crítico para tres diferentes situaciones
(cola izquierda Ha:<;cola derecha Ha:> y prueba bilateral Ha:≠) para el nivel de confianza
fijado.
• Basado en la probabilidad asociada al valor crítico de la prueba seleccionada, se tona la
decisión de rechazar o no la hipótesis Nula
ASPECTOS TEÓRCOS DE LA PRUEBA
Recordemos la teoría univariada para determinar si un valor específico μ0 es un

valor plausible para la media poblacional μ . Desde el punto de vista de las
pruebas de hipótesis, este problema se puede formular como una prueba
Aquí Ho es la hipótesis nula y H1 es la hipótesis alternativa (a dos colas). Si X1,

X2,…, Xn denota una muestra aleatoria de una población normal, la adecuada
prueba estadística es:
Esta estadística de prueba tiene distribución t-Student con n - 1 grados de

libertad . Rechazamos Ho si μ0 es un valor plausible para μ , si el observado del
estadístico de prueba t calculado excede un específico punto porcentual de la
distribución t con n - 1 g.l. Rechazar Ho cuando | t | es grande es equivalente a
rechazar Ho si t2 es grande
Una vez observados los valores muestrales, el estadístico llega a ser:
Si Ho no se rechaza, llegamos a la conclusión de que μ0 es un valor plausible para

la media de la población normal. ¿Existen otros valores de la media muestral que
también sean compatibles con los datos? ¡La respuesta es sí! De hecho, no es
siempre hay un conjunto de valores plausibles para la maedia de la población
normal.
De la siguiente expresión:
Se obtiene el intervalo de confianza que consiste de todos aquellos valores de la

media μ0 que no serían rechazado a nivel de confianza de la prueba.
Consideremos ahora el problema de determinar si un vector de medias μ0 es un

valor plausible para la media de una distribución Normal Multivariante.
Procediendo de modo análogo al caso univariante, a continuación se presenta

una generalización del estadístico desarrollado por Hotelling :
Y las hipótesis a probar ahora son de forma multivariada:
y del mismo modo, si T2 es “demasiado grande”, entonces es que el vector

de medias muestral dista “demasiado” del vector de medias planteado en
la hipótesis nula.
El estadístico T2 posee distribución
de este modo rechazamos Ho si
Recuerde que el vector de medias muestral se denota en este caso con

y la matriz de varianzas y covarianzas muestral con S.
Evaluación con R del Estadistico T2
Ejemplo: Si teóricamente se conoce que las necesidades medias de

macronutrientes del maíz para una producción de 1000 kg es:
30 Kg N- 15 Kg. P- 25 Kg K , pruebe si los datos que se muestran a
continuación soportan este supuesto
Las estadísticas obtenidas de 20 mediciones para cada variable dieron:

ALGUNAS CORRIDAS EN R: PRUEBA t-STUDENT
ALGUNAS CORRIDAS EN R: PRUEBA T2 para una muestra y 3 variables
NPK-MAIZ

PG 214 LIBRO DE wichern
NPK-MAIZ
Los datos se guardan como MAIZNPK.txt EN EL ESCRITORIO, como testo

delimitado por Tabulaciones.
Luego en R se importan como
tipo Texto.
Verificar los
separadores y
encabezados de la
matriz de datos
Así luce la matriz
importada
Obtenemos la misma salida que

Cuando se introdujo la matriz de datos
INTERVALOS DE CONFIANZA SIMULTÁNEOS
Univariantes
Multivariantes
Univariantes corregidos por Bonferroni

Con la siguiente matriz de datos :
• Cambie la U y T por su último y tercer número de cédula
• Realice la prueba t-Student por variable para valores

hipóteticos de pH:4,T CE =3,6U MO= 2,1T
• Construya los intervalos de confianza para cada variable

(modo univariante)
• Utilice el T2 de Hotelling y pruebe una sola hipótesis

Nula con los valores de pH:4,T CE =3,6U MO= 2,1T
• Construya los intervalos de confianza simultáneos
• Construya los intervalos de Bonferroni
• Use un nivel de confianza del 95%
• Cree un función en R para los intervalos simultáneos

TEST DE HOTELLING- MUESTRAS PAREADAS
MEDIDAS REPETIDAS
En ocasiones tenemos medidas de varias variables (un solo factor entre-sujetos)
pero dos o más mediciones de un factor intra-sujetos (tiempo, espacio).
Por ejemplo, el pH , la Conductividad y el carbono orgánico del suelo es medido
en dos o más tiempos o dos o más profundidades de una misma calicata
(punto de muestreo).
Al test de Hotelling en este caso le competen dolo dos mediciones temporales o

espaciales.
Este test tambien tiene su equivalente univariante en la prueba t-Student de
muestras pareadas. Esta prueba pudiera realizarse solo para contrastar los
Resultados del análisis univariante con la opción multivariante.
Univariante Diferencia de medias
Media y varianza de las

diferencias
InterValo de
Hipótesis Estadístico
Conf.
MEDIDAS REPETIDAS
Multivariante Diferencia de medias

En p variables
Vector de
Diferencias
en p variables
Estadístico
Vector de medias de las Matriz de varianzas y

Diferencias en p variables Covarianzas de las
diferencias
InterValo de Conf.
Distribución del T2 SIMULTÁNEO
Hipótesis
InterValo de Conf. Bonferroni
EJEMPLO :MEDIDAS REPETIDAS
EJEMPLO PARA DESARROLLO EVALUABLE
En los datos del pH, CE y MO, genere en R ,tres variables con distribución
normal, con media 0,2 y desviación 0,1 y reste estas columnas de las
variables dadas originalmente. No ordene las generadas aleatoriamente.
Asuma que las mediciones secundarias se corresponden con la medida

repetida tomada en una segunda profundidad del suelo.
Probar:
TEST DE HOTELLING- MUESTRAS INDEPENDIENTES
Caso 1 : Σ1 = Σ2 Estadístico
Distribución
Ejemplo de Hipótesis
Intervalo Simultáneo
Intervalo Bonferroni
Caso 2 : Σ1 ≠ Σ2 Estadístico
Caso 3 : Σ1 ≠ Σ2
muestras pequeñas Estadístico
Distribución
PROBANDO LA IGUALDAD DE MATRICES DE
VARIANZAS
Y COVARIANZAS –M de Box
1. Instalar para R el paquete BIOTOOLS
2. Definir el conjunto de datos y la variable factor que agrupa los tratamientos
boxM(data, grouping)
La matriz de datos Iris que aparece
en el paquete BIOTOOLS contiene
tres especies de la planta (setosa,
virgínica, versicolor). La última
columna se usa para identificar los
grupos. La matriz es de 5 columnas
y 150 filas. Los datos se llaman IRIS
y están en las primeras 4 columnas,
y en la columna 5 está la variable
que agrupa , por eso el código del
ejemplo es:
Para separar los datos del factor se usa iris[ ,-5] para
eliminar la quinta columna, y con iris[ ,5] se dice que
haga la prueba Σse =Σvi =Σve pues aquí se dispone
de
PROBANDO NORMALIDAD MULTIVARIANTE
Royston
1. Instalar para R el paquete MVN
2. Definir el conjunto de datos y la variable factor que agrupa los tratamientos
roystonTest(data, qqplot = TRUE)

Se usará la matriz de datos Iris que aparece en el paquete BIOTOOLS con las mismas
especies (setosa, virgínica, versicolor), solo que se usará como ejemplo solo los datos de
SETOSA para las 4 variables, por eso, se toman los primeros 50 datos de las columnas 1 a
la 4 con iris[1:50,1:4]
Como la normalidad Univariante No garantiza normalidad Multivariante, se hará una

prueba para probar las Normalidades de cada variable por el Método de Shapiro-Will
Los supuestos Revisados
PROBANDO ATÍPICOS MULTIVARIANTES
1. Instalar para R el paquete MVN
salida
Transformaciones
1. Instalar para R el paquete CAR
Comparación de más de dos TRATAMIENTOS
MANOVA vs. M anovas
MANOVA vs. M anovas
MANOVA vs. M anovas
MANOVA vs. M anovas
MANOVA vs. M anovas
Estadísticos de Prueba
Haciendo pruebas Univariantes en lugar de
multivariantes
Haciendo pruebas Univariantes en lugar de
multivariantes
MANOVA DE DOS VÍAS
MANOVA DE DOS VÍAS
Ejemplo a Desarrollar en Clase/USE SOLO 3
respuestas
1. Cargar la matriz de datos de R llamada IRIS, la cual contiene:
• 150 observaciones, divididas en grupos de 50 datos para cada especie de flor
• 3 especies florales: SETOSA, VIRGÍNICA, VERSICOLOR
• 4 variables respuesta: Largo y Ancho de Sépalos, largo y ancho de Pétalos.
2. Realizar análisis descriptivo (MEDIAS, VARIANZAS, COEFICIENTES DE

VARIACIÓN POR VARIABLE RESPUESTA). Obtener la matriz de varianzas y covarianzas
por especie floral, lo mismo que la matriz de correlaciones.
3. Realizar la prueba de Igualdad de matrices de Varianzas y covarianzas para las
especies florales. Compare en la medida de lo posible, este resultado, con la prueba de
igualdad de Varianzas de Barttlet en el modo univariante (para cada respuesta).
4. Realizar la prueba de Normalidad Multivariable. Compare en la medida de lo
posible, este resultado, con la prueba de normalidad Univariante de Shapiro-Wilk
(para cada respuesta).
5. Detecte observaciones atípicas de modo univariante, bivariante y
multivariante. Compare estos resultados.
respuestas
6, Pruebe la Hipótesis:
y compare el resultado, con las pruebas univariantes con y sin corrección de Bonferroni:
respuestas
7. Con la siguiente expresión, construya los intervalos de confianza simultáneos para
las diferencias de efectos:
La matriz W es la misma matriz E

Ejemplo Propuesto
En un experimento que involucra el uso de sensores remotos, fue medida la

reflectancia espectral en plántulas de tres especies de un año de edad en
varias longitudes de onda durante el crecimiento. Las plántulas fueron
tratadas con un nutriente usual óptimo. Las especies de pino fueron la
(SS,JL,LP). Las dos variables medidas fueron :
X1: % de reflectancia espectral a 560 nm de longitud de onda (verde)
X2: % de reflectancia espectral a 720 nm de longitud de onda (infrarojo
cercano)
Como la medida de reflectancia puede variar de acuerdo a la época de
crecimiento, se tomaron medidas a los 150 (tiempo 1) , 235 (tiempo 2) y 320
(tiempo 3) dias julianos durante la etapa de crecimiento.
1. Realizar análisis descriptivo (MEDIAS, VARIANZAS, COEFICIENTES DE VARIACIÓN POR

VARIABLE RESPUESTA). Obtener la matriz de varianzas y covarianzas por especie, por
tiempo de medición y por tratamiento; lo mismo que la matriz de correlaciones.
2. Realizar la prueba de Igualdad de matrices de Varianzas y covarianzas para las
especies, para tiempos y por tratamientos. Compare en la medida de lo posible, este
resultado, con la prueba de igualdad de Varianzas de Barttlet en el modo univariante
(para cada respuesta).
Ejemplo Propuesto
3. Realizar la prueba de Normalidad Multivariable. Compare en la medida

de lo posible, este resultado, con la prueba de normalidad Univariante
de Shapiro-Wilk (para cada respuesta).
4. Detecte observaciones atípicas de modo univariante, bivariante y
multivariante. Compare estos resultados.
5. Realice el MANOVA y formule las hipótesis de lso efectos principales y de
la interacción. Escriba completamente la tabla del MANOVA. Compare esta
tabla con las tablas del ANOVA que haría para cada respuesta.
• La matriz de datos aparece en la siguiente página.
6. Investigue la forma de graficar residuales del modelo de modo que
pudiera detectarse una presumible dependencia de los datos a causa del
tiempo, pues se trata de la misma unidad experimental medida en 3
tiempos.
7. Realice un gráfico de interacción simultáneo (dos respuestas) tiempo*
especie e interprete la naturaleza de la interacción (si está presente).
8, Del artículo:
Calcule según la metodología que aquí se propone, los parámetros

espectrales: Separabilidad espectral, picos de reflectancia, pendiente, radio
de curvatura y cambio de posición de la absorción.
Ejemplo Propuesto
Código R para el ejercicio a desarrollar en clase
Data IRIS: descriptivas
Data IRIS: varianzas y covarianzas
Data IRIS: Correlaciones
Data IRIS: p-valores en las Correlaciones
Data IRIS: Coeficientes de Variación
Data IRIS: Supuestos (M Box-Normalidad Multivar.)
Data IRIS: Buscando Atípicos
Data IRIS: Varios ANOVAS y supuestos univariantes
Normalidad Univariante
Homocedasticidad Univariante
Diagramas de Caja
ANOVAS
Comparaciones por Pares: Bonferroni
MANOVA-Pillai y Wilks

Algebra Conr

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Algebra Conr

Caricato da

Copyright:

Formati disponibili

ÁLGEBRA LINEAL

matrices) y 2) manipular estos conceptos en el entorno R.

Fueron escritas con el propósito de utilizar del entorno R las operaciones

matriciales necesarias para el curso de Métodos Multivariados, por lo

que no pueden ser consideradas adecuadas para un curso de álgebra

En ambos casos, la lista está ordenada, es decir,

escribir los vectores fila, escribiremos con frecuencia vectores como

vectores fila, pero con el entendimiento de que realmente es un vector

En general, un n-vector tiene la forma:

cuenta que vectores fila y columna se dibujan del mismo modo.

Figura 1, Dos vectores

Figura 2, Un vector en R-Studio

Se escribió el código en el Script de R y el resultado se ilustra en consola

considerado como un vector columna, por la convención anterior.

La transposición se denota con “T“ como superíndice.

De ahí que la doble transposición nos lleva de vuelta al punto de partida:

Figura 3, Transposición de un vector en R-Studio

Figura 4, Multiplicación por un escalar en R-Studio

Figura 5, Un vector multiplicado por el escalar 2.

n-vector. No olviden que se pueden sumar vectores de la misma dimensión. Es

decir, del mismo número de filas o de columnas.

El producto punto de dos vectores de igual dimensión genera un

Note que en R el solo uso

Figura 7, Producto de dos Vectores en R-Studio

Esta notación puede resultar confusa, pues si el vector “a “ es un vector

columna, no podrían multiplicarse ambos vectores pues se necesitaría

transponer el Primero y luego sí multiplicar por el segundo, sin embargo, la no

Distinción de vector Fila o columna permite esto en R, además de otras formas.

A medida que avancemos recortaremos las líneas de código en R para

lograr estas operaciones, pues habrán otras que requerirán más

Figura 8, Suma de vectores

• La función NA indica que no se hará gráfico alguno

La primera línea de programación genera

Figura 9, Cuadrante para el gráfico en R-Studio

• La función with es una función genérica para evaluar expresiones, la cual se

Figura 10, Vectores en R-Studio

de modo que no se solapen con las flechas.

Figura 11, Vectores en R-Studio ( el vector suma se genera por defecto)

unos respectivamente. El vector nulo usualmente se escribe como 0 y con

1 (a veces J) al vector unitario. En ocasiones se usa el subíndice n para

indicar las filas del vector.

La función rep indica cuantas veces

Se repetirá el primer argumento

Figura 11, Vectores nulo y unitario en R-Studio

Tenga en cuenta que cualquier vector es ortogonal al vector nulo.

Para entrar ya en la creación de funciones en R , se introducirá una función

que permite calcular el ángulo entre dos vectores.

entradas en las m filas y las n columnas.

Una entrada en la fila i y columna j puede denotarse con aij . En la matriz A,

i=1,2,…,m y J=1,2,…, n, es decir, posee m filas y n columnas

Tenga en cuenta que se puede considerar la matriz como un conjunto de n

vectores columna uno tras otro.

Figura 13, Creación de una matriz

por sus filas.

Para algunas personas es más fácil crear (pequeñas) matrices usando la

Modo como se va leyendo.

Noten el signo “+” en el script, esto se

cuando se corta una sentencia para

escribirla en la siguiente línea.

Para un número α (alfa) y una matriz A, el producto α A es una matriz que se

obtiene multiplicando cada elemento de A por el escalar α.

Figura 15, Producto escalar y matriz en R

columnas. Se denotará del mismo modo, a saber con la letra T como

Figura 16, Matriz transpuesta en R