Sei sulla pagina 1di 148

ÁLGEBRA LINEAL

CON

A.E. Darghan
Estas notas tienen dos objetivos: 1) Introducir al álgebra lineal (vectores y

matrices) y 2) manipular estos conceptos en el entorno R.

Fueron escritas con el propósito de utilizar del entorno R las operaciones

matriciales necesarias para el curso de Métodos Multivariados, por lo

que no pueden ser consideradas adecuadas para un curso de álgebra

Lineal
Un vector columna es una lista de números apilados uno encima del otro,

por ejemplo:

Un vector fila es una lista de números apilados uno encima del otro, por

ejemplo:

En ambos casos, la lista está ordenada, es decir,


De ahora en adelante se hará la siguiente convención:

• En lo que sigue todos los vectores son vectores columna a menos que se

indique lo contrario.

• Sin embargo, como escribir vectores columna ocupa más espacio que

escribir los vectores fila, escribiremos con frecuencia vectores como

vectores fila, pero con el entendimiento de que realmente es un vector

columna.

En general, un n-vector tiene la forma:

donde a1,a2,…,an suelen ser números. Este vector puede escribirse como:
Una representación gráfica de 2-vectores se muestra la Figura 1. Tenga en

cuenta que vectores fila y columna se dibujan del mismo modo.

Figura 1, Dos vectores


Script

Consola

Figura 2, Un vector en R-Studio

Se escribió el código en el Script de R y el resultado se ilustra en consola

El vector aparece impreso "en formato de fila", pero en realidad puede ser

considerado como un vector columna, por la convención anterior.


Transpone
r
La transposición de un vector significa convertir un vector columna (fila) en un

vector fila(columna).

La transposición se denota con “T“ como superíndice.

De ahí que la doble transposición nos lleva de vuelta al punto de partida:


Transpone
r

Script

Consola

Figura 3, Transposición de un vector en R-Studio


Multiplicar un escalar (número) por un vector
Si a es un vector y α (alfa) es un número, se tiene que aα es el vector:

Ejemplo 1

Figura 4, Multiplicación por un escalar en R-Studio


Multiplicar un escalar (número) por un vector

Figura 5, Un vector multiplicado por el escalar 2.


Sean a y b sea n-vectores (vectores de n elementos). La suma a + b es también un

n-vector. No olviden que se pueden sumar vectores de la misma dimensión. Es

decir, del mismo número de filas o de columnas.

Ejemplo 2
Figura 6, Suma de dos Vectores en R-Studio
Sean a = (a1, . . . , an) y b = (b1, . . . , bn). El producto punto de dos vectores

a y b se define como:

El producto punto de dos vectores de igual dimensión genera un


escalar
Ejemplo 3

Note que en R el solo uso


del asterisco para la
multiplicación rinde otro
vector, pues multiplica
elemento por
elemento, por lo que es
necesario usar la función
sum para que genere el
resultado deseado.

Figura 7, Producto de dos Vectores en R-Studio


La longitud de un vector (módulo o norma) se expresa como:

Esta notación puede resultar confusa, pues si el vector “a “ es un vector

columna, no podrían multiplicarse ambos vectores pues se necesitaría

transponer el Primero y luego sí multiplicar por el segundo, sin embargo, la no

Distinción de vector Fila o columna permite esto en R, además de otras formas.


Figura 7, Módulo de un Vector en R-Studio

A medida que avancemos recortaremos las líneas de código en R para

lograr estas operaciones, pues habrán otras que requerirán más

elaboradas estrategias.
Ejemplo 4 En R podemos dibujar vectores y su suma

Script

Figura 8, Suma de vectores


Gráficos
Programado en R-Studio
Entendiendo las líneas para el generar el gráfico R

• La función NA indica que no se hará gráfico alguno


• xlim=c(0,5) rendirá el rango de oscilación de la coordenada x
• ylim=c(0,5) rendirá el rango de oscilación de la coordenada y
• xlab=“x” mostrará el texto asociado a la coordenada x
• ylab=“y” mostrará el texto asociado a la coordenada y
• lwd=2 rinde el ancho de la línea

La primera línea de programación genera


El cuadrante donde serán dibujados
Los vectores

Figura 9, Cuadrante para el gráfico en R-Studio


Entendiendo las líneas para el generar el gráfico R

• La función with es una función genérica para evaluar expresiones, la cual se


une a la sentencia anterior, la que generó el cuadrante
• vecs será el nombre que se dará a las flechas que indicarán los vectores.
• mapply genera una lista multivariante con las funciones o argumentos dados,
en este caso se desean flechas con color de cierto ancho.
• lwd=2 rinde el ancho de las flechas

Figura 10, Vectores en R-Studio


Entendiendo las líneas para el generar el gráfico R

• La última línea agrega las etiquetas a los vectores en las posiciones deseadas,

de modo que no se solapen con las flechas.

Figura 11, Vectores en R-Studio ( el vector suma se genera por defecto)


El 0-vector y el 1-vector son vectores con entradas todas nulas o todos

unos respectivamente. El vector nulo usualmente se escribe como 0 y con

1 (a veces J) al vector unitario. En ocasiones se usa el subíndice n para

indicar las filas del vector.

La función rep indica cuantas veces

Se repetirá el primer argumento

Figura 11, Vectores nulo y unitario en R-Studio


Dos vectores v1 y v2 son ortogonales si su producto interno es cero, lo que
se escribe como:

Tenga en cuenta que cualquier vector es ortogonal al vector nulo.

Para entrar ya en la creación de funciones en R , se introducirá una función

que permite calcular el ángulo entre dos vectores.


Figura 12, Cálculo del ángulo entre dos vectores
Se creó la función “angulo” , la cual pide como parámetros a los vectores u y v.
Una mirada a la ecuación previa, notará que se requiere del producto punto de
Los vectores y de las longitudes de ellos (normas)
En la variable phi se guardará el arco-coseno del cociente del producto punto
Y el producto de las normas como un valor númerico.
Cerrada la función se Introducen el par de vectores y se pide el ángulo usando la
función creada. En consola aparece el valor aproximadamente cero.
(son ortogonales).
Una matriz A de dimensión m × n (m filas y n columnas) es un arreglo con

entradas en las m filas y las n columnas.

Una entrada en la fila i y columna j puede denotarse con aij . En la matriz A,

i=1,2,…,m y J=1,2,…, n, es decir, posee m filas y n columnas

Tenga en cuenta que se puede considerar la matriz como un conjunto de n

vectores columna uno tras otro.


Para crear la matriz en R
hacemos:

Figura 13, Creación de una matriz

Note que se introdujeron los números en forma lineal pero se pidieron tres

columnas, esto obliga automáticamente a tener dos filas, por lo que va leyendo de

dos en dos para ponerlos en columnas. Para leerlos por fila hacemos:
Figura 14, Creación de una matriz

por sus filas.

Para algunas personas es más fácil crear (pequeñas) matrices usando la

función rbind porque se introducen los números que aparecen en la matriz del

Modo como se va leyendo.

Noten el signo “+” en el script, esto se

usa

cuando se corta una sentencia para

escribirla en la siguiente línea.


Figura 14, Creación de una matriz con rbind
multiplicadas por un número

Para un número α (alfa) y una matriz A, el producto α A es una matriz que se

obtiene multiplicando cada elemento de A por el escalar α.

Ejemplo 5

Figura 15, Producto escalar y matriz en R


Transpuestas

Al igual que en los vectores, la transposición en este caso cambiará filas por

columnas. Se denotará del mismo modo, a saber con la letra T como

superíndice.
Ejemplo 6

Figura 16, Matriz transpuesta en R


Suma de Matrices

Sean A y B dos matrices de dimensión m×n. La suma de A + B es la matriz de

dimensión m × n obtenida se sumar elemento por elemento de una misma

posición, entre matrices diferentes.

Ejemplo 7
Suma de Matrices

Se creó una matriz C de dimensión


diferente para conocer un error común
en muchos paquetes de estadística
“arreglos no conformables”
La matriz C no puede sumarse con A,
pues la primera es de dimensión 2 ×2
y la segunda 3×2.

Figura 17, Suma de matrices en R


Multiplicación de matriz con vector

Sea A una matriz r × c, y sea b un vector columna c dimensional. El producto es la

matriz Ab , la cual es conformable, pues A tiene c filas y el vector también. No

podría obtenerse bA por no ser conformables.

La multiplicación se desarrolla tal como se indica a continuación:


Multiplicación de matriz con vector

Ejemplo 8

Note que se dieron una matriz


D y un vector e, al pedir D*e,
no coincide con el resultado del
ejemplo 8. Se debe al operador, ahora
debe usarse %*% y no solo asterisco.
El resultado aunque no es erróneo,
genera la multiplicación de cada fila
de D por los elementos (elemento a
elemento) del vector e. Este
resultado
es igual si se conmuta el vector por la
matriz con solo asterisco.
Finalmente, la multiplicación con el
nuevo operador introducido
conmutando el vector con la matriz
genera error por lo no conformable de
la operación.
Figura 18, Producto matriz con vector en R
Multiplicación de matrices

Sea A una matriz r × c y B una matriz de dimensión c × t , A. B es la matriz de

dimensión r × t dada por:

Note como A se multiplica por todos los vectores columna de B tal como se explicó

anteriormente.

Ejemplo 9

La multiplicación es comformable si la primera matríz tiene igual cantidad de


columnas que filas en la segunda matriz. La matriz resultante es de dimensión
Igual a las filas de la primera con las columnas de la segunda.
Multiplicación de matrices

Figura 18, Producto de matrices en R

Los vectores se pueden manipular como matrices de una sola columna


Matrices Especiales

Cuadrada Igual cantidad de filas


como de columnas

Matriz cuya transpuesta


es igual a la original
Simétrica

Nula Matriz con todas las


entradas cero (0)

Unitaria Matriz con todas las


entradas cero (1)
Matrices Especiales

Diagonal No nulos solo en la


diagonal principal

Matriz diagonal con solo


Identidad unos en la diagonal
principal.

Definida Positiva

Matriz A (m ×n) que premultiplicada por un vector de m filas y


postmultiplicada por el mismo vector, rinde un escalar mayor que
cero.
Matrices Especiales en R

Script
Traza de una matriz

Algunos operadores para usar en matrices requieren de librerias que facilitan


su obtención. Uno de estos es la traza de una matriz, la cual requiere de la
Librería {psych} la cual se debe instalar del siguiente modo (así con todas las
Otras).

Figura 19, Instalación de librerías o paquetes


Traza de una matriz

Continuando, ahora cuando se empieza a escribir el nombre de


la librería, aparecen otras que inician sus nombres con las mismas
letras . En este caso seleccionamos
{psych} y hacemos clic al botón de
instalar y empieza el proceso. el
sistema genera al final un mensaje
del éxito de la instalación.

Figura 20, Seleeción de la librería de interés


Traza de una matriz

Nos movemos al ambiente

donde aparecen los paquetes

instalados, allí activamos

la de interés, o lo hacemos

directamente en el script. Figura 21, Activando librería {psych}

Con la librería activa, procedemos al cálculo de la traza,

la cual es la suma de los elementos de la diagonal principal.


Traza de una matriz

Aquí usamos una secuencia de números

de1 1 al 16, pero al pedir cuatro columnas

rinde una matriz cuadrada a la cual sí

podemos calcular la traza.

Se aprovechó la matriz para introducir

dos funciones que permiten calcular la

dimensión de la matriz pidiendo el

número de filas (nrow) y el número de


Figura 22, Traza de la matriz
columnas (ncol), con lo que se verificó que

la matriz es cuadrada 4 ×4.


Aspectos sobre Inversas de matrices

En el caso de una matriz 2 × 2 , la inversa resulta sencilla. Cuando:

la inversa viene dada por:

De hecho, aplicando algunas reglas antes mencionadas, se tiene que:

Siempre que ab – ac ≠ 0. El número ab - bc se llama el determinante de A, a


veces escrito | A | o det (A). Una matriz A tiene una inversa si y sólo si | A | ≠ 0.
Si | A | = 0, entonces A no tiene inversa, lo que ocurre si y sólo si las columnas de
A son linealmente dependientes.
Aspectos sobre Inversas de matrices

Ambos operadores, rango y determinante de una matriz se pueden calcular en R.


El rango requiere de la librería {Matrixcalc} y el determinante requiere de la
función det .

Figura 22, Rango y

Determinante de una matriz.

A pesar de ser una matriz de 4 × 4, su rango es dos, por lo que su determinante


será nulo, pues el rango debe dar 4, igual al número de columnas Independientes.
Como puede verse, el determiante es nulo.
Inversa de una matriz

Se creó una matriz D cuadrada,

se pidió su inversa.

Finalmente se multiplicó la

inversa por la matriz original

para verificar que rinde una

matriz identidad.

Figura 23, Inversa de una matriz


Inversa Generalizada de una matriz

En estadística es relativamente No todas las matrices cuadradas tienen

frecuente encontrar que no es una inversa - sólo los de rango completo.

posible invertir una matriz por Sin embargo todas las matrices (no solo

el método usual, por lo que se cuadradas) tienen un número infinito de

requiere de otro tipo de inversa, inversas generalizadas. Una inversa

conocida como inversa generalizada (G-inversa) de una matriz A

generalizada. es una matriz que satisface:


Inversa Generalizada de una matriz

Con la función ginv dentro de la librería

{MASS} obtenemos la inversa deseada.

Con la operación de triple multiplicación

se verifica que:

Figura 24, Inversa generalizada de una matriz


Organización de los DATOS
Vectores y Matrices Usuales en Métodos Multivariados

Vector de Medias
Muestrales

Matriz de Varianza y Covarianzas


Muestrales

Matriz de Correlaciones
Muestrales
Propiedades de Matrices

Valores y Vectores propios de una Matriz

Considere una matriz A de dimensión p × p . Si existe un escalar λ escalar y


un vector γ tal que:

entonces
λ es llamado el valor propio de A
γ es llamado el vector propio de A

Se puede demostrar que un valor propio λ es una raíz del p-ésimo orden del
polinomio | A - λIp | = 0. Por lo tanto, hay hasta p autovalores λ1, λ2,. . . , λp de A.
Para cada valor propio hay un vector propio correspondiente .
Valores y Vectores propios de una Matriz

El determinante | A | y la traza de A se pueden reescribir en términos de los


valores propios:

Otras Propiedades de Matrices


Otras Propiedades de Matrices
Obteniendo a partir de Matrices y Vectores
Los vectores de Medias, Matrices de Covarianzas y
Matrices de Correlaciones

Es una matriz diagonal con elementos


Cálculos en R
Matriz de datos: 10 mediciones de 4 variables medidas en el suelo

Guardado de la matriz de datos en Excel: Escritorio de Mi PC

El archivo se llamó suelos.txt


Se guardó en el escritorio de
Mi PC, como texto delimitado
por tabulaciones.

Puede usarse una carpeta


Para todo el curso si se desea.
Cálculos en R
Importando el archivo desde excel

En el ambiente aparece un botón para importar conjuntos de datos, en este caso


despliego “como archivo de texto”

Figura 25, Importando datos de

Excel a R

Como los datos tienen rótulos se


activa el botón “Heading”, se verifica
el separador de decimales y se hace
clic al botón de importar.
Cálculos en R
Importando el archivo desde excel

Ya en R la matriz se visualiza del siguiente modo:

Figura 25, Matriz de datos en R

Podemos ahora utilizar esta matriz para nuestros cálculos sin tener que introducirla
necesariamente con comandos.
Se puede abrir ahora un script para introducir las líneas que permitirán calcular
El vector de medias, las matrices de varianzas y covarianzas y la de correlaciones.
Cálculos en R

Figura 26, Vector de Medias y

Matrices S y R en R
Cálculos en R
Matriz de Covarianza Insesgada y la Función Cov

Cuando querramos usar funciones que calculen matrices de varianzas y covarianzas


podemos usar la función cov , por ejemplo con el método Pearson, para obtener la
matriz de varianzas y covarianzas insesgada (en lugar de dividir por n se divide por
n-1 la matriz S obtenida en los pasos anteriores de modo matricial. Aquí presento
la equivalencia de resultados en R.

Figura 27. Matriz de Varianzas

y covarianzas insesgada y su

equivalente en R usando la

función cov
Cálculos en R
Invertir la Matriz de covarianzas con la función solve

Es muy frecuente la necesidad de invertir la matriz de varianzas y covarianzas,


Por lo que recomiendo el uso de la función solve para obtener resultados rápidos

Figura 28. Matriz de Varianzas de Pearson Invertida


Cálculos en R
Particionando Matrices

También es muy frecuente la necesidad de particionar una matriz , ya que

pudiera tenerse que cierta cantidad de los datos pertenecen a una muestra

y el remanente a otra muestra.

Suponga que en la matriz X que hemos estado trabajando, las primeras 5

filas se corresponden con muestras en el primer horizonte del suelo (0 a 10 cm)

y el resto provienen de una profundidad de (10 a 20 cm).

Aquí resultaría de interés tener todas las estadísticas calculadas para cada

profundidad, por lo que usando las funciones solve y cov podemos calcular

Nuevamente las estadísticas multivariadas para cada profundidad haciendo

la partición respectiva.
Cálculos en R
Particionando Matrices

Figura 29. Partición de la Matriz X


Cálculos en R
Particionando Matrices

Esta partición involucra dos


variables en cada parte.
la que necesitamos involucra
las 4, pero en dos muestras.

Figura 30. Partición de la Matriz de Covarianzas (COVAR)


Cálculos en R
Particionando Matrices

La partición que necesitamos es entre muestras, es decir, las 5 primeras


filas y las restantes con las cuatro variables, para que rinda dos matrices
De varianzas y covarianzas S1 y S2 , una para cada muestra.

Agregando una nueva columna de datos

Para generar la partición necesitamos agregar una columna que codifique


las muestras, es decir, que actúe como factor con dos niveles, algo como
Un vector de la siguiente forma:
(1,1,1,1,1,2,2,2,2,2)
Este lo llamaremos “Muestra”
Los pasos siguiente sirven para realizar esta operación
Cálculos en R
Incoporación de una columna

Figura 31. Creación de una nueva columna a la matriz de datos llamada suelos.txt

Así luce nuestra nueva matriz de datos

Tenemos una nueva columna, pero


la obtención de las dos submatrices
de varianzas y covarianzas (una por
Muestra) requiere de la elección solo
de las variables x1 hasta x4, lo cual se
Logra como se explica a continuación

Figura 32. Matriz de datos suelos.txt

actualizada
Cálculos en R
Selección de variables de datos mediante niveles de un factor
En estadística es importante realizar estadísticas por grupo o por muestra, y no
para todo el conjunto de datos. En este caso se obtendrán las estadísticas por
muestra , lo que incluye a las Matrices de varianzas y covarianzas para cada
muestra, algo que usualmente se necesita en métodos multivariados.

Figura 32. submatrices de datos


Cálculos en R
Submatrices de varianzas y covarianzas

Figura 33. submatrices de varianzas y covarianza


Cálculos en R

Probando la igualdad de las matrices de varianzas y covarianzas

La prueba anterior suele ser un supuesto importante en el contexto


inferencial multivariable, y aunque parece obvia la diferencia, resulta
Importante aprender a ejecutar la prueba, usando como información de
Entrada, las dos matrices de varianzas y covarianzas muestrales, el
Número de variables y el número de observaciones por variable.

Figura 33. submatrices de varianzas y covarianza


Ejercicios para desarrollar en R- parte I
Ejercicios para desarrollar en R- parte I

Investigue lo que
significa la palabra
indica con signo de
interrogacción y
usando R haga el
cálculo respectivo.
Ejercicios para desarrollar en R- parte I
Ejercicios para desarrollar en R- parte I

El símbolo ρ representa al coeficiente de correlación poblacional


Ejercicios para desarrollar en R- parte I
Ejercicios para desarrollar en R- parte I
Ejercicios para desarrollar en R- parte I
Un cuadro de datos es más general que una matriz, en
que las diferentes columnas pueden tener diferentes
modos (numérico, carácter, factores, etc.). Esto es
similar a los conjuntos de datos SAS .

Lista: colección ordenada de objetos (componentes). Una lista permite


reunir una variedad de objetos (posiblemente no relacionados) bajo un
mismo nombre.
El factor almacena los valores
nominales
como un vector de enteros en
el intervalo
[1 ... k]. Si se ordena se
maneja en escala ordinal.
Eliminar elementos (hasta filas y columnas)
A continuación se da la matriz A combinando dos columnas, la primera con números del 1 al 3 y
la segunda con números del 4 al 6, con la matriz de dos columnas con números del 7 al 12,

Luego mediante índices de fila y columna,


se eliminan la primera y segunda fila, con la
tercera y cuarta columna, usando el código:
Eliminar elementos (hasta filas y columnas)

Para eliminar solo filas o columnas se deja vacío el índice de fila o columna, según sea el caso.
Eliminar elementos (hasta filas y columnas)

Podemos eliminar filas o columnas usando índices negativos


ELIMINAR UN ELEMENTO

Podemos eliminar solo un elemento y no filas o columnas completas. Esto se logra convirtiendo
la matriz en vector.
Reemplazar valores
Crear arreglos

En ocasiones tenemos datos matriciales a los que debemos incorporar una tarcera
dimensión, por ejemplo, la matriz de datos tenía 4 mediciones de N,P y K, sin embargo,
queremos ver estos datos en dos localidades, por lo que pudiera crear un arreglo que me
Permitiera incorporar las mediciones de N,P y K de una segunda localidad.

Se pidieron 24 números aleatorios


de la distribución normal con
media 5 y desviación estándar 1.
con “dim “ se pidió que se
arreglaran en 3 filas, 4 columnas
ydos tablas.
CONVERTIR EL VECTOR EN UN ARREGLO

Se tenía un vector de 24 mediciones de nitrógeno, con media 6 y desviación típica 1,


luego
Se redimensionó el vector con dim(N) de modo que tuviera 3 filas, cuatro columnas y dos
tablas.
Crear un data frame con vectores

Se crearon los 3 vectores


Uno para localidad, uno para
Las horas de trabajo y otro
Para las fechas. Con la
Variable asesoria.data se creó
el data.frame. Con “str” se
notó la nueva estructura de
los datos y con View se pudo
Viasualizar la tabla generada.
Crear un data frame con vectores

Se crearon los 3 vectores


Uno para localidad, uno para
Las horas de trabajo y otro
Para las fechas. Con la
Variable asesoria.data se creó
el data.frame. Con “str” se
notó la nueva estructura de
los datos y con View se pudo
Viasualizar la tabla generada.
Agregar una columna al data frame y eliminarla al final

Se agregó el vector de los días de trabajo llamado “dias”. Se combino en columnas con el
data frame previo con cbind y al viasualizarlo rindió el data frame que aparece al con una
nueva columna de días. Finalmente con la última fila de código se vuelve a eliminar la
columna agregada para que quede como al principio.
Agregar una columna al data frame y eliminarla al final

Ejecutar el código hasta la línea 8 rinde la matriz completa inicial. La línea 9 elimina la
variable dias y se pide en la diez para confirmar.
La mayoría de las tareas se realizan llamando a una función en R. De hecho, casi

todo lo que hemos hecho hasta ahora está llamando a una función existente que a su

vez lleva a cabo una tarea determinada que resulta en

algún tipo de salida.

Una función puede considerarse como una colección de sentencias y es un de la

clase "función". Uno de los puntos fuertes de R es la capacidad de escribir nuevas

funciones. La forma general de una función viene dada por:


Una función tiene dos ventajas muy agradables en comparación con las
secuencias de comandos (scripts):
• Trabaja con variables de entrada, por lo que pueden usarse diferentes datos.
• Devuelve la salida como un objeto, por lo que puede volver a trabajarse con el
resultado de la función.
Ejemplo: Suponga que se quiere probar la hipótesis Nula de que la media
poblacional normal toma cierto valor μ0 con cierto nivel de confianza. En
otras palabras, verificaremos la plausibilidad de que μ0 sea la media de una
población Normal.

Ordenando la información para realizar la prueba de Hipótesis Ho: μ =μ0

• Se proporcionan los valores que toma la variable de interés en la muestra seleccionada


• Se calculan la media muestral y el error estándar de la media
• Se fija el nivel de confianza para la prueba
• Se calcula el valor crítico para la distribución t-Student
• Se pueden calcular las probabilidades del valor crítico para tres diferentes situaciones
(cola izquierda Ha:<;cola derecha Ha:> y prueba bilateral Ha:≠) para el nivel de confianza
fijado.
• Basado en la probabilidad asociada al valor crítico de la prueba seleccionada, se tona la
decisión de rechazar o no la hipótesis Nula
ASPECTOS TEÓRCOS DE LA PRUEBA

Recordemos la teoría univariada para determinar si un valor específico μ0 es un


valor plausible para la media poblacional μ . Desde el punto de vista de las
pruebas de hipótesis, este problema se puede formular como una prueba

Aquí Ho es la hipótesis nula y H1 es la hipótesis alternativa (a dos colas). Si X1,


X2,…, Xn denota una muestra aleatoria de una población normal, la adecuada
prueba estadística es:

Esta estadística de prueba tiene distribución t-Student con n - 1 grados de


libertad . Rechazamos Ho si μ0 es un valor plausible para μ , si el observado del
estadístico de prueba t calculado excede un específico punto porcentual de la
distribución t con n - 1 g.l. Rechazar Ho cuando | t | es grande es equivalente a
rechazar Ho si t2 es grande
ASPECTOS TEÓRCOS DE LA PRUEBA

Una vez observados los valores muestrales, el estadístico llega a ser:

Si Ho no se rechaza, llegamos a la conclusión de que μ0 es un valor plausible para


la media de la población normal. ¿Existen otros valores de la media muestral que
también sean compatibles con los datos? ¡La respuesta es sí! De hecho, no es
siempre hay un conjunto de valores plausibles para la maedia de la población
normal.
De la siguiente expresión:

Se obtiene el intervalo de confianza que consiste de todos aquellos valores de la


media μ0 que no serían rechazado a nivel de confianza de la prueba.
ASPECTOS TEÓRCOS DE LA PRUEBA

Consideremos ahora el problema de determinar si un vector de medias μ0 es un


valor plausible para la media de una distribución Normal Multivariante.

Procediendo de modo análogo al caso univariante, a continuación se presenta


una generalización del estadístico desarrollado por Hotelling :

Y las hipótesis a probar ahora son de forma multivariada:

y del mismo modo, si T2 es “demasiado grande”, entonces es que el vector


de medias muestral dista “demasiado” del vector de medias planteado en
la hipótesis nula.
ASPECTOS TEÓRCOS DE LA PRUEBA

El estadístico T2 posee distribución

de este modo rechazamos Ho si

Recuerde que el vector de medias muestral se denota en este caso con


y la matriz de varianzas y covarianzas muestral con S.
Evaluación con R del Estadistico T2

Ejemplo: Si teóricamente se conoce que las necesidades medias de


macronutrientes del maíz para una producción de 1000 kg es:
30 Kg N- 15 Kg. P- 25 Kg K , pruebe si los datos que se muestran a
continuación soportan este supuesto

Las estadísticas obtenidas de 20 mediciones para cada variable dieron:


ALGUNAS CORRIDAS EN R: PRUEBA t-STUDENT
ALGUNAS CORRIDAS EN R: PRUEBA T2 para una muestra y 3 variables
NPK-MAIZ

ALGUNAS CORRIDAS EN R: PRUEBA T2 para una muestra y 3 variables


PG 214 LIBRO DE wichern
ALGUNAS CORRIDAS EN R: PRUEBA T2 para una muestra y 3 variables
NPK-MAIZ

Los datos se guardan como MAIZNPK.txt EN EL ESCRITORIO, como testo


delimitado por Tabulaciones.
Luego en R se importan como
tipo Texto.

Verificar los
separadores y
encabezados de la
matriz de datos
Así luce la matriz
importada

Obtenemos la misma salida que


Cuando se introdujo la matriz de datos
INTERVALOS DE CONFIANZA SIMULTÁNEOS

Univariantes

Multivariantes
INTERVALOS DE CONFIANZA SIMULTÁNEOS

Univariantes corregidos por Bonferroni


INTERVALOS DE CONFIANZA SIMULTÁNEOS
Con la siguiente matriz de datos :

• Cambie la U y T por su último y tercer número de cédula

• Realice la prueba t-Student por variable para valores


hipóteticos de pH:4,T CE =3,6U MO= 2,1T

• Construya los intervalos de confianza para cada variable


(modo univariante)

• Utilice el T2 de Hotelling y pruebe una sola hipótesis


Nula con los valores de pH:4,T CE =3,6U MO= 2,1T

• Construya los intervalos de confianza simultáneos

• Construya los intervalos de Bonferroni

• Use un nivel de confianza del 95%

• Cree un función en R para los intervalos simultáneos


TEST DE HOTELLING- MUESTRAS PAREADAS
MEDIDAS REPETIDAS
En ocasiones tenemos medidas de varias variables (un solo factor entre-sujetos)
pero dos o más mediciones de un factor intra-sujetos (tiempo, espacio).
Por ejemplo, el pH , la Conductividad y el carbono orgánico del suelo es medido
en dos o más tiempos o dos o más profundidades de una misma calicata
(punto de muestreo).

Al test de Hotelling en este caso le competen dolo dos mediciones temporales o


espaciales.
Este test tambien tiene su equivalente univariante en la prueba t-Student de
muestras pareadas. Esta prueba pudiera realizarse solo para contrastar los
Resultados del análisis univariante con la opción multivariante.

Univariante Diferencia de medias

Media y varianza de las


diferencias
InterValo de
Hipótesis Estadístico
Conf.
TEST DE HOTELLING- MUESTRAS PAREADAS
MEDIDAS REPETIDAS

Multivariante Diferencia de medias


En p variables

Vector de
Diferencias
en p variables
Estadístico

Vector de medias de las Matriz de varianzas y


Diferencias en p variables Covarianzas de las
diferencias
InterValo de Conf.
Distribución del T2 SIMULTÁNEO
Hipótesis
InterValo de Conf. Bonferroni
TEST DE HOTELLING- MUESTRAS PAREADAS
EJEMPLO :MEDIDAS REPETIDAS
TEST DE HOTELLING- MUESTRAS PAREADAS
EJEMPLO PARA DESARROLLO EVALUABLE

En los datos del pH, CE y MO, genere en R ,tres variables con distribución
normal, con media 0,2 y desviación 0,1 y reste estas columnas de las
variables dadas originalmente. No ordene las generadas aleatoriamente.

Asuma que las mediciones secundarias se corresponden con la medida


repetida tomada en una segunda profundidad del suelo.
Probar:
TEST DE HOTELLING- MUESTRAS INDEPENDIENTES
Caso 1 : Σ1 = Σ2 Estadístico

Distribución

Ejemplo de Hipótesis

Intervalo Simultáneo

Intervalo Bonferroni
TEST DE HOTELLING- MUESTRAS INDEPENDIENTES
Caso 2 : Σ1 ≠ Σ2 Estadístico

Ejemplo de Hipótesis
TEST DE HOTELLING- MUESTRAS INDEPENDIENTES
Caso 3 : Σ1 ≠ Σ2
muestras pequeñas Estadístico

Distribución

Ejemplo de Hipótesis
PROBANDO LA IGUALDAD DE MATRICES DE
VARIANZAS
Y COVARIANZAS –M de Box
1. Instalar para R el paquete BIOTOOLS
2. Definir el conjunto de datos y la variable factor que agrupa los tratamientos

boxM(data, grouping)
La matriz de datos Iris que aparece
en el paquete BIOTOOLS contiene
tres especies de la planta (setosa,
virgínica, versicolor). La última
columna se usa para identificar los
grupos. La matriz es de 5 columnas
y 150 filas. Los datos se llaman IRIS
y están en las primeras 4 columnas,
y en la columna 5 está la variable
que agrupa , por eso el código del
ejemplo es:
Para separar los datos del factor se usa iris[ ,-5] para
eliminar la quinta columna, y con iris[ ,5] se dice que
haga la prueba Σse =Σvi =Σve pues aquí se dispone
de
PROBANDO NORMALIDAD MULTIVARIANTE
Royston
1. Instalar para R el paquete MVN
2. Definir el conjunto de datos y la variable factor que agrupa los tratamientos

roystonTest(data, qqplot = TRUE)


Se usará la matriz de datos Iris que aparece en el paquete BIOTOOLS con las mismas
especies (setosa, virgínica, versicolor), solo que se usará como ejemplo solo los datos de
SETOSA para las 4 variables, por eso, se toman los primeros 50 datos de las columnas 1 a
la 4 con iris[1:50,1:4]

Como la normalidad Univariante No garantiza normalidad Multivariante, se hará una


prueba para probar las Normalidades de cada variable por el Método de Shapiro-Will
Los supuestos Revisados
PROBANDO ATÍPICOS MULTIVARIANTES

1. Instalar para R el paquete MVN

salida
Transformaciones
1. Instalar para R el paquete CAR
Comparación de más de dos TRATAMIENTOS
MANOVA vs. M anovas
Comparación de más de dos TRATAMIENTOS
MANOVA vs. M anovas
Comparación de más de dos TRATAMIENTOS
MANOVA vs. M anovas
Comparación de más de dos TRATAMIENTOS
MANOVA vs. M anovas
Comparación de más de dos TRATAMIENTOS
MANOVA vs. M anovas
Comparación de más de dos TRATAMIENTOS
Estadísticos de Prueba
Comparación de más de dos TRATAMIENTOS
Haciendo pruebas Univariantes en lugar de
multivariantes
Comparación de más de dos TRATAMIENTOS
Haciendo pruebas Univariantes en lugar de
multivariantes
Comparación de más de dos TRATAMIENTOS
MANOVA DE DOS VÍAS
Comparación de más de dos TRATAMIENTOS
MANOVA DE DOS VÍAS
Ejemplo a Desarrollar en Clase/USE SOLO 3
respuestas
1. Cargar la matriz de datos de R llamada IRIS, la cual contiene:
• 150 observaciones, divididas en grupos de 50 datos para cada especie de flor
• 3 especies florales: SETOSA, VIRGÍNICA, VERSICOLOR
• 4 variables respuesta: Largo y Ancho de Sépalos, largo y ancho de Pétalos.

2. Realizar análisis descriptivo (MEDIAS, VARIANZAS, COEFICIENTES DE


VARIACIÓN POR VARIABLE RESPUESTA). Obtener la matriz de varianzas y covarianzas
por especie floral, lo mismo que la matriz de correlaciones.
3. Realizar la prueba de Igualdad de matrices de Varianzas y covarianzas para las
especies florales. Compare en la medida de lo posible, este resultado, con la prueba de
igualdad de Varianzas de Barttlet en el modo univariante (para cada respuesta).
4. Realizar la prueba de Normalidad Multivariable. Compare en la medida de lo
posible, este resultado, con la prueba de normalidad Univariante de Shapiro-Wilk
(para cada respuesta).
5. Detecte observaciones atípicas de modo univariante, bivariante y
multivariante. Compare estos resultados.
Ejemplo a Desarrollar en Clase/USE SOLO 3
respuestas
6, Pruebe la Hipótesis:

y compare el resultado, con las pruebas univariantes con y sin corrección de Bonferroni:
Ejemplo a Desarrollar en Clase/USE SOLO 3
respuestas
7. Con la siguiente expresión, construya los intervalos de confianza simultáneos para
las diferencias de efectos:

La matriz W es la misma matriz E


Ejemplo Propuesto

En un experimento que involucra el uso de sensores remotos, fue medida la


reflectancia espectral en plántulas de tres especies de un año de edad en
varias longitudes de onda durante el crecimiento. Las plántulas fueron
tratadas con un nutriente usual óptimo. Las especies de pino fueron la
(SS,JL,LP). Las dos variables medidas fueron :
X1: % de reflectancia espectral a 560 nm de longitud de onda (verde)
X2: % de reflectancia espectral a 720 nm de longitud de onda (infrarojo
cercano)
Como la medida de reflectancia puede variar de acuerdo a la época de
crecimiento, se tomaron medidas a los 150 (tiempo 1) , 235 (tiempo 2) y 320
(tiempo 3) dias julianos durante la etapa de crecimiento.

1. Realizar análisis descriptivo (MEDIAS, VARIANZAS, COEFICIENTES DE VARIACIÓN POR


VARIABLE RESPUESTA). Obtener la matriz de varianzas y covarianzas por especie, por
tiempo de medición y por tratamiento; lo mismo que la matriz de correlaciones.
2. Realizar la prueba de Igualdad de matrices de Varianzas y covarianzas para las
especies, para tiempos y por tratamientos. Compare en la medida de lo posible, este
resultado, con la prueba de igualdad de Varianzas de Barttlet en el modo univariante
(para cada respuesta).
Ejemplo Propuesto

3. Realizar la prueba de Normalidad Multivariable. Compare en la medida


de lo posible, este resultado, con la prueba de normalidad Univariante
de Shapiro-Wilk (para cada respuesta).
4. Detecte observaciones atípicas de modo univariante, bivariante y
multivariante. Compare estos resultados.
5. Realice el MANOVA y formule las hipótesis de lso efectos principales y de
la interacción. Escriba completamente la tabla del MANOVA. Compare esta
tabla con las tablas del ANOVA que haría para cada respuesta.
• La matriz de datos aparece en la siguiente página.
6. Investigue la forma de graficar residuales del modelo de modo que
pudiera detectarse una presumible dependencia de los datos a causa del
tiempo, pues se trata de la misma unidad experimental medida en 3
tiempos.
7. Realice un gráfico de interacción simultáneo (dos respuestas) tiempo*
especie e interprete la naturaleza de la interacción (si está presente).
8, Del artículo:

Calcule según la metodología que aquí se propone, los parámetros


espectrales: Separabilidad espectral, picos de reflectancia, pendiente, radio
de curvatura y cambio de posición de la absorción.
Ejemplo Propuesto
Código R para el ejercicio a desarrollar en clase
Data IRIS: descriptivas
Código R para el ejercicio a desarrollar en clase
Data IRIS: varianzas y covarianzas
Código R para el ejercicio a desarrollar en clase
Data IRIS: Correlaciones
Código R para el ejercicio a desarrollar en clase
Data IRIS: p-valores en las Correlaciones
Código R para el ejercicio a desarrollar en clase
Data IRIS: Coeficientes de Variación
Código R para el ejercicio a desarrollar en clase
Data IRIS: Supuestos (M Box-Normalidad Multivar.)
Código R para el ejercicio a desarrollar en clase
Data IRIS: Buscando Atípicos
Código R para el ejercicio a desarrollar en clase
Data IRIS: Varios ANOVAS y supuestos univariantes
Código R para el ejercicio a desarrollar en clase
Data IRIS: Varios ANOVAS y supuestos univariantes
Normalidad Univariante

Homocedasticidad Univariante
Código R para el ejercicio a desarrollar en clase
Data IRIS: Varios ANOVAS y supuestos univariantes
Diagramas de Caja

ANOVAS
Código R para el ejercicio a desarrollar en clase
Data IRIS: Varios ANOVAS y supuestos univariantes
Comparaciones por Pares: Bonferroni
Código R para el ejercicio a desarrollar en clase
Data IRIS: Varios ANOVAS y supuestos univariantes
MANOVA-Pillai y Wilks

Potrebbero piacerti anche