Sei sulla pagina 1di 5

Gonzalez Federico - R studio - Econometría I

nombre / instalador

library(dplyr) install.packages("dplyr”)

library(tidyverse)

library(moments) install.packages("moments")

library(ggplot2)

library(PoEdata) _install.packages("remotes")
_remotes::install_github("ccol
onescu/PoEdata")

library(readxl) abrir excel

TP 4 mul

library(reshape2) #install.packages("caret")
library(haven)
library(caret)

library(car) install.packages("car")

library(lmtest) install.packages("lmtest") tp6 htero

library(MASS) install.packages("MASS") regression robusta

Cambiar el nombre a una columna del DF xxx <- rename(df1, nombre_viejo = Nuevo_nombre)

valor mínimo de una columna xxx <- min (df1$nombre_de_columna)

valor maximo de una columna xxx <- max (df1$nombre_de_columna)

promedio de una columna xxx <- mean (df1$nombr_columna)

“ xxx <- df_1 %>% summarise(promedio = mean(columna))

Mediana de una columna xxx <- median (df1$nombr_columna)


“ xxx<- df_1 %>% summarise (mediana = median(columna))

Varianza, curtosis, asimetría de una df_1 %>% summarise(varianza = var(columna), curtosis =


columna kurtosis(columna), asimetria = skewness(columna))

Filtrado de una columna Positiva (>0) xxx_positivo <- filter(df_1 , columna> 0 )

Cuenta la cantidad de observaciones xxx_columna <- df_1 %>% count(columna)


repetidas en una columna y crea un df
nuevo

Creación de vectores xxx <- c (numeros)


xxx <- c ( palabras con comiya)

Creo data frame xxx <- data.frame ( vector1 , vector2) misma cantidad de datos

REGRESIÓN mod1 <- lm ( Y ~ X1 + X2 + X3, data = df_que_trabajo)

Resumen del modelo estimado xxx <- summary(mod1)

Guardar los BETAS xxx <- mod1$coefficients

Crear un DF para los objetos para valuar obj_p_valuar <- data.frame(nombre_columna = c(10) , …)
en los BETAs

Valuar el objeto creado en el modelo predict ( mod1, newdata = obj_p_valuar)

crear una variable nueva en un DF a df1[“nombre_de_nueva_var”] <- log


partir de una ya existente. Aplico (df1$variable_q_convierto)
logaritmo

Crear una columna vacia en un DF df [ , “nombre_columna” ] <- NA

LLenar la columna creada a partir de una df $ columna_llenar [ df$ column_condic < 20] <-dato_que
condición _ aparecera _en_la_columna

lo de arriba pero con DOBLE condición [ df$ column_condic >= 20 & df$column_condic < 30]

Crear una columna en un df y llenarlo df[ , “nueva.columna” ] <- log ( df$columna.a.transformar)


con la transformación de una columna
existente. Aplico log

cambio el relleno de la columna de arriba df $ column_llenar [ df $ column_llenar == relleno anterior


<-nuevo_relleno

Crea un DF (nuevo) de la columna de dfNuevo <- df %>% count(columna)


otro DF(original)

Filtrar una columna de DF y mantener df6_B <- df6[df6$Column == 1, ]


todas las demas columnas constante Condicion p filtrar

RESIDUOS de un modelo xxx <- residuals (modelo)

Estimado (Y) de un modelo xxx <- fitted (modelo)


tp 4-------------------------- ---------------------------

matriz de correlación de un df correlacion_df1 <- cor ( df1)

Matriz de correlacion entre las variables correla_df <- round(cor(df1), 2)


indep, con dos decimales

Guarda en una tabla la correlacion entre melted_df1 <- melt(correla_df)


las variables indep

Grafico de matriz de correlacion Ver nota 1

TESTS VIF = 1/1-R^2 > 10 car::vif(mod1) mod1=modelo con log


regresion auxiliar x2 = b1+b3x3+e r <- cuadrado

tp6-------------------------- ---------------------------

Residuos xxx <- resiudals (mod1)

Guardar los residuos en el DF df1 [ , “residuos”] <- residuals (mod1)

plot: res.vs.x1-res.vs.x2-al.cuadrad tmb histo.x1.x2

Calcular Y estimado y guardarlo en DF df1 [ , “Y_hat ] <- predict ( mod, data = df1)

tests white install.packages("lmtest") - library(lmtest)

ej1,-. mod1 <- lm (price ~ sqft + age, data = df1)

valor p >o,o5 A Ho homo bptest(mod1, ~ sqft*age + I(age^2) + I(sqft^2), data = df_1)


chi2 gl=cantidad_indep vs BP

ej2.-.regresion robusta - solución hetero mod2_rob <- rlm(price ~ lotsize + sqrft + bdrms, data = df2)
de ultima instancia summary(mod2_rob)
Para ver la significancia con ltl > 1.96

Gráfico de dispersión xx <- plot( df1$columnaX, df1$columnaY, xlab= “nombreX” ,


Cuando pide la relacion d 2 variables ylab = “nombreY”)

Gráfico de dispersión que une los puntos plot (df$columX, df$columY,type = "b", pch = 19,
con una línea col = "blue", xlab = "dias", ylab = "porcentaje_ocupacion")

Histograma de una columna xx <- ggplot(df_1, aes(x=columna)) + geom_histogram()

Para ver un gráfico guardado plot (nombre del gráfico)

Gráfico de torta pie(df_1_filtrado$columa1, labels = df_1_filtrado$columa2)


Cálculo de porcentaje de cada categoría xxx_pproporcion <- prop.table(df_1_filtrado$n)
NOTA 1: ggplot(data = melted_df1, aes(x=Var1, y=Var2, fill=value)) +
geom_tile() +
geom_text(aes(Var2, Var1, label = value), size = 5) +
scale_fill_gradient2(low = "blue", high = "red",
limit = c(-1,1), name="Correlation") +
theme(axis.title.x = element_blank(),
axis.title.y = element_blank(),
panel.background = element_blank())

Potrebbero piacerti anche