Comando para Econometria Con R Studio

Gonzalez Federico - R studio - Econometría I
nombre / instalador
library(dplyr) install.packages("dplyr”)
library(tidyverse)
library(moments) install.packages("moments")
library(ggplot2)
library(PoEdata) _install.packages("remotes")
_remotes::install_github("ccol
onescu/PoEdata")
library(readxl) abrir excel
TP 4 mul
library(reshape2) #install.packages("caret")
library(haven)
library(caret)
library(car) install.packages("car")
library(lmtest) install.packages("lmtest") tp6 htero
library(MASS) install.packages("MASS") regression robusta
Cambiar el nombre a una columna del DF xxx <- rename(df1, nombre_viejo = Nuevo_nombre)
valor mínimo de una columna xxx <- min (df1$nombre_de_columna)
valor maximo de una columna xxx <- max (df1$nombre_de_columna)
promedio de una columna xxx <- mean (df1$nombr_columna)
“ xxx <- df_1 %>% summarise(promedio = mean(columna))
Mediana de una columna xxx <- median (df1$nombr_columna)

“ xxx<- df_1 %>% summarise (mediana = median(columna))
Varianza, curtosis, asimetría de una df_1 %>% summarise(varianza = var(columna), curtosis =

columna kurtosis(columna), asimetria = skewness(columna))
Filtrado de una columna Positiva (>0) xxx_positivo <- filter(df_1 , columna> 0 )
Cuenta la cantidad de observaciones xxx_columna <- df_1 %>% count(columna)

repetidas en una columna y crea un df
nuevo
Creación de vectores xxx <- c (numeros)

xxx <- c ( palabras con comiya)
Creo data frame xxx <- data.frame ( vector1 , vector2) misma cantidad de datos
REGRESIÓN mod1 <- lm ( Y ~ X1 + X2 + X3, data = df_que_trabajo)
Resumen del modelo estimado xxx <- summary(mod1)
Guardar los BETAS xxx <- mod1$coefficients
Crear un DF para los objetos para valuar obj_p_valuar <- data.frame(nombre_columna = c(10) , …)
en los BETAs
Valuar el objeto creado en el modelo predict ( mod1, newdata = obj_p_valuar)
crear una variable nueva en un DF a df1[“nombre_de_nueva_var”] <- log

partir de una ya existente. Aplico (df1$variable_q_convierto)
logaritmo
Crear una columna vacia en un DF df [ , “nombre_columna” ] <- NA
LLenar la columna creada a partir de una df $ columna_llenar [ df$ column_condic < 20] <-dato_que
condición _ aparecera _en_la_columna
lo de arriba pero con DOBLE condición [ df$ column_condic >= 20 & df$column_condic < 30]
Crear una columna en un df y llenarlo df[ , “nueva.columna” ] <- log ( df$columna.a.transformar)

con la transformación de una columna
existente. Aplico log
cambio el relleno de la columna de arriba df $ column_llenar [ df $ column_llenar == relleno anterior

<-nuevo_relleno
Crea un DF (nuevo) de la columna de dfNuevo <- df %>% count(columna)

otro DF(original)
Filtrar una columna de DF y mantener df6_B <- df6[df6$Column == 1, ]

todas las demas columnas constante Condicion p filtrar
RESIDUOS de un modelo xxx <- residuals (modelo)
Estimado (Y) de un modelo xxx <- fitted (modelo)

tp 4-------------------------- ---------------------------
matriz de correlación de un df correlacion_df1 <- cor ( df1)
Matriz de correlacion entre las variables correla_df <- round(cor(df1), 2)

indep, con dos decimales
Guarda en una tabla la correlacion entre melted_df1 <- melt(correla_df)

las variables indep
Grafico de matriz de correlacion Ver nota 1
TESTS VIF = 1/1-R^2 > 10 car::vif(mod1) mod1=modelo con log

regresion auxiliar x2 = b1+b3x3+e r <- cuadrado
tp6-------------------------- ---------------------------
Residuos xxx <- resiudals (mod1)
Guardar los residuos en el DF df1 [ , “residuos”] <- residuals (mod1)
plot: res.vs.x1-res.vs.x2-al.cuadrad tmb histo.x1.x2
Calcular Y estimado y guardarlo en DF df1 [ , “Y_hat ] <- predict ( mod, data = df1)
tests white install.packages("lmtest") - library(lmtest)
ej1,-. mod1 <- lm (price ~ sqft + age, data = df1)
valor p >o,o5 A Ho homo bptest(mod1, ~ sqft*age + I(age^2) + I(sqft^2), data = df_1)

chi2 gl=cantidad_indep vs BP
ej2.-.regresion robusta - solución hetero mod2_rob <- rlm(price ~ lotsize + sqrft + bdrms, data = df2)
de ultima instancia summary(mod2_rob)
Para ver la significancia con ltl > 1.96
Gráfico de dispersión xx <- plot( df1$columnaX, df1$columnaY, xlab= “nombreX” ,

Cuando pide la relacion d 2 variables ylab = “nombreY”)
Gráfico de dispersión que une los puntos plot (df$columX, df$columY,type = "b", pch = 19,
con una línea col = "blue", xlab = "dias", ylab = "porcentaje_ocupacion")
Histograma de una columna xx <- ggplot(df_1, aes(x=columna)) + geom_histogram()
Para ver un gráfico guardado plot (nombre del gráfico)
Gráfico de torta pie(df_1_filtrado$columa1, labels = df_1_filtrado$columa2)

Cálculo de porcentaje de cada categoría xxx_pproporcion <- prop.table(df_1_filtrado$n)
NOTA 1: ggplot(data = melted_df1, aes(x=Var1, y=Var2, fill=value)) +
geom_tile() +
geom_text(aes(Var2, Var1, label = value), size = 5) +
scale_fill_gradient2(low = "blue", high = "red",
limit = c(-1,1), name="Correlation") +
theme(axis.title.x = element_blank(),
axis.title.y = element_blank(),
panel.background = element_blank())

Comando para Econometria Con R Studio

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Comando para Econometria Con R Studio

Caricato da

Copyright:

Formati disponibili

Gonzalez Federico - R studio - Econometría I

library(readxl) abrir excel

library(lmtest) install.packages("lmtest") tp6 htero

library(MASS) install.packages("MASS") regression robusta

valor mínimo de una columna xxx <- min (df1$nombre_de_columna)

valor maximo de una columna xxx <- max (df1$nombre_de_columna)

promedio de una columna xxx <- mean (df1$nombr_columna)

“ xxx <- df_1 %>% summarise(promedio = mean(columna))

Mediana de una columna xxx <- median (df1$nombr_columna)

Varianza, curtosis, asimetría de una df_1 %>% summarise(varianza = var(columna), curtosis =

Filtrado de una columna Positiva (>0) xxx_positivo <- filter(df_1 , columna> 0 )

Cuenta la cantidad de observaciones xxx_columna <- df_1 %>% count(columna)

Creación de vectores xxx <- c (numeros)

REGRESIÓN mod1 <- lm ( Y ~ X1 + X2 + X3, data = df_que_trabajo)

Resumen del modelo estimado xxx <- summary(mod1)

Guardar los BETAS xxx <- mod1$coefficients

Valuar el objeto creado en el modelo predict ( mod1, newdata = obj_p_valuar)

crear una variable nueva en un DF a df1[“nombre_de_nueva_var”] <- log

Crear una columna vacia en un DF df [ , “nombre_columna” ] <- NA

Crear una columna en un df y llenarlo df[ , “nueva.columna” ] <- log ( df$columna.a.transformar)

cambio el relleno de la columna de arriba df $ column_llenar [ df $ column_llenar == relleno anterior

Crea un DF (nuevo) de la columna de dfNuevo <- df %>% count(columna)

Filtrar una columna de DF y mantener df6_B <- df6[df6$Column == 1, ]

RESIDUOS de un modelo xxx <- residuals (modelo)

Estimado (Y) de un modelo xxx <- fitted (modelo)

matriz de correlación de un df correlacion_df1 <- cor ( df1)

Matriz de correlacion entre las variables correla_df <- round(cor(df1), 2)

Guarda en una tabla la correlacion entre melted_df1 <- melt(correla_df)

Grafico de matriz de correlacion Ver nota 1

TESTS VIF = 1/1-R^2 > 10 car::vif(mod1) mod1=modelo con log

Residuos xxx <- resiudals (mod1)

Guardar los residuos en el DF df1 [ , “residuos”] <- residuals (mod1)

plot: res.vs.x1-res.vs.x2-al.cuadrad tmb histo.x1.x2

tests white install.packages("lmtest") - library(lmtest)

ej1,-. mod1 <- lm (price ~ sqft + age, data = df1)

valor p >o,o5 A Ho homo bptest(mod1, ~ sqft*age + I(age^2) + I(sqft^2), data = df_1)

Gráfico de dispersión xx <- plot( df1$columnaX, df1$columnaY, xlab= “nombreX” ,

Histograma de una columna xx <- ggplot(df_1, aes(x=columna)) + geom_histogram()

Para ver un gráfico guardado plot (nombre del gráfico)

Gráfico de torta pie(df_1_filtrado$columa1, labels = df_1_filtrado$columa2)

Potrebbero piacerti anche