Sei sulla pagina 1di 8

Estadística

El rango de una distribución corresponde a:


La diferencia entre el máximo valor y su mínimo valor

Si la mediana de una distribución es de 12, eso quiere decir:


Que hay tantos sujetos por debajo de 12 como por encima

¿Cuál de los siguientes son ejemplos de variables continuas?


La tasa de desempleo nacional

Un histograma corresponde a:
El gráfico de la distribución de probabilidades de la variable

Una variable aleatoria Y toma los valores 10, 15, 25 y 35 y las probabilidades de
ocurrencia conocidas son P(Y=10) = 0.3; P(Y=15) = 0.2; P(Y=25) = 0.4. Luego el valor
de P(Y=35) es:
0.1

La distribución normal se caracteriza porque:


Se define completamente por la media y la desviación estándar

La mediana será un mejor indicador de tendencia central que la media:


Cuando existen pocas observaciones muy alejadas de la mediana

La construcción de un intervalo de confianza permite:


Tener una aproximación del nivel de error de una estimación

Respecto de las medidas de tendencia central, podemos concluir que:


Los parámetros son complementarios

¿Cuál de los siguientes son ejemplos de variables discretas?


Las Regiones de Chile

Una variable aleatoria X toma los valores 1, 3, 5, con probabilidades P(X=1) = 4/6,
P(X=3) = 1/6, P(X=5) = 1/6. El valor de su media aritmética es:
2

Para construir un intervalo de confianza al 90% debemos considerar:


La media, la desviación estándar y el valor de z de 1.64

La hipótesis nula representa:


La afirmación respecto de un parámetro que se asume cierta al inicio del estudio.
La hipótesis alternativa representa:
La característica del parámetro que es de interés de la persona que elabora el estudio

Considere que usted está interesado en saber si la participación de mercado de su


empresa es significativamente mayor que la de la competencia. Luego usted
establece la hipótesis nula contra la alternativa . El
estadístico t de contraste tiene un valor de 1.49 en tanto que el estadístico t0.05= 2.22.
Luego el resultado del test, será:
No se rechaza la hipótesis nula

El objetivo de la prueba de hipótesis para dos varianzas es:


Establecer si existen diferencias entre los niveles de volatilidad entre dos poblaciones

El proceso de prueba de hipótesis se puede resumir en comparar dos números, z y


z que provienen:
El valor de z proviene de los datos muestrales en tanto z
proviene de la distribución asumida de los datos. El primero es el estadístico de contraste

En términos del tamaño muestral utilizado en el proceso de contraste de hipótesis:


Dependerá del fenómeno en estudio

El nivel de significancia de la prueba de hipótesis corresponde a:


El valor máximo tolerable de cometer error tipo 1

Si estamos analizando la relación entre el nivel de consumo y de ingreso, estamos


frente a un test de hipótesis que contrasta:
El valor de la media

En el caso de una hipótesis simple, rechazaremos la hipótesis nula si:


El valor del estadístico de contraste es mayor al valor del estadístico asociado al nivel de
significancia

El error tipo 2 es:


No rechazar H0 cuando H0 es falsa

Si usted dispone datos de una muestra de datos de ingresos de los trabajadores de


dos empresas y quiere saber si los niveles de desigualdad de sueldos en ambas
empresas son similares, usted llevara a cabo un test para contrastar:
Diferencia de varianzas

Según una encuesta, el candidato A tiene el 31% de las preferencias versus el


candidato B que muestra el 29% de las preferencias, La encuesta tiene un nivel de
error del 3%. Luego podemos concluir que:
Existe un empate técnico
En el estudio de regresión donde queremos estimar la influencia que tiene el precio
del cobre sobre el tipo de cambio:
El precio del cobre es la variable independiente y el tipo de cambio es la variable dependiente.

La solución a través de mínimos cuadrados estableces que:


El óptimo se puede lograr al considerar al minimizar el valor del error al cuadrado.

Un parámetro estimado será aceptable si:


Su estadístico t permite aprobar el test de hipótesis

Si el valor medio de los residuos observados se ve que aumenta a medida que


aumenta la variable independiente (no se mantiene constante), se puede decir que:
Se observa heterocedasticidad

El supuesto de homoscedasticidad se puede interpretar como:


La varianza de la muestra es constante respecto de la variable independiente.

Suponga que usted establece un modelo que relaciona el ingreso con los años de
escolaridad. Asuma que los parámetros son significativos y que el modelo
estimado es el siguiente: . Donde la
variable EDUC es la ecolaridad medida en años. Luego el valor estimado para una
persona con 16 años de educación será de:
1.427.000

La etapa final en el proceso de estimación de un modelo de regresión lineal, es:


Realizar el ejercicio de proyección

Si el número de observaciones es menor al número de parámetros a calcular:


No es factible calcular los parámetros.

En un modelo que plantea una relación entre ventas e inversión publicitaria de la


empresa, cuya especificación es se lleva a cabo un
test de significancia sobre los parámetros y el resultado es
que β0 es significativo, pero β1 no lo es, esto implica que:
Las ventas serán son independientes de la publicidad.

Si la hipótesis nula asociada al parámetro beta de la variable independiente se


rechaza:
La variable independiente es significativa para predecir la dependiente

Suponga que el p-value obtenido en un análisis de regresión para un parámetro es


de 0.04, luego esto implicará para este parámetro que:
Se rechazará la hipótesis nula de si el nivel de significancia previamente establecido es de
5%.
Dado el supuesto de que el valor medio del componente irregular es cero, esto
implica que en el proceso de proyección, este componente:
No se considera

En el caso de variables independientes de tipo continuas, el valor del parámetro


obtenido podrá interpretarse como:
La tasa de cambio de la variable dependiente respecto de la variable independiente

La justificación de utilizar más de una variable explicativa en los modelos de


regresión, es que:
Las variables económicas suelen ser complejas y por ende explicadas por varias variables

Si se rechaza la hipótesis nula asociada a la evaluación del modelo completo,


entonces:
Al menos un parámetro beta es estadísticamente distinto de 0

El coeficiente de determinación nos permitirá en el caso de una regresión múltiple:


Comparar dos modelos con distintas especificaciones

El mínimo valor del coeficiente de determinación para que un modelo se considere


válido es:
No existe un mínimo valor, dependerá de cada situación

La solución óptima de parámetros en el caso multivariado difiere de la solución en


el caso simple en que:
En el caso multivariado se requiere encontrar un conjunto de parámetros que minimicen la
suma de los errores al cuadrado

La regresión multivariada es preferible a la regresión simple.


Siempre que la variable en estudio sea compleja y requiera más de una variable
independiente

La función de estadístico t en el análisis de regresión multivariada, es:


Realizar test de hipótesis para cada variable particular

El énfasis en el análisis de la regresión debe estar en:


La correcta interpretación de los resultados

En términos de la implementación en software, la incorporación de variables


discretas:
No presenta mayor diferencia
La mayor diferencia en términos analíticos entre el modelo de regresión simple y el
multivariado, es:
El modelo multivariado implica revisar el modelo en su conjunto además de analizar cada
variable

Al momento de realizar la estimación de parámetros en software, se recomienda


previamente:
Realizar análisis descriptivo de los datos y graficar

El parámetro que nos permitirá evaluar si un modelo es mejor que otro, es:
El coeficiente de determinación
En el caso de variables independientes de tipo discretas, el valor del
parámetro obtenido podrá interpretarse como:
La diferencia que existe entre cada categoría de la variable
Respecto del nivel de significancia de las variables en un modelo
multivariado:
Las variables discretas requieren un nivel de significancia igual a las continuas
En el caso de regresión múltiple, el supuesto de media cero del componente
de error:
Se mantiene
La incorporación de variables discretas en conjunto con variables continuas
permite para estas últimas incorporar:
Diferencias en el intercepto y/o en la pendiente respecto de la variable
dependiente
Usted está analizando un modelo para determinar los determinantes del
ingreso y obtiene la siguiente especificación:
La variable de género toma el valor de 1 en
el caso de mujer y cero en el caso de hombre. Luego el intervalo de
confianza para la variable género que implica una diferencia significativa en
el ingreso a favor del hombre será:
(-25.000, -35.000)
En el caso de incorporar una variable discreta en el modelo, se deberán
incorporar:
Un numero de variables igual al número de categorías de la variable discreta
menos uno
El número máximo de variables que se pueden considerar en un modelo
estará limitado por:
El software y el tamaño muestral
El coeficiente de determinación se define como:
La suma explicada de cuadrados (SEC) sobre la suma total de Cuadrados (STC)
Al incorporar una variable discreta como género, la diferencia entre
considerar una u otra categoría con el valor 1 o 0 implicará:
Una diferencia en la interpretación de los parámetros
La regresión multivariada es preferible a la regresión simple:
Siempre que la variable en estudio sea compleja y requiera más de una variable
independiente
La distribución normal se caracteriza por:
Se define completamente por la media y la desviación estándar

Si la distribución de las notas de un curso de economía respecto del 100% de los


estudiantes está dado por:
Mayor o igual que 1.0 y menor que 3.0: 10%
Mayor o igual que 3.0 y menor que 4.0: 15%
Mayor o igual que 4.0 y menor que 5.0: 35%
Mayor o igual que 5.0 y menor o igual que 7.0: 40%
La proporción de los alumnos aprobó el curso es de:
0.75

La moda de una distribución corresponde a:


El valor más frecuentemente observado

La metodología de estimación de parámetros en la regresión lineal simple, se basa


en:
Minimizar la distancia vertical entre los valores observados y estimados

Asuma que se estima el siguiente modelo que relaciona el ingreso con el consumo:

El siguiente intervalo para el parámetro asociado a la variable ingreso (β1), no nos


permitirá rechazar la hipótesis nula respecto de la hipótesis
alternativa .
(-0.07, 1.73)

La etapa de planteamiento de la teoría en el análisis de regresión permite:


Establecer con claridad la relación causal entre variables.
La relación entre la desviación estándar y la varianza de una muestra es:
La desviación estándar es la raíz cuadrada de la varianza

En una distribución normal se cumple que:


Aproximadamente el 99% de las observaciones se encuentran a tres desviaciones estándar
de la media

La ventaja de utilizar la desviación estándar por sobre la varianza es que:


Esta expresada en la misma de unidad de medida que la variable original

Las medidas de tendencia central y de dispersión más utilizadas son:


La media y la desviación estándar

El cálculo de la varianza utiliza el valor cuadrático de las desviaciones respecto de


la media:
Para evitar que valores positivos se cancelen con los negativos

Una variable aleatoria es aquella que:


Toma valores determinados por un experimento

Un intervalo de confianza corresponde a:


Un rango de valores que nos permite realizar inferencia

La relación entre variables discretas y continuas es que:


Una variable continua puede transformarse en discreta

En el caso de una distribución normal estándar, una vez construido el valor Z para
una observación xi, podremos concluir que:
Si z es igual a cero, xi es igual a la media

Si en un modelo de regresión lineal múltiple se tienen como variables


independientes la estatura, el largo del brazo, y además el largo de las piernas de
determinados sujetos, al probar el modelo se podría presentar un problema de:
Multicolinealidad

Respecto del modelo simple, el modelo multivariado requerirá:


Un mayor número de observaciones

Frente a dos modelos multivariados con distintas combinaciones de variable


independientes, el criterio utilizado para elegir uno por sobre otro será:
Será elegible el modelo que tenga el mayor valor de suma explicada de cuadrados

El no incorporar una variable relevante en el modelo tendrá efecto en:


Aumenta el error del modelo

El uso de la moda como medida de tendencia central:


Es poco representativa en el caso de variables continuas

Respecto de las medidas de tendencia central:


Solo la moda puede tener más de un valor

Respecto de los supuestos de la regresión lineal simple, en el procedimiento de


regresión lineal multivariada, los supuestos que ya no aplican son:
Ninguno

Potrebbero piacerti anche