Sei sulla pagina 1di 168

Más de 777 preguntas

de Bioestadística y sus respuestas


MATILDE CAMPOS ARANDA

Más de 777
preguntas
de Bioestadística
y sus respuestas

2011
Tercera edición revisada, corregida y aumentada, 2011

El editor no se hace responsable de las opiniones recogidas, comentarios y manifestaciones vertidas


por los autores. La presente obra recoge exclusivamente la opinión de su autor como manifestación
de su derecho de libertad de expresión.

Quedan rigurosamente prohibidas, sin la autorización escrita de los titulares del Copyright, bajo las
sanciones establecidas en las leyes, la reproducción parcial o total de esta obra por cualquier medio
o procedimiento, comprendidos la reprografía y el tratamiento informático, y la distribución de
ejemplares de ella mediante alquiler o préstamo públicos.

© Matilde Campos Aranda

Diseño de portada: Manuel Canteras Campos

© DM
Librero-Editor
Merced, 25. 30001-Murcia
Tfnos.: 968 24 28 291968 23 75 78

I.S.B.N.: 978-84-8425-928-2
D.L.: MU 919-2011

Edición a cargo de: Diego Marín Librero-Editor


A mi profesor y a mis alumnos
PRÓLOGO

La dificultad de la docencia y del aprendizaje de una asignatura como la


Bioestadística podría pensarse que radica fundamentalmente en que la Bioestadística
utiliza conceptos y métodos probabilísticos y estadísticos. Es cierto que dichas
disciplinas no pueden abordarse en un curso de 40 - 60 horas ni se puede presuponer
que los alumnos entren en la universidad con conocimientos suficientes de Probabilidad
y de Estadística.

Pero existe un inconveniente, quizá mucho más importante, y que afecta a la


misma actitud y forma de pensamiento de los alumnos. Estos han sido educados para
estudiar y pensar utilizando el método lógico, es decir, "deduciendo". La Estadística y,
por tanto, la Bioestadística, enseña a pensar según el método inductivo, es decir,
experimental o inferencia!. Este es el método de las ciencias experimentales.

Este inconveniente exige del alumno de Bioestadística una madurez, tanto en la


forma de pensar como en el conocimiento de los conceptos y métodos que la
Probabilidad y la Estadística proporcionan a la Bioestadística.

El objetivo de este libro es facilitar a los alumnos el estudio de los conceptos de


Bioestadística. Durante los últimos años, hemos puesto en práctica en las aulas,
especialmente en los cursos donde el número de alumnos es más reducido, un sistema
de trabajo y aprendizaje consistente en preguntas realizadas desde múltiples
perspectivas sobre distintos conceptos estadísticos. Tal método ha producido unos
resultados excelentes en la asimilación y comprensión de la materia.

Por este motivo hemos pensado que sería una buena idea recopilar estas
preguntas en un libro, con el fin de que el alumno, al tratar de responderlas a partir de
sus apuntes o libros y teniendo las respuestas para comprobar que lo están haciendo
correctamente, puedan, por un lado, repasar toda la asignatura, ya que en el libro se
tratan todos los temas, y, por otro lado, puedan aclarar los conceptos y profundizar en
ellos.

9
ÍNDICE Páginas

CAPÍTULO 1

ESTADÍSTICA DESCRIPTIVA Preguntas Respuestas

Conceptos básicos .. ......... .................... .. ........... ... ... 17 93


Representaciones gráficas....................................... 21 97
Medidas de posición central . . . . . . . . . . . . . . . . . . . . . . . . .. 25 101
Medidas de posición .............................................. 27 103
Medidas de dispersión ..... ........... ........ .......... ..... .. .. 29 105

CAPÍTULO 11

PROBABILIDAD

Tipos de experimentos........................................... 35 111


Álgebra de sucesos.............................................. ... 37 113
Probabilidad ..... .. ....... .............. .. .. ........ .......... ......... 41 117
Probabilidad condicionada. ........ ....................... ...... 43 121
Tests diagnósticos.................................................. 47 125
Variable aleatoria.................................................... 51 129
Modelos probabilísticos.......................................... 53 131

CAPÍTULO 111

MUESTREO Y ESTIMACIÓN

Muestreo...................... ........... ...................... .......... 59 137


Estimación.............................................................. 61 139

CAPÍTULO IV
CONTRASTE DE HIPÓTESIS ............................................ 67 ........... 147

CAPÍTULO V
ANÁLISIS DE LA VARIABILIDAD I: REGRESIÓN...... 73 . . . . . . . . ... 155

CAPÍTULO VI

ANÁLISIS DE LA VARIABILIDAD IL ............................. 81 ........... 165

11
PARTE 1

PREGUNTAS
CAPÍTULO 1

ESTADÍSTICA
DESCRIPTIVA
CONCEPTOS BÁSICOS

En cada uno de los siguientes casos hay que detallar la población que se está
estudiando, la característica que se observa, tipo de característica, modalidades a
considerar y la población estadística que se genera:

1.1 Estudio del consumo de droga en menores de 16 años.

1.2 Estudio sobre la tensión arterial en mayores de 60 años.

1.3 Estudio sobre la salud bucodental en la ciudad de Murcia.

1.4 Estudio del cáncer de mama en mujeres menopáusicas tratadas con hormonas.

1.5 ¿Puede una variable estadística tomar valores negativos? S(. ~f.

1.6 ¿De qué depende que una característica sea considerada cualitativa o
cuantitativa? <AAc,{..A ~ o ~vo>

1.7 ¿Cuántas modalidades puede tener una variable discreta? V\ l R\M lo ..)
""' \1~ yWV\It y¡.. C. ,
1.8 ¿Qué son las modalidades?
ti\A~h'v\, b ve-v~.-t.~ .
1.9 ¿Podría la marca de clase estar fuera de la misma? ~S l~ \1\A...,(..Sl- 1 ~

1.10 ¿El extremo ~uperíor de una clase pertenece a la clase?


s
w o (C)-. ~tN...... -t.>-+ rl \1\N:l \1 9o ·f'· w·
1.11 ¿Qué relación existe entre la frec~encia absoluta y relativa?

1.12 ¿La frecuencia absoluta de una modalidad puede ser negativa?


!Jo
1.13 La suma de las frecuencias absolutas ~cuánto
vale? L L.·
d ~~ ~ 1(0 c-..
eP.P IAÑVIVJ r' ~ "" 0 ~
1.14 La sumJ. de las frecuencias relativas ¿cuánto vale?

1.15 ¿Las frecuencias absolutas pueden tomar el valor O?


e¡, ~ ~ (,{? 6l,s" "'"' .
1.16 ¿Qué significa que la frecuencia absoluta correspondiente a una modalidad valga
cero? fvo h.) C...~,l e.u~l.o ~ ~., ~e..- Ci)$4-¡Kv-

1.17 Si sabemos que el 20% de una población son hombres, ¿¡::uál es la frecuencia
relativa correspondiejte a la modalidad hombre en dicha población?
::.- O' 2.o
1.18 ¿Entre qué valores os ifan las frecuencias relativas? 0 l J¡
l. (

1.19 Si la suma de todas las frecuencias absolutas es igual a 120, ¿qué información
nos aporta sobre la población? {lo o':,~o..,.. V"" C.: ' !M~
17
1.20 ¿Puede una frecuencia absoluta ser mayor que N (numero total de elementos de
la población)?lvo fJ~ fo~ t; l,.s t-L;,)~ ,..,.,5.
1.21 ¿Puede alguna frecuencia absoluta valer 25,5?

1.22
/"o. rv ú~ tJ ""'~ n..\
¿La suma de las frecuencias relativas puede variar de una población a otra?
u'O ,s.·~¡~ a~ 1
1.23 ¿El n° de elementos de la población literal puede ser distinto del n° de elementos
de la población estadística? ( oíiA~tÁev..

1.24 Si la suma de todas las frecuencias relativas fuese igual a 1,1. ¿Qué conclusión
sacaríamos? e YhY sti (, J..
1.25 ¿Qué diferencia hay entre una variable y una observación? ¿__
Vvi~L.,. V> ~ ~ St- ckl•tt...:- '=' e~~. R.s el """4~ ~ ~~~
1.26 ¿De qué depende que una característica sea considerada cualitativa o '
cuantitativa? tMc.,(..'&VJ o &t¡.~V'--P ("'
1.27 ¿Cómo "mediríamos" la edad para obtener una población de datos cualitativos?
~ V\ e>'> 1 J~ e. .V... LJ-.cJ 5o •
1.28 ¿Una variable discreta puede tomar infmitos valores?..
~(, t'9r:o SPf"'ilú-. h.,vvWY-~ ....
1.29 ¿Qué es uná distribuci<'\t}. de fr;cuen;~?.,t. ~
te.~/.... t\k..tL.~~' 1 ~~<..S .
1.30 ¿Qué diferencia hay entre unaf;vanable discreta y un~_99..Q_~ua?
D iSC ve t"L (Á:, {);~ 'l. c. . "'t.-.""""- -;.z) eo...;;~
1.32 ¿Qué interpretacitrr'tene que una frecuencia relaJiva c~rrespondiente a una
modalidad valga 0,42? Lt lo¡. 1:;
L-t h.,. ~;t..v{

1.32 ¿Qué interpretación tiene que una frecuencia relativa correspondiente a una
modalidad valga 2,8? /J 0 v'V\¿)A.e_ {_ . e.r>or
1.33 Si la frecuencia relativa correspondiente a una modalidad vale O, ¿cuánto valdrá
su frecuencia absoluta? O

1.34 Si en una población estadística la frecuencia relativa correspondiente a una


modalidad vale 1, ¿qué significaría? á~SCI~ 0

1.35 Si queremos estudiar la tensión arterial de una población considerando que el


resultado de la observación es hipotenso, normotenso o hipertenso, ¿qué tipo de
característica estaremos manejando? ~ {:/cJ,tA;,

1.36 Las modaljdad1s de una variable estadística discreta, ¿son cualidades o


atributos?¡t{.e ~..(;~S ~\,)"' vW~

Si la característica que queremos estudiar es las recidivas de una determinada


enfermedad, considerando como modalidades de la misma: "sí recidiva" y "no
recidiva", ¿de qué tipo de car~c!erística se trata?
~~kr-'~
18
1.38 ¿Qué son las modalidades de una característica?

1.39 ¿Por qué las frecuencias relativas se pueden expresar en %?

1.40 Las frecuencias relativas permiten comparar.. . j_ ' · ¿f..,/¿5 ¡ < vz..l.es. """"'
M~v: Dl/"4 pt;.sF. V\-1-..s /~
T

¡)

1.41 ¿:ffi no de modalidade~ble estadística discreta es siempre infinito?

1.42 ¿Q~~o~eben cumplir las modalidades?


~~\,w~ J;•\/t-1:> '2 ~'IG~j tM~li5
1.43 ¿Qué significa que las modalidades tienen que ser exhaustivas?
~e~ Co\~~,... ~ Js~vt.-.f.vs ~~
1.44 La condición de que las modalidades tengan que ser excluyentes garantiza
que... <;1..-- (_~~

1.45 ¿Cómo podemos tabul~uni ~ariable estadística continua?


~ v-4 ~V 1 VVO' \1'-"4 \IV\..t> D"k.ú ~
s n las clases en un~ ?oblación de una variable estadística?
1.46 ¿Qur;I'
\ \ \.A,Afv)
1
V~ tft'C<J ~ ~-z.,~ fe
1.47 ¿Qué s n las clases abiertas~ 1/ 1'. _
'(} Vt-o }\. e.-..._ cu.s L._
v'VLe ~· L0;1 .(Kr re~
1.48 Si tenemos qué cerrar una clase abierta, ¿qué amplitud le daremos si
necesitáramos cerrarla?. )._ ll\.r.,c'$ ~ ~¿,¡{ ~ k ~~Vt;.

1.49 ¿Qué condiciones deben cumplir las ;::lases?


-!)C~~~t.w.. / ~~.,~
1.50 ¿Por qué se utilizan las clases abiertas?
J~-l~ yw ~l- ~~"~

19
REPRESENTACIONES GRÁFICAS

1.51 En un diagrama de sectores a cada modalidad le corresponde ...

1.52 ¿Cómo se obtiene el ángulo del sector circular correspondiente a una modalidad?

1.53 Si en un diagrama rectangular dos rectángulos tienen la misma altura, ¿qué


tendrán en común las modalidades correspondientes?

1.54 En un diagrama rectangular a cada modalidad le corresponde ...

1.55 ¿Qué interpretación tendría el hecho de que en un diagrama rectangular todos los
rectángulos fuesen iguales?

1.56 ¿Un diagrama rectangular es una representación gráfica propia de características


cualitativas o cuantitativas?

1.57 ¿Qué interpretación tiene que el sector circular correspondiente a una modalidad
tenga un ángulo de 360°?

1.58 ¿Qué interpretación tiene que el sector circular correspondiente a una modalidad
tenga un ángulo de O0 ?

1.59 ¿Qué interpretación tiene que el sector circular correspondiente a una modalidad
tenga un ángulo de 180 °?

1.60 ¿Qué interpretación tiene que en un diagrama rectangular sólo uno de los
rectángulos tenga una altura distinta de O?

1.61 El diagrama de sectores el ángulo representación gráfica representativa de ...

1.62 En el diagrama de sectores, ¿a quien es proporcional la amplitud de ángulo


correspondiente a cada sector?

1.63 En el diagrama de barras la altura de cada una de ellas es proporcional a ...

1.64 El diagrama de barras es una representación gráfica propia de ...

1.65 En una variable continua, ¿las clases pueden tener distinta amplitud?

1.66 ¿Dónde está situada la marca de clase?

1.67 ¿La amplitud de una clase puede ser negativa?

1.68 ¿Por qué para construir la tabla correspondiente a una variable estadística
continua necesitamos las clases?
21
1.69 En un histograma ¿cómo se construye el rectángulo correspondiente a una clase?

1.70 En el diagrama de sectores ¿el área de cada sector circular correspondiente a una
modalidad depende de su frecuencia absoluta?

1.71 ¿Cuánto vale el área que encierra el polígono de frecuencias relativas si el


tamaño de la población es 120?

1.72 ¿Con quién coincide el área del histograma de frecuencias absolutas?

1.73 ¿Cómo medirlas la tensión para que se considere una característica cualitativa
dicotómica?

1.74 En el diagrama de barras, si la barra correspondiente a un determinado valor es


la más alta, ¿qué podemos decir de dicho valor?

1.75 ¿La marca de clase puede ser negativa?

1.76 El histograma de frecuencias es una representación gráfica propia de ...

1.77 ¿Qué representación gráfica se construye sobre el histograma de frecuencias?

1.78 ¿Cómo se construye el polígono de frecuencias?

l. 79 El área que encierra el polígono de frecuencias absolutas ¿cuánto vale?

1.80 ¿Por qué el área que encierra el histograma de frecuencias relativas vale 1?

1.81 ¿Cuántas modalidades tiene en una clase de una variable continua?

1.82 ¿Una variable discreta puede tomar un n° finito de valores? ¿Y una variable
continua?

1.83 ¿Qué tienen en común una variable discreta y una continua?

1.84 ¿El peso es siempre una variable continua?

1.85. ¿El área que encierra un rectángulo de un diagrama rectangular coincide con la
frecuencia absoluta correspondiente a su modalidad?

1.86 El polígono de frecuencias es una representación gráfica representativa de una ...

1.87 Si tuviésemos que representar gráficamente la edad de una población, medida


como: niños, jóvenes, adultos y ancianos, ¿qué representación gráfica
utilizaríamos?

1.88 Si tuviésemos que representar gráficamente la edad de una población medida en


años, ¿qué representación gráfica utilizaríamos?

22
1.89 ¿Podría construirse el polígono de frecuencias sin el histograma de frecuencias?

1.90 El pictograma es una representación propia de ...

1.91 ¿Cuándo se utiliza el diagrama polar?

23
MEDIDAS DE POSICIÓN CENTRAL

1.92 ¿Qué son las medidas de posición central?

1.93 Si la moda de una población de pesos vale 50Kg, ¿qué significa?

1.94 ¿La moda puede ser negativa?

1.95 En una población asimétrica y continua ¿qué medida de posición central es la


que mejor la representa?

1.96 Si hemos considerado que la medida que mejor representa a una población es la
moda ¿cómo sería dicha población?

1.97 Si la moda vale O, ¿podemos decir de la población toma valores negativos?

1.98 ¿En qué unidades se expresa la moda?

1.99 ¿En qué unidades se expresa la media?

1.100 ¿En qué unidades se expresa la mediana?

1.1 O1 ¿Qué podríamos decir de una población de pesos si su mediana es igual a 20Kg?

1.102 ¿Qué medida de posición central es más representativa de poblaciones


simétricas?

1.103 ¿La media es un valor de la variable?

1.104 ¿Qué lugar ocupa la mediana respecto al resto de las observaciones?

1.105 ¿Por qué no se pueden calcular la mediana y la media en una población de datos
cualitativos?

1.106 ¿La media puede ser negativa?

1.107 Si una población tiene dos modas, ¿qué tendrían en común?

1.108 Si la mediana de una distribución de frecuencias vale O, ¿qué podemos decir de


las observaciones?

1.109 ¿En qué tipo de población coinciden las tres medidas de posición central?

1.11 O ¿Puede la mediana ser negativa?

1.111 ¿Qué interpretación tiene que la moda sea negativa?


25
1.112 Si la media de una población es negativa, ¿podemos asegurar que todos los
elementos de la población son negativos?

1.113 ¿Una población que tenga varias modas tendrá varias medias?

1.114 ¿La moda es siempre un valor de la variable?

1.115 ¿Qué medida de posición central se corresponde con la modalidad que tiene la
frecuencia más alta?

1.116 Si una distribución de frecuencias tiene el mismo numero de valores positivos


que negativos, ¿cuánto valdrá la mediana?

1.117 ¿Cuál de las medidas de posición central necesita una ordenación previa para ser
calculada?

1.118 ¿Qué significaría que una población tuviese el mismo n° de modas que de
modalidades?

1.119 ¿Cuáles de las medidas de posición central son únicas?

1.120 En el caso de una característica en la que la única medida de posición central que
podemos obtener sea la moda. ¿qué tipo de característica será?

1.121 Si la moda es mayor que la media, ¿qué podríamos decir de la población?

1.122 Si la moda es menor que la media, ¿qué podríamos decir de la población?

1.123 Si una población de observaciones continuas es muy dispersa, ¿qué medida de


posición central la representa mejor?

1.124 ¿Por qué se utiliza la media para comparar poblaciones?

26
MEDIDAS DE POSICIÓN

1.125 ¿Cuántos cuartiles hay?

1.126 ¿Q 1 puede ser mayor que Q 3 ?

1.127 ¿Cuál de los siguientes valores es mayor D 6 o P 70 ?

1.128 ¿Con qué decil coincide la mediana?

1.129 ¿Con qué decil coincide el Q 3 ?

1.130 ¿Qué interpretación tiene que en una población de tensiones arteriales sistólicas
P 20 = 14 cm Hg?

1.131 ¿Con qué decil coincide el Q¡?

1.132 ¿Cómo podríamos saber si un valor es alto o bajo dentro de su población?

1.133 Si la mediana de una tabla de alturas es 1,65m, un elemento de la población que


esté en el D 6 , ¿superará dicha altura?

1.134 ¿Cuál de los parámetros característicos de una población nos informa sobre la
posición de una observación respecto al resto?

1.135 Si se sabe que el 85% de pacientes afectados en una epidemia tienen la cifra de
leucocitos superior a 20mil, ¿qué percentil corresponde a dicho valor?

1.136 Ordena de menor a mayor Q3, D3, P3s, Me.

1.13 7 ¿Qué interpretación tiene dentro de una población de tensiones sistólicas


P 25 = 170mmHg? ¿Podríamos decir que es una población de hipotensos?

1.138 ¿Cuántos percentiles hay?

1.139 ¿Las medidas de posición pueden ser negativas?

1.140 ¿Qué % de observaciones hay entre dos percentiles consecutivos?

1.141 ¿Existe el P 305 ?

1.142 ¿Qué información proporciona el percentil correspondiente a una tensión de


150mmHg dentro de una población de tensiones arteriales sistólicas?

27
1.143 ¿Qué % de observaciones hay entre el P32 y el D7 ?

1.144 ¿Qué podríamos deducir de una población que tiene los 50 primeros percentiles
negativos?

1.145 Si el P 32 es negativo ¿que signo tendrá el Q 1 ?

1.146 ¿Un percentil es un%?

1.147 ¿Qué % de observaciones hay entre dos cuartiles consecutivos?

1.148 ¿Qué % de observaciones hay entre dos deciles consecutivos?

1.149 ¿Cuál de las medidas de posición central es un percentil?

1.150 ¿En qué unidades se expresan los percentiles?

28
MEDIDAS DE DISPERSIÓN

1.151 ¿Qué se entiende por dispersión?

1.152 ¿Para que sirven las medidas de dispersión?

1.153 ¿Cómo son las observaciones si el coeficiente de variación vale O?

1.154 Si el rango de una distribución de frecuencias es igual a O, ¿la varianza valdría


necesariamente O?

1.155 ¿En qué unidades se expresa el coeficiente de variación?

1.156 ¿En qué unidades se expresa la varianza?

1.157 Si una población tiene el mismo número de valores positivos que negativos,
¿cuál sería el signo de la varianza?

1.158 ¿Qué información sobre la población nos aporta el rango?

1.159 ¿El rango puede ser negativo?

1.160 ¿Qué medida de dispersión es la más adecuada para medir la dispersión de una
población donde la dispersión aumenta con la media?

1.161 Si queremos comparar las dispersiones de la tensión arterial y de los pesos, ¿qué
medida debemos utilizar?

1.162 Si una población tiene todos sus valores negativos, ¿cómo será el signo de su
desviación típica?

1.163 Si quiero comparar la dispersión de los pesos de los hombres y de las mujeres,
¿qué medida debemos de utilizar?

1.164 ¿Cuándo el valor de la varianza de una población será O?

1.165 Si el rango de una distribución de frecuencias vale O, ¿podríamos decir que el


coeficiente de variación vale O aunque éste no dependa del rango? ¿Por qué?

1.166 Si una población tiene el mismo número de valores positivos que negativos,
¿qué podemos decir del rango?

1.167 Si todas las observaciones son negativas, ¿el rango será negativo?

1.168 ¿Por qué la varianza no puede ser negativa?


29
1.169 ¿El coeficiente de variación se puede emplear para comparar dispersiones de
poblaciones que tengan las mismas unidades?

1.170 ¿Cuál de las medidas de dispersión depende sólo de los extremos?

1.171 ¿Una población que tenga mucha dispersión podrá ser simétrica?

1.172 ¿Qué medidas de dispersión no tienen las mismas unidades que la variable?

1.173 ¿Una población muy heterogénea tendría mucha o poca dispersión?

1.174 ¿Qué condición debe cumplir una población para que el intervalo de normalidad:
( 11- 2a; 11 + 2a) contenga el 95% de las observaciones?

1.175 ¿Cómo compararíamos dos observaciones de poblaciones distintas?

1.176 En una población que se distribuya normalmente, ¿qué valores se consideran


normales?

1.177 ¿Qué % de elementos de la población contiene el intervalo de normalidad?

1.178 ¿Que interpretación tiene que la amplitud del intervalo de normalidad valga O?

1.1 79 ¿Cuál de las medidas de dispersión no depende de los extremos?

1.180 Una población asimétrica ¿tendrá mucha o poca dispersión?

1.181 ¿Qué medidas de dispersión tienen las mismas unidades que la variable?

1.182 ¿Un valor tipificado puede ser negativo?

1.183 ¿Cuándo será necesario tipificar una observación?

1.184 Si todas las observaciones son iguales a -7, ¿cuánto valdrá el rango?

1.185 Si la media vale cero, ¿cuánto vale el coeficiente de variación?

1.186 Si se consideran normales las observaciones que están dentro del intervalo de
normalidad, ¿qué % se considera anormal?

1.187 ¿Cuánto vale la amplitud del intervalo de normalidad?

1.188 ¿Cuándo no es recomendable emplear el coeficiente de variación como medida


de dispersión?

1.189 Si la media de una distribución de frecuencias vale O, ¿cuánto valdrá su


varianza?

30
1.190 Si una población tiene el mismo numero de valores positivos que negativos,
¿qué signo tendrán el valor máximo y el mínimo? Y en función de ellos, ¿como
sería el signo del rango?

1.191 ¿Qué es la varianza?

1.192 ¿El coeficiente de variación podría ser mayor que 1?

1.193 Si al tipificar una observación el resultado es negativo, ¿qué significa?

1.194 Si quisiera comparar el colesterol de los hombres con el colesterol de las


mujeres, ¿con que parámetro se haría?

1.195 ¿Cuál es el punto medio del intervalo de normalidad?

1.196 ¿Por qué un valor tipificado es adimensional?

1.197 ¿Cuál es el valor de la media en una población de datos tipificados?

1.198 ¿Cuál es el valor de la desviación típica en una población de datos tipificados?

1.199 Si una población de coeficientes de inteligencia cuya media es 100 y su


desviación típica es 25 se distribuye normalmente, ¿entre qué valores se
encontrará el 95% de las observaciones de dicha población?

1.200 Si en el 95% de la edad de una población está comprendido entre 10 años y 30


años, ¿cuál será la media y la desviación típica de dicha población? (La edad se
distribuye normalmente)

1.201 ¿Cómo se tipifica una observación?

1.202 Si la media de una distribución es O y su desviación típica es 1, ¿Cuál será el


resultado de tipificar una observación de esta población?

Coincidirá con ella misma ya que se trata de una población de datos tipificados.

31
CAPÍTULOII

PROBABILIDAD
TIPOS DE EXPERIMENTOS

2.1 ¿Qué difere~cia hay entr~un e~perüp~~o determinista Y. uno al¡¡afori~? {


~t<? .,..-Mq"\ 5 t-~ ~ t'r(t....,, ~ -,~lP¡ Ól~ ..hf' D.: 1-M ~ yt!. ~ \~~ ~ e
2.2 ¿Por qué el resultado de un experimento aleatorio es impredecible?
r4c. \. ~::> V\..0 {.)v\\vo lc,v -~ AtAQ,
2.3 ¿Qué condiciona el resultado de un experimento determinista?
~l.o t~) el)"' (Á,. c... ov-~> q,;..¡f ~ V\ttvl.~ le..s
2.4 ¿Cuántos sucesos están asociados a un experimento determinista bajo las mismas
condiciones experimentales? Solo Uol\...o

2.5 4Qué entiendes por condiciones ex\'erimentales de un experimento?


~s. c..; YlM!. 'iE:.~ 4> b..jc. L'"'> """!.t.) ~ .,.~(...te. et ~s~o
2.6 ¿Qué caracteriza a un experimento aleatorio?
ft.duvt> ljM '-'0 p>cA.. ""'-!> Co '-'Tn>~
2.7 En un experimento determinista ¿en qué porcentaje la variabilidad del resultado
está explicada por las circunstancias experimentales? 1o o/.
2.8 En un experimento aleatorio ¿qué elementos influyen en la variabilidad de los
resultados? s,(. v~e.l,.; l tf.-1.(__ ivt& vt-'
~ ;~.,..

2.9 La variabilidad de los resultados en un experimento determinista bajo las


mismas circunstancias experimentales ¿cuánto vale? ·fj
2.10 ¿La variabilidad de los resultados de un experimento aleatorio puede ser
totalmente controlada por el experimentador? /Jo st. ~vedL (oV\~ (,..., el
A~v IJ
2.11 En un experimento determinista ¿quién o qué condiciona el resultado?
Cc'-'CIU (1\ bV"l S &: pe? t"\ ~kit~ ~~ ª t'tbJn...
2.12 Si un experimento tie'ne asociado más de un suceso, se trataría de un
experimento. .. ólte..,
-\-ov-\ 0
2.13 En un experimento aleatorio ¿quién o qué condiciona el resultado?
~c.:o~ ~ ro.--" ~r.,~ ~ -tR... L\-ko,..
2.14 ¿Qué se entiende por azar? ¡. 1 • r
~ \o'>~(,\;. No~ ~ ~ S~tic>> ~N.,V'\0..>
2.15 ¿Se podrían controlar los factores que provocan el azar?
N!f)
2.16 ¿Cuántos sucesos tiene asociado un experimento aleatorio?
+ "'e \MO
2.17 ¿En un experimento determinista influye el azar?
tvo ~-~bt. A.~
2.18 ¿Un experimento aleatorio podría llegar a ser determinista?

2.19. E!:ya~ fá~es~~~ri!en~


f> Le.w~·o
2.20. La administración de 500mg de un sedante es un experimento . ..
~ tt_ Y\IV\A, V\A)~
35
/
ÁLGEBRA DE SUCESOS

Los sucesos A, B y e que aparecen en las preguntas siguientes son sucesos de ~


(conjunto de sucesos asociados al experimento), salvo especificación.

2.21 Siendo A y B dos sucesos de~ (conjunto de sucesos asociados al experimento),


si~ e B., ¿qué sucesos son los siguientes?:

a) AnB: A
b) AuB::-f>

2.22 Si A es un suceso de ~. ¿qué sucesos serán los siguientes, siendo E el suceso


seguro?: l

a) A n E= A
b) AuE.:-E'

2.23.- Si A es un suceso de ~. ¿qué sucesos serán los siguientes, siendo A el suceso


complementario de A?:

a) p Svce~ (~ fcl1 1~ Lu
b) 5vc a. }o ~ú'(t)

2.24 Si A es un suceso compatible con el suceso B y B es comyatible con el suceso e,


¿el suceso A n B n e puede ser el suceso imposible?~

2.25 Si dos sucesos A y B son incompatibles, ¿son necesariamente sucesos


elementales? t./o ~~~e fveJ.b. "'--e,~ ú-JS S\..C~S ~~',IQ}
~f'-"1-: ~~l 1

2.26 Si A es un suceso compuesto, ¿estará A contenido en el suceso E (suceso


seguro)? ~( -}uJ... A e'Jk.. C-. ~

2.27 Si A e B e e, ¿qué sucesos son los siguientes?:

a) (AuB)ue =:C-
b) (AnB)ne: A
C!,._/
2.28 Si A e B y e es incompatible con B, ¿A será incompatible con e? /'

2.29 Si A es incompatible con B y B es incompatible con e, ¿podemos decir que A es


incompatible con e? M ~ ~~" ~fe

2.30 Si A es compatible con B y B es compatible con e , ¿podemos decir que A y e


son compatibles? v~ ~~ ~,... ~t Q

37
2.31 Si A n B n C es el suceso imposible, ¿podemos asegurar que A y B son
incompatibles? M~ ¡./(!.. (.&,. \-)1.. ~

2.32 Si A y B son incompatibles, ¿cuál es el suceso (A n B )? ;::::A-


2.33 Si ~on sucesos incompatibles, ¿cuál será el suceso (A n B)?
2.34
v
Si A y B son sucesos incompatibles, ¿cuál será el suceso (A u
-
2.35 Si A y B son sucesos de ~' ¿cuál es el suceso A n B?
4oi;
2.36.- Si A :_B s~n sucesos de ~ ¿qué suceso es (A u B ) ?
An6
2.37.- Si A y B ~esJl~eJ, ¿cuál es el suceso Au B?
2.38 Si A y B son su::sos de ~ ¿qué suceso es (A n B )?
AtvA
2.39 Si A e B, ¿podemos decir que A e B?
No
2.40 Si A e B, ¿cómo se expresa el suceso compuesto por los sucesos que están en B
pero no están en A? A
116
2.41 Si A e B, ¿cómo se expresa el suceso compuesto por lü"s sucesos que no están en
B ni están en A? ~

2.42 Si A y B son sucesos incompatibles y A u B es el suceso seguro, ¿cómo son los


sucesos A y B? (6"""'- ple V\l'fM.~..,· ~

2.43 Si A y B son sucesos compatibles, ¿cómo se expresaría el suceso compuesto por


los sucesos que están en A pero no están en B?
Af\ ~
2.44 Si A y B son sucesos compatibles, ¿cómo se expresaría el suceso compuesto por
los sucesos_gue están en B pero no están en A?

2.45
& 1\-A
¿Cuándo sucede el suceso C siC= A u B?
~ s\lc~ A ol!>
2.46 ¿Cuándo sucede el sqceso C siC = A n B?
A '? e, >; \,1\,\A) 1~k.&~il
2.47 Si A e B y B e C, comprobar que:

a) A u {B n e )= (A u B ) n (A u e ) ~~)O I_S
b) An(BuC)=(AnB)u(AnC) ~4

2.48 Si A es un suceso compatible con el suceso B, B es un suceso compatible con el


C y el A compatible con el C, ¿el suceso A n B n C puede ser el suceso
imposible? .) l
38
2.49 Si A e B y C es compatible con B, ¿sería neces~riamente A compatible con C?
f.Jo ~~~H .tJot'>ft\1\ ~A
2.50 Si A e B , expresa B como unión de ~s sucesos incompatibles.
fl;, ~ Av(~a.11A)
2.51 ¿Cuál es el suceso que contiene a cua(quier suceso?
a_ c;.V(e,:,o >e~..>{o
2.52 Expresa A u B como unión de sucesos incompatibles.

2.53 ¿Todos los sucesos compuestos se pueden expresar como unión de sucesos
elementales? ~'(

2.54 Si Q consta de n sucesos elementales, ¿podrá un suceso A E ; estar compuesto


por un número de sucesos elerpentaltis mayor que n?
fvce')D "-"~lf'\I\C ~~ V\
2.55 Si los sucesos A 1, A2, ... , An son los sucesos que contiene el espacio muestral,
¿cómo podemos expresar el suceso seguro en función de ellos?
~> lo> s..~ee.)->> eh \1\.(M.~lts
2.56 Si el suceso B es un suceso compuesto, ¿cuántos sucesos elementales contendrá
comomínimo? '=-~ ~\MMc 2
2.57 Si el suceso B es un compuesto, ¿cuántos sucesos elementales contendrá como
máximo si Q (espacio muestral) contienen sucesos elementales?
~~ ~ - v'\
2.58 ¿Un suceso compuesto se podrá expresar como unión de sucesos compuestos?
Pon un ejemplo que justifique la respuesta. ~(

2.59 En el experimento de lanzar un dado, pon un ejemplo de dos sucesos compuestos


que sean incompatibles. ~e"~ p-lt' ':1 <)L.(..., ,·~r~

2.60 Si A e Be C, ¿la intersección de los tres sucesos puede ser el suceso


imposible? 1\./'o

2.61 Sí AuB = E y AnB = 0 , ¿cómo son los sucesos Ay B? SvC~~.5 Co~J,"""'~!


2.62 Si A es un suceso compatible con el suceso B y B está contenido en el suceso C,
¿A puede ser incompatible con C? Vb

2.63 Si A e B y C es compatible con B, ¿A sería necesariamente compatible con C?


fVo V'ttt-...,..V.~~
2.64 Si A e B y C es compatible con A y B, ¿qué suceso es (A n ii n C) ?
l]..<P:,o ~ ~p~lt,lt_
2.65 Si A e B y C es compatible con A y B, ¿cómo expresarías el suceso compuesto
por los sucesos comunes entre B y C pero no que no estén en A?

2.66
kl\ 6 (l t
¿El conjunto de sucesos asociados a un experimento ; tiene necesariamente que
contener sucesos compuestos?

39

PROBABILIDAD

2.67 ¿Cuál de los axiomas de Frechet-Kolmogorov alude a la propiedad de que la


suma de las frecuencias relativas es 1? ev3 óx
i o~
¿Con qué concep~o ~staQístico se asocia la probabilidad? f'dw..eu..t:t. flflh'vc.
2.68
9
h.~ \ "1r"V-.J.- ~ vt.Lt-S
2.69 ¿La probabilidad de un suceso puede ser negativa? AJ 0 pv-Ptk_ ')Qv Wfir'~·K.

2.70 En el experimento del lanzamiento de un dado, ¿qué sucesos son elementales y


qué propiedad tienen? \ ~,..,. 1 • • ~c~v Cf eJ.o~A-dt S ~.oY.Slt.s
1

2.71 Según la regla de Laplace ¿cuál será la probabilidad de sacar par en el


experimento de lanzar un dado? ) ¡, -::
lfz
2.72 ¿Qué condiciones se exigen para poder decir que P(A u B) = P(A) + P(B) ?
~ ~eo w.~~~te.s All ~ =r1
2.73 ¿Qué criterio utiliza Savage para definir la probabilidad? p JQ _p)
2.74 ¿En cuál de las definiciones de probabilidad se ve mejor la idea frecuentista de
probabilidad? n.__ 'l.
~~ f' 11\,0 " ' ~ ~
2.75 Aplicando la regla de Laplace ¿cómo justificaríamos que la probabilidad del
suceso imposi6k es cero?

2.76 Según la definición de Laplace ¿cómo podríamos ver que la probabilidad del
sucesose!Juroes l? ~} Svc~'-6 ~ ~~(6 SvC~ ~i)/;
lo, .
2.77 Si P(A)=0,5 y AcB , ¿la P(B) podrásermenorque0,5? A/o ~d,. PI'/
O,)
2.78 Si P(A) = O, 2, ¿cuánto vale la P(A)? O1f p( J- ~~
2.79 Si P(A u B) = 1, ¿podremos decir que A y B son complementarios?)v (o ~,'.SO....,
r""c~ p..~~
2.80 Si P(A)=0,5 y P( B)=0,6, ¿qué podemos decir de ambos sucesos?
~"' to VV" 9"'-~ b~
2.81 ¿Por qué la P(0) = Osegún la axiomática de Frechet-Kolmogorov?
p @S) :: /- p rey ~o
2.82 Si A y B son incompatibles, ¿cuánto valdría P(An B)? )Q..V'\.'1, O

2.83 Conociendo P(A) y P(B), ¿se puede conocer P(A u B)?


~ CANk A ) ~ )~ i\ A(O""'-fA-k}ú.s A
2.84 Si A y B son complementarios, ¿cuánto valdrá P(A u B)? '":: ti.
2.85 Si P(A n B)=O, ¿qué podemos decir de A y B? Svc~ """'" r -5\ )!t
~~~~ltS
41
2.86 Si según la regfa áe Lapface P(A)=0,5 y el número de sucesos posibles es 8,
¿cuántos son los sucesos elementales que contiene el suceso A? t.¡
2.87 Si A 1, A 2 , .• . An, son los sucesos elementales que constituyen el espacio muestra}
Q, ¿cuánto vale la P(A1 u A2 u .. .... u An)? J.
2.88 ¿Cómo expresarías que los sucesos A y B son equiprobables?
f@) ~fea.\
2.89 ¿Los sucesos eleméíÍtales asociados a un experimento tienen todos la misma
pr~abilidad? L- /> ~ .• _ 1 _ U ... I/••
~Wb~pA'f' '1~ ~ V\0 ~c:v~ ~·~on'~"Y
2.90 ¿Cuál es el va,or máximo y mínimo de la probabilidad de un suceso?
O~J.
2.91 Si P(A)=0,2 y P(B)= 0,4 y P(A u B)=0,6 ¿qué podemos decir de los sucesos
AyB? ~cid.>~ ~ \\Mvw-.1'-A·t~
2.92 ¿Cuál de los axiomas de Frechet -Kolmogorov nos permite deducir que P(A) es
siempre mayor o igual que 1?
~p~~ ~ ~ i.
.t
O A:.de•;,. ¡· V\.;5 o~
t-'
2.93 Si P(An B)=P(A), ¿qué podemos decrr de los sucesos A y B?
~ e....,~ ~ ~ÚD .13>
2.94 S~=0,4, ¿puede la P(An B) ser mayor que 0,4?

2.95 ¿Qué condiciones exige Laplace para poder aplicar su Regla?

~~~~~

42
PROBABILIDAD CONDICIONADA

Si A, By C son sucesos E q
2.96 Demostrar que P(A/B) cumple los axiomas de Frechet- Kolmogorov.

2.97 Comprobar que si A y C son sucesos independientes, entonces


P(Ane) = P(A).P(e).

2.98 Demostrar que si A y B son sucesos equiprobables, P(A/B)=P(B/A).

2.99 ¿Cómo son los sucesos A y C si P(A/C)=O?

2.100 Si dos sucesos son incompatibles, ¿son necesariamente independientes?

2.1O1 Si dos sucesos son independientes, ¿son necesariamente incompatibles?

2.102 ¿Qué probabilidad es mayor P(A/B) o P(An B)?

2.103 ¿P(A/B) es siempre mayor que P(A)?

2.104 Si P(A/C)= l, ¿qué relación existe entre los A y C?

2.105 Si AcB, ¿cuánto vale P(A/B)?.

2.106 ¿Cuánto vale P((A uB) / e]?

2.107 ¿Cuánto vale P[(A nB)I e]?

2.108 ¿Cuánto vale P [(A u B) 1 e] si A y B son sucesos incompatibles?

2.109 ¿Cuánto vale P[ (A n B) l e] si A y B son sucesos independientes?

2.110 ¿Cuánto vale P[ A/(B ne)]?

2.111 Expresa la probabilidad del suceso B condicionado por los sucesos A y C

2.112 ¿A qué es igual P(AnBne)?

43
Denominando CP al suceso "tener cáncer de pulmón", F al suceso "ser fumador" y
AF al suceso "tener antecedentes familiares":

2.113 ¿Cómo expresarías la probabilidad de que un fumador tenga cáncer de pulmón?

2.114 ¿Cómo expresarías la probabilidad de ser fumador y tener cáncer de pulmón?

2.115 ¿Cómo expresarías la probabilidad de tener cáncer de pulmón siendo fumador y


teniendo antecedentes familiares?

2.116 ¿Cómo expresarías la probabilidad de tener cáncer de pulmón, ser fumador y


tener antecedentes familiares?

2.117 ¿Cómo expresarías la probabilidad de no tener cáncer de pulmón no siendo


fumador?

2.118 ¿Cómo expresarías la probabilidad de tener cáncer de pulmón no siendo


fumador?

2.119 ¿Qué conclusión sacarías si P(CP/ F )=O?

2.120 ¿Qué conclusión sacarías si P(CP n F )=O?

2.121 ¿Qué conclusión sacarías si P(CP/ F) fuese siempre menor que P(CP)?

2.122 ¿Cuánto vale P( A 1B) sabiendo que P(NB)=0,2?

2.123 ¿Cuánto vale P(A 1E) sabiendo que P(NB)=0,2?

2.124 ¿Cómo expresarías mediante la probabilidad condicionada que los sucesos A y


B son sucesos independientes?

2.125 Si P(NB)~ 1 ¿qué relación existiría entre los sucesos A y B?

Si denominamos Cal suceso ''padecer pancreatitis crónica" y B al suceso "ser


bebedor habitual de alcohol":

2.126 ¿Cómo interpretarías que P(C/B) >P(C)?

2.127 ¿Cómo interpretarías que P(C/B) =P(C)?

2.128 ¿Cómo interpretarías que P(C/ B) <P(C)?

44
Si denominamos M al suceso "padecer melanoma", PL al suceso" tener la piel
blanca" y SE al suceso "tomar el sol en exceso":

2.129 ¿Qué representa la probabilidad P (M 1 PB 11 SE)?

2.130 ¿Qué representa la probabilidad P (M 1 PB 11 SE)?

2.131 ¿Qué interpretación tendría que P(M/SE)>P(M/PB)?

2.132 ¿Qué representa la probabilidad P(SE/M)?

2.133 Sabiendo que la exposición excesiva al sol está asociado con padecer melanoma,
¿cómo lo expresarías mediante la probabilidad?

2.134 ¿Qué interpretación tendría que P(SE 1 M)=O?

2.135 ¿Qué interpretación tendría que P(M/PB)>P(M/ PB )?

45
TESTS DIAGNÓSTICOS

2.136 ¿Cuales son las características de un test diagnóstico?

2.137 ¿Cuales son las propiedades de un test diagnóstico?

2.138 Si queremos determinar la sensibilidad de un test diagnóstico, ¿tendremos que


verificar el resultado del test entre los enfermos o entre los sanos?

2.139 ¿De quién depende la especificidad de un test diagnóstico?

2.140 Si queremos determinar la sensibilidad de un test diagnóstico, tendremos que ver


cuántos enfermos dan como resultado del test ...

2.141 Si queremos calcular la especificidad de un test diagnóstico, ¿tendremos que


verificar el resultado del mismo entre los sanos o entre los enfermos?

2.142 Si la prevalencia de un test diagnóstico aumenta, ¿cuál de los valores predictivos


de un test diagnóstico disminuye?

2.143 Si la prevalencia de un test diagnóstico disminuye, ¿cuál de los valores


predictivos aumenta?

2.144 Si la sensibilidad de un test diagnóstico aumenta, ¿qué valor predictivo


aumenta?

2.145 ¿Qué le pasa al valor predictivo positivo de un test diagnóstico si la


especificidad aumenta?

2.146 ¿Qué le pasa al valor predictivo negativo de un test diagnóstico si la


especificidad aumenta?

2.147 ¿Qué le pasa a la sensibilidad de un test diagnóstico si la prevalencia aumenta?

2.148 ¿Qué le pasa a la especificidad de un test diagnóstico si la prevalencia


aumenta?

2.149 Un test diagnóstico que tiene un valor predictivo positivo alto, ¿servirá mejor
para detectar o para descartar?

2.150 Un test diagnóstico que tiene un valor predictivo negativo alto, ¿servirá mejor
para detectar o para descartar?

2.151 Si la prevalencia aumenta, ¿hará que el test diagnóstico descarte o detecte


mejor?

47
2.152 Si la prevalencia disminuye, ¿hará que el test diagnóstico descarte o detecte
mejor?

2.153 ¿Cuándo diremos que un test diagnóstico es lícito para diagnosticar una
enfermedad?

2.154 ¿De quién depende la eficacia de un test diagnóstico?

2.155 En el diagnóstico de una enfermedad, ¿qué consideráremos un acierto?

2.156 ¿Entre qué valores varia el coeficiente kappa de Cohen?

2.157 ¿Qué significaría que el coeficiente kappa de Cohen valiese 1?

2.15 8 ¿Qué significaría que el coeficiente kappa de Cohen valiese O?

2.159 Si tenemos varios test diagnósticos para diagnosticar una misma enfermedad,
¿cómo decidiremos cual es el mejor?

2.160 Si buscamos un test diagnóstico para descartar, ¿qué características tiene que
tener?

2.161 Si buscamos un test diagnóstico para detectar, ¿qué características tiene que
tener?

2.162 Si un test diagnóstico se pasa a un grupo de enfermos y el 99% dan el test


positivo diremos que el test diagnóstico es muy ...

2.163 Si un test diagnóstico ha dado negativo en un grupo de personas resultando que


el 98% no tienen la enfermedad, ¿qué diremos de dicho test?

2.164 Si un test diagnóstico se pasa a un grupo personas que no tienen la enfermedad


y el 99% dan el test negativo diremos que el test diagnóstico es muy .. .

2.165 Si un test diagnóstico ha dado positivo en un grupo de personas de las que el


98% tienen la enfermedad, ¿qué diremos de dicho test?

2.166 ¿Cómo podríamos determinar experimentalmente la sensibilidad de un test


diagnóstico?

2.167 ¿Cuándo diríamos que la especificidad de un test diagnóstico es alta?

2.168 ¿Cómo podríamos calcular experimentalmente el valor predictivo positivo de un


test diagnóstico?

2.169 ¿Cuándo diríamos que la sensibilidad de un test diagnóstico es baja?

2.170 ¿Cómo podríamos calcular experimentalmente el valor predictivo negativo de un


test diagnóstico?

48
2.171 ¿Cómo podríamos calcular experimentalmente los valores característicos y los
predictivos de un test diagnóstico con una sola muestra?

2.172 Si el 98% de los pacientes que padecen una determinada enfermedad la cursan
con fiebre alta y consideramos la fiebre como un test diagnóstico de dicha
enfermedad, ¿qué sensibilidad y especificidad tendría dicho test? ¿Sería un test
bueno para descartar o para detectar?

2.173 La rubéola es una enfermedad vírica con erupción cutánea. El 99% de los
pacientes con una enfermedad vírica con erupción cutánea distinta de la rubéola
no tienen inflamación de ganglios en el cuello y el 97% de los que la padecen la
presentan. Si consideramos este síntoma -la inflamación de ganglios- como test
diagnóstico para diagnosticar la rubéola, ¿cómo serían las características de
dicho test?

2.174 Si en un test diagnóstico el 1% son falsos negativos, ¿cuál es el valor predictivo


negativo de dicho test?

2.175 Si en un test diagnóstico el 2% son falsos negativos, ¿cuál es el valor predictivo


positivo de dicho test?

2.176 La probabilidad de que teniendo una enfermedad un test diagnóstico dé positivo


se denomina ...

2.177 La probabilidad de que el resultado de un test diagnóstico sea positivo sin tener
la enfermedad es O, l. ¿Cuál será el valor predictivo positivo del test?

2.178 La probabilidad de que dando el test diagnóstico negativo no se tenga la


enfermedad es . ..

2.179 ¿Un test diagnóstico de alta sensibilidad y alta especificidad puede ser bueno
para detectar?

2.180 Si el valor predictivo positivo del test diagnóstico de una enfermedad es del
25%, ¿qué quiere decir?

2.181 Si un test se aplica en un grupo en el que la prevalecía de la enfermedad es


superior a la de la población en general, ¿cuál de los parámetros del test se ven
afectados?

2.182 Si el valor predictivo negativo de una prueba diagnóstica para diagnosticar una
enfermedad es del 96%, ¿qué podríamos decirle a un enfermo si utilizamos
dicho test para diagnosticarle dicha enfermedad?

2.183 Si al estudiar un test diagnóstico la probabilidad de obtener un resultado


negativo cuando el paciente tiene la enfermedad es de un 30% y la probabilidad
de que sea negativo cuando no se tiene la enfermedad es del 92%, ¿cuál es la
sensibilidad del test?

49
2.184 En la pregunta anterior, ¿cuál sería la probabilidad de que, si el resultado del
test es positivo, se padezca la enfermedad?

2.185 Si al estudiar un test diagnóstico el9% son falsos positivos, ¿qué significa?

2.186 Si al estudiar un test diagnóstico el 10% son falsos negativos, ¿qué significa?

2.187 Si de 100 personas que han dado un resultado positivo en un test diagnóstico 90
tienen la enfermedad, ¿se trata de un test bueno para descartar o para detectar?

2.188 Si en una prueba diagnóstica su especificidad es de un 95%, ¿cuál es la


probabilidad de que este test dé como resultado un falso positivo?

2.189 Un test diagnóstico aplicado a 100 enfermos da negativo en 5 de ellos, ¿qué


información tendremos sobre dicho test?

2.190 Si la sensibilidad y la especificidad de un test diagnostico son 0,99, ¿el test será
bueno para descartar?

2.191 Si el valor predictivo positivo de una prueba diagnóstica para diagnosticar una
enfermedad es del 96%, ¿qué podríamos decirle a un enfermo si utilizamos ese
test para diagnosticarle dicha enfermedad?

50
VARIABLES ALEATORIAS

2.192 ¿Cómo se define una variable aleatoria?

2.193 La variable aleatoria nos permite calcular la probabilidad de un ...

2.194 ¿Qué significa que hayamos definido una variable aleatoria por extensión?

2.195 ¿Qué es una ley de probabilidad?

2.196 ¿Qué significa que hayamos definido una variable aleatoria por comprensión?

2.197 ¿Toda función que aplica el espacio muestral Q en el conjunto de los números
reales R sea una variable aleatoria?

2.198 ¿Cuántas tipos de variables aleatorias hay teniendo en cuenta la naturaleza de


los valores que toman dichas variables?

2.199 ¿Cuánto vale la suma de todas las probabilidades de una variable aleatoria?

2.200 Define una variable aleatoria basada en el experimento de lanzar una moneda.

2.201 Define una variable aleatoria basada en el experimento consistente en la


administración de un fármaco, considerando si se tiene reacción alérgica al
mismo o no y teniendo en cuenta que el 20% de los que toman el fármaco la
sufren.

2.202 ¿Cómo obtendremos cuál es la probabilidad de que una variable aleatoria tome
un determinado valor?

51
MODELOS DE PROBABILIDAD

2.203 ¿El modelo binomial es característico de una variable aleatoria discreta o


continua?

2.204 ¿Cuáles son los parámetros característicos del modelo binomial?

2.205 ¿Cuánto vale la media en la distribución binomial?

2.206 ¿Cuánto vale la varianza en una distribución binomial?

2.207 ¿Bajo qué condiciones experimentales debe aplicarse un modelo binomial?

2.208 ¿Qué valores toma la variable aleatoria en un modelo binomial?

2.209 ¿Cuántos valores toma la variable aleatoria binomial si n=6?

2.210 En un modelo binomial, ¿entre que valores puede tomar el parámetro p?

2.211 En un modelo binomial, ¿el parámetro n puede ser negativo?

2.212 ¿El menor valor que puede tomar una variable binomial varía de una distribución
binomial a otra?

2.213 ¿El valor máximo que puede tomar una variable aleatoria binomial varía de una
distribución a otra?

2.214 ¿El modelo de Poisson es característico de variable aleatoria discreta o continua?

2.215 ¿Cuáles son los parámetros característicos de un modelo de Poisson?

2.216 ¿Cuánto vale la media de una distribución de Poisson?

2.217 ¿Cuánto vale la varianza de una distribución de Posisson?

2.218 ¿Cómo se denomina también a la distribución de Poisson?

2.219 ¿Qué valores toma una variable aleatoria de Poisson?

2.220 ¿Bajo qué condiciones se puede aproximar una variable aleatoria Binomial por
una de Poisson?

2.221 ¿Bajo qué condiciones se puede aproximar una variable aleatoria de Poisson por
una Binomial?

2.222 ¿Cuál es el modelo de Bemouilli?

53
2.223 Si una variable aleatoria sigue un modelo Normal, ¿esta variable es discreta o
continua?
2.224 ¿Cómo se obtienen las probabilidades correspondientes a los valores de una
variable aleatoria Normal?

2.225 ¿Qué valores puede tomar una variable aleatoria Normal?

2.226 ¿Qué condiciones debe cumplir un experimento aleatorio para que genere una
distribución normal?

2.227 ¿Cuáles son los parámetros característicos de un modelo Normal?

2.228 ¿Bajo qué condiciones se puede aproximar una variable Binomial por una
Normal?

2.229 ¿Bajo qué condiciones se puede aproximar una variable Poisson por una
Normal?

2.230 ¿Qué se entiende por transformación normalizante?

2.231 Si queremos saber la probabilidad de que de 1Opacientes vacunados de la gripe,


menos de 3 tengan una reacción alérgica, ¿qué ley de probabilidad tenemos que
aplicar?

2.232 Si queremos saber la probabilidad de que al menos 2 personas fallezcan por hora
en un hospital, ¿qué ley de probabilidad tenemos que aplicar?

2.233 ¿Qué es la corrección de continuidad?

2.234 Si queremos saber la probabilidad de que un nifio recién nacido tenga un peso
menor de 3 Kg, ¿qué modelo de probabilidad debemos considerar?

2.235 Una distribución Normal es simétrica respecto de .. .

2.236 En una distribución Normal el intervalo que contiene aproximadamente el 68%


de las observaciones, ¿cómo se obtiene?

2.23 7 La variable aleatoria "número de personas de entre n observadas que verifican


una de las opciones de un característica dicotómica", ¿sigue siempre una
distribución Binomial?

2.238 Si la variable aleatoria X sigue una distribución Binomial y tenemos que


calcular la P(X<3) mediante la aproximación a una distribución normal
aplicando la corrección de continuidad, ¿qué probabilidad tendremos que
calcular?

2.239 Si la variable aleatoria X sigue una distribución Binomial y tenemos que


calcular la P(X>3) mediante la aproximación a una distribución normal
aplicando la corrección de continuidad, ¿qué probabilidad tendremos que
calcular?
54
2.240 Si la variable aleatoria X sigue una distribución Binomial y tenemos que calcular
la P(X~3) mediante la aproximación a una distribución normal aplicando la
corrección de continuidad, ¿qué probabilidad tendremos que calcular?

2.241 Si la variable aleatoria X sigue una distribución Binomial y tenemos que calcular
la P(X ~ 3) mediante la aproximación a una distribución normal aplicando la
corrección de continuidad, ¿qué probabilidad tendremos que calcular?

2.242 Si la variable aleatoria X sigue una distribución Binomial y tenemos que calcular
la P(X=3) mediante la aproximación a una distribución normal aplicando la
corrección de continuidad, ¿qué probabilidad tendremos que calcular?

2.243 Si la variable aleatoria X sigue una distribución Binomial y tenemos que calcular
la P(O<X<3) mediante la aproximación a una distribución normal aplicando la
corrección de continuidad, ¿qué probabilidad tendremos que calcular?

2.244 Si la variable aleatoria X sigue una distribución Binomial y tenemos que calcular
la P(O~X~3) mediante la aproximación a una distribución normal aplicando la
corrección de continuidad, ¿qué probabilidad tendremos que calcular?

2.245 ¿La corrección de continuidad es necesaria para aproximar una variable normal
por una binomial?

2.246 Si la variable aleatoria X se distribuye normalmente y queremos calcular


P(X<30,4), ¿que paso previo tendremos que dar para poder buscar esta
probabilidad en la tabla?

2.247 Si la variable aleatoria X se distribuye normalmente, ¿cuál de las siguientes


probabilidades es mayor: P(X<3,2) o P(X>3,2)?

2.248 ¿Por qué para buscar probabilidades en una distribución Normal es necesario
tipificar?

2.249 Si hemos tenido que aproximar una distribución de Binomial mediante distribución
Normal, ¿Qué podemos decir de la media de la distribución Binomial?

2.250 Si hemos tenido que aproximar una distribución de Poisson mediante distribución
Normal, ¿Qué podemos decir de la media de la distribución de Poisson?

55
CAPÍTULO III

MUESTREO
y
ESTIMACIÓN
MUESTREO

3.1 ¿Qué es una muestra?

3.2 ¿Qué condiciones debe cumplir una muestra?

3.3 ¿Qué quiere decir que una muestra es representativa?

3.4 ¿Cuándo será conveniente realizar un muestreo estratificado o por


conglomerados?

3.5 ¿Cómo son entre sí los elementos que forman un estrato?

3.6 ¿Cómo son entre sí los elementos que forman un conglomerado?

3.7 ¿Cómo se realiza la elección de los elementos que van a pertenecer a la muestra
en un muestreo estratificado?

3.8 ¿Cómo se realiza la elección de los elementos que van a pertenecer a la muestra
en un muestreo por conglomerados?

3.9 ¿Los conglomerados entre sí son homogéneos o heterogéneos?

3.1 O ¿Los estratos entre sí son homogéneos o heterogéneos?

3.11 ¿Cómo tienen que ser los elementos de una población para que el método de
muestro mas adecuado sea el aleatorio simple?

3.12 ¿Cómo se realiza un muestreo aleatorio simple?

3.13 ¿Por qué existen distintos tipos de muestreo?

3.14 ¿Qué quiere decir que una muestra es aleatoria?

3.15 ¿Pueden existir varias muestras representativas y aleatorias de una población?

3.16 ¿Qué es el muestro?

3.17 ¿Qué circunstancias podrían hacer que un muestreo no fuese aleatorio?

3.18 ¿Qué es el muestreo con reemplazamiento?

3.19 En un muestreo estratificado el número de elementos de cada estrato que van a


formar parte de la muestra ¿de quien depende?

59
3.20 ¿Qué son los muestreos bietápicos?

3.21 En un muestro estratificado, ¿los tamaños de los estratos son iguales?

3.22 ¿Cómo se realiza un muestreo sistemático?

3.23 ¿Qué tipo de muestreo realizariamos si queremos conocer la tensión arterial


media de las personas mayores de 65 años?

3.24 ¿Qué circunstancias condicionan la representatividad de la muestra?

3.25 ¿Cómo se consigue que la muestra sea aleatoria?

60
ESTIMACIÓN

3.26 ¿Qué es un estadístico?

3.27 ¿De qué depende un estadístico?

3.28 ¿Qué es un estimador?

3.29 ¿Un estadístico puede tomar un valor negativo?

3.30 ¿Todo estadístico es un estimador?

3.31 ¿Qué es una estimación?

3.32 ¿Todo estimador es un estadístico?

3.33 ¿Qué diferencia existe entre una estimación y un estimador?

3.34 ¿Qué diferencia hay entre un estadístico y un estimador?

3 .3 5 ¿En que consiste estimar un parámetro?

3.36 ¿Pueden existir varios estimadores para estimar un mismo parámetro?

3 .3 7 ¿Qué es la cota de error?

3.38 ¿Qué es nivel de confianza?

3.39 ¿De qué depende la cota de error de la media?

3 .40 ¿Qué es el error de muestro?

3.41 ¿Cómo influye el nivel de confianza en el error de muestreo?

3.42 Si en el 95% de las muestras la desviación de su media respecto a la media de la


población es menor que 2, ¿qué nombre recibe dicho valor?

3.43 Si el tamaño de la muestra aumenta, ¿mejoraría la precisión de la estimación?

3.44 En una población de datos cualitativos ¿qué parámetro se suele estimar?

3.45 La dispersión de la población en la estimación de la media ¿cómo afecta a la


cota de error?

3.46 ¿Cuál es el mejor estimador de la varianza poblacional?

61
3.47 Si en la estimación de una media la cota de error vale O, ¿cual sería su
interpretación?
3.48 ¿De qué depende la cota de error en la estimación de una proporción?

3.49 ¿En la estimación de una media la cota de error puede ser menor que 1?

3.50 Si en la estimación de una proporción la cota de error vale O, ¿cual sería su


interpretación?

3.51 Si para un error máximo admisible menor que 2 el tamaño de la muestra para
estimar una media es 25, ¿cuál sería el tamaño de la muestra bajo las mismas
condiciones si el error máximo admisible fuese menor que 1?

3.52 ¿Qué interpretación tiene que la cota de error sea grande?

3.53 Si la estimación de la edad de una población es de 60 años con una cota de error
de 2 años y con un nivel de confianza de 0,95, ¿qué interpretación tiene esta
estimación?

3.54 ¿Cómo conseguiremos una buena estimación de la media para un mismo nivel
de significación si la población es muy dispersa?

3.55 Si la estimación por intervalos de la proporción de hipertensos de una población


es (1 %; 8%) con un nivel de confianza de 0,95, ¿qué interpretación daremos a
este resultado?

3.56 Si la estimación por intervalos de la media de la tensión arterial de una población


es (115; 119) mmHg con un nivel de confianza de 0,95, ¿qué interpretación
daremos a este resultado?

3.57 ¿Cuál es el mejor estimador de la varianza muestra!?

3.58 ¿En la estimación de una proporción la cota de error puede ser mayor que 1?

3.59 ¿Qué diferencia hay entre la cota de error y el error máximo admisible?

3.60 Supongamos que la cota de error en la estimación de una proporción es de un


1% para un nivel de confianza del 99%. Si el nivel de confianza fuera del 95%,
¿qué ocurriría con la cota de error?

3.61 Si aumentamos el nivel de confianza, bajo las mismas condiciones


experimentales, ¿cómo afectará a la precisión de la estimación?

3.62 ¿El error máximo admisible para la estimación de una proporción depende del
nivel de confianza?

3.63 ¿Cuál es la paradoja de Friedman en la estimación de una media?

3.64 ¿Cómo se resuelve la paradoja de Friedman en la estimación de una media?

62
3.65 ¿Cómo se resuelve la paradoja de Friedman en la estimación de una proporción?

3.66 En el cálculo del tamaño de la muestra para estimar una proporción ¿cuál es el
caso más desfavorable pare resolver la paradoja de Friedman?

3.67 ¿Qué es el error máximo admisible?

3.68 ¿Cómo influye el error máximo admisible en el tamaño de una muestra?

3.69 ¿El error máximo admisible para calcular el tamaño de una muestra para la
estimación de una proporción puede ser mayor que 1?

3.70 ¿Cómo influye en la cota de error el aumento del tamaño de la muestra?

3.71 ¿Cómo repercute en el tamaño de la muestra de la estimación de una media el


hecho de que la población sea muy dispersa?

3.72 ¿El error máximo admisible para calcular el tamaño de una muestra para la
estimación de una media es siempre mayor que 1?

3.73 Si aumentamos el nivel de confianza, ¿qué sucederá con el tamaño de la


muestra?

3.74 ¿El tamaño de una muestra para la estimación de una proporción depende del
nivel de confianza?

3.75 ¿Qué es el factor de corrección para poblaciones finitas?

3.76 ¿Cómo afecta al error de muestreo el factor de corrección para poblaciones


finitas?

3.77 ¿Cuándo consideramos que una población es infinita?

3.78 ¿Cómo se realiza el muestreo con reemplazamiento?

3.79 ¿Cuándo será necesario realizar una estimación?

3.80 ¿En qué consiste una estimación por intervalos?

3.81 ¿Cuál es el intervalo de confianza en la estimación de la media poblacional?

3.82 ¿Cuál es el intervalo de confianza en la estimación de la proporción


poblacional?

3.83 ¿Cuánto vale la amplitud del intervalo de confianza?

3.84 ¿Qué significaría que la amplitud del intervalo de confianza valiese O?

3.85 Si en una muestra de 20 enfermos se ha observado que el tiempo medio de


curación de un proceso infeccioso es de 1O días y la cota de error es 2 días,

63
considerando un nivel de confianza del 95% ¿cuál será el intervalo de
confianza?

3.86 Si en una muestra de 25 enfermos se ha obtenido que el intervalo de confianza


del tiempo de curación de un proceso infeccioso es (7; 12)días, con un nivel de
confianza del 99%, ¿qué interpretación tiene este intervalo?

3.87 Si en el caso anterior el tamañ.o de la muestra hubiese sido de 100, ¿la amplitud
de intervalo de confianza habría sido mayor o menor que la amplitud anterior?

3.88 Si se quiere disminuir el error máximo admisible a la mitad en la estimación de


una media, ¿cuánto tendremos que aumentar el tamaño de la muestra?

3.89 ¿Cómo afecta a la estimación de la predicción de un valor de la variable


dependiente Y para un valor de la variable independiente X=x 0 que dicho valor
se aleje de la media de los valores de X?

3.90 Si la dispersión de la variable independiente X es grande, ¿cómo afectará a la


estimación de la predicción de la variable dependiente Y para un valor X = x0 ?

3.91 ¿Con cuántos grados de libertad se trabaja en la estimación de una predicción?

3.92 ¿El intervalo de confianza correspondiente a la estimación de un parámetro


depende del nivel de confianza?

64
CAPÍTULO IV

CONTRASTE
.DE
,
HIPOTESIS
CONTRASTE DE HIPÓTESIS

4.1 En un contraste de hipótesis, ¿qué hipótesis se supone cierta?

4.2 ¿Qué es la hipótesis nula?

4.3 ¿Qué hipótesis no se contrasta en un contraste de hipótesis?

4.4 ¿Cómo se contrasta una hipótesis?

4.5 ¿Qué es el nivel de significación?

4.6 ¿Qué es la potencia del test?

4.7 ¿Qué es la hipótesis alternativa en un contraste de hipótesis?

4.8 La hipótesis alternativa ¿cuando se rechaza?

4.9 ¿Cómo medimos el riesgo de rechazar la hipótesis nula y que realmente sea
cierta?

4.10 ¿Cómo medimos el riesgo de aceptar la hipótesis nula y que ésta sea falsa?

4.11 ¿Cómo denominamos a la probabilidad de rechazar la hipótesis nula?

4.12 ¿Cómo denominamos a la probabilidad de acertar al rechazar la hipótesis nula?

4.13 Aceptar la hipótesis nula siendo falsa se denomina ...

4.14 ¿Qué supone que un test sea muy potente?

4.15 ¿Cuáles son los elementos característicos de un test o contraste?

4.16 ¿Cómo podemos aumentar la potencia de un test o contraste?

4.17 En un contrate de hipótesis sólo podemos aceptar la hipótesis ...

4.18 ¿Cómo denominamos a la probabilidad de equivocamos al aceptar Ho?

4.19 ¿Puede existir más de un test para contrastar una misma hipótesis?

4.20 ¿Cómo sabremos cual es el mejor test para contrastar una misma hipótesis en el
caso de que se disponga de más de uno?

67
4.21 ¿Qué es un test paramétrico?

4.22 ¿Qué es un test no paramétrico?

4.23 ¿Qué tests son más potentes: los paraméticos o los no paramétricos?

4.24 ¿Por qué no podemos aceptar Ho?

4.25 ¿A qué llamamos nivel critico en un contraste de hipótesis?

4.26 ¿Cuál es el mayor nivel de significación que podemos considerar para contrastar
una hipótesis?

4.27 ¿Qué test tiene más capacidad para rechazar una hipótesis nula: un test bilateral
o uno unilateral?

4.28 ¿Qué diferencia hay entre un test bilateral o uno unilateral?

4.29 Si el nivel crítico al cual hemos rechazado la hipótesis nula es menor que 0,01 en
un test bilateral, ¿cuál será el nivel critico si el test se puede hacer unilateral?

4.30 ¿Los contrastes no paramétricos pueden ser unilaterales?

4.31 Si en un contraste de hipótesis el nivel critico es 0,001, ¿cómo se interpretaría?

4.32 Si bajo las mismas condiciones experimentales bajamos el nivel de significación,


¿qué le ocurre a la potencia?

4.33 ¿Cuál es la hipótesis nula en el contraste de una media?

4.34 ¿Cuál es la hipótesis alternativa en el contraste de una media si el test es


bilateral?

4.35 ¿Cuál es la hipótesis alternativa en el contraste de una media si el test es


unilateral?

4.36 En el contraste de una media, ¿cuáles son las diferencias entre un test bilateral y
uno unilateral?

4.37 En el contrate de una media, ¿de que depende el tamaño de la muestra?

4.38 Si la hipótesis alternativa en el contraste de una proporción es H 1 : 1r = 1r0 ,


¿el test será bilateral o unilateral?

4.39 ¿Cómo afecta a la hipótesis nula que el test sea bilateral o unilateral?

4.40 ¿Cuál es la hipótesis alternativa en el contraste de una proporción, si el test es


bilateral?

4.41 En el contrate de una proporción ¿de qué depende el tamaño de la muestra?


68
4.42 Si queremos saber si la media de la tensión arterial sistólica de la población es
superior a 150mmHg, ¿cuál será la hipótesis nula en este contraste?

4.43 Si queremos saber si la media de la tensión arterial sistólica de la población es


superior a 150mmHg, ¿cuál será la hipótesis alternativa en este contraste?

4.44 ¿Cómo afecta al test el factor de corrección para poblaciones finitas?

4.45 Si una hipótesis se rechaza con un nivel de significación del 5%, ¿se rechazaría
all%?

4.46 Si una hipótesis se rechaza con un nivel de significación del 0,5%, ¿se rechazaría
all%?

4.47 Si una hipótesis se rechaza con un test cuya potencia es de un 80%, ¿se
rechazaría con uno cuya potencia fuera de un 70%?

4.48 Si una hipótesis se rechaza con un test cuya potencia es de un 80%, ¿se
rechazaría con uno cuya potencia fuera de un 85%?

4.49 Si aumentamos el tamaño de la muestra, ¿cómo afectará al nivel crítico?

4.50 Si deseamos rechazar una hipótesis, ¿cómo tendremos que considerarla?

4.51 Si la probabilidad de aceptar la hipótesis alternativa de un test es alta siendo esta


cierta, ¿qué podemos decir sobre él?

4.52 Si en un test unilateral se rechaza la hipótesis nula con un nivel crítico igual a
0,05, ¿cuál será el nivel crítico si el test es bilateral?

4.53 ¿Los grados de libertad en un contraste influyen en la potencia de un test?

4.54 En cualquier test, si la población es infmita, ¿los grados de libertad son infinitos?

4.55 En el contraste de una media, ¿de qué dependen los grados de libertad del test?

4.56 Si en el contraste de una media los grados de libertad son 22, ¿cuál será el
tamaño de la muestra utilizada para contrastar la hipótesis?

4.57 Si la media de la tensión arterial sistólica de una población se supone que supera
los 150mmHg y no se puede rechazar la hipótesis nula de que la media
poblacional sea igual a 150mmHg .con un test cuya potencia es de un 80%, ¿qué
significa?

4.58 En el caso anterior, si aumentamos el tamaño de la muestra, ¿a qué afectará?

4.59 Si en el contraste de una proporción no podemos rechazar la hipótesis nula, ¿a


qué conclusión llegaremos?

69
4.60 Si en un contraste no se puede aceptar la hipótesis alternativa y la potencia del
test era del 30%, ¿qué seria aconsejable?

4.61 ¿Cómo llamamos a la probabilidad de aceptar la hipótesis nula siendo cierta?

4.62 ¿Cuándo son necesarios los contrastes de hipótesis?

4.63 Si queremos aceptar una hipótesis, ¿como tenemos que considerarla?

4.64 Si queremos saber si el %de jóvenes que beben supera el 80%, ¿qué contraste
tendremos que hacer?

4.65 Si queremos saber si una determinada enfermedad cursa con anemia y la


concentración normal de glóbulos rojos en esa población es de 4millones, ¿qué
contraste tendremos que hacer?

4.66 Si queremos saber si en una población de alcohólicos hay más hombres que
mujeres, ¿qué contraste tendremos que hacer?

4.67 Si se sospecha que una determinada enfermedad altera la concentración de


leucocitos, ¿tendremos que hacer un contraste unilateral o bilateral?

4.68 Si al estudiar la tensión arterial sistólica (TAS) de una población consideramos


como hipótesis alternativa que la TAS es superior a150mmHg, ¿qué
sospechamos de esta población?

4.69 ¿Por qué no se contrastan los parámetros de la muestra?

4. 70 Si queremos saber si en una población por cada hombre hay dos mujeres, ¿qué
contraste tendremos que hacer?

70
CAPÍTULO V

ANÁLISIS DE LA
VARIABILIDAD I:

REGRESIÓN
REGRESIÓN

5.1 ¿A qué llamamos función de regresión?

5.2 ¿Qué es el método de mínimos cuadrados?

5.3 ¿En qué se basa el método de mínimos cuadrados para determinar los parámetros
característicos de la función que queremos ajustar?

5.4 ¿Para qué se utiliza la regresión?

5.5 ¿Cuántas rectas de regresión lineal hay?

5.6 ¿Cuáles son los parámetros característicos de una recta de regresión?

5.7 ¿Qué valores se pueden predecir a partir de la recta de regresión de Y sobre X?

5.8 ¿Qué interpretación tiene el coeficiente de regresión de la recta de regresión de


Y sobre X?

5.9 ¿Qué interpretación tiene el coeficiente de regresión de la recta de regresión de


X sobre Y?

5.1 O Si la pendiente de la recta de regresión de Y sobre X es negativa, ¿cuál será el


signo de la pendiente de la otra recta de regresión?

5.11 ¿En qué unidades se expresa el término independiente de la recta de regresión de


Y sobre X?

5.12 ¿En qué unidades se expresa el termino independiente de la recta de regresión de


X sobre Y?

5.13 ¿En qué unidades se expresa la pendiente de la recta de regresión de Y sobre X?

5.14 ¿En qué unidades se expresa la pendiente de la recta de regresión de X sobre Y?

5.15 ¿Qué coeficiente mide la variación de Y por unidad de X en las rectas de de


regresión lineal?

5.16 ¿Qué coeficiente mide la variación de X por unidad de Y en las rectas de


regresión lineal?

5.17 ¿Qué interpretación tiene el coeficiente de determinación lineal?

5.18 ¿En qué unidades se mide el coeficiente de determinación lineal?

5.19 ¿Puede el coeficiente de determinación lineal ser negativo?

73
5.20 ¿Puede el coeficiente de determinación lineal ser mayor que 1?

5.21 ¿Entre qué valores oscila el coeficiente de determinación lineal?

5.22 ¿Qué mide el coeficiente de correlación lineal?

5.23 ¿Qué interpretación tendría que el coeficiente de correlación lineal fuese 2,5?

5.24 ¿El coeficiente de correlación lineal puede ser negativo?

5.25 ¿El coeficiente de correlación lineal puede ser O?

5.26 ¿Entre qué valores oscilan los coeficientes de regresión lineal?

5.27 ¿En qué unidades se mide el coeficiente de correlación lineal?

5.28 ¿Cuál de los coeficientes que caracterizan la regresión lineal me permitirá


conocer el sentido de la dependencia de las variables?

5.29 ¿Qué condición deben cumplir las variables en la regresión lineal para que el
coeficiente de correlación mida el grado de relación entre ellas?

5.30 Si el coeficiente de determinación vale O, ¿qué % de la variación de Y no es


debida a X?

5.31 ¿Cómo es la relación entre las variables si el coeficiente de correlación lineal


vale 1?

5.32 ¿Qué interpretación tiene una predicción de la variable Y hecha mediante la


regresión lineal?

5.33 Si el coeficiente de correlación lineal es negativo, ¿los coeficientes de regresión


correspondientes serán opuestos?

5.34 ¿Por qué si el signo del coeficiente de correlación lineal es negativo, el signo de
las pendientes de las rectas de regresión también es negativo?

5.35 Si el coeficiente de correlación lineal vale -0,91, ¿qué% de la variación de Y es


debida a X?

5.36 Si el coeficiente de correlación lineal vale -0,92, ¿cuál el sentido de la


dependencia de las variables?

5.37 Si el 81% de la variación de X es debida a Y, ¿cuánto valdrá el coeficiente de


correlación?

5.38 Si el coeficiente de correlación lineal vale O, ¿qué relación existe entre las
variables?

74
5.39 ¿Qué mide la varianza del ajuste?

5.40 Si la pendiente de la recta de regresión de Y sobre X vale O, ¿cuánto valdrá el


coeficiente de correlación lineal?

5.41 ¿Cómo obtendremos el % de la variación de Y que no es explicada por la


variación de X?

5.42 ¿Como serán las rectas de regresión si las variables son independientes?

5.43 Si la varianza del ajuste vale O, ¿qué podemos decir de las variables?

5.44 Si el coeficiente de correlación lineal vale -1, ¿qué relación existe entre las
variables?

5.45 ¿Cómo se obtendría la varianza de Y debida a X?

5.46 Si dos variables son linealmente independientes, ¿Cuál es la amplitud del ángulo
que forman las dos rectas?

5.47 Si dos variables son independientes, ¿cómo será la varianza del ajuste?

5.48 Si la varianza del ajuste vale O, ¿cuánto vale el coeficiente de determinación?

5.49 Si el coeficiente de correlación lineal vale -1, ¿cuánto vale la varianza del ajuste?

5.50 ¿Qué diferencia hay entre la varianza de Y debida a X y el coeficiente de


determinación?

5.51 ¿Qué hipótesis se contrasta en el contraste del coeficiente de correlación lineal?

5.52 ¿Qué tipo de características intervienen en el contraste del coeficiente de


correlación lineal?

5.53 Si rechazamos la hipótesis nula en el contraste del coeficiente de correlación


lineal, ¿qué relación existe en las dos variables que intervienen?

5.54 Si en un contraste del coeficiente de correlación lineal aceptamos la hipótesis


alternativa de que el coeficiente de correlación sea menor que O : H 1 : p < O,
¿qué tipo de relación existe en las dos variables que intervienen?

5.55 Si al realizar el contraste del coeficiente de correlación lineal no podemos


rechazar la hipótesis nula H 0 : p =O, lo que supondría hacer una hipótesis de
independencia de las variables, ¿qué relación concluiremos que existe entre las
mismas?

5.56 Si queremos saber si el sentido de la relación entre dos características


cuantitativas es el de que cuando una disminuye la otra disminuye también, ¿qué
tipo de test tenemos que realizar?

75
5.57 Sí el contraste del coeficiente de correlación lineal es bilateral, ¿cuál es la
hipótesis alternativa?

5.58 Sí queremos saber si el descenso de la ansiedad (medido en puntos) es debido a


la práctica de un determinado ejercicio fisico (medido en días), ¿qué contraste
tendremos que hacer?

5.59 Si queremos saber si la edad está relacionada con el colesterol (ambas


características medidas cuantitativamente), ¿qué contraste haríamos?

5.60 Si queremos saber si el colesterol aumenta con la edad (ambas características


medidas cuantitativamente), ¿qué contraste haríamos?

5.61 Si queremos saber si la memoria disminuye con la edad (ambas medidas


cuantitativamente), ¿qué contraste haríamos?

5.62 Si el coeficiente regresión lineal está cerca de O, ¿quiere decir que las variables
(normales) no están relacionadas?

5.63 Si la recta de regresión de la tensión arterial sistólica y la edad en una


determinada población esTAS= 85,2 + 1,2(edad), ¿cuál es el aumento de TAS
por año?

5.64 ¿Pueden coincidir los coeficientes de regresión lineal?

5. 65 Si el coeficiente de correlación lineal entre dos variables vale 0,80, ¿en qué%
no dependen las variables entre sí?

5.66 ¿Cuál es el punto de corte de las rectas de regresión?

5.67 Supongamos una población en la cual la recta de regresión de la tensión arterial


sistólica y la edad esTAS = 85,2 + 1,2(edad). Para una edad de 20 años laTAS
es 109,2mmHg. ¿Qué interpretación tiene este valor?

5.68 Si queremos predecir valores de X a partir de los de Y, ¿qué recta de regresión


utilizaremos?

5.69 Si podemos utilizar la misma recta para calcular valores de Y a partir de los de X
y valores de X a partir de los de Y, ¿qué relación existe entre dichas
variables?

5.70 ¿Qué diferencia existe entre una relación funcional y una relación no funcional?

5.71 ¿Qué criterios se usan para decidir la función de ajuste?

5.72 ¿Qué diferencia existe entre el coeficiente de determinación de la recta de


regresión de Y sobre X y el coeficiente de determinación de la recta de regresión
de X sobre Y?

76
5.73 Si el termino independiente de la recta de regresión de Y sobre X es O, ¿cómo
será el termino independiente de la recta de regresión de X sobre Y?

5.74 Si el termino independiente de la recta de regresión de Y sobre X es negativo,


¿el termino independiente de la recta de regresión X sobre Y será también
negativo?

7.75 Si el coeficiente de regresión de la recta de regresión de Y sobre X vale 1, ¿qué


podemos decir de la relación que existe entre las variables X e Y?

7.76 Si las dos rectas de regresión no coinciden, ¿qué relación existe entre las
variables?

5.77 Si la recta de regresión de Y sobre X es Y= 2+3X, ¿podríamos calcular el valor


de X para Y=5?

5.78 ¿En qué punto se cortan la recta Y= a1X y la recta de regresión X= b1Y? ¿Qué
interpretación tiene?

5.79 ¿Siempre que se estudie la relación entre la edad y el colesterol tendremos que
hacerlo mediante el contraste del coeficiente de correlación?

5.80 ¿Qué recta de regresión me permite predecir valores de X a partir de los de Y?

5.81 Si la relación entre las variables X e Y es inversa, ¿las pendientes de las rectas
de regresión serán inversas?

77
CAPÍTULO VI

,
ANALISIS
DELA
VARIABILIDAD 11
ANÁLISIS DE LA VARIABILIDAD 11

6.1 ¿En qué consiste el análisis de la variabilidad entre dos características?

6.2 ¿Qué condiciones se exigen para poder aplicar el test de la t-Student combinada?

6.3 ¿Qué condiciones se exigen para poder aplicar el test de Behrens?

6.4 En el contraste de igualdad de dos medias, ¿cuál es la hipótesis nula?

6.5 En el contraste de igualdad de dos medias, ¿qué tipo de características


intervienen?

6.6 Si la hipótesis alternativa en un contraste de igualdad de dos medias es que las


medias poblacionales sean distintas, ¿se tratará de un test unilateral o bilateral?

6.7 Si rechazamos la hipótesis nula en un contraste de igualdad de dos medias,


¿podremos concluir que la característica cualitativa dicotómica influye en la
cuant~tativa? ¿Por qué?

6.8 ¿Cómo se puede aumentar la potencia del test de la t-Student combinada?

6.9 Si la hipótesis alternativa en un contraste de igualdad de dos medias es que una


de las medias poblacionales sea menor que la otra, ¿se tratará de un test
unilateral o bilateral?

6. 10 ¿Cuál es un test alternativo al test de la t de Student combinadasi en un contraste


de igualdad de dos medias falla la condición de igualdad de varianzas?

6.11 ¿Cuándo decimos que los datos son apareados?

6.12 ¿Qué condiciones exige el test de la t-apareada?

6.13 ¿Qué diferencia hay entre el test de la t- apareada y el test de la t-Student


combinada?

6.14 ¿Qué hipótesis se contrasta en el test de la t-apareada?

6.15 ¿Qué test es equivalente al contraste de igualdad de dos medias?

6.16 En el contraste de igualdad de dos proporciones, ¿cuál es la hipótesis nula?

6.17 Mediante el contraste de igualdad de dos proporciones estudiamos la relación


que existe entre dos características . ..

81
6.18 ¿Cómo se puede aumentar la potencia de un contraste de igualdad de dos
proporciones?

6.19 ¿Qué test es equivalente al contraste de igualdad de dos proporciones?

6.20 En un test de igualdad de dos proporciones unilateral, ¿cuál es la hipótesis


alternativa?

6.21 ¿Qué características intervienen en las tablas de contingencia?

6.22 ¿Se puede contrastar la dependencia en el análisis de las tablas de contingencia?

6.23 ¿Cómo se puede contrastar la igualdad de varias proporciones?

6.24 ¿Cuál es la hipótesis nula en el análisis de tablas de contingencia?

6.25 ¿Qué condición se debe cumplir para aplicar test de la z 2


de Pearson?

6.26 ¿Qué son las frecuencias esperadas en el test de la z 2


de Pearson?

6.27 ¿El test de la z 2


de Pearson es un test paramétrico o no paramétrico?

6.28 ¿En qué consiste el análisis de residuos?

6.29 ¿Para qué se hace el análisis de residuos?

6.30 ¿Cómo se interpreta que un residuo positivo dé significativo?

6.31 En el análisis de tablas de contingencia, ¿cómo se resuelve el problema de que


una frecuencia esperada sea menor que 5?

6.32 Si la tabla de contingencia es de dos por dos, ¿como se resuelve el problema de


que una frecuencia esperada sea menor que 5?

6.33 ¿Cómo se puede contrastar la igualdad de varias medias?

6.34 ¿Cuál es la hipótesis nula en un análisis de varianza?

6.35 Si rechazamos la hipótesis nula en el análisis de varianza, ¿podremos decir cuál


de las medias es distinta?

6.36 ¿Cuáles son las condiciones para poder aplicar el análisis de varianza simple?

6.37 La potencia en el análisis de varianza simple aumenta ...

6.38 ¿Mediante un análisis de varianza podemos saber cual de las medias


poblacionales es mayor?

6.39 ¿Qué interpretación tiene la varianza del error en un análisis de varianza

82
simple?

6.40 Si la varianza entre poblaciones es menor que la varianza de dentro de las


poblaciones, ¿cómo lo explicaríamos?

6.41 ¿Qué tipo de variables intervienen en el análisis de varianza?

6.42 ¿Se pueden comparar dos medias poblacionales mediante un análisis de


varianza simple?

6.43 Si queremos saber si una reacción alérgica (ninguna, poca, regular, mucha)
depende de la edad (medida en años), ¿qué contraste tendremos que hacer?

6.44 Si queremos saber si los hombres tienen la tensión arterial sistólica (medida en
mmHg) más alta que las mujeres, ¿qué tipo de contraste tendremos que hacer?

6.45 ¿Qué tipo de contraste hay que realizar si queremos saber si el nivel económico
-medido como bajo, medio, alto-, está asociado con el consumo de alcohol
-medido como nunca, circunstancialmente, habitualmente, todos los días,
continuamente-?

6.46 ¿Cuál sería la hipótesis alternativa en el contraste anterior?

6.47 Si nos preguntamos si los antecedentes familiares favorecen el padecer cáncer de


mama, ¿qué contraste tendremos que hacer?

6.48 Si queremos saber dónde hay más fumadores, entre los hombres o entre las
mujeres, ¿qué contraste tenemos que hacer?

6.49 ¿Cuál es la hipótesis alternativa en un análisis de varianza simple?

6.50 ¿Cuál es la hipótesis nula en el análisis de tablas de contingencia?

6.51 Si queremos saber si el sexo influye en ser bebedor o no ser bebedor, ¿bastaría
con un contraste de una tabla de contingencia dos por dos?

6.52 Si queremos saber si los hombres beben mas que las mujeres, ¿bastaría con un
contraste de una tabla de contingencia dos por dos?

6.53 ¿Qué es la corrección de Yates?

6.54 En un estudio sobre la efectividad de un fármaco para la cicatrización de una


úlcera se utiliza un grupo placebo en el que el porcentaje de cicatrización es de
un 61% y un grupo tratado con el fármaco en el que el porcentaje de
cicatrización es de un 70%. Al comparar ambas proporciones no encontramos
que la diferencia entre ambas proporciones sea estadísticamente significativa.
¿Qué interpretación darías a este resultado?

83
6.88 Si se quiere comparar dos antihipertensivos aplicándolos a hombres y mujeres,
¿qué diseño y análisis habría que hacer?

6.89 ¿Con cuántos grados de libertad se trabaja en el contraste de una distribución de


z
Poisson con el test de la 2 de Pearson?

6.90 ¿Con cuántos grados de libertad se trabaja en el contraste de una distribución


Normal?

6.91 Si en un análisis de varianza hemos aceptado que las medias poblacionales no


son iguales, ¿cómo podremos saber cuales son distintas entre sí?

6.92 ¿Cuáles son las condiciones para aplicar el análisis de varianza doble?

6.93 ¿Qué interpretación tiene la varianza del error en un análisis de varianza doble?

6.94 ¿En qué se diferencian el contraste de dos medias mediante la t de Student


combinada o mediante la t de Student como análisis complementario del
análisis de varianza (MDS)?

6.95 ¿Qué diferencia existe entre un análisis de varianza doble y un análisis de


varianza doble con interacción?

6.96 Si tomamos un grupo de personas enfermas con una enfermedad E y otro


grupo de personas sanas y observamos si han sido sometidas a un determinado
factor de riesgo. ¿Qué medida nos permite cuantificar del grado de asociación
de dicho factor de riesgo con la enfermed~d E?

6.97 Tenemos un grupo ·de personas sometidas a un factor de riesgo asociado a una y
solo una enfermedad E y otro grupo que no están sometidas a ningún factor
asociado a dicha enfermedad. Observamos posteriormente cuantas de estas
personas han contraído la enfermedad en cada uno de los grupos. ¿ Qué medida
nos permite cuantificar del grado de asociación de dicho factor de riesgo con la
enfermedad E?

6.98 Si consideramos que en un análisis de varianza doble hay r filas y k columnas y


queremos contrastar la igualdad de las medias de las poblaciones columnas dos a
dos, ¿qué tamaño de muestra tendrían dichas medias muestrales?

6.99 Si consideramos que en un análisis de varianza doble hay r filas y k columnas y


queremos contrastar la igualdad de las medias de las poblaciones filas dos a dos,
¿qué tamaño de muestra tendrían dichas medias muestrales?

6.100 Si consideramos que en un análisis de varianza doble hay r filas y k columnas y


queremos contrastar la igualdad de las medias entre casillas dos a dos, ¿qué
tamaño de muestra tendrían dichas medias muestrales?

86
6.1 O1 Si la varianza del error en un análisis de varianza doble es mayor que la
varianza correspondiente a una de las fuentes de variación sistemática que
influyen sobre la característica cuantitativa, ¿Qué interpretación tendría?

6.102 Si la varianza del error en un análisis de varianza doble es mayor que la


varianza correspondiente a una de las fuentes de variación sistemática que
influyen sobre la característica cuantitativa, ¿Qué tendríamos que hacer para
aumentar la potencia de dicho análisis de varianza?

6.103 ¿Qué hipótesis se contrasta en el test de McNemar?

6.104 ¿Qué condiciones se exigen para aplicar el test de McNemar?

87
CAPÍTULO!

ESTADÍSTICA
DESCRIPTIVA
CONCEPTOS BÁSICOS

1.1 La población donde se hace el estudio son los menores de 16 años.


La característica a estudiar es "el consumo de droga".

El tipo de característica se puede considerar cualitativa dicotómica si la


observamos como "sí consumo"," no consumo", que serán las modalidades de
la misma.

La población estadística será el conjunto de observaciones de "sí consumo"," no


consumo" de esta característica realizadas en la población de menores de 16
años.

1.2 La población donde se hace el estudio son las personas mayores de 60 años.
La característica a estudiar es" la tensión arterial".

El tipo de característica se puede considerar cuantitativa si se mide la tensión en


mmHg y sus modalidades serían los infinitos valores que puede tomar la tensión
arterial; se trataría por tanto de una variable estadística continua.

La población estadística será el conjunto de tensiones arteriales medidas a estos


mayores de 60 años.

1.3 La población donde se hace el estudio son los habitantes de Murcia capital.
La característica a estudiar es" la salud bucodental".

El tipo de característica se puede considerar cualitativa, con las modalidades:


"mala", "regular"," buena","muy buena".

La población estadística será el conjunto de observaciones de esta característica


realizadas en la capital murciana.
Si la salud bucodental la "medimos" por el numero de caries, se trataría de una
variable estadística discreta, ya que sus modalidades serán O, 1, 2, ...caries.

La población estadística será el conjunto de número de caries medidas de cada


habitante de la capital murciana.

1.4 La población donde se hace el estudio son las mujeres menopáusicas tratadas
con hormonas.
La característica a estudiar es" el cáncer de mama".
El tipo de característica se puede considerar cualitativa dicotómica, con las
modalidades "sí cáncer"," no cáncer".

La población estadística será el conjunto de observaciones de"sí cáncer"," no


cáncer" de esta característica realizadas en mujeres menopáusicas tratadas con
hormonas.

1.5 Sí; por ejemplo, la variable temperatura


93
1.6 De que las modalidades sean cualidades o números.

1.7 Una variable discreta presenta un número finito de modalidades o un número


infinito pero numerable.

1.8 Son las distintas opciones que tiene la característica, es decir, los distintos los
"valores" que puede tomar la característica.

1.9 La marca de clase es la media (semisuma) de los límites de la clase, por


lo que es imposible que quede fuera de la clase

l.l O No, porque las clases son clases cerradas por la izquierda y abiertas por la
derecha, es decir, no contienen el extremo superior.

1.11 La frecuencia relativa correspondiente a una modalidad es el cociente entre su


frecuencia absoluta y el n° total de observaciones de la población.

1.12 La frecuencia absoluta correspondiente a una modalidad es un número natural,


ya que es el número de veces que se repite la modalidad, por lo que no puede ser
negativa.

1.13 La frecuencia absoluta de una modalidad es el n° de elementos de la población


estadística que presentan esa modalidad, por tanto la suma de todas las
frecuencias absolutas será igual al número de elementos de la población
estadística.

1.14 Vale 1, ya que la frecuencia relativa de una modalidad es el tanto por uno con
que se da dicha modalidad

1.15 Sí, cuando la modalidad esperada no se observa.

1.16 La frecuencia absoluta de una modalidad es el número de casos con esa


modalidad, por tanto, que una frecuencia absoluta valga O indica que no hay
casos con esa modalidad dentro de la población estadística.

1.17 20% =>la frecuencia relativa correspondiente a la modalidad hombre es:

jH= 0,20

1.18 Son positivas y menores que la unidad: O< ¡; < 1

1.19 La población estadística tiene 120 observaciones.

1.20 Si N es el número total de observaciones, es imposible que la frecuencia


absoluta de una modalidad supere N, ya que la suma de todas las frecuencias
absolutas es igual a N.

1.21 La frecuencia absoluta es un número natural, porque es el número de veces que


se repite una modalidad; no puede ser, por tanto, un número decimal.
94
1.22 La suma de las frecuencias relativas es siempre 1 para cualquier población.

1.23 Si todos los elementos de la población literal son observados, el número de


elementos de la población literal coincide con el número de elementos de la
población estadística

1.24 Tendríamos que pensar en un error de cálculo o de redondeo: la suma de las


frecuencias relativas debe ser l.

1.25 Variable es lo que se observa. Una observación es el resultado de observar esa


variable en una población literal.

1.26 De la forma en que "se mida" dicha característica, es decir, si el resultado de la


observación sea una cualidad o un número respectivamente.

1.27 Niños, jóvenes, adultos y ancianos, por ejemplo.

1.28 Sí, pero se pueden numerar.

1.29 La tabla estadística correspondiente a una población estadística basada en sus


modalidades y las frecuencias correspondientes a dichas modalidades.

1.30 Entre cada dos valores de una variable discreta no hay ningún valor, mientras
que entre cada dos valores de una variable continua hay infinitos valores; es
decir, el número de modalidades de una variable discreta puede ser finito o
infinito numerable, mientras que el número de modalidades de una variable
continua es siempre infinito y no numerable.

1.31 Que el 42% de la población estadística tienen dicha modalidad.

1.32 Que existe un error de cálculo (y no de redondeo) porque las frecuencias


relativas no pueden ser mayor que l.

1.33 La frecuencia absoluta valdrá también O, ya que : ¡; = ni =O::::> n¡ =O .


n

1.34 Que en esa población sólo se da esa modalidad, es decir, para el resto de las
modalidades su frecuencia absoluta es O.

1.35 Se trataría de una característica cualitativa, ya que el resultado de la observación


es una cualidad.

1.36 Sus modalidades son números.

1.37 Es una característica cualitativa, porque sus modalidades son cualidades.

1.38 Los distintas "valores" (cualidades en el caso de que la característica sea


cualitativa) que puede tomar la característica en los elementos de la población.

95
1.39 Porque son un tanto por 1, es decir, una parte de uno. Si la frecuencia relativa se
multiplica por 100 se transforma en un %.

1.40 modalidades iguales de poblaciones distintas.

1.41 No necesariamente.

1.42 Las modalidades de una característica tienen que ser exhaustivas y excluyentes.

1.43 Que las modalidades de una característica tengan que ser exhaustivas quiere
decir que todas las observaciones deben coincidir con alguna de las modalidades
consideradas

1.44 Que las modalidades sean excluyentes garantiza que una observación no puede
coincidir con dos modalidades al mismo tiempo.

1.45 Dividiendo el campo de variabilidad de la variable estadística en intervalos con


infinitas modalidades cada uno.

1.46 Denominamos clases a los distintos intervalos en los que se agrupan los infinitos
valores que puede tomar dicha variable.

1.47 Son clases que carecen de alguno de los extremos.

1.48 Le daremos la misma amplitud que la contigua.

1.49 Las mismas que las modalidades: exhaustivas y excluyentes

1.50 Para garantizar que sean exhaustivas.

96
REPRESENTACIONES GRÁFICAS

1.51 ... un sector circular de área proporcional a su frecuencia relativa.

1.52 Se multiplica 360° por la frecuencia relativa correspondiente a esa modalidad:

1.53 Su frecuencia absoluta.

1.54 Le corresponde un rectángulo de altura proporcional a la frecuencia.

1.55 Todos los rectángulos tienen las bases de igual longitud, luego, al ser iguales,
tienen la misma altura. Como la altura de cada rectángulo es proporcional a la
frecuencia absoluta de la modalidad, todas las modalidades presentan la misma
frecuencia.

1.56 De una característica cualitativa.

1.57 Que solo esa modalidad tiene una frecuencia absoluta distinta de O.

1.58 Teóricamente significaría que esa modalidad no se da en esa población, por tanto
su frecuencia absoluta sería O.

1.59 Al ser 180° la mitad del círculo, la mitad de las observaciones tienen esa
modalidad.

1.60 Que todos los datos de dicha población son iguales a esa modalidad, es decir esta
característica no tiene variabilidad.

1.61 Las frecuencias relativas de una característica cualitativa.

1.62 La amplitud del ángulo de un sector circular correspondiente a una modalidad es


proporcional a su frecuencia relativa.

1.63 Las frecuencias absolutas correspondientes a cada modalidad (si en el diagrama


de barras se representan frecuencias absolutas), y es proporcional a las
frecuencias relativas (si se trata de un diagrama de barras para frecuencias
relativas).

1.64 Representa las frecuencias absolutas o relativas (existe un diagrama para cada
una) de una característica cuantitativa discreta.

1.65 Sí, las amplitudes de las clases no tienen por qué ser iguales.

1.66 En el centro de la clase, ya que se obtiene mediante la semisuma de los extremos


de la misma.

97
1.67 La amplitud de una clase no puede ser nunca negativa, ya que es la diferencia
entre el extremo superior y el extremo inferior.

1.68 Porque el número de modalidades es infinito y no numerable por lo que no se


podrían numerar todas las modalidades para construir una tabla. La única opción
posible es hacer un número finito de clases.

1.69 La base de cada rectángulo se corresponde con la amplitud de la clase y la altura


debe ser tal que el área de cada rectángulo sea proporcional a la frecuencia de
la clase.

l. 70 El área de cada sector circular depende de la frecuencia absoluta ya que dicha


área es proporcional a la frecuencia relativa de la modalidad correspondiente y
esta, a su vez, depende de la frecuencia absoluta.

1.71 El área del histograma de frecuencias relativas siempre vale 1, no depende del
número de observaciones de la población.

l. 72 El área que encierra el histograma coincide con la suma de las frecuencias


absolutas, es decir, con el número total de datos de la población estadística.
También coincide con el área que encierra el polígono de frecuencias.

l. 73 Las modalidades serían: no hipertenso, sí hipertenso.

1.74 Que es el valor que presenta mayor frecuencia.

1.75 Sí; siempre que el extremo inferior sea negativo, la marca de clase puede ser
negativa.

1.76 .. .las frecuencias absolutas o relativas de una variable estadística continua,


según el tipo de frecuencias que queramos representar.

l. 77 El polígono de frecuencias.

1.78 Uniendo los puntos medios de las bases superiores de los rectángulos, con la
precaución de añadir una clase inferior y otra superior de amplitudes iguales a
las de la clase vecina, y de altura cero. De esta forma, la poligonal y el eje
coordenado encierran un área.

l. 79 El polígono de frecuencias absolutas, por construcción, encierra un área igual a


la del histograma, es decir, es igual a la suma de las frecuencias absolutas, que
coincide con el número total de observaciones de la población.

1.80 El área que encierra el histograma es la suma de las áreas de los rectángulos, esto
es, la suma todas las frecuencias relativas correspondientes a las clases, ya que,
el área de cada clase es igual a la frecuencia relativa correspondiente y, por
tanto, su suma es igual a l.

1.81 Una variable continua presenta un número infinito de valores dentro de una
clase, pero un infinito de la potencia del continuo (siempre hay un valor

98
comprendido entre dos valores cualesquiera lo que supone que no se pueden
numerar)

1.81 Infinitas modalidades no numerables.

1.82 Ambas pueden tomar un número infinito de valores: en la discreta un número


infinito numerable y en la continua un infinito de la potencia del continuo (no se
puede numerar), pero solo la variable discreta puede tomar un no finito de
valores.

1.83 Que sus modalidades son números y que el número de modalidades en ambas
puede ser infinito.

1.84 No necesariamente. Puede ser cualitativa si lo que se observa es una cualidad;


por ejemplo: delgado, normal, grueso.

1.85 No. La altura del rectángulo es proporcional a la frecuencia absoluta.

1.86 Variable estadística continua, para frecuencias absolutas y relativas, según el


tipo de frecuencias que queramos representar.

1.87 Se trataría de una característica cualitativa y se haría mediante el diagrama


rectangular en el caso de frecuencias absolutas y el diagrama de sectores en el
caso de frecuencias relativas.

1.88 Se trataría de una característica cuantitativa continua y la representación grafica


correspondiente será el histograma o el polígono de frecuencias, tanto si se
trata de frecuencias absolutas como frecuencias relativas.

1.89 No, ya que el polígono de frecuencias se construye sobre el histograma.

1.90 .. características cualitativas.

1.91 El diagrama polar es propio de características cualitativas observadas


cíclicamente.

99
MEDIDAS DE POSICIÓN CENTRAL

1.92 Son parámetros representativos de la población y alrededor de ellas están todas


las observaciones.

1.93 Que 50 Kg es el peso más frecuente en esa población.

1.94 La moda es un valor de la variable. Será negativa cuando el valor de mayor


frecuencia sea negativo.

1.95 La mediana es la que mejor representa a una población asimétrica de datos


continuos.

1.96 Será una población de datos cualitativos o una población asimétrica de datos
cuantitativos discretos.

1.97 No, solo que O es la observación más frecuente.

1.98 En las mismas unidades de la variable, ya que es un valor de la misma.

1.99 En las mismas unidades de la variable, ya que se obtiene sumando valores de la


variable y dividiendo posteriormente por el número de valores.

1.100 En las mismas unidades de la variable, ya que tiene que ser un valor de la
misma.

1.1 O1 Que el 50% de los pesos son inferiores o iguales a 20Kg, lo que supondría que,
posiblemente, se trata de una población de niños.

1.102 La media.

1.103 N o tiene por qué ser un valor de la variable, ya que en el caso de variables
discretas puede ocurrir que la media no sea un valor entero, lo que supondría que
no es un valor de la variable.

1.104 Está en el centro de la población: deja por debajo el mismo número de datos que
por encima.

1.105 Para calcular la mediana es necesario que los datos se puedan ordenar. Para
calcular la media es necesario que los datos se puedan sumar. Los datos
cualitativos no son necesariamente ordenables y, desde luego, no se pueden
sumar.

1.106 La media representa a los datos. Puede ser negativa cuando la población tenga
datos negativos.

101
1.107 Ambas modas serían valores de la variable que tendrían en común la misma
frecuencia máxima.

1.108 Que el 50% de las observaciones correspondientes a esta población son positivos

1.109 En las poblaciones simétricas y unimodales.

1.11 O Sólo si en la población hay más datos negativos que positivos.

1.111 Que el valor de la variable que tiene mayor frecuencia es un valor negativo.

1.112 No necesariamente, solo podemos concluir que dentro de la población algunos


elementos son negativos.

1.113 No. Una población puede tener varias modas pero la media es única.

1.114 Sí, por definición.

1.115 La moda, por definición.

1.116 Valdrá O.

1.117 La mediana.

1.118 Que todas las modalidades tienen la misma frecuencia.

1.119 La mediana y la media.

1.120 La característica sería cualitativa.

1.121 Si la moda es mayor que la media, las observaciones correspondientes a esta


población se desplazan hacia los valores más altos.

1.122 Si la moda es menor que la media, las observaciones correspondientes a esta


población se desplazan hacia los valores más bajos.

1.123 Si una población de datos continuos es muy dispersa, la medida de posición


central que mejor la representa es la mediana.

1.124 Porque es un parámetro representativo de la población.

102
MEDIDAS DE POSICIÓN

1.125 Hay tres cuartiles que dividen a la población en cuatro partes iguales.

1.126 No. Q 1 es un valor de la variable que deja por debajo el 25% de las
observaciones y Q3 es un valor de la variable que deja por debajo el 75% de las
mismas, luego el valor de Q¡ será menor que el valor de Q3.

1.127 D6 < P70, porque D 6 es un valor de la variable que deja por debajo el 60% de los
datos y P 70 es el valor de la variable que deja por debajo el 70 % de los datos.

1.128 Mediana = Ds, ambos valores de la variable dejan por debajo el 50% de las
observaciones.

1.129 Q 3 no coincide con ningún decil, ya que no hay ningún decil que deje por debajo
el 75% de los datos.

1.130 Que el 20% de las tensiones arteriales sistólicas de esa población son menores o
iguales a 14 cmHg.

1.131 Q 1 no se corresponde con ningún decil, ya que no hay ningún decil que deje por
debajo el 25% de los datos.

1.132 Viendo entre qué percentiles está comprendido.

1.133 D6 es superior a 1,65m, ya que D6 deja por debajo al 60% de las alturas y la
mediana deja por debajo un 50% de las mismas.

1.134 Los percentiles.

1.135 P 1s =20mil leucocitos, ya que esto supondría que el 15% de los afectados no
superan los 20milleucocitos y, por lo tanto, superarían ese valor el 85% de los
afectados.

1.137 Indica que el 75% de las tensiones sistólicas de esta población son superiores a
170mmHg, por tanto se trataría de una población de hipertensos.

1.138 Los percentiles dividen a la población en 100 partes. Hay, por tanto, 99
percentiles.

1.139 Sí pueden ser negativas porque son valores de la variable y una variable puede
tomar valores negativos. Por ejemplo: la temperatura.

1.140 Un 1% de ellas.

103
1.141 No, porque los percentiles son: P 1 , P 2 ••••• ,P 99 •

1.142 Aproximadamente el % de tensiones arteriales de la población que son menores


o iguales a dicha tensión y, por lo tanto, la posición de 150 mmHg dentro de la
población.

1.143 70% - 32% = 38%.

1.144 Que, por lo menos, el 50% de los valores son negativos.

1.145 Será negativo porque Q 1 < P32

1.146 El percentil no es un %; es un valor de la variable.

1.147 Un 25%, ya que dividen a la población en cuatro partes iguales.

1.148 Un 10%, ya que dividen a la población en diez partes iguales.

1.149 La mediana.

1.150 En las mismas unidades de la variable, porque son valores de la misma.

104
MEDIDAS DE DISPERSIÓN

1.151 La dispersión es la variabilidad que presentan las observaciones.

1.152 Sirven para medir la variabilidad que presentan las observaciones.

1.153 Las observaciones serían todas iguales, ya que el hecho de que el coeficiente de
variación valga O supone que en esta población no hay dispersión.

1.154 Sí, ya que al coincidir el valor máximo y el valor mínimo, todas las
observaciones serían iguales.

1.155 El coeficiente de variación es adimensional, es decir, no se expresa en ninguna


unidad.

1.156 La varianza se expresa en unidades cuadráticas.

1.157 La varianza es siempre positiva o cero.

1.158 El rango nos informa sobre la dispersión de la población.

1.159 El rango no puede ser negativo: el valor máximo nunca puede ser menor que el
valor mínimo.

1.160 El coeficiente de variación.

1.161 El coeficiente de variación, porque es adimensional. Al no tener dimensión se


pueden comparar dispersiones de tensiones arteriales medidas en mmHg con la
dispersión de los pesos medidos en Kg.

1.162 La desviación típica siempre es positiva.

1.163 Cualquier medida de dispersión, incluido el coeficiente de variación.

1.164 Cuando todas las observaciones son iguales.

1.165 Sí. Podemos decir que el coeficiente de variación vale O, aunque no dependa del
rango, porque si el rango vale cero indica que no hay dispersión y, por tanto,
todas las medidas de dispersión valen O.

1.166 No podemos saber nada sobre el rango.

1.167 No, aunque las observaciones sean negativas siempre el valor máximo será
mayor que el valor mínimo.

105
1.168 Porque es el resultado de promediar desviaciones al cuadrado.

1.169 Sí, el coeficiente de variación permita comparar las dispersiones de poblaciones


cualesquiera.

1.170 El rango o recorrido.

1.171 Sí, el concepto de dispersión no está relacionado con el de simetría.

1.172 La varianza y el coeficiente de variación.

1.173 Tendría mucha dispersión.

1.174 Que la población se distribuya normalmente.

1.175 Tipificándolas, ya que los datos tipificados son adimensionales.

1.176 Los comprendidos dentro del intervalo de normalidad:

(¡.t- 2o ; ¡.t + 2o)

1.177 El 95% en poblaciones normales.

1.178 Que la población no tiene dispersión, ya que la.amplitud sería:

(f.L + 2u)-(p- 2o') =O=> 4u =O=> u= O.

1.179 Todas dependen de los extremos.

1.180 La dispersión no guarda relación con la asimetría.

1.181 Rango, desviación absoluta media, desviación típica.

1.182 Sí puede ser negativo.

1.183 Cuando se quiera comparar con otra observación de otra población.

1.184 Cero.

1.185 El coeficiente de variación no se puede calcular.

1.186 El5%.

1.187 4o = (¡.t + 2o)- (¡.t- 2o).

1.188 Cuando los valores son negativos y cuando la media sea próxima a cero.

1.189 La media de los cuadrados de las observaciones.

106
1.190 El valor máximo será positivo y el valor mínimo será negativo, y el rango es
siempre positivo.

1.191 Es la media de los cuadrados de las desviaciones respecto de la media.

1.192 Si, en los casos en que la dispersión sea muy grande.

1.193 Quiere decir que la observación que se ha tipificado es inferior a la media.

1.194 Se usaría un parámetro representativo de la población, es decir, media, mediana,


o moda.

1.195 La media.

1.196 Un valor tipificado es un cociente con las mismas unidades en el numerador que
en el denominador, por lo que las unidades se simplifican.

1.197 La media de los valores tipificados vale cero.

1.198 La desviación típica de los datos tipificados es l.

1.199 (,u- 2a;,u + 2a) =(lOO- 50;100+ 50)= ( 50;150).

1.200 El intervalo de normalidad es: ( 1O; 30) ~ ,u- 2a = 1O y ,u+ 2a = 30 , lo que


supone que: ,u =20 y la a =5

1.201 Restándole la media de su distribución y dividiendo el resultado por la


desviación típica de la misma.

1.202 Coincidirá con ella misma ya que se trata de una población de datos tipificados.

107
CAPÍTULO II

PROBABILIDAD
TIPOS DE EXPERIMENTOS

2.1 Conociendo las circunstancias experimentales en las que se realiza un


experimento, en un experimento determinista el resultado es previsible, mientras
que en un experimento aleatorio bajo las mismas circunstancias experimentales
el resultado es impredecible.

2.2 Porque hay factores que influyen en el resultado que no se pueden controlar
(azar).

2.3 Sólo las condiciones experimentales.

2.4 Solo uno.

2.5 Las circunstancias bajo las cuales se realiza el mismo.

2.6 Que aunque "controlemos" las condiciones experimentales, no podremos


conocer el resultado del experimento por la influencia de azar (factores que no
podemos controlar).

2.7 En un 100%.

2.8 Bajo las mismas condiciones experimentales sólo la variabilidad debida al azar.

2.9 Vale cero.

2.10 No, porque no puede controlar la variabilidad debida al azar.

2.11 Las condiciones experimentales.

2.12 Aleatorio.

2.13 Las condiciones experimentales y el azar.

2.14 La variabilidad provocada por la influencia de variables que influyen: con poca
intensidad, de forma independiente e incontrolable, sus efectos son aditivos y de
sentidos contrarios.

2.15 No.

2.16 Depende del experimento, pero siempre más de uno.

2.17 En un experimento determinista no existe el azar, por eso conocemos el


resultado del experimento.

2.18 Nunca porque un experimento aleatorio para poder ser determinista se


necesitaría controlar el azar y eso es imposible.

111
2.19 Aleatorio, porque bajo las mismas condiciones experimentales los efectos del
fármaco pueden ser distintos.

2.20 Determinista, porque hay un solo suceso asociado a dicho experimento: la


muerte del paciente.

112
ALGEBRA DE SUCESOS

2.21

a) Si A e B, todos los sucesos elementales de A están contenidos en B,


luego

AnB = A

b) AuB=B

2.22
a) Cualquier suceso AeE, luego: A n E = A

b) AuE=E

2.23
a) A n A= 0 (suceso imposible)

b) A u A= E (suceso seguro)

2.24 Sí, porque A y B pueden tener sucesos elementales comunes que no compartan
con C (representar con el diagrama de Venn).

2.25 No necesariamente. Pueden existir dos sucesos compuestos incompatibles.

2.26 Sí, ya que todo suceso, elemental o compuesto, está contenido en E.

2.27
a) Si A e Be C, todos los sucesos elementales que componen A, están en
B y en C, y todos los sucesos elementales que componen B están en C.
Por tanto:
(AuB)uC=C

b) (A n B) n C = A

2.28 Sí, porque, como B y C no tienen sucesos elementales comunes y como todos los
sucesos elementales de A están contenidos en B, A y C no comparten sucesos
elementales.

2.29 No necesariamente. A no comparte sucesos elementales con B, pero sí puede


compartirlos con C, aunque B no los comparta con C.

113
2.30 No necesariamente, porque los sucesos elementales que A comparte con B
pueden no coincidir con sucesos elementales que comparten B y C.

2.31 No necesariamente, porque el que A, By C no compartan sucesos elementales,


no impide que A y B puedan compartir sucesos elementales que no compartan
con C.

2.32 A n B es la parte de A que no comparte con B. Si A y B son incompatibles,


A no comparte ningún suceso elemental con B, luego A n B = A

2.33 El complementario de A u B, es decir, A u B .

2.34 El complementario de A n B, es decir, A nB, que es el suceso E, ya que A y B


son sucesos incompatibles : A n B = 0.

2.35 El complementario de A u B, es decir, A u B .

2.36 Seria el suceso A n B


2.37 El complementario del suceso (A n B ), es decir, A n B .

2.38 Sería el suceso Au B


2.39 No. Si todos los sucesos elementales de A están en los de B, entonces todos los
sucesos del complementario de B (Ji) estarán contenidos en el complementario
de A: Ji e A.

2.40 A nB

2.41 Los sucesos que no están en B tampoco están A, ya que A e B, luego el suceso
compuesto por los sucesos que no están en A ni en B será Ji

2.42 Complementarios.

2.43 A ll B
2.44 BnA

2.45 Cuando suceden los sucesos A ó B.

2.46 Cuando suceden los sucesos A y B simultáneamente

2.47

a) El resultado de los dos miembros de la ecuación es el suceso B.

b) El resultado de los dos miembros de la ecuación es A.

114
2.48 Sí, porque el hecho de que los sucesos A y B compartan sucesos elementales, los
sucesos B y C compartan también sucesos elementales y A y C también lo
hagan no implica que A, B, C compartan algun suceso.

2.49 No necesariamente. Puede haber sucesos elementales comunes entre B y C que


no estén en A

2.50 B = Au(B nA)

2.51 El suceso seguro.

2.52 (A uB) =(A n B) u(A nB) u(A nB)

2.53 Sí.

2.54 No. Como máximo, el número de sucesos elementales será n.

2.55 Como unión de todos ellos, es decir A 1 u A 2 u ... u An, ya que el espacio
muestra) está compuesto por todos los sucesos elementales.

2.56 Como mínimo dos.

2.57 Como máximo n.

2.58 Sí. En el experimento de lanzar un dado el suceso "sacar menos de 5", se puede
expresar como unión del suceso "sacar primo" u "sacar par menor que 6".

2.59 "Sacar par "y "sacar impar"

2.60 No.

2.61 Sucesos complementarios.

2.62 No, porque A comparte con C los sucesos que tienen en común B y C.

2.63 No necesariamente. Los sucesos que comparten B y C podrían no pertenecer a A

2.64 El suceso imposible.

2.65 A nBnC
2.66 El conjunto de sucesos asociados a un experimento q contiene todos los
sucesos asociados a los experimentos tanto elementales como compuestos.

115
2.80 Si A y B fuesen sucesos incompatibles, la P(A u B) = P(A) + P(B) = 0,5 + 0,6
= 1,1 > 1, que es imposible, ya que la probabilidad de un suceso no puede ser
mayor que uno. Por tanto, A y B son sucesos compatibles.

2.81 Por el m Axioma de Frechet-Kolmogorov, la probabilidad del suceso seguro es


P(E)=l, por tanto la probabilidad de su suceso complementario (el suceso
imposible) es P(0)=1 - P(E) =O.

2.82 Si A y B son incompatibles, su intersección es el suceso imposible cuya


probabilidad sería O.

2.83 Por el II axioma de Frechet-Kolmogorov, P(A u B)=P(A) + P(B) cuando A y


B son incompatibles. Por tanto, sólo podremos conocer P(A u B) conociendo
P(A) y P(B) solo en el caso de que A y B lo sean..

2.84 Si, ya que la unión de un suceso con su complementario es el suceso seguro. Por
tanto, la P(A u B) = P(E) =l.

2.85 Si P(A n B) = O, A n B = 0, ya que el único suceso cuya probabilidad es Oes el


suceso imposible, luego A y B serían incompatibles.

2.86 Según la regla de Laplace, la probabilidad de un suceso A es el conciente entre


el número de sucesos elementales que lo componen y el número total de sucesos
elementales asociados al experimento. Por tanto, si el número de sucesos
posibles (número de sucesos elementales) es 8 y si P(A) = 0,5, el número de
sucesos que componen A (k) será k/8 = 0,5 luego k = (0,5)(8) = 4.

2.87 Como el espacio muestra! contiene todos los sucesos elementales y la unión de
todos de los sucesos elementales constituyen el suceso seguro, la probabilidad de
la unión de los sucesos elementales es l.

2.88 P(A) = P(B).

2.89 Los sucesos elementales asociados a un experimento son incompatibles, pero no


son necesariamente equiprobables.

2.90 Por el axioma I de Frechet-Kolmogorov, la probabilidad de un suceso es siempre


mayor o igual que cero. Como cualquier suceso está contenido en el suceso
seguro y la probabilidad del suceso seguro es 1 (III Axioma de Frechet-
Kolmogorov), la probabilidad de cualquier suceso es menor o igual que l. Por
tanto, la probabilidad de cualquier suceso está comprendida entre O y 1 ambos
inclusive.

2.91 Como la probabilidad de la unión de estos dos sucesos es igual a la suma de las
probabilidades de los mismos P(A uB) =P(A)+ P(B) = 0,2+0,4 = 0,6 los
dos sucesos son incompatibles (II Axioma de Frechet-Kolmogorov).

2.92 Ninguno. La probabilidad de un suceso no puede ser mayor que l.

118
2.93 Si P(A n B) = P(A), es porque A n B = A, lo que implica que el suceso A está
contenido en el suceso B.

2.94 No, porque el suceso A n B ~A.

2.95 Que los sucesos elementales sean equiprobables.

119
PROBABILIDAD CONDICIONADA

2.96
a) Axioma 1: P(AJB);:::O

Demostración:

P(AnB)
P(AIB)= como P(An B);:::O y P(B);::: O::::> P(A 1B);::: O
P(B)

b) Axioma 11: Si AIB y C/B son incompatibles:

P[(AuC)/ B] =P(A/ B)+P(C 1B)

Demostración:

P[(AuC)nB] P[(AnB)u(CnB)]
P [ (AuC)IB ] = =--=--------=-
P(B) P(B)
= P(AnB) + P(CnB) =P(A/ B)+P(C 1B) al ser sucesos
P(B) P(B)
incompatibles (A n B) y (C nB).

e) Axioma III: P(E/B)=l

Demostración:

P(E/ B) = P(EnB) = P(B) =l


P(B) P(B)

2.97 Si A y C son independientes ::::> P(A/ C) = P(A).

Sabemos que, en general, P(AnC) = P(AIC).P(C), por lo tanto, en este caso:

P(A n C) = P(A).P(C)

2.98 Si los sucesos A y B son equiprobables entonces P(A)=P(B).

P(A/B)= P(A n B) y P(B 1 A)= P(A n B) por lo tanto P(AIB)=P(B/A).


P(B) P(A)
121
2.99 P(A/C)=O => P(A n e) =O=> P(A n e)= O=> A n e= 0, es decir, que los
P(e)
sucesos A y C son incompatibles.

2.100 No necesariamente.

2.101 No necesariamente.

2.102 Como P(AIB)= P(A n B) y P(B) es siempre ~O => P(A 1B) ~ P(A n B).
P(B)

2.103 No necesariamente, por ejemplo: P("padecer cáncer de pulmón"/"no fumar") es


menor que la P("padecer cáncer de pulmón").

P(Ane)
2.104 P(A/e) = )= 1 => P(Ane) =P(e) => Ane =e=> e e A.
P(e)

2.105 P(A/ B)= P(AnB) si A e B=> AnB =A luego P(A/B) =P(A).


P(B) P(B)

2.106 P[(A uB)/e] = P(A/e)+P(B/e)-P[(A nB)/e]

2.107 P((A nB)I e]= P(AI e)P[B /(A n e)]

2.108 P[(A u B)/ e]= P(A/ e)+ P(B 1e)

2.109 P[(AnB)!e)=P(Aie)P(B/e)

2.110 P[(AnB)!e]= P(AnBne)


P(e)

2.111 P[B/(AnC)]

2.112 P(AnBne) = P(A)P(B/A)P[C/(AnB)]

2.113 P (CP/F)

2.114 P(FnCP)

2.115 P [CP/(F n AF)]

2.116 P(CPnFnAF)

2.117 P(eP/ F)

122
2.118 P(CPI F)

2.119 Que entre los no fumadores no se da el cáncer de pulmón.

2.120 Que no es posible ser no fumador y tener cáncer de pulmón.

2.121 Que entre los no fumadores es menor la probabilidad de que se dé el cáncer de


pulmón que en la población general.

2.122 P( A1B) = 1- P( A 1B) = 1- O, 2 =O, 8, por ser sucesos complementarios.

2.123 No se puede calcular porque no guardan relación.

2.124 Se puede expresar de dos formas: P(A/B)=P(A) o P(B/A)=P(B)

2.125 Es imposible que P(A/B);::: 1, ya que cualquier probabilidad es menor o igual a


uno.

2.126 Que el ser bebedor habitual aumentaría la probabilidad de padecer pancreatitis


crónica, es decir, la pancreatitis crónica se da con más frecuencia entre los
bebedores.

2.127 Que el ser bebedor habitual no predispone a padecer pancreatitis crónica, es


decir, ambos sucesos son independientes.

2.128 Que el no ser bebedor habitual disminuye la probabilidad de padecer pancreatitis


crónica, es decir, la pancreatitis crónica se da con menos frecuencia entre los no
bebedores.

2.129 Probabilidad de padecer melanoma entre los que tienen la piel blanca y toman el
sol en exceso.

2.130 Probabilidad de que se padezca melanoma entre los que no tienen la piel blanca
y toman el sol en exceso.

2.131 Que la probabilidad de padecer melanoma tomando el sol en exceso es mayor


que la probabilidad de padecer melanoma teniendo la piel blanca.

2.132 Probabilidad de haber tomado el sol en exceso entre los que padecen melanoma.

2.133 P(M/SE) >P(M)

2.134 Que es imposible tener melanoma y no haber tomado el sol en exceso.

2.135 Que es más probable padecer melanoma teniendo la piel blanca que si no se
tiene la piel blanca.

123
TESTS DIAGNÓSTICOS

2.136 La sensibilidad, especificidad.

2.13 7 Los valores predictivos positivos, valores predictivos negativos.

2.138 Entre los enfermos.

2.139 De los sanos que han dado el test negativo.

2.140 Positivo.

2.141 Entre los sanos.

2.142 Disminuye el valor predictivo negativo.

2.143 Aumenta el valor predictivo negativo.

2.144 Aumenta el valor predictivo negativo.

2.145 El valor predictivo positivo aumenta.

2.146 No se puede saber.

2.147 No varía; la sensibilidad no depende de la prevalencia.

2.148 No varía.; la especificidad no depende de la prevalencia

2.149 Para detectar la enfermedad.

2.150 Para descartar la enfermedad.

2.151 Hará que detecte mejor, ya que el valor predictivo positivo aumenta.

2.152 Hará que descarte mejor, ya que el valor predictivo negativo aumenta.

2.153 Cuando demostremos que el test está relacionado con la enfermedad.

2.154 Depende directamente de la prevalencia, la sensibilidad y la especificidad.

2.155 Que el test dé positivo cuando se padece la enfermedad y que el test dé negativo
cuando no se padece la enfermedad.

2.156 Entre O y l.

2.157 Que el test acierta siempre.

2.158 Sería un test no valido, ya que su eficacia relativa es O.

125
2.159 Será mejor aquel cuya eficacia sea mayor.

2.160 La sensibilidad alta y con prevalencia de la enfermedad baja.

2.161 La especificidad alta y con prevalencia de la enfermedad alta.

2.162 Sensible.

2.163 Que tiene un valor predictivo negativo muy alto.

2.164 Específico.

2.165 Que el valor predictivo positivo es muy alto.

2.166 Pasando el test diagnóstico a un grupo de enfermos y ver los que dan el test
positivo.

2.167 Cuando el % de sanos que dan el test negativo es alto.

2.168 Viendo en un grupo de pacientes que han dado el test positivo, cuántos
realmente tienen la enfermedad.

2.169 Cuando el % de enfermos que dan el test positivo es bajo.

2.170 Viendo en un grupo de pacientes que han dado el test negativo, cuántos
realmente no tienen la enfermedad.

2.171 Siguiendo el siguiente proceso:


1o Tomando una muestra de pacientes elegidos al azar.
2° Viendo los que son sanos y enfermos de la misma.
3° Aplicando el test a todos ellos y observar el resultado del mismo.

2.172 La sensibilidad es alta: s = 0,98, e = no se sabe. Si la prevalencia es baja, el test


sería bueno para descartar.

2.173 Un alta especificidad e = 0,99 y alta sensibilidad s = 0,97.

2.174 v-= 0,99.

2.175 El valor predictivo positivo no se puede conocer a partir de los falsos negativos.

2.176 La sensibilidad.

2.177 Si ¡+ = P ( i5 1r+) = O, 1 , el valor predicativo positivo valdría:


v+= P(D!T+)=l - 0,1=0,9

2.178 El valor predicativo negativo.

2.179 Siempre que la prevalencia de la enfermedad sea alta.


126
2.180 Que sólo el 25% de los que dan el test positivo realmente tienen la enfermedad.

2.181 El valor predictivo positivo, que será mayor en este grupo.

2.182 Que no padece dicha enfermedad y que la probabilidad de equivocarse es de un


4%.

2.183 La sensibilidad del test será: s = P( r+ 1D) = 1- P( r- 1D) = 1-0,30 =O, 70.
2.184 No se puede calcular porque no se conoce la prevalencia.

2.185 Que el 9% de los que dan el test positivo no padecen la enfermedad.

2.186 Que el 10% de los que dan el test negativo padecen la enfermedad.

2.187 El resultado supone que v+ = P ( D 1r+) =O, 90 , por lo que es bueno para
detectar.

2.188 La especificidad es e= P( r- 115) = 0,95 y los falsos positivos son


¡ + =P ( D1r+) =1- P ( D 1T +) , por lo tanto no se puede calcular, porque no se
conoce la prevalencia ni la sensibilidad.

2.189 Los resultados nos permiten conocer la P ( r- 1D) = O, 05 , con lo que


P(T+ 1D) =1-P(r- 1D) =1-0,05 =0,95, que es la sensibilidad.

2.190 No podremos asegurar que el test sea bueno para descartar, puesto que para ello
el valor predicitvo negativo tiene que ser alto, y si la prevalencia es muy alta,
este valor disminuirá.

2.191 Que padece dicha enfermedad y la probabilidad de !lCertar es de un 96%.

127
VARIABLE ALEATORIA

2.192 Es una aplicación (función) del espacio muestra! Q (conjunto de los sucesos
elementales) en el conjunto de los números reales R, de forma que la imagen
inversa de cualquier intervalo perteneciente al conjunto de los números reales R
es un suceso asociado al experimento contenido en el conjunto de sucesos
asociados al experimento.

2.193 Valor numérico (imagen de esa variable aleatoria).

2.194 Definirla detallando todos los valores que toma la variable aleatoria y sus
probabilidades correspondientes.

2.195 Una fórmula que me permite obtener la probabilidad correspondiente a cada uno
de los valores que toma la variable aleatoria.

2.196 Definirla dando todos los valores que toma la variable y las probabilidades
correspondientes a dichos valores no se detallan sino que se obtienen mediante
una ley de probabilidad.

2.197 No, debe de reunir la condición expresada en la repuesta 2.192.

2.198 Existen variables aleatorias discretas y variables aleatorias continuas.

2.199 Uno.

2.200 La variable aleatoria toma el valor 1 correspondiente al suceso "sacar cara" con
P(X =1) = 0,5 y toma el valor O correspondiente al suceso "no sacar cara" con
P(X = O) = 1- 0,5

2.201 La variable aleatoria toma el valor 1 correspondiente al suceso "tener reacción


alérgica" con P(X = 1) = 0,2 y toma el valor O correspondiente al suceso "no
tener reacción alérgica" con P(X = O) = 0,8.

2.202 Asociándola con su imagen inversa, que es un suceso contenido en el espacio


muestra!, la probabilidad de dicho valor es igual a la probabilidad del suceso que
es su imagen inversa.

129
MODELOS DE PROBABILIDAD

2.203 Es característico de una variable aleatoria discreta

2.204 n (número de veces que se repite el experimento dicotómico) y p (probabilidad


de uno de los sucesos asociados al experimento dicotómico)

2.205 11 =np

2.206 o-2 = np ( 1- p)

2.207 Las condiciones son:

a) Experimento dicotómico (A y no A) siendo p = P(A).

b) Que el experimento se repitan veces de forma independiente y en las


mismas condiciones probabilísticas.

e) Que la variable aleatoria sea el número de veces que ocurre el suceso A al


repetir el experimento dicotómico n veces.

2.208 X= 0,1, .. . , n (número de veces que se repite el experimento dicotómico).

2.209 Puede tomar 7 valores: X= 0,1, ... ,6.

2.21 O Entre los valores O y 1 ambos inclusive, ya que se trata de una probabilidad.

2.211 No, porque es el número de veces que se repite el experimento dicotómico.

2.212 Es siempre O, ya que la ocurrencia de uno de los sucesos asociados al


experimento dicotómico al repetirlo n veces puede ser Oen todos los casos.

2.213 Como el valor máximo es siempre n (número de veces que se repite el


experimento dicotómico); variará de una distribución binomial a otra.

2.214 Es característico de una variable aleatoria discreta

2.215: El parámetro característico de una distribución de Poisson es: A. (número medio


de ocurrencias de un suceso por unidad de tiempo, espacio, volumen ... ).

2.216 La media de una distribución de Poisson coincide con su parámetro


característico: 11 =A. (número medio de ocurrencias de un suceso por unidad de
tiempo, espacio, volumen .. .).

2.217 La varianza de una distribución de Poisson es o-2 =A. (número medio de


ocurrencias de un suceso por unidad de tiempo, espacio, volumen ... ).

131
2.218 Ley de sucesos raros (La probabilidad más alta corresponde al valor de la
variable aleatoria X = O y la probabilidad va disminuyendo conforme aumenta
e"l valor de la variable).

2.219 X= O, l ... , es decir, de cero a infinito.

2.220 Para p< 0,01 y np <5

2.221 No se contempla.

2.222 El modelo llamado de Bernouilli consiste en un experimento dicotómico con


sucesos asociados: A y noA siendo p = P(A). El experimento se repite una sola
vez. Se trata, por tanto, de un caso particular del modelo de Binomial.

2.223 Se trata de una variable aleatoria continua.

2.224 Mediante la función de distribución.

2.225 Cualquier valor comprendido entre menos infinito y más infmito: ( -oo; -too) .

2.226 Las condiciones son:

a) Que la observación sea suma de efectos.

b) La probabilidad de que tome valores extremos es muy pequeña.

e) Que hay la misma probabilidad de obtener un valor alto que bajo.

2.227 Los parámetros característicos son: J.1 (media) y cr (desviación típica).

2.228 Cuando 0,1 < p <0,9 (algunos autores proponen: 0,3 < p < 0,7) y np > 5.

2.229 Cuando 'A > 5.

2.230 Una transformación de una variable que al ser transformada se comporta como
una variable aleatoria Normal.

2.231 Una ley de distribución Binomial.

2.232 Una ley de distribución de Poisson.

2.233 Es la corrección que hay que hacer cuando se aproxima una variable discreta por
una continua, ya que la probabilidad de que una variable continua tome un valor
concreto, X= a, es cero: P(X =a) = O.Así:

Pdiscreta (X = a) = Pcontinua(a-0,5 < X< a+0,5)

2.234 Un modelo de probabilidad Normal.

132
2.235 Su media.

2.236 El extremo inferior se obtiene restando a la media la desviación típica, y el


extremo superior, sumando a la media la desviación típica, es decir:

2.237 No necesariamente. Se precisaría que las n personas observadas tengan la misma


probabilidad de verificar esa opción de la característica dicotómica.

2.238 Tendremos que buscar P(X < 2, 5) en la tabla de probabilidades normales.

2.239 Tendremos que buscar P(X > 3, 5) en la tabla de probabilidades normales.

2.240 Tendremos que buscar P(X < 3,5) en la tabla de probabilidades normales

2.241 Tendremos que buscar P(X > 2,5) en la tabla de probabilidades normales.

2.242 Tendremos que buscar P(2,5 <X< 3,5) en la tabla de probabilidades


Normales.

2.243 Tendremos que buscar P(0,5 <X< 2,5) en la tabla de probabilidades


Normales

2.244 Tendremos que buscar P(-0,5 <X< 3,5) en la tabla de probabilidades


Normales

2.245 No, porque nunca se aproxima una variable normal por una variable binomial.

2.246 Tendremos que tipificar el valor 30,4, es decir:


30,4- .Ux
~X
2.247 Depende de la media:

Si .U= 3,2 entonces P(X < 3,2) = P(X > 3,2)


Si .U< 3,2 entonces P(X < 3,2) < P(X > 3,2)
Si .U> 3,2 entonces P(X < 3, 2) > P(X > 3,2)

2.248 Porque la distribución de los datos tipificados tiene de media O y desviación


típica 1, que es la distribución de la que disponemos de una tabla: la Normal
tipificada.

2.249 Que la media de dicha distribución será mayor o igual que cinco.

2.250 Que la media de dicha distribución será mayor o igual que cinco.
133
CAPÍTULO 111

MUESTREO
. y
ESTIMACIÓN
MUESTREO

3.1 Una muestra es una parte de la población que me permite conocer cómo es
aproximadamente la población.

3.2 Cualquier parte de la población no sirve para conocer cómo es aproximadamente


la población. Para que esto ocurra, la muestra debe cumplir dos condiciones:

- Ser representativa de la población.


- Que las observaciones que pertenecen a la muestra hayan sido elegidas
aleatoriamente.

3.3 Una muestra es representativa cuando es lo suficientemente grande como para


que tanto las mayorías como las minorías estén representadas.

3.4 Los muestreos estratificados y por conglomerados es conveniente realizarlos


cuando los elementos de la población no son homogéneos.

3.5 Los elementos que forman cada estrato son homogéneos entre sí.

3.6 Los elementos que forman los conglomerados son heterogéneos entre sí (cada
conglomerado debe ser una población "en pequefio").

3.7 La elección de la muestra en el muestreo estratificado se realiza haciendo un


muestreo aleatorio en cada uno de los estratos y el n° de elementos de cada
estrato que pertenecerán a la muestra será proporcional al tamafio del estrato. La
muestra estará formada por los elementos obtenidos de cada estrato.

3.8 La elección de la muestra en el muestreo por conglomerados se realiza haciendo


un muestreo entre los conglomerados. La muestra estará formada por todos los
elementos de cada uno de los conglomerados elegidos.

3.9 Los conglomerados son muy parecidos unos a otros: son homogéneos.

3.1 O Los estratos son muy distintos entre sí: son heterogéneos

3.11 Para poder aplicar el muestreo aleatorio simple, los elementos de la población
deben ser homogéneos.

3.12 El muestreo aleatorio simple se realiza eligiendo los elementos de la población


que van a pertenecer a la muestra al azar.

3.13 Para garantizar, dentro de lo posible, la representatividad de la muestra sin


detrimento de la aleatoriedad.

3.14 Una muestra es aleatoria cuando todos elementos de la población han tenido la
misma probabilidad de pertenecer a ella.

137
3.15 Naturalmente se pueden obtener distintas muestras representativas y aleatorias
de una población.

3.16 El muestreo es un procedimiento de selección de la muestra.

3.17 Los fallos de aleatoriedad provienen:


- del sistema de aleatorización.
- de una definición ambigua de la población.
-del sesgo.

3.18 Un muestreo se dice que es con reemplazamiento cuando, una vez extraído cada
elemento que va a pertenecer a la muestra, es devuelto a la población, por lo que
puede volver a ser seleccionado para pertenecer a la misma.

3.19 El número de elementos de cada estrato que van a pertenecer a la muestra debe
ser proporcional al tamaño del estrato dentro de la población (afijación
proporcional).

3.20 Son métodos de muestro en el que se combinan dos métodos de muestreo


consecutivos.

3.21 No. Los tamaños de los estratos en los que se divide la población no están
condicionados.

3.22 Haciendo una lista numerada de los elementos de la población y los elementos
que pertenecerán a la muestra, se eligen, seleccionándolos de la lista
ordenadamente, uno cada k elementos ("uno cada 4" o" uno cada 5").

3.23 Si consideramos que la tensión arterial media de las personas mayores de 65


años es homogénea, se realizaría un muestreo aleatorio simple para obtener la
muestra.

3.24 Como la representatividad depende del tamaño de la muestra, esta


representatividad estará condicionada por:

-La dispersión de las observaciones.


-La naturaleza de las observaciones.
-Lo que se quiera conocer de la población a partir de la muestra.
-El tipo de muestreo elegido.

3.25 Se conseguirá eligiendo los elementos que van a pertenecer a la muestra


mediante un método de aleatorización (tabla de números aleatorios por ejemplo).

138
ESTIMACIÓN

3.26 Un estadístico es una función de los valores de la muestra.

3.27 Un estadístico depende de la muestra que se obtenga: tomará un valor, en


general, distinto para cada muestra.

3.28 Un estimador es un estadístico que toma valores próximos al parámetro que se


quiere conocer, por tanto, existen estimadores distintos para parámetros
distintos.

3.29 Sí, puede tomar valores negativos.

3.30 No. Cualquier estadístico no es un estimador, ya que el estadístico es sólo una


función de la muestra, mientras que el estimador es un estadístico que nos
permite conocer valores aproximados de parámetros de la población.

3.31 Una estimación de un parámetro es el valor que toma el estimador de ese


parámetro para una muestra concreta.

3.32 Sí. Todo estimador es un estadístico, porque todo estimador es una función de la
muestra.

3.33 La estimación es el valor que toma el estimador para una muestra concreta; por
tanto, la estimación es un número y el estimador es una función de la muestra.

3.34 Los estimadores son estadísticos que nos permiten conocer valores aproximados
de los parámetros de la población. Los estadísticos son sólo funciones de la
muestra.

3.35 Estimar un parámetro consiste en obtener valores aproximados del mismo


sustituyendo una muestra en el estimador apropiado.

3.36 Pueden existir varios estimadores de un mismo parámetro, ya que pueden existir
varios estadísticos que al sustituir la muestra en ellos den valores próximos a
dicho parámetro.

3.37 En la estimación de un parámetro asignamos a un parámetro un valor próximo a


él. Por tanto, es seguro que nos equivocaremos en la estimación. De lo que se
trata es de asegurar que nos equivocaremos (error) en menos de una cantidad
(cota): e. La cota de error (e) será tal que "sea cual fuere la muestra que se
extrajere, nos equivocaríamos al estimar en menos de esa cantidad e".

3.38 El nivel de confianza es la probabilidad (porcentaje de muestras) con la que nos


equivocaremos al estimar un parámetro en menos de una cota de error.

3.39 La cota de error de la media depende del nivel de confianza, de la dispersión de


los datos, del tamaño de la muestra. Si la población es finita, depende también
del tamaño de la población.
139
3.40 El error de muestreo es lo que llamamos cota de error y es consecuencia de
utilizar una muestra, es decir, parte de la población, para conocer un parámetro
de la misma.

3.41 Al depender el error de muestreo directamente del valor correspondiente de la t


de Student (ta) y éste a su vez del nivel de confianza (1-a). Si aumenta el
nivel de confianza, disminuye a, y, como consecuencia, aumenta el valor de
ta, lo que supone que el error de muestro e aumenta; es decir, si aumenta el
nivel de confianza, bajo las mismas condiciones, el error de muestreo aumenta.

3.42 El valor 2 será la cota de error de la estimación de la media, con una confianza
de195%.

3.43 Al aumentar el tamaño de la muestra la cota de error disminuye y, por tanto, se


mejora la estimación, es decir, se estima el parámetro con más precisión.

3.44 En una población de datos cualitativos estimaremos fundamentalmente las


frecuencias relativas de cada modalidad (cualidad). Estimamos, por tanto, las
proporciones con que de dan, dentro de la población, cada una de las
modalidades.

3.45 En la estimación de la media, a mayor dispersión de los datos, mayor cota de


error. La estimación será menos precisa.

3.46 El mejor estimador de la varianza poblacional es la cuasi-varianza de la muestra:

3.47 Si el valor de la cota de error es O, la dispersión será O. Esto indicaría que todos
los elementos de la muestra son iguales. La cota de error también valdría O si se
observan todos los elementos de la población y, por lo tanto, no cometemos
ningún error.

3.48 La cota de error en la en la estimación de una proporción depende del nivel de


confianza y del tamaño de la muestra, si la población es infinita. Si la población
es finita, dependerá también del tamaño de la población.

3.49 La cota de error en la estimación de la media puede tomar cualquier valor.

3.50 En la estimación de la proporción, una cota de error O puede significar tres


cosas:

a) Que la proporción de la cualidad en la muestra es O, lo que supondría que


no hay en la muestra ninguna observación con esa cualidad.
b) Que la proporción de la cualidad en la muestra es 1, lo que supondría que
todos los elementos de la muestra tienen esa cualidad.

140
e) Que se están observando todos los elementos de la población y, por lo
tanto, no cometemos ningún error.

3.51 El tamaño de la muestra es inversamente proporcional al cuadrado del error


máximo admisible. Una disminución del error máximo admisible a la mitad (de
2 a 1) supondría un tamaño de muestra 4 veces superior: 25 x 4 = 1OO.

3.52 Una cota de error grande supone que la estimación del parámetro es poco
precisa.

3.53 Que la edad media de la población es aproximadamente de 60 ± 2 años por lo


menos para el 95% de las muestras. Hay un 5% de las muestras en las que nos
equivocaríamos en más de 2 años.

3.54 En la estimación de la media, si queremos mucha preclSlon para una


determinada dispersión y nivel de confianza, tendremos que aumentar el tamaño
de la muestra.

3.55 Que la proporción de hipertensos en la población está comprendida entre el 1% y


el 8%, con un nivel de confianza del 95%.

3.56 Que la tensión arterial media en esa población oscila entre 115 y 119 mmHg con
una confianza del95%.

3.57 La varianza muestral no es necesario estimarla, porque se puede calcular, ya que


conocemos todos los elementos de la muestra.

3.58 La proporción oscila entre O y l. Como la cota de error en la estimación de una


proporción es también una proporción debe estar comprendida entre O y l. No
puede, por tanto, ser mayor que l.

3.59 La cota de error es consecuencia de la estimación de un parámetro de la


población a partir de la muestra elegida, es decir, se calcula. El error máximo
admisible lo fija el investigador y es anterior a la selección de la muestra.

3.60 Si el nivel de confianza disminuye, la cota de error disminuye. En este caso sería
inferior a un 1%. La estimación será más precisa, pero con menos nivel de
confianza.

3.61 Si queremos tener mayor nivel de confianza en una estimación bajo las mismas
condiciones, la estimación será menos precisa.

3.62 El error máximo admisible no depende del nivel de confianza.

3.63 La paradoja de Friedman consiste en que para tratar de obtener el tamaño de la


muestra mínimo necesario para estimar la media poblacional se nos exige
conocer la varianza poblacional, que no podemos conocer ya que dicha varianza
la obtenemos a partir de la media poblacional que el parámetro que queremos
estimar.

141
3.64 En el caso del tamaño de la muestra para estimar la media poblacional, se nos
pide que conozcamos la varianza poblacional. En este caso podemos proceder
así:

a) Tomar como varianza poblacionalla varianza de un estudio similar.


b) Tomar como varianza poblacionalla varianza de una muestra piloto.
e) Tomar el error máximo admisible proporcional a la desviación
típica (e=k a).
d) Tomar la desviación típica de intervalo de normalidad.
e) Tomar el mayor tamaño posible de la muestra.

3.65 En el caso del tamaño de la muestra para estimar la proporción poblacional, se


nos pide que conozcamos, precisamente, la proporción poblacional. En este caso
se puede proceder así:

a) Tomar como proporción poblacionalla proporción de un estudio similar.


b) Tomar como proporción poblacionalla proporción de una muestra piloto.
e) Darle a la proporción el valor ~.

3.66 El valor de tt= ~ es el caso más desfavorable porque el tamaño de muestra


mínimo necesario para estimar la proporción es máximo bajo las mismas
condiciones.

3.67 El error máximo admisible es el error máximo que el investigador está dispuesto
a asumir en la estimación de un parámetro, por lo tanto lo fija el investigador.

3.68 Si queremos equivocarnos poco (error máximo admisible pequeño), tendremos


que aumentar el tamaño de la muestra. Si estamos dispuestos a admitir más error
necesitaremos menos tamaño de muestra.

3.69 Como la proporción poblacional con que se da una cualidad está comprendida
ente O y 1, el error máximo admisible, que es también una proporción, no podrá
ser superior a l.

3.70 Si el tamaño de la muestra aumenta la cota de error disminuye, ya que la cota de


error depende inversamente del tamaño de la muestra.

3.71 Si la dispersión de los datos es grande, el tamaño de la muestra tendrá que ser
mayor si queremos que el error de muestreo no sea muy grande.

3.72 Para la estimación de la media el error máximo admisible es mayor que O, pero
no tiene por qué ser mayor que l.

3. 73 Si se quiere tener mucho nivel de confianza, deberá aumentarse el tamaño de la


muestra.

3.74 Para la estimación de la proporción poblacional, el tamaño de la muestra mínimo


necesario depende del nivel de confianza: cuanto mayor sea el nivel de
confianza, mayor tendrá que ser el tamaño de la muestra.

142
3.75 Cuando el muestreo se hace en población finita (con muestreo sin
reemplazamiento), la cota de error en la estimación de la media y de la
proporción vienen multiplicadas por el factor de corrección para poblaciones
finitas, que es:
~
vN=I
3.76 El factor de corrección para poblaciones fmitas es menor que la unidad, por lo
que al multiplicar la cota de error por dicho factor, ésta se hace más pequeña y se
obtiene una estimación más precisa.

3.77 Una población es infinita cuando tiene un número infinito de elementos o,


siendo finito el número de elementos, el muestreo es con reemplazamiento.

3.78 El muestreo con reemplazamiento consiste en obtener la muestra eligiendo los


elementos de la muestra sucesivamente de la población de forma que una vez
seleccionado uno, se le observa y se vuele a introducir en la población, por lo
que puede volver a ser seleccionado y observado.

3.79 Una estimación será necesaria cuando no podamos disponer de todos los
elementos de la población, sino sólo de una parte de la misma (muestra).

3.80 La estimación de un parámetro de la poblacional, e, por intervalos consiste en


obtener dos estadísticos que contengan al parámetro con un determinado nivel
de confianza (1-a), es decir: P( T1 < e < T2 ) = 1-a , lo que supone que en un
alto porcentaje de muestras (1-a)100, los estadísticos Tl y T2 tomarán valores
que comprenderán al parámetro e.

3.81 El intervalo de confianza en la estimación de la media poblacional es:


(x-e; x +e) , siendo x la media muestral y e la cota de error de la estimación

3.82 El intervalo de confianza en la estimación de la proporción poblacional es


(p-e; p +e) , siendo p la proporción muestral y e la cota de error de la
estimación.

3.83 La amplitud del intervalo de confianza es dos veces el error: 2e.

3.84 Si la amplitud de intervalo de confianza vale O, esto implica que la cota de error
valdrá O.

3.85 El intervalo de confianza será: (10- 2; 10 + 2) = (8; 12) días.

3.86 Que la probabilidad de que el intervalo: (7 ; 12) contenga a la media de la


población es 0.99.

3.87 La amplitud será menor, ya que al aumentar el tamaño de la muestra la cota de


error disminuye.

3.88 El tamaño de la muestra tendremos que multiplicarlo por cuatro.

143
3.89 La cota de error de la estimación de la predicción aumentará y la estimación será
menos precisa.

3.90 La cota de error de la estimación de la predicción disminuirá y la estimación será


más precisa.

3.91 Los grados de libertad con los que se trabaja en la estimación de una predicción
son iguales al tamaño de la muestra menos dos: n- 2., siendo n el tamaño de la
muestra.

3.92 Sí, ya que dicho intervalo depende de la cota de error correspondiente y esta
depende del nivel de confianza.

144
CAPÍTULO IV

CONTRASTE
DE
HIPÓTESIS
CONTRASTE DE HIPÓTESIS

4.1 La hipótesis que se contrasta, que es la hipótesis nula: H 0 •

4.2 La hipótesis nula es la hipótesis que se contrasta, la que se somete a prueba:


Ho.

4.3 La hipótesis alternativa H 1 •

4.4 Creando un experimento que lleve asociado un suceso: S, que si la hipótesis que
se contrasta fuese cierta la probabilidad de que ocurra dicho suceso es muy
pequeña. Si ocurriera dicho suceso rechaza la hipótesis que se contrasta.

4.5 Es la probabilidad de equivocarse al rechazar la hipótesis nula ( H 0 ). Es la


probabilidad de rechazar la hipótesis nula (H0 ) siendo cierta.

4.6 Es la probabilidad de rechazar la hipótesis nula, H 0 , cuando H 0 es falsa. Es la


probabilidad de acertar al rechazar la hipótesis nula H 0 •

4.7 Es una hipótesis ( H 1 ) complementaria a la hipótesis nula ( H 0 ). Por tanto, es una


hipótesis que necesariamente tendrá que aceptarse si se rechazase la hipótesis
nula.

4.8 La hipótesis alternativa no se rechaza se acepta o no se acepta.

4.9 Con el nivel de significación (a), probabilidad de equivocarse al rechazar la


hipótesis nula.

4.10 No se puede medir ese error.

4.11 No se le conoce con ningún nombre.

4.12 Potencia del test, (1 - p).

4.13 Error f3 .
4.14 Que tiene una probabilidad muy alta de rechazar una hipótesis nula y aceptar la
hipótesis alternativa.

4.15 El nivel de significación (a) y la potencia (1 - p).


4.16 En general, aumentando el nivel de significación (hasta un máximo de 0,05) y
aumentando el tamaño de la muestra.

147
4.17 Alternativa, H 1 , puesto que podemos medir el riesgo de aceptar la hipótesis
alternativa y que no sea cierta, ya que es el mismo riesgo de rechazar H 0 y que
sea cierta, que es lo que denominamos nivel de significación.

4.18 Error P.
4.19 Sí, puede haber varios tests para contrastar una misma hipótesis.

4.20 Un test será mejor que otro cuando tenga menor nivel de significación y mayor
potencia; es decir, para un mismo nivel de significación, el mejor test sería aquel
que tuviese mayor potencia.

4.21 Un test en el que las hipótesis se plantean en función de un parámetro o


parámetros, por ejemplo, un test cuya hipótesis nula sea: H 0 : J.1=3,8.

4.22 Un test no paramétrico es aquel en el que las hipótesis se plantean en términos


no paramétricos, es decir, en términos cualitativos; como: H 0 : Independencia.

4.23 Son más potentes los tests paramétricos.

4.24 Porque no podemos conocer el error que cometemos aceptando H 0 y que sea
una hipótesis falsa.

4.25 Al nivel de significación más pequeño al que se puede rechazar la hipótesis H 0 •

4.26 Aumentando el nivel de significación podemos aumentar la potencia de un test,


pero este nivel de significación no puede ser superior a 0,05.

4.27 Los tests unilaterales son siempre más potentes que los bilaterales.

4.28 Un test es unilateral cuando descarta como posible uno de los lados del test, por
ejemplo, cuando descartamos la posibilidad de que una media sea menor o
mayor que un valor ( H 1 : p < p 0 o( H 1 : p > p 0 ). Por ejemplo: cuando
descartamos que un antitérmico pueda aumentar la fiebre, cuando descartamos
que el fumar produzca un beneficio, ... Mientras que un test bilateral no descarta
ninguno de los lados del test ( H 1 : p :t: p 0 ).

4.29 Si el nivel crítico en un test bilateral es: a = 0,01, si el test fuese unilateral, el
nivel crítico sería a = 0,0112 = 0,005 (la mitad).

4.30 En general no.

4.31 Que la probabilidad de equivocarse al rechazar la hipótesis es inferior a 0,00 l.

4.32 Si disminuye el nivel de significación, también disminuye la potencia del test.



4.33 Que la media poblacional tome un valor concreto: H 0 : Jl = JlO.

148
4.34 H 1 : ll =1- f.la ,.

4.35 H 1 : ll < f.la o bien que H 1 : ll > f.la.

4.36 Que en el contraste bilateral la hipótesis alternativa es: H 1 : ll =1- f.la , por lo que
no descartamos que: ll > f.la, ni que: ll < f.la. En el contraste unilateral
descartamos una de las opciones anteriores.

4.37 Del nivel de significación, de la potencia, de la dispersión de los datos, de la


diferencia respecto de la media poblacional que se quiera detectar.

4.38 La hipótesis alternativa en contraste de una proporción nunca puede ser: 1r = lra,
esta es la hipótesis nula.

4.39 En la probabilidad de rechazarla: el test bilateral es menos potente que el


unilateral porque el nivel crítico es menor si el test es unilateral que bilateral.

4.40 Que la proporción poblacional sea distinta a un valor concreto: H 1 : 1r =1- lra.

4.41 Del nivel de significación, de la potencia, de la diferencia respecto de la


proporción poblacional que se quiera detectar.

4.42 Ha : "la tensión arterial sistólica media de la población es igual a 150 mmHg",
es decir Ha: f.1 =150mmHg
4.43 La hipótesis alternativa es "que la tensión arterial sistólica de la población sea
superior a 150 mmHg", es decir, H 1 : f.1 > 150mmHg

4.44 Aumenta la potencia del contraste ya que el factor de corrección para


poblaciones fmitas es menor que l.

4.45 No necesariamente, ya que al disminuir la probabilidad de equivocarme y correr


menos riesgo, podría no rechazarla.

4.46 Sí, siempre, ya que antes de rechazar con el nivel de 0,5%, habríamos rechazado
con el nivel 1%.

4.47 No necesariamente. La potencia es la capacidad que tiene el test para rechazar la


hipótesis nula. Si disminuye la potencia del test, perdemos capacidad de rechazo
y podría no ser lo suficientemente potente para rechazar dicha hipótesis.

4.48 Sí, siempre. Si con una potencia del 80% hemos podido rechazar una hipótesis,
con más potencia, seguro que podremos seguir rechazando la hipótesis.

4.49 Si aumentamos el tamaño de la muestra podría disminuir el nivel crítico.

149
4.50 Para rechazar una hipótesis habrá que considerarla como hipótesis nula.

4.51 Que la potencia del test es alta.

4.52 Sería (0,05)(2) = 0,10 lo que supondría que no podríamos rechazar la hipótesis
nula.

4.53 Sí, porque los grados de libertad dependen del tamañ.o de la muestra, y la
potencia del test aumenta al aumentar el tamaño de la muestra.

4.54 No. Los grados de libertad de un test no dependen del tamaño de la población.

4.55 Dependen del tamaño de la muestra.

4.56 El tamaño de la muestra será de 23 observaciones ya que los grados de libertad


correspondientes a este contraste son g.l =23-1 =22.

4.57 Que, si la tensión arterial sistólica (TAS) de la población es superior a


150mmHg, y la capacidad de este test para detectarlo es de un 80%, como no se
ha podido rechazar que H 0 : f1 = 150mmHg y aceptar que H 1 : f1 > 150mmHg,
necesitaremos un test con una potencia superior a un 80% para poder decir que
la media de la población es superior al 50 mmHg.

4.58 Aumentaría la potencia del test, por lo tanto la capacidad del mismo para
detectar que la TAS de la población es superior a 150mmHg, si realmente fuese
cierto.

4.59 No podemos concluir nada sobre esa proporción de la población.

4.60 Aumentar la potencia del test.

4.61 Esta probabilidad no tiene un nombre específico.

4.62 Cuando no se pueden observar todos los elementos de la población para


comprobar si la hipótesis sobre la misma es cierta o no.

4.63 Tendremos que considerarla como hipótesis alternativa, que es la única que
podemos aceptar.

4.64 Tendremos que contrastar la hipótesis de que la proporción sea igual a 0,8
(H0 : 1l =O, 8 ) con la hipótesis alternativa de que la proporción sea superior a

0,8 (H1 :n>0,8).

4.65 Tendríamos que contrastar la hipótesis de que la media de la concentración de


glóbulos rojos de la población es igual a 4millones (H0 : f1 = 4millones) con la
hipótesis alternativa de que la concentración de glóbulos rojos de la población
sea menor que 4millones ( H 1 : f1 < 4millones ), que supondría anemia.

150
4.66 Habría que hacer el contraste de que la proporción de hombres es de 0,5(50%)
( H 0 :le= O, 5) con la hipótesis alternativa de que la proporción de hombres sea
superior a 0,5 ( H 1 :le> O, 5 ).

4.67 Tendremos que hacer un contraste bilateral, ya que no sabemos si esta alteración
supone una bajada de leucocitos, lo que supondría un descenso de leucocitos, o
un proceso infeccioso, lo que supondría un aumento de leucocitos.

4.68 Estamos suponiendo que se trata de una población de hipertensos, ya que


buscamos aceptar que la media de la TAS de esta población supere los
150mmHg.

4.69 Porque podemos conocerlos al poder observar todos los elementos de la misma.

4.70 Tenemos que contrastar la hipótesis de que la proporción de hombres de la


población sea 1/3 ( H 0 :le=.!.= O, 33) con la hipótesis alternativa de que esta
3
proporción sea distinta de 1/3 ( H 1 : le 1:- .!. =O, 3 3).
3

151
CAPÍTULO V
,
ANALISIS DE LA
VARIABILIDAD I:
,
REGRESION
REGRESIÓN/CORRELACIÓN
Las variables se anotan con mayúscula para destacar la respuesta

5.1 A la función que pasa por los puntos medios de valores de Y para cada valor de
X.

5.2 El método de mínimos cuadrados es un método que permite calcular los


coeficientes de la función de regresión que se quiere a ajustar.

5.3 Que sea mínima la suma de los cuadrados de los errores. Se llama error a la
diferencia entre el valor de Y observado y el valor de Y esperado de la función a
ajustar, que es el valor que se obtiene sustituyendo el valor observado de X en la
función de regresión Y= f(X;a0,a¡).

5.4 El objetivo de la regresión es obtener una función que exprese la relación entre
dos variables cuantitativas que permita predecir valores de Y conociendo valores
de X o predecir valores de X a partir de valores de Y: interpolar y extrapolar.

5.5 Al ser la regresión una función empírica (la recta no pasa por todos los puntos) y
no matemática, habrá una función de regresión que exprese Y en función de X
(regresión de Y/X) y otra función que exprese X en función de Y (regresión de
X/Y).

5.6 Los parámetros característicos de una recta de regresión son los coeficientes de
dicha recta de regresión, es decir, su termino independiente (ordenada o abscisa
en el origen) y su pendiente (coeficiente de regresión).

5.7 La regresión pasa por Jos puntos medios de los valores de Y. La predicción
hecha con la regresión nos dará, por tanto, un valor medio de valores de Y para
un valor concreto de X.

5.8 El coeficiente de regresión de la recta de regres10n es el coeficiente que


multiplica a la X: a1 • Tiene las siguientes interpretaciones:

a) Es la tangente trigonométrica del ángulo que forma la recta de regresión


con el eje de la X.
b) Es la pendiente de la recta: cuanto mayor sea, más "pendiente" será la
recta.
e) Es el incremento/decremento de Y por unidad de X: tiene, por tanto, la
interpretación de una "velocidad".

5.9 El coeficiente de regresión de la recta de regreswn es el coeficiente que


multiplica a la Y: b1 • Tiene las siguientes interpretaciones:

a) Es la tangente trigonométrica del ángulo que forma la recta de regresión


con el eje de la Y.
b) Es la pendiente de la recta: cuanto mayor sea, más "pendiente" será la
recta.
e) Es el incremento/decremento de X por unidad de Y.
155
5.1 O Las pendientes de las dos rectas de regresión tienen siempre el mismo signo, ya
que en su cálculo se ve que el denominador de ambas pendientes es siempre
positivo y ambas tienen el mismo numerador. Por tanto, el signo del numerador
dará el signo de las dos pendientes.

5.11 La recta de regresión de Y sobre X es: Y = a0 + a1 X. Si llamamos Uy a las


unidades de Y y Ux a las unidades de X, resulta que a0 tiene que tener como
unidades Uy para que las unidades de la suma del segundo miembro de la
igualdad sean Uy.

5.12 La recta de regresión de X sobre Y es X= b0 + b1 Y. Si llamamos Uy a las


unidades de Y y Ux a las unidades de X, resulta que b1 tiene que tener como
unidades Ux para que las unidades de la suma del segundo miembro de la
igualdad sean Ux.

5.13 La recta de regresión de Y sobre X es Y= a0 + a1 X. Si llamamos Uy a las


unidades de Y y Ux a las unidades de X, resulta que a0 tiene que tener como
unidades Uy para que las unidades de la suma de los dos sumandos del segundo
miembro de la igualdad sean Uy. Asimismo, el sumando a1 .X tiene que tener
también como unidades Uy. Como X tiene unidades Ux, para que al multiplicar
por las unidades de a1 nos quede Uy, a1 tiene que tener como unidades Uy/ U x,
es decir, las unidades de una "velocidad".

5.14 La recta de regresión de X sobre Y es X= b0 + b1 Y. Si llamamos Uy a las


unidades de Y y Ux a las unidades de X, resulta que b0 tiene que tener como
unidades Ux para que las unidades de la suma del los sumandos del segundo
miembro de la igualdad sean Ux. Asimismo, el sumando b1 .Y tiene que tener
también como unidades Ux. Como Y tiene unidades Uy, para que al multiplicar
por b1 nos quede Ux, b1 tiene que tener como unidades Ux!Uy, es decir, las
unidades de una "velocidad".

5.15 Lapendiente, al'delarectaderegresión: Y= a0 + a1 X yaque dY/dX= a1 •

5.16 La pendiente, b1 , de la recta de regresión X = b0 + b1 Y ya que dX/dY = b1 •

5.17 El coeficiente de determinación es un cociente cuyo numerador es la varianza


de Y explicada por la variabilidad de X y su denominador es la varianza total
de Y. Por tanto, el coeficiente de determinación es el "tanto por uno en que la
varianza de Y es explicada por la variabilidad de la X.

5.18 Las unidades de a1 son Uy/Ux y las unidades de b1 son Ux/Uy. Como el
coeficiente de determinación se puede expresar como el producto de los
coeficientes de regresión lineal, dicho coeficiente es adimensional.

156
5.19 El coeficiente de determinación es un cociente de varianzas (siempre positivas),
por tanto el coeficiente de determinación es siempre positivo.

5.20 El coeficiente de determinación lineal no puede ser mayor que 1 porque es un


tanto por 1: es el cociente de una parte de la varianza de Y que es explicada por
la variabilidad de X y la varianza total de Y, en el caso de la regresión de Y
sobre X. Análogamente ene. caso de la regresión de X sobre Y.

5.21 El coeficiente de determinación lineal está comprendido entre O y 1(ver 5.19 y


5.20).

5.22 El coeficiente de correlación lineal mide el grado de dependencia lineal (si las
variables X ,Y se distribuyen normalmente) y la bondad del ajuste lineal.

5.23 El valor del coeficiente de correlación lineal oscila entre -1 y 1, al ser la raíz
cuadrada del coeficiente de determinación lineal. Por tanto, no puede tomar el
valor 2,5.

5.24 El coeficiente de correlación lineal puede ser negativo, como ya se ha


justificado en el apartado anterior. En ese caso indicaría que la dependencia
entre las variables es inversa: al aumentar una disminuiría la otra.

5.25 Si puede ser O, ya que el valor del coeficiente de correlación lineal oscila entre
- 1 y 1 (ver 5.23).

5.26 Pueden tomar cualquier valor.

5.27 Es adimensional porque es la raíz cuadrada del coeficiente de determinación


lineal y éste es adimensional (ver 5.18).

5.28 El coeficiente de correlación lineal y los coeficientes de regresión de las rectas,


ya que tienen el mismo signo.

5.29 Que las dos variables X, Y se distribuyan normalmente.

5.30 El 100%, ya que el coeficiente de determinación lineal es el tanto por 1 de la


variación de Y que es debida la X, y, en este caso, éste vale O (el 0% si se
multiplica por 100), por lo que el 100% de la variación de Y no es debida a X.

5.31 Si el coeficiente de correlación lineal vale 1 quiere decir que existe una
dependencia lineal funcional (matemática) entre las dos variables, ya que toda la
variabilidad de Y es debida a la variabilidad de X, es decir la variable Y varia
solo cuando varia la variable X.

5.32 Nos da un valor medio de todos los valores que toma Y para un valor concreto
de X.

5.33 Los coeficientes de regreswn de las dos rectas de regreswn no pueden ser
opuestos ya que tienen siempre el mismo signo (ver respuesta 5.10).

157
5.34 Porque en los tres casos su signo depende del numerador y dicho numerador es
el mismo en los tres parámetros.

5.35 El coeficiente de correlación lineal no tiene interpretación frecuentista pero sí el


coeficiente de determinación: (-0,9i = 0,81. Por tanto, el 81% de la variación de
Y es debida a la variación de X. ·

5.36 Como el coeficiente de correlación lineal es negativo, las pendientes de las


rectas serán también negativas, por tanto, las variables dependen inversamente:
al aumentar una disminuye la otra.

5.37 El coeficiente de correlación lineal valdrá 0,90, es decir, la raíz cuadrada del
coeficiente de determinación, que en este caso es 0,81.

5.38 No existe relación lineal, aunque no se excluye una relación de otro tipo.

5.39 Mide el valor de la varianza de Y que no es debida a la variabilidad de X.

5.40 Si una pendiente vale cero, la otra pendiente vale también cero y el coeficiente
de determinación y el de correlación también valdrán cero.

5.41 El% de la varianza de Y que no es explicada por la variación de X se obtendría


restando de 1 el valor del coeficiente de determinación (varianza de Y debida a
la variabilidad de X) y multiplicando esta diferencia por 1OO.

5.42 Si las variables son independientes, el valor del coeficiente de correlación lineal
y el de las pendientes de ambas rectas será cero, por lo que son paralelas a los
ejes de coordenadas. Las rectas de regresión serían: Y= a0 ; X=b0 •

5.43 Si la varianza del ajuste vale cero, quiere decir que no hay "varianza no
explicada", lo cual supone que toda la variabilidad de Y es debida a la
variabilidad de X. Por lo tanto, la dependencia entre las dos variables es
funcional (matemática): la recta pasa por todos los puntos (los puntos están
alineados) y, por tanto, las dos rectas de regresión coinciden.

5.44 La relación es inversa por ser negativo el coeficiente de correlación lineal: rectas
decrecientes, al aumentar una disminuye la otra. Pero el coeficiente de
determinación valdrá, entonces, 1, es decir, el 100% de la variabilidad de Y es
debida a la variabilidad de X, no hay varianza en el ajuste, la recta pasa por
todos los puntos. La relación es, por tanto, funcional (matemática), las dos rectas
coinciden.

5.45 El coeficiente de determinación mide el tanto por uno de la varianza de Y debida


a X. Para calcular dicha varianza bastará con multiplicar el coeficiente de
determinación por la varianza de los valores de Y.

5.46 Si las dos variables son linealmente independientes la amplitud del ángulo que
forman las dos rectas es de 90°, las rectas son perpendiculares. ·

158
5.47 Si son independientes, la varianza de Y explicada por X es cero, en
consecuencia, la varianza de Y coincide con la varianza del ajuste, que es la
varianza de Y no debida a X.

5.48 Si la varianza del ajuste vale cero, no hay varianza no explicada, toda la varianza
de Y es explicada por la variabilidad de X. El coeficiente de determinación
valdrá, por tanto, l.

5.49 Si el coeficiente de correlación lineal vale -1, el de determinación será 1, por lo


tanto toda la varianza de Y es explicada por la variabilidad de X y, por tanto, la
varianza no explicada (varianza del ajuste) valdrá cero.

5.50 La varianza de Y debida a X es la parte de la varianza de Y debida a la


variabilidad de X. El coeficiente de determinación expresa esta variabilidad en
tanto por uno. Si se multiplica por 100, nos dará el % de esta variabilidad de Y
debida a X.

5.51 Que el coeficiente de correlación lineal es cero: H 0 : p =O. Es equivalente a


considerar que las dos variables sean independientes (linealmente).

5.52 Dos caracteristicas cuantitativas.

5.53 Una relación lineal entre las dos variables.

5.54 Relación lineal inversa: al aumentar una variable, la otra disminuye.

5.55 No podemos decir que exista relación lineal., pero se podría estudiar si existe
una relación de otro tipo (logaritmica, exponencial, ... )

5.56 El contraste de la hipótesis de que el coeficiente de correlación es cero:


H 0 : p =O, con una hipótesis alternativa unilateral de que el coeficiente de
correlación es positivo: H 1 : p >O.

5.57 La hipótesis alternativa a que el coeficiente de correlación sea cero es que sea
distinto de cero: H 1 : p :t:. O (contraste bilateral).

5.58 Un contraste de la hipótesis de que el coeficiente de correlación es cero:


H 0 : p =O teniendo como hipótesis alternativa de que el coeficiente de
correlación es menor que cero: H 1 : p <O (contraste unilateral), ya que
descartamos la posibilidad de que un aumento del ejercicio fisico se asocie con
más ansiedad.

5.59 Un contraste de la hipótesis de que el coeficiente de correlación es cero:


H 0 : p =O, teniendo como hipótesis alternativa que el coeficiente de correlación
es distinto de cero: H 1 : p :t:. O(bilateral).

159
5.60 Contraste de la hipótesis de que el coeficiente de correlación sea cero.
H 0 : p =O, tomando como hipótesis alternativa que el coeficiente de correlación
sea mayor que cero: H 1 : p >O (contraste unilateral), ya que estaríamos
descartando la posibilidad de que el colesterol disminuya con la edad.

5.61 Contraste de la hipótesis de que el coeficiente de correlación sea cero.


H 0 : p = O, tomando como alternativa que el coeficiente de correlación sea
menor que cero. H 1 : p <O (contraste unilateral), ya que estaríamos
descartando la posibilidad de que la memoria aumente con la edad.

5.62 No. Solamente podemos decir que no están relacionadas linealmente, pero
pueden tener algún tipo de relación no lineal.

5.63 El aumento delaTAS es de 1,2 cmHg por año.

5.64 Si pueden coincidir.

5.65 En un 36%.

5.66 El punto de corte de las rectas de regresión es: (x,y).

5.67 Que laTAS media para una edad de 20 años es 109,2mmHg.

5.68 La recta de regresión X= b0 + b1Y

5.69 Las variables X e Y son funcionalmente dependientes linealmente


(dependencia matemática).

5.70 En el caso de una relación funcional lineal, a un mismo valor de X le


corresponde un solo valor de Y. En el caso de que dicha relación no sea
funcional, a un mismo valor de X puede corresponderle varios valores de Y.

5.71 Si se conoce la naturaleza de la relación de las variables no es necesario elegir


función de ajuste. Nos limitaremos a determinar los parámetros
correspondientes a la función de regresión que sabemos que relaciona dichas
variables.
Si no conocemos la naturaleza de la relación de las variables
representamos sobre los ejes cartesianos los n pares de datos observados,
obtendremos así una nube de puntos cuya forma sugerirá la función de regresión
a ajustar.

5.72 No existe ninguna diferencia. El coeficiente de regresión mide el tanto por 1 de


la variación de Y por unidad de X y el tanto por 1 de la variación de X que es
debida a Y, y coinciden.

5.73 No podemos saber cómo será el término independiente de la recta de regresión


X sobre Y.

160
5.74 No necesariamente. Los términos independientes de las dos rectas de regresión
pueden tener distintos signos.

5.75 Solo que la relación entre ambas es directa, es decir, que cuando una aumenta la
otra aumenta.

5.76 Podemos asegurar que X e Y no son linealmente dependientes funcionalmente.

5.77 No podríamos calcularlo porque se no se trata de una relación funcional sino


empírica, y, por lo tanto, no se puede despejar la X de la recta de regresión
Y=2+3X.

5.78 En el punto (0,0), lo que significaría que la media de la variable X vale O y la


media de la variable Y vale O.

5.79 No siempre; sólo cuando ambas se midan cuantitativamente.

5.80 La recta de regresión de X sobre Y: X= b0 + b1Y

5.81 Podemos asegurar que el signo de ambas será negativo, pero no podemos decir
que sean inversas.

161
CAPÍTULO VI

ANÁLISIS
DELA
VARIABILIDAD II
ANÁLISIS DE LA VARIABILIDAD 11

6.1 En analizar la variabilidad de una característica y ver si parte de esa variabilidad


es debida a la variabilidad (influencia) de la otra.

6.2
1) Modelo lineal: cada dato debe ser suma de efectos.
2) Distribución normal de los datos.
3) Varianzas poblacionales iguales.
4) Observaciones independientes.

6.3
1) Modelo lineal: cada dato debe ser suma de efectos.
2) Distribución normal de los datos.
3) Varianzas poblaciona/es desiguales.
4) Observaciones independientes.

6.4 Que las dos medias poblacionales son iguales, es decir: H 0 : f11 =f1 2 •

6.5 Una característica cualitativa dicotómica y una característica cuantitativa.

6.6 Se trataría de un test bilateral, ya que la hipótesis nula se podría rechazar por ser
la primera media mayor que la segunda media o la primera menor que la
segunda.

6.7 Sí, porque al variar los niveles (modalidades) de la dicotómica, varían las medias
de la cuantitativa, es decir, las medias correspondientes a cada nivel (modalidad)
son significativamente distintas.

6.8 Una mayor potencia en este test se puede conseguir:

a) Aumentando el nivel de significación a (hasta a= 0,05).


b) Aumentando los tamaños muestrales.
e) Haciendo que los dos tamaños muestrales sean iguales.

6.9 Se trataría de un test unilateral. La hipótesis alternativa sería: H 1 : 14 < f12 •


Estamos descartando, por tanto, la posibilidad de que la primera sea mayor que
la segunda, lo que supone que solo hay una opción o alternativa.

6.10 Si falla la condición de igualdad de varianzas pobalacionales, se aplicarán tests


aproximados como el de Behrens, Welch ....

6.11 Cuando cada paciente (unidad experimental) aporta dos datos de la misma
variable.
165
6.12
1) Modelo lineal: cada dato debe ser suma de efectos.
2) Distribución normal de los datos.
3) Varianzas poblacionales iguales.
4) Datos apareados.

6.13 En el contrate de la t-Student combinada comparamos dos medias con datos


independientes y en el test de la t-apareada comparamos dos medias, pero los
datos no son independientes porque están apareados.

6.14 Se calcula la diferencia entre los datos observados de cada persona y se contrasta
que la diferencia entre las medias de las poblaciones correspondientes a los
datos apareados valga O, es decir: H 0 : /1¡ - J12 =O ó H 0 :S= O.

6.15 Un análisis de varianza simple, siempre que el contraste de las dos medias sea
bilateral.

6.16 La igualdad de dos proporciones poblacionales, es decir, la hipótesis nula sería:


H 0 : lr1 = Jr2 •

6.17 Cualitativas dicotómicas.

6.18 Una mayor potencia en este test se puede conseguir:

a) Aumentando el nivel de significacióna (hasta a =0,05).


b) Aumentando los tamaños muestrales.
e) Haciendo que los dos tamaños muestrales sean iguales.

6.19 U na tabla de contingencia 2x2, siempre que el contraste de igualdad de dos


proporciones sea bilateral.

6.20 Si de dos proporciones poblacionales la primera no puede ser mayor que la


segunda, la hipótesis alternativa es que la proporción primera es menor que la
segunda: H 1 : Jr1 < 1r2 • Si de las dos proporciones poblacionales la primera no
puede ser menor que la segunda, la hipótesis alternativa es que la proporción
primera es mayor que la segunda: H 1 : Jr1 > 1r2 •

6.21 Intervienen dos características cualitativas.

6.22 En un análisis de tablas de contingencia, la hipótesis de dependencia es la


hipótesis alternativa ( H 1 :Dependencia), por tanto no se puede contrastar.

6.23 Mediante un análisis de tablas de contingencia 2 x k, siendo k el número de


proporciones a comparar.

166
6.24 La hipótesis nula es la independencia de dos características cualitativas
( H 0 :Independencia).

6.25 Que todas las frecuencias esperadas sean al menos iguales a 5.

6.26 Las frecuencias esperadas (correspondientes a las observadas) son las


frecuencias que deberían ser observadas si las variables fueran independientes.

6.27 Es un test no paramétrico, ya que las hipótesis no se formulan en función de


parámetros ( H 0 :Independencia y H 1 :Dependencia).

6.28 En comparar cada frecuencia observada con su correspondiente frecuencia


esperada. Así se puede ver en qué situación se observa más de lo esperado y
cuándo se observa menos de lo esperado.

6.29 S.e hace para determinar el sentido de la dependencia, es decir, nos permite
responder a la pregunta: ¿Qué modalidad de una de las variables se asocia con
qué modalidad de la otra variable?

6.30 Un residuo positivo significativo permite decir si se ha observado más de lo


esperado bajo la hipótesis de independencia entre las modalidades
correspondientes de las dos características cualitativas, lo que me permitiría
decir que ambas modalidades están asociadas.

6.31 Agrupando clases, si tiene sentido hacerlo. S.i no es posible agrupar, se


eliminaría la fila o la columna oportuna.

6.32 En principio, aplicando la corrección de Yates. Cabe la posibilidad de aplicar el


test exacto de Fisher si son aplicables los supuestos de dicho test.

6.33 Mediante un análisis de varianza, el test de Welch, el test de Brown- Forsythe, el


de Kruskal-Wallis, ... segun las condiciones de la respuesta a la pregunta 6.2 que
se cumplan.

6.34 La igualdad de las medias de las poblaciones que genera la característica


cualitativa:
H 0 : ¡..t,_ = f.L2 = ....... = f.l,, siendo r el no de medias que queremos comparar que
coincide, naturalmente, con n° de modalidades correspondiente a la característica
cualitativa.

6.35 No. Al aceptar la hipótesis alternativa, sólo podemos concluir que al menos una
de las medias poblacionales es distinta.

6.36
1) Modelo lineal: cada dato debe ser suma de efectos.
2) Distribución normal de los datos.
3) Varianzas poblacionales iguales.
4) Observaciones independientes.

167
Estas condiciones coinciden con las exigidas para aplicar el test de la t -Student
combinada.

6.37 En un análisis de varianza podremos aumentar la potencia del test:

a) Aumentando el nivel de significación a (hasta a =0,05).


b) Aumentando los tamaños muestrales.
e) Haciendo que los dos tamaños muestrales sean iguales.

6.38 No. Para saberlo necesitamos hacer un análisis complementario de comparación


de medias dos a dos teniendo en cuenta los datos que nos aporta la tabla del
análisis de varianza.

6.39 Es la varianza dentro de poblaciones, la varianza debida al azar, la varianza no


debida a las poblaciones, (la varianza no debida a la influencia de la
característica cualitativa sobre la cuantitativa).

6.40 La varianza entre poblaciones, en teoría, no puede ser menor que la varianza de
dentro de las poblaciones (variabilidad debida al azar). En el caso de que la
varianza del error sea mayor, podría ser debido a que se le ha añadido la varianza
de otra fuente de variación que no se ha controlado y que sería considerada como
debida al azar.

6.41 La relación que existe entre una característica cualitativa con un n° de


modalidades cualquiera y una característica cuantitativa.

6.42 Sí se puede comparar, ya que el análisis de varianza es equivalente al test de la


t-Student combinada, siempre que éste sea un test bilateral.

6.43 Un análisis de varianza, ya que intervienen una variable cualitativa multinomial


(reacción alérgica) y una variable cuantitativa (edad).

6.44 El contraste de la igualdad de la media de la tensión arterial sistólica de los


hombres y la media de la tensión arterial sistólica de las mujeres
(Ha : 11H =11M), pero el contraste debe ser unilateral, es decir, la hipótesis
alternativa sería: H 1 : 11H >11M , ya que se descarta que la tensión arterial
sistólica de los hombres sea menor que la de las mujeres.

6.45 Un análisis de tablas de contingencia, ya que se trata de estudiar la relación de


dos características cualitativas multinomiales.

6.46 La hipótesis alternativa sería la dependencia entre el nivel económico y el


consumo de de alcohol.

6.47 Un contraste unilateral de igualdad de dos proporciones, es decir, si la


proporción de enfermos con cáncer de mama es igual entre los que tienen
antecedentes familiares(S) y los que no los tienen(N): Ha: 1ís =!iN, con la
hipótesis alternativa: H 1 : 1ís >!iN, ya que se descarta la posibilidad de que el no
tener antecedentes favorezca el cáncer de mama.
168
6.48 Un contraste de igualdad de dos proporciones bilateral que serian: la proporción
de hombres que fuman y la proporción de mujeres que fuman. Es bilateral
porque no podemos descartar ninguna de las dos opciones: que fumen más
hombres que mujeres o lo al contrario. También se podría hacer un análisis de
tablas de contingencia 2 x 2, en la que las características a considerar serian:
consumo de alcohol y sexo, complementado con un análisis de residuos.

6.49 Que al menos una de las medias de las que estamos suponiendo iguales en la
hipótesis nula sea distinta.

6.50 La independencia de dos características cualitativas.

6.51 Sí, dado que si rechazamos la hipótesis nula, aceptamos la alternativa que
supone que se da la dependencia entre las características -en este caso: el sexo y
el ser bebedor o no-, lo que implica que la primera influye en la segunda.

6.52 No. Tendríamos que complementarlo con un análisis de residuos, que nos
indicarían las asociaciones que se dan entre las modalidades correspondientes a
las dos características cualitativas.

6.53 Es la corrección que se hace en el test de la z 2 de Pearson cuando la tabla de


contingencia es de 2 x 2 y alguna de las frecuencias esperadas es menor que 5.
Consiste en restar !!.. a la expresión de la z 2 cuando las frecuencias esperadas
2
2
( lnttn22 -n¡znztl-!!..
2)
n
son mayores o iguales que 5, es decir: z2 =
nt.nz.ntnz

6.54 No podemos decir si el fármaco es efectivo o no.

6.55 Un contraste unilateral de igualdad de dos medias, que serian las


correspondientes al colesterol de ambos grupos:

6.56 El test de la t-Student combinada, el test de Berhens, el test de t-apareada, el test


de Brow-Forsyte, el test de Wilcoxon, el test de Mann-Wihtney ... dependiendo
de las condiciones del experimento.

6.57 La condición de que las observaciones sean independientes.

6.58 Un análisis de tablas de contingencia considerando las variables: consumo


de alcohol y comunidad autónoma a la que pertenecen, complementado con un
análisis de residuos.

169
6.59 Un contraste bilateral de la igualdad de dos medias, que corresponderían, en
este caso, a la comparación de las medias de la concentración de glucosa en ambos
grupos:
Ho :f1A =JlB
H¡ =!lA *11B

6.60 Siempre que ambas características estén medidas cuantitativamente.

6.61 Que ambas características son cualitativas dicotómicas.

6.62 No. Para aplicar el test de la z 2 de Pearson es necesario que todas las
frecuencias esperadas sean mayores o iguales que 5.

6.63 El test es poco potente para poder detectar una diferencia verdadera entre el
tratamiento y el placebo.

6.64 Solamente mediante un contraste del coeficiente de correlación podremos


concluir que, en general, ambas variables están relacionadas midiendo,
naturalmente, la probabilidad de equivocamos (nivel crítico).

6.65 Un contraste unilateral del contraste de dos medias para datos apareados: el
test de la t-Student apareada, considerando la diferencia entre al ansiedad antes
de realizar el ejercicio y al final del periodo de ejercicio:

6.66 Un contraste bilateral de igualdad de dos proporciones, que serán las


proporciones de hipertensos controlados correspondientes a cada terapia, o
mediante un análisis de tablas de contingencia 2x2 complementado con un
análisis de residuos.

6.67 Intervienen tres características: dos características cualitativas y una


cuantitativa

6.68 Es un efecto aditivo e independiente de los dos factores y que sólo se produce
cuando los dos factores se dan conjuntamente.

6.69 La influencia de dos características cualitativas sobre una cuantitativa y la


posible interacción entre ambas.

6. 70 Se contrasta la igualdad de medias de las poblaciones fila, la igualdad de media


de las poblaciones columnas y la interacción entre las dos características
cualitativas que intervienen, es decir, estudia la influencia de dos características
cualitativas sobre una cuantitativa:

H~: J4 =/12 =······=Jl,


1
H 1 : al menos una de las medias es distinta.
170
H~ : T/1 = T/z = ···· = T/k
H 12 : al menos una de las medias es distinta.

Hg :No interacción
H 13 :Sin interacción

"r " y "k" son el no de modalidades correspondientes a las características


cualitativas.

6.71 Un análisis de varianza doble.

6.72 Sí puede existir interacción aunque las características cualitativas no influyan


sobre la cuantitativa.

6.73 En un análisis de varianza doble existen dos fuentes sistemáticas de variación


(influencia de dos características cualitativas sobre una cuantitativa) y en un
análisis de varianza simple interviene sólo una fuente sistemática de variación
(influencia de una característica cualitativa sobre una cuantitativa)

6.74 Es una medida del grado de asociación de un factor con una enfermedad .Indica
cuántas veces es más probable contraer la enfermedad estando sometido al
factor que cuando no se está sometido a él.

6.75 Es el cociente entre la probabilidad de que ocurra un suceso y la probabilidad


de que no ocurra.

6.76 La ORes el cociente de dos ODD: la ODD de la probabilidad de contraer la


enfermedad estando sometido al factor y la ODD de la probabilidad de contraer
la enfermedad no estando sometido al factor.

6. 77 En estudios transversales y prospectivos.

6.78 Que los fumadores tienen 5,2 veces más probabilidad de contraer cáncer de
pulmón que los no fumadores.

6.79 Que la ODD de la probabilidad de padecer cáncer de pulmón siendo fumador


es 5,2 veces mayor que la ODD de la probabilidad de padecer cáncer de
pulmón no siendo fumador.

6.80 El riesgo relativo es aproximadamente igual a la OR cuando la prevalencia de


la enfermedad es baja.

6.81 No, porque la probabilidad de contraer la enfermedad estando sometido al


factor no se conoce, ya que se parte de personas enfermas.

6.82 La OR ratio.
171
6.83 Porque siempre que haya dos fuentes sistemáticas de variación, hay que tener en
cuenta, como fuente de variación independiente, la interacción posible
provocada por la acción conjunta de ambas fuentes de variación.

6.84 Tres: dos cualitativas y una cuantitativa.

6.85 Sí es independiente.

6.86 Que, por ejemplo, un antihipertensivo fuese más efectivo en hombres y otro más
efectivo en mujeres.

6.87 Un análisis doble con interacción y contrastar la interacción, teniendo como


fuentes de variación: los anestésicos y el tipo de dolor que influirán sobre el
tiempo de duración del efecto del anestésico( medido en horas) y contrastar la
interacción.

6.88 Un análisis de varianza doble con interacción, ya que sobre el descenso de la


tensión arterial pueden influir no solo el tipo de antihipertensivo sino el sexo y la
interacción entre ambos. Contrastaremos la hipótesis de igualdad de las medias
de los descensos de la tensión arterial con ambos antihipertensivos y la
interacción.

6.89 En general los grados de libertad en el contraste de una distribución son:

N° de clases - 1 -no de parámetros estimados


En este caso solo podrá ser estimado un parámetro: A, .

6.90 La respuesta es la misma que en la pregunta anterior salvo que en este caso los
parámetros susceptibles de ser estimados son: 11 y a.

6.91 Contrastando la igual de pares de medias utilizando los datos del análisis de
varianza. Un método, entre otros, es el de la mínima diferencia significativa
(MDS).

6.92 Además de las condiciones generales expuestas en el análisis de varianza simple,


la condición específica es que sobre los datos influyan de forma sistemática dos
factores/variables.

6.93 Es la varianza residual después de descontar de la varianza total la debida a la


influencia de los dos factores/variables.

6.94 El método de la MDS utiliza como varianza conjunta la varianza del error del
ANOVA y como grados de libertad los grados de libertad del error del ANOVA.
El test de la t de Student aplicado al ANOVA utilizaría una varianza de error
usando solo las muestras de las medias que se comparan y como grados de
libertad la suma de los grados de libertad de las varianzas de las medias
muestrales que se comparan.

172
6.95 Se diferencia en que se tiene en cuenta la interacción como fuente de variación
aditiva e independiente de las otras dos causas sistemáticas de variación. A
efectos de diseño, para poder contrastarse es necesario tener más de una
observación por casilla.

6.96 Sólo se puede usar la Odds ratio (OR). Para un prevalencia baja se aproxima al
riesgo relativo (RR).

6.97 Tanto el riesgo relativo (RR) y la odds ratio (OR) son lícitos pero más intuitivo
es el RR.

6.98 Las muestras de las poblaciones-columna tienen tamaño r.

6.99 Las muestras de las poblaciones-fila tienen tamaño k.

6.1 00 Las muestras de cada casilla tienen como tamaño el número de observaciones
repetidas de variable cuantitativa para cada par de modalidades correspondientes
a las características cualitativas que intervienen en el análisis de varianza (n° de
observaciones por casilla).

6.101 Que hay una fuente de variación sistemática que no se ha considerado.

6.102 Obtener una nueva media cuadrática del error sumando las medias cuadráticas
de esa fuente de variación con la del error y los grados de libertad del nuevo
error serán el resultado de tomar los grados de libertad de ambas fuentes de
variación.

6.103 Se contrasta la igualdad de dos proporciones para datos apareados.

6.104 Se exige: que en la tabla 2 x 2 correspondiente las no coincidencias (n 12,n21)


tienen que ser mayores o iguales a 10.

173