Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
de Enfermería
Bioestadística
Autores
Javier Marín Valenciano
Amparo Bravo Malo
Revisión técnica
Saturnino Mezcua Navarro
ÍNDICE
TEMA 1. GENERALIDADES 05
BIOESTADÍSTICA
1.1. Método científico y de investigación 05
1.2. Estadística. Definición y tipos 06
1.3. Conceptos básicos 07
1.4. Tipos de variables 07
TEMA 3. PROBABILIDAD.
CÁLCULO DE PROBABILIDADES Y VARIABLES ALEATORIAS 13
3.1. Generalidades 13
3.2. Sucesos mutuamente excluyentes 14
3.3. Sucesos no mutuamente excluyentes 15
3.4. Probabilidad condicionada 15
3.5. Sucesos independientes y dependientes 15
3.6. Teorema de Bayes 15
ÍNDICE
TEMA 6. TÉCNICAS DE MUESTREO 29
6.1. Muestreo probabilístico 29
6.2. Muestreo no probabilístico 30
- PROBLEMAS RESUELTOS 31
- BIBLIOGRAFÍA 36
Bio es t a d í s tic a
Aspectos esenciales
1 La estadística es una disciplina que, mediante un razonamiento lógico-matemático, es-
tudia aquellos aspectos de la realidad en los que interviene el azar y cuya característica
fundamental es la variabilidad. Los tipos de estadística son dos: descriptiva e inferencial.
2 La estadística descriptiva utiliza distintas técnicas para organizar, sintetizar y exponer los da-
tos obtenidos en función del tipo de variable estudiada. Las representaciones gráficas de
los datos obtenidos de la medición de variables, se denominan pictogramas. Las variables
pueden ser: cuantitativas (continuas/discretas: descritas con medidas de tendencia central,
dispersión, posición y forma) y cualitativas (dicotómicas/ordinales: descritas en frecuencias).
3 En Ciencias de la Salud, la mayoría de los fenómenos corresponden a situaciones aleatorias, de
manera que si un experimento se repite en las mismas condiciones, puede dar lugar a distin-
tos resultados (experiencia aleatoria). Cada uno de los posibles resultados de un experimento
aleatorio se denomina suceso elemental. El cálculo de probabilidades de que ocurra un su-
BE
ceso indica la frecuencia relativa con la que ese suceso tendrá lugar a largo plazo en pruebas
repetidas en condiciones similares.
4 Atendiendo a la clasificación de las variables se describen las principales leyes de distribu-
ción de probabilidad de cada una de ellas. Con variables continuas se utiliza habitualmen-
te: distribución normal o gaussiana y con variables discretas, encontramos: distribución de
Bernoulli, distribución binomial y distribución de Poisson.
5 La estadística inferencial tiene como objetivo establecer conclusiones en la población (in-
ferir) a partir de los resultados obtenidos en la muestra. Dentro de este contexto, será
necesario asumir un estadístico o estimador como una variable aleatoria con una determi-
nada distribución, y que será la pieza clave en las dos amplias categorías de la inferencia
estadística: la estimación de parámetros y el contraste de hipótesis.
6 Las técnicas de muestreo son el conjunto de procedimientos que permiten llevar a cabo
la selección de muestras a partir de una población. Existen dos clases de muestreo: el pro-
babilístico (utiliza algún sistema de selección aleatoria) y el no probabilístico (en el que los
elementos que componen la muestra se escogen por métodos en los que no interviene
el azar).
TEMA 1
GENERALIDADES
El método científico es el método más avanzado para la adquisición de conocimientos. Es una fuente
de conocimiento metódico y sistemático que se apoya en la evidencia empírica, la inducción y la
deducción.
Los estudios epidemiológicos, como estudios científicos, deben cumplir con los requerimientos y
condiciones conceptuales y metodológicas que permitan la validez científica y social de los trabajos
de investigación. Una vez planteado, descrito o definido el problema, la hipótesis y los objetivos de
la investigación, se describe la estructura general de la logística del estudio con todos los detalles
metodológicos y la secuencia para conseguir los objetivos: cómo, a quién y dónde se realizará la
investigación, los aspectos éticos, el cronograma, el presupuesto y las conclusiones.
La estadística se ocupa del análisis de los datos obtenidos en el proceso de investigación y consta
de dos partes:
• Estadística descriptiva: aquella parte de la estadística que se ocupa de la síntesis y de la re-
presentación gráfica (pictogramas) de los resultados obtenidos durante el proceso de investi-
gación. Describe, analiza y representa los datos utilizando métodos numéricos y gráficos que
resumen y presentan la información contenida en ellos. También ha sido denominada estadís-
tica deductiva.
• Estadística inferencial: tiene como objetivo realizar inducciones o estimaciones a partir de
los datos obtenidos en un subconjunto o grupo de elementos representativos (muestra),
sobre la totalidad del conjunto (población). Es considerada también como estadística in-
ductiva.
6
M a n u a l C TO d e E n fe r m e r í a
BE
muestra.
• Parámetro: función definida sobre los valores numéricos de características medibles de una pobla-
ción. Son los índices que resumen una determinada información de la población (se representan
por letras griegas: μ, σ).
• Estadístico: función definida sobre los valores numéricos de una muestra. Son los índices que
resumen una determinada información de la muestra (se representan por letras del alfabeto
latino: x, s).
Las variables son los diferentes valores que puede tomar el aspecto que se mide en los elementos in-
tegrantes de la muestra. Pueden ser aleatorias y es posible que tomen cualquier modalidad (valor
y función). Las variables se referencian con un símbolo (X, Y, A, B...), que puede tomar cualquier
modalidad (valor) de un conjunto determinado y se le conoce como dominio de la variable o
rango. En función del tipo de dominio las variables se clasifican en:
• Cuantitativas: miden una cantidad. Se dividen en continuas, cuando entre dos valores con-
secutivos se pueden encontrar infinitos valores (talla, peso, etc.), o discretas, cuando entre
dos valores consecutivos sólo es posible hallar valores enteros (número de hijos, número de
camas de hospital, etc.).
• Cualitativas (o categóricas): miden una cualidad o atributo. Cuando en una misma variable
únicamente son posibles dos categorías, se denominan dicotómicas (sexo: hombre o mujer).
Si los valores o categorías de una variable cualitativa siguen un orden, creciente o decrecien-
te, se llaman ordinales (nivel socioeconómico bajo, medio, alto, valoración de la prueba de
APGAR, etc.).
Según la escala de medida utilizada para agrupar las distintas categorías de una variable (Tabla 1), se
distingue entre escalas (modalidades o valores) cualitativas (nominal y ordinal) y escalas cuantitati-
vas (razón y de intervalo).
• Escala nominal: las categorías o grupos de una variable son excluyentes entre sí (p. ej.: sexo
[hombre/mujer], grupo sanguíneo [A/B/O]).
• Escala ordinal: los grupos o categorías de una variable siguen un orden creciente o decreciente
(p. ej.: gravedad [leve/moderada/severa]).
• Escala de intervalo: existe un orden numérico y la diferencia entre dos valores es siempre la mis-
ma. Esta escala no se inicia en el cero absoluto (es el caso de la temperatura).
• Escala de razón o proporción: tiene las mismas características que la escala de intervalo,
pero se inicia en el cero (que significa ausencia de la característica que se mide) (p. ej.: el
peso, la talla).
· N.º de hijos
Discretas
Toman valores · N.º de cigarrillos
Cuantitativas
numéricos · Peso
Continuas
· Edad
7
B ioes t adística
TEMA 2
ESTADÍSTICA DESCRIPTIVA
2.1. CONCEPTO
La estadística descriptiva utiliza distintas técnicas para organizar, sintetizar y exponer los datos ob-
tenidos en función del tipo de variable estudiada. Las representaciones gráficas mejoran la com-
presión de los datos y se denominan pictogramas y mejoran su comprensión. Expresan con dibujos
alusivos al tema de estudio las frecuencias de las modalidades de la variable.
La descripción de los resultados obtenidos de una variable cualitativa se hace mediante la distribu-
ción de frecuencias de cada una de las categorías.
Ejemplo 1
Este tipo de variables se representa gráficamente con los histogramas, los diagramas de barras y
los polígonos de frecuencias.
Las variables cuantitativas discretas se representan con un diagrama de barras, que será diferente
en función de que se apliquen las frecuencias (absolutas o relativas) o las frecuencias acumuladas.
• Diagramas diferenciales: en ellos se representan frecuencias absolutas o relativas y también
el número o porcentaje de elementos que presenta una modalidad dada. Las barras deben ser
estrechas para representar que los valores de la variable son discretos.
• Diagramas integrales: en ellos se representa el número de elementos de una modalidad inferior
o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos
crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas. El
diagrama integral o acumulado tiene, por la naturaleza de la variable, forma de escalera.
BE
de frecuencias (Figuras 3a y 3b).
En conjunto, con las representaciones se pueden resumir los datos Figura 3a. Histograma y polígono de frecuencias
obtenidos del estudio de una muestra (o una población) en una
tabla estadística o un gráfico. Sería conveniente también que, tras
la elaboración de la tabla y su representación gráfica, se pudiera
concretar esa información en alguna medición de manera que los
resultados numéricos la expresen de forma clara y concisa. Dado
que los fenómenos biológicos no suelen ser constantes, se hace
necesario que junto a una medida que indique el valor alrededor
del cual se agrupan los datos, se puedan manejar de forma con-
junta unas mediciones (estadísticos o parámetros) que los resu-
man aún más en referencia a esa variabilidad y esa fluctuación.
Medidas de centralización
Estas medidas informan sobre el valor de la variable alrededor del cual se agrupan los restantes valo-
res, y son: media aritmética, mediana y moda.
• Media aritmética: equivale a la suma de todos los valores observados dividido por el número
de observaciones. Sus unidades de medida son las de la propia variable.
_ xi
x=
n
9
B ioes t adística
Ejemplo 2
_ 2+3+4+5+6
x= =4
5
La media es una medida de tendencia central útil en distribuciones simétricas y sin valores extremos.
Es el centro de gravedad de la distribución.
• Mediana: corresponde a aquel valor que divide la distribución en dos partes iguales. La parte que se
encuentra por encima y la parte que se encuentra por debajo del valor de la mediana contienen
el mismo número de individuos. Cuando la distribución está formada por un número impar de
valores, la mediana corresponde al valor que se sitúa en el centro (en el Ejemplo 2, la mediana es
de cuatro hijos).
Cuando el número de valores de la distribución es par, el valor de la mediana corresponde a la
media aritmética de los dos valores centrales.
Ejemplo 3
Sean 3, 4, 6 y 7 el número de hijos de 4 parejas; el valor de la mediana es de 5 hijos.
La mediana, al no verse influenciada por los valores alejados, es una medida de tendencia central
útil para describir distribuciones asimétricas, que presentan alguna observación o valor extremo
(o en general, una pequeña parte de las observaciones).
• Moda: valor más frecuente de la variable. Pueden existir distribuciones con más de una moda
(bimodales, trimodales, etc.).
Ejemplo 4
Los siguientes datos corresponden al número de abortos previos de diez pacientes de una consulta de
ginecología:
0; 1; 1; 1; 1; 1; 2; 2; 2; 3
La moda es 1, puesto que se trata del valor que se repite más veces.
• Media geométrica: raíz n-ésima del producto de una cantidad finita de números. Sólo es relevante
si todos los números son positivos. Muy utilizada en microbiología y en serología, cuyos datos
tienen una marcada asimetría positiva (hacia la derecha).
Ejemplo 5
La media geométrica de 1, 3 y 9 es:
La media utiliza todos los datos y es, por tanto, preferible si los datos son homogéneos; tiene el
inconveniente de ser muy sensible a observaciones atípicas, y un error de datos o un valor anormal
puede modificarla totalmente.
Por el contrario, la mediana utiliza menos información que la media, ya que tiene en cuenta el orden
de los datos y no su magnitud, pero no se ve alterada si una observación es extrema o contiene erro-
res grandes de medida o de transcripción, por lo que es útil en distribuciones asimétricas o con gran
heterogenicidad en los datos.
Las medidas de dispersión informan sobre la variabilidad (heterogeneidad) de los datos de la mues-
tra. Incluyen: amplitud o rango, varianza y desviación estándar.
10
M a n u a l C TO d e E n fe r m e r í a
• Amplitud o rango: diferencia entre el valor mayor y el menor de toda la serie de medidas. En el Recuerda
Ejemplo 5, la amplitud del número de abortos de diez mujeres de la consulta de ginecología es
de 3 (3 – 0 = 3). La desviación estándar y la media se
afectan por los valores extremos y sólo
• Desviación y desviación media: expresa la distancia que debe recorrer un individuo para llegar
son índices válidos para describir distri-
a la media. La desviación media es un índice de dispersión poco utilizado, es el sumatorio de la buciones simétricas.
diferencia de los valores de la variable con respecto a la media en valores absolutos. La media de
este índice es un índice de dispersión.
_
( xi - x )
DM =
n
• Varianza (s2): corresponde a la media de las diferencias al cuadrado entre cada valor de la varia-
ble y la media aritmética de la distribución. Sus unidades son las de la variable al cuadrado. En
BE
general, se puede afirmar que cuanto menor sea la varianza mayor es la homogeneidad de la
variable y, por tanto, menor es la dispersión.
_
( xi - x )2
s2 =
n
• Cuasivarianza: es igual que la varianza pero dividiendo por (n-1), se representa por s2n-1.
• Desviación estándar (s): corresponde a la raíz cuadrada de la varianza. Se toma siempre el valor
positivo. Sus unidades son las mismas que las de la variable. La media aritmética de las desviacio-
nes de la variable respecto al promedio de las mismas es 0. La desviación estándar es una medida
de dispersión útil en distribuciones simétricas.
Recuerda
No confundir coeficiente de variación y
tipificación. Los coeficientes de variación
• Coeficiente de variación (CV): la varianza y la desviación estándar dependen de las unidades de
sirven para comparar las variabilidades
medida de la variable, lo que imposibilita la comparación entre sí de estos índices de dispersión de dos conjuntos o distribuciones de va-
obtenidos en distintas distribuciones. Para comparar la dispersión entre distintas distribuciones lores (muestras o poblaciones), mientras
se debe utilizar el coeficiente de variación (CV), que es un índice de dispersión relativa que no que si se desea comparar a dos indivi-
depende de las unidades de medida. duos de cada uno de esos conjuntos, es
necesario usar los valores tipificados.
s
CV = _ · 100
x
• Tipificación: proceso de restar la media y dividir por su desviación típica a una variable x.
De este modo se obtiene una nueva variable denominada variable tipificada que carece de uni-
dades y permite hacer comparables dos medidas que en un principio no lo son. Así, es posible
preguntarse si un caballo es más pesado que una liebre determinada, pero cada uno en relación
a su población. También es aplicable al caso en que se quieran comparar individuos semejantes
de poblaciones diferentes.
Ejemplo 6
Se realiza un recuento de glóbulos rojos (distribución 1) y un recuento de glóbulos blancos (distribu-
ción 2) ¿Cuál de las dos distribuciones es más dispersa?
• Distribución 1: media = 5 x 106 hematíes/mm3; s = 104 h/mm3
• Distribución 2: media = 10.000 hematíes/mm3; s = 100 h/mm3
Solución:
Considerando sólo los valores de la desviación estándar, se podría pensar que la distribución 1
es la más dispersa. Sin embargo, al calcular el valor del coeficiente de variación se observa que la
distribución 2 es la que presenta un mayor CV (y es, por tanto, más dispersa):
• Distribución 1: CV = (104/5 x 106) . 100 = 0,2
• Distribución 2: CV = (100/10.000) 100 = 1
Para comparar la dispersión de dos distribuciones, se debe utilizar el coeficiente de variación (rela-
tiviza el valor de la desviación estándar en función de la media).
11
B ioes t adística
MEDIDA
MEDIDA DE DISPERSIÓN
DE CENTRALIZACIÓN
Distribución homogénea Media Desviación típica o estándar
· Rango intercuartílico
Distribución asimétrica Mediana
· Rango
Las medidas de posición se obtienen tras ordenar los datos de menor a mayor.
Los estadísticos de posición van a ser valores de la variable caracterizados por superar a cierto por-
centaje de observaciones en la población o en la muestra. Se consideran los percentiles y, asociados
a ellos, los deciles, quintiles y cuartiles.
Percentiles
Se incluyen entre las principales medidas de posición. En general, el percentil K es el valor de la variable
que deja por debajo el K por ciento de los individuos, y en consecuencia deja el (100-K) por encima.
Los percentiles se obtienen a partir de los sujetos ordenados según el valor de la variable que se
desee describir. Así:
• Percentil 10: valor de la variable que deja por debajo el 10% de los sujetos.
• Percentil 25: valor de la variable que deja por debajo al 25% de los individuos.
• Percentil 50: valor de la variable que deja por debajo el 50% de los individuos. Equivale a la
mediana.
Los deciles, los cuartiles y los quintiles son medidas de posición derivadas de los percentiles.
• Deciles: son los nueve valores de una variable que dividen la distribución en diez partes iguales
(decil 1, 2, 3, etc.).
• Quintiles: son los cuatro valores de la variable que dividen la distribución en cinco partes iguales.
• Cuartiles: son los tres valores de la variable que dividen a la distribución en cuatro partes igua-
les. Corresponden al cuartil 1 (Q1), que equivale al percentil 25, el cuartil 2 (Q2), que equivale
al percentil 50, y el cuartil 3 (Q3), que equivale al percentil 75. La diferencia entre el Q3 y Q1 se
denomina amplitud intercuartílica y corresponde al 50% central de la distribución.
Ejemplo 7
Se estudia una variable en un grupo de 600 personas. El percentil 60 (P60) es el valor de la variable del
individuo que deja un 60% por detrás y un 40% por delante de él. Estará situado en el lugar 360.
Se ha estudiado ya que es posible calcular los valores alrededor de los cuales se distribuyen las ob-
servaciones de una variable sobre una muestra y también se puede saber cómo calcular la dispersión
que ofrecen esos mismos valores con respecto al valor central. Además, se puede conocer si los datos
se distribuyen de forma simétrica con respecto a un valor central, o si bien la gráfica que representa la
distribución de frecuencias, lo hace diferente en el lado derecho con respecto al izquierdo.
Simetría y asimetría
Para saber si una distribución de frecuencias es simétrica, lo primero es precisar con respecto a qué.
Un buen referente es la mediana, ya que para variables continuas, divide al histograma de frecuen-
cias en dos partes de igual área. Cuando la variable es discreta, se dice que es simétrica, si lo es con
12
M a n u a l C TO d e E n fe r m e r í a
BE
mayor dispersión a la derecha. En este caso la media es mayor
que la mediana (la media a la derecha de la mediana) entonces
la distribución está sesgada a la derecha (positivamente).
• Asimetría negativa: los valores se agrupan más a la derecha y
toman mayor dispersión a la izquierda (la cola de la distribución
está en el lado izquierdo). En este caso la media es menor que la
mediana (la media a la izquierda de la mediana), entonces la dis-
tribución está sesgada a la izquierda negativamente (Figura 4b).
• Coeficiente de asimetría: permite cuantificar la asimetría, se
basa en comparar la media con la posición de la moda o la Figura 4b. Asimetría positiva
mediana (Figura 4c). La distribución será simétrica cuando sea
igual a 0, será asimétrica positiva si es mayor que 0, y asimétri-
ca negativa si es menor que 0.
_
3( x - Md)
AS = s
Apuntamiento
TEMA 3
PROBABILIDAD. CÁLCULO DE PROBABILIDADES
Y VARIABLES ALEATORIAS
3.1. GENERALIDADES
En ciencias tales como la Física o la Química, los fenómenos se dan de manera determinada, se dice
que se rigen según leyes deterministas. Por el contrario, en Ciencias de la Salud, la mayoría de los
fenómenos corresponden a situaciones aleatorias, de forma que si un experimento se repite en las
13
B ioes t adística
mismas condiciones, puede dar lugar a distintos resultados. A este experimento o prueba se le de-
nomina experiencia aleatoria. Cada uno de los posibles resultados de un experimento aleatorio se
denomina suceso elemental. La probabilidad de ocurrencia de un suceso indica la frecuencia relativa
Recuerda con la que ese suceso tendrá lugar a largo plazo en pruebas repetidas en condiciones similares.
El cálculo de probabilidades suministra
las reglas para el estudio de los experi- El valor de una probabilidad queda comprendido entre 0 (no sucede) y 1 (sucede). Así, una probabili-
mentos aleatorios o de azar, constitu- dad P(A) de 0,30 indica que tiene un 30% de probabilidades de ocurrir, mientras que la probabilidad
yendo la base para la estadística induc- del suceso contrario P(nA) sería de 1 - 0,30 = 0,70; es decir, del 70%:
tiva o inferencial.
Al ser los sucesos aleatorios subconjuntos de un conjunto E (espacio muestral), se les aplican
operaciones con conjuntos: unión, intersección y diferencia.
• Unión: dados dos sucesos aleatorios A, B se denomina suceso unión de A y B al conjunto
formado por todos los sucesos elementales que pertenecen a A o bien que pertenecen a B
(incluyendo los que sean de ambos simultáneamente).
• Intersección: dados dos sucesos aleatorios A, B se denomina suceso intersección de A y B al
conjunto formado por todos los sucesos elementales que pertenecen a A y B a la vez.
• Diferencia: dados dos sucesos aleatorios A, B se llama suceso diferencia de A y B, y se repre-
senta mediante A\B, o bien A-B, al suceso aleatorio formado por todos los sucesos elementa-
les que pertenecen a A, pero no a B.
• Diferencia simétrica: se denomina suceso de diferencia simétrica de A y B, al suceso aleatorio for-
mado por todos los sucesos elementales que pertenecen a A y no a B, y los que están en B y no en A:
Los sucesos son mutuamente excluyentes o incompatibles cuando no pueden suceder de manera
simultánea (p. ej.: lanzar una vez una moneda al aire: la posibilidad de que salga cara excluye la de
que salga cruz).
En los sucesos mutuamente excluyentes o incompatibles, la intersección entre los dos sucesos no
existe (Figura 6):
La probabilidad de que dos sucesos mutuamente excluyentes sucedan se obtiene por la adición de
las probabilidades individuales de cada uno: ley de la adición.
14
M a n u a l C TO d e E n fe r m e r í a
Por tanto, la probabilidad de que al lanzar un dado salga un resultado superior a 2 o par, debe tener
en cuenta que los resultados 4 y 6 cumplen con las dos condiciones.
BE
3.4. PROBABILIDAD CONDICIONADA
A veces, la probabilidad de que un determinado suceso tenga lugar depende del resultado de algún otro
suceso, esto se denomina probabilidad condicionada.
Se lee así, probabilidad de que el suceso B tenga lugar, suponiendo que el suceso A ha ocurrido ya
(p. ej.: en un juego de cartas, obtener el as de copas cuando ya ha salido el as de oros).
En este caso, la probabilidad de que dos sucesos A y B ocurran se calcula mediante la ley multipli-
cativa:
En el caso de las cartas, sacar el as de copas de entrada tiene una probabilidad de 1/48 (en la baraja
española), mientras que obtener el as de copas cuando ya ha salido el as de oros es de 1/48 x 1/47.
Dos sucesos son independientes si la realización del suceso A no interfiere en la probabilidad del
suceso B, es decir:
La probabilidad de que un recién nacido sea varón será de 0,5 para cada nacimiento, por lo que la
probabilidad de tener dos varones será de 0,25 (1/2 x 1/2).
15
B ioes t adística
Aplicado a la validez de las pruebas diagnósticas, el Teorema de Bayes permite hallar los valores pre-
dictivos a posteriori, es decir, una vez conocido el resultado de la prueba del paciente y conociendo
la prevalencia de la enfermedad en la población.
Ejemplo 8
El 20% de la población indígena de Nueva Guinea padece la enfermedad de Kuru. Para su diagnóstico
se utiliza un test de aglutinación que da falsos positivos en el 10% de los casos.
Pregunta 1 (intersección): ¿Qué probabilidad hay de que un paciente de Nueva Guinea esté enfermo y
tenga un resultado positivo en la prueba?
Pregunta 2 (p. condicional): ¿Qué probabilidad hay de que la prueba resulte positiva si se padece la
enfermedad?
P. 1: ¿ p(Enfermo y Test +) ?
P. 2: ¿ p(Test +/Enfermo) ?
Pregunta 3 (p. condicional): ¿Qué probabilidad hay de que la prueba resulte negativa si no se tiene la
enfermedad? ¿ p(Test -/Sano)?
Pregunta 4 (teorema de Bayes): ¿Qué probabilidad hay de estar enfermo si la prueba ha salido positiva?
¿ p(Enfermo/Test +)?
Pregunta 5 (teorema de Bayes): ¿Qué probabilidad hay de estar sano si la prueba ha sido negativa?
¿p(Test -/Sano)?
16
M a n u a l C TO d e E n fe r m e r í a
BE
17
B ioes t adística
TEMA 4
DISTRIBUCIONES DE PROBABILIDAD
Una vez seleccionada la muestra y recogidos los datos, el siguiente paso será inferir las propieda-
des de la población a partir de la muestra (estadística inferencial). El instrumento conceptual que
permitirá esta generalización es un modelo de población, es decir, una representación simbólica
de su comportamiento. Atendiendo a la clasificación de las variables aleatorias en discretas y con-
tinuas se describirán las principales leyes de probabilidad de cada una de ellas.
Cuando se quiera realizar un estudio o cálculo de probabilidades con variables aleatorias continuas
se utilizan: distribución normal o gaussiana, distribución uniforme o rectangular, distribución expo-
nencial o distribución t de Student.
Para el estudio de las distribuciones con variables aleatorias discretas, se aplican: distribución de
Bernoulli, distribución binomial y distribución de Poisson.
Las tres leyes teóricas más utilizadas por distribuciones de probabilidad que tienen la particula-
ridad de ser seguidas por una inmensa mayoría de los fenómenos biológicos habituales son las
siguientes:
• Distribución de Gauss o normal.
• Distribución binomial.
• Distribución de Poisson.
La mayoría de las variables biológicas siguen una distribución denominada normal o de Gauss. La
forma de la función de densidad es la llamada campana de Gauss (Figura 10). Esta distribución se
caracteriza por:
• Tener forma de campana.
• Ser simétrica alrededor de la media (el área comprendida entre la curva y el eje de abscisas se
encuentra concentrado alrededor de la media).
• Media, mediana y moda coinciden.
• La mayor parte de los valores se sitúan alrededor de la media.
• Va de – ∞ a + ∞.
• El área total bajo la curva es 1.
• La probabilidad de un valor concreto es 0.
• Se puede conocer entre qué valores está un determinado por-
centaje de valores:
- La media ± 1 desviación estándar comprende el 68% cen-
tral de los valores.
- La media ± 2 desviaciones estándar comprende el 95%
central de los valores.
- La media ± 2,57 desviaciones estándar comprende el 99%
central de los valores.
- La media ± 3 desviaciones estándar comprende el 99,75%
central de los valores.
18
M a n u a l C TO d e E n fe r m e r í a
La ley normal estandarizada permite hacer cálculos de probabilidad de debajo de la curva de forma
muy sencilla, convirtiendo a la familia de las curvas normales en lo que se llaman normales tipifica-
das haciendo el valor de = 0 y el valor de 2 = 1:
Esta transformación se hace de manera matemática haciendo una serie de operaciones sobre la fór-
mula de la curva, de forma que ahora cada valor de variable del eje de ordenadas toma un nuevo
valor llamado z, que es igual a:
Donde:
BE
• xi: es el valor de la variable que sigue una distribución normal.
• μ: valor de la media poblacional de la variable continua a estudio (talla, peso, colesterol, urea, etc.).
• : desviación típica de la variable continua a estudio.
Sin ser una de las leyes que siguen habitualmente los fenómenos biológicos, conviene citarla dado
que es la base sobre la que podrá desarrollarse la distribución binomial. La distribución de Bernoulli
consiste en realizar un experimento aleatorio una vez y observar si cierto suceso ocurre o no, siendo
p la probabilidad de que esto sea así (éxito) y q = 1−p la de que no lo sea (fracaso).
Se trata de una variable dicotómica, es decir que únicamente puede tomar dos modalidades. Lla-
mar éxito o fracaso a los posibles resultados de las pruebas obedece más a una forma de reflejarlas
en los tratados de estadística sobre el estudio de las variables aleatorias, que a la situación real que
pueda derivarse del resultado. Se puede definir este experimento mediante una variable aleatoria
(va) discreta X que toma los valores X = 0 si el suceso no ocurre, y X = 1 en caso contrario. Un ejem-
plo típico de este tipo de variables aleatorias consiste en lanzar una moneda al aire y considerar la
variable aleatoria (p).
Es una ley teórica de aplicación siempre que se conozca, de entrada, la probabilidad de aparición de
un fenómeno biológico (p). El resultado es dicotómico y puede ser evaluado como “éxito o fracaso”
(distribución de Bernoulli). Se dice que una variable aleatoria X sigue una ley binomial de parámetros
n y p, si es la suma de n variables aleatorias independientes de Bernouilli con el mismo parámetro p.
La distribución de frecuencias de una variable dicotómica sigue la ley binomial, que se enuncia
B (n, p), donde n es el número total de sucesos y p la probabilidad de que el suceso que nos in-
teresa suceda. Siguen esta ley la presencia de hipertensión, el daltonismo, el resultado positivo
de una prueba, etc.
Por ejemplo, una urna que contiene bolas blancas y negras en proporción P(blanca) = p y P(negra) =
1-p. Se extrae de manera aleatoria un número K bolas blancas o negras (con reposición después de
cada extracción). Al extraer un total de n bolas, se tiene una probabilidad p(K).
19
B ioes t adística
Ejemplo 9
Recuerda
La distribución normal o gaussiana se
Sacar 2 bolas blancas en un total de 3 extracciones, si en la bolsa la proporción de bolas blancas es del
utiliza con variables continuas. 60%, tendría una probabilidad:
Las distribuciones binomial y/o Poisson
se emplean para variables discretas.
Cuando el tamaño de la muestra es grande (n >30) y los valores de np y npq son mayores o iguales a
5, la distribución de la ley binomial sigue la misma ley que la normal.
Se hallan los puntos en z y se calcula la probabilidad de la misma forma que para el cálculo de la
normal.
TEMA 5
ESTADÍSTICA INFERENCIAL
La estadística inferencial tiene como objetivo establecer conclusiones en la población (inferir) a partir de
los resultados obtenidos en la muestra. Dentro de este contexto, será necesario asumir un estadístico o
20
M a n u a l C TO d e E n fe r m e r í a
estimador como una variable aleatoria con una determinada distribución, y que será la pieza clave en las
dos amplias categorías de la inferencia estadística: la estimación de parámetros y el contraste de hipótesis.
Ejemplo 10
• ¿Qué proporción de fumadores hay en la provincia de Guadalajara?
• ¿Cuál es el valor medio de la concentración de colesterol en los hombres de entre 18-65 años?
BE
• Contraste de hipótesis: en la práctica pueden presentarse situaciones en las que exista una teo-
ría preconcebida relativa a la característica de la población sometida a estudio y que obligará a
contrastarla con la realidad.
Ejemplo 11
• ¿Fuman más las mujeres que los hombres?
• ¿Las características de la dieta influyen en la concentración de colesterol?
• ¿Son más altos los niños de la Comunidad Valenciana que los de la Comunidad de Madrid?
Se entiende por error estándar una medida de dispersión de todas las medias muestrales con res-
pecto a la media poblacional. Su fórmula viene dada por:
Si a una estimación puntual (de una media, de una proporción, etc.) se le asocia el error de muestreo,
se obtendrá un intervalo de confianza denominado intervalo de confianza 1-α (de la media, de la
proporción, etc.). Si se construye un intervalo de confianza del 95%, la conclusión es que en el 95%
de las ocasiones la media poblacional está entre:
El intervalo de confianza (generalmente del 95%) corresponde al rango de valores con una probabi-
lidad del 95% de contener el verdadero valor del parámetro.
Si el intervalo de confianza es del 99%, la media poblacional se encontrará el 99% de las veces entre
los valores de:
El intervalo de confianza del 99% corresponde al rango de valores con una probabilidad del 99% de
contener el verdadero valor del parámetro.
21
B ioes t adística
En el caso de que la muestra sea pequeña (n < 30) los límites de confianza se calculan utilizando los
valores tabulados de la t de Student, que son valores no fijos, dependientes del número de sujetos
que tenga la muestra (distribución de la t de Student):
Se calcula de la misma forma que para la media poblacional, teniendo en cuenta que el error mues-
tral de la proporción es igual a:
Recuerda En la práctica se pueden presentar situaciones en las que exista una teoría preconcebida sobre
El propósito inicial de todo estudio al algunas características de la población estudiada. Por ejemplo, si se piensa que un tratamiento
que se le somete al contraste de hipótesis nuevo puede tener un porcentaje de éxito mayor que otro estándar, o cuando se plantea si los niños
parte de la idea de rechazar la H0 (avan- de las distintas Comunidades españolas tienen el mismo peso. Este tipo de circunstancias son las
zar en nuevos estudios H1 con resultados que justifican el estudio de una parcela de la Estadística Inferencial denominada genéricamente
mejores).
como contraste de hipótesis. Este concepto implica, en cualquier investigación, la existencia de
dos teorías o hipótesis. De la misma manera aparecen, implícitamente, diferentes tipos de errores
que pueden cometerse durante el procedimiento y que afecten a la decisión final de aceptar o
rechazar una u otra.
Recuerda En el contraste de hipótesis se formulan dos hipótesis: la hipótesis nula (H0, de igualdad, no
El contraste de hipótesis y el valor de diferencia) y la hipótesis alternativa (H1, la hipótesis del investigador, la que se quiere de-
p avalan en parte la decisión correcta, mostrar) que de alguna manera reflejarían esa idea previa que se pretende contrastar con la
pero no eliminan la posibilidad de come- “realidad”.
ter errores.
Antes de contrastar una hipótesis, se fija qué valor máximo de probabilidad se aceptará para
determinar que las diferencias observadas sean debidas al azar. Esta probabilidad se denomina
grado de significación estadística o nivel de significación α o p. Cuanto menor sea el valor
de p obtenido en la prueba de contraste de hipótesis, menor es la probabilidad de que las di-
ferencias observadas sean debidas al azar. En Ciencias de la Salud, por convenio se considera
significativo todo valor de p igual o inferior a 0,05. Si α < 0,05, se aceptará H1, mientras que si
α > 0,05, se rechazará H1.
22
M a n u a l C TO d e E n fe r m e r í a
Ejemplo 12
Se comparan dos tratamientos, uno nuevo (N) y otro tradicional (T). Con el tratamiento (N) se consigue
un éxito en el 75% de los pacientes y con el T en el 40%. Se pretende averiguar si esta diferencia entre
ambos tratamientos es real (el tratamiento N es mejor que el T) o si, por el contrario, se debe al azar
(variaciones aleatorias del muestreo) sin que realmente existan diferencias entre ambos tratamientos.
Por tanto, se establecen dos hipótesis:
• H0 o hipótesis nula: no existen diferencias entre ambos tratamientos (N = T).
• H1 o hipótesis alternativa: sí existen diferencias entre ambos tratamientos (N ≠ T).
Estas dos hipótesis son mutuamente excluyentes, por lo que sólo son posibles dos decisiones:
• Rechazar H0 ........... y aceptar H1.
• No rechazar H0 ........... y rechazar H1.
BE
5.4.2. Tipos de errores
Las pruebas de contraste de hipótesis conducen a la aceptación o al rechazo de la hipótesis nula. Este
proceso conlleva en sí mismo dos tipos de errores (Tabla 3):
• Error tipo I: error que se comete al rechazar la hipótesis nula, siendo ésta cierta. El riesgo α es la
probabilidad de cometer un error tipo I. El riesgo α es conocido y se fija antes de iniciar el expe-
rimento. Generalmente se rechaza la hipótesis nula cuando el riesgo de equivocarse es menor
de 0,05 (riesgo α).
• Error tipo II: error que se comete al no rechazar la hipótesis nula, siendo ésta falsa. El riesgo β es
la probabilidad de cometer un error tipo II.
VERDAD
H0 verdadera H0 falsa
H0 verdadera Decisión correcta Error tipo II
DECISIÓN
H0 falsa Error tipo I Decisión correcta
Una prueba de hipótesis será tanto mejor cuanta mayor potencia tenga.
• Relación entre los dos tipos de errores: los errores asociados a las pruebas de contraste de hipó-
tesis son análogos a las características asociadas a una prueba diagnóstica.
Las pruebas de contraste de hipótesis se pueden clasificar, en función del problema que plantean, en
tres tipos:
• Pruebas de conformidad: en ellas se determina:
- Si los resultados de un estudio están, o no, de acuerdo con una teoría preexistente.
- Si un valor o una distribución observada procede, o no, de una distribución teórica conocida.
Las pruebas de hipótesis también se pueden clasificar en función de la distribución que siguen las
variables estudiadas o los estadísticos utilizados. Se diferencian dos tipos de pruebas:
• Pruebas paramétricas: para su utilización, deben cumplirse determinadas condiciones en los
parámetros de la población de donde se obtuvo la muestra. Se fundamentan en la distribución
normal o derivada.
• Pruebas no paramétricas: no hacen ningún supuesto sobre los parámetros de la población.
23
B ioes t adística
Para estudiar la relación entre dos variables cualitativas o categóricas, se utiliza la prueba de la Jhi
cuadrado (es lo mismo que Chi cuadrado).
Ejemplo 13
• ¿Los hombres fuman más (fumar sí/no) que las mujeres?
- Tipo de variable:
› Sexo (hombre/mujer): cualitativa (dos categorías)
› Fumar (sí/no): cualitativa (dos categorías).
Recuerda
Chi cuadrado t-Student, ANOVA, correla- La relación entre las dos variables, sexo y hábito de fumar, se puede expresar en una tabla de contingen-
ción y regresión son las pruebas que per- cia donde, en las distintas casillas, se muestra la distribución de frecuencias observadas de cada catego-
miten estudiar la relación de variables ría de la variable sexo, en función de las categorías de la variable hábito de fumar (o viceversa) (Tabla 4) .
independientes con muestras paramé-
tricas (n ≥ 30).
FUMADOR NO FUMADOR
HOMBRE 3 7
MUJER 5 4
Ejemplo 14
• ¿El ejercicio físico (nulo/moderado/intenso) se relaciona con la obesidad (sí/no)?
- Tipo de variable (Tabla 5):
› Ejercicio físico: cualitativa (tres categorías).
› Obesidad (sí/no): cualitativa (dos categorías).
La condición de aplicación de esta prueba estadística es que, en cualquier casilla de la tabla de contingencia, las
frecuencias esperadas sean 5.
Ejemplo 15
Considerando lo recogido en la Tabla 3, la frecuencia esperada en la casilla correspondiente a FUMA-
DOR/HOMBRE se calcularía:
Las pruebas de comparación de medias estudian la relación entre una variable categórica y una
variable cuantitativa. Las pruebas utilizadas son la t de Student, cuando la variable cualitativa o cate-
24
M a n u a l C TO d e E n fe r m e r í a
górica tiene dos categorías, y el análisis de la varianza (ANOVA), si la variable categórica posee más
de dos categorías.
Ejemplo 16
Solución: t de Student.
BE
Ejemplo 17
Solución: ANOVA.
El uso de estas dos pruebas estadísticas obliga a que se cumplan las siguientes condiciones para su
aplicación:
• La muestra debe ser superior a 30 casos (n ≥ 30).
• Si n < 30, la variable deberá seguir una distribución normal o gaussiana.
Cuando no se cumplen estos criterios, se deben utilizar pruebas o test no paramétricos: U de Mann-
Whitney, como alternativa a la t de Student, y test de Kruskal-Wallis, como alternativa al análisis de
la varianza (ANOVA).
La dependencia funcional o total se describe con un ejemplo común conocido y se expresa con una
fórmula matemática. Por ejemplo, en una población de alumnos, se definen las variables x = altura me-
dida en centímetros e y = altura medida en metros. Al tomar a uno de los alumnos, no podrá saberse
cuál es su altura hasta su medición. Sí podrá tenerse cierta intuición sobre qué valor es más probable
que tome (alrededor de la media, con cierta dispersión). Sin embargo, si la medida x ha sido realizada,
no es necesario practicar la de y, pues la relación entre ambas es exacta (dependencia funcional):
y = x/100
De la independencia entre variables surge la regresión de cada valor desde su eje hasta encontrarse
con la otra variable dando lugar a una zona de unión o regresión en forma de línea o no lineal, resul-
tado de la influencia de una variable sobre la otra.
25
B ioes t adística
Covarianza
La covarianza (S) de xy es una medida que nos hablará de la variabilidad conjunta de dos variables
numéricas (cuantitativas). Para hacer una interpretación geométrica de la covarianza, se considera la
nube de puntos formadas por las (n) parejas de datos (xi, yi). El centro de gravedad de esta nube de
puntos es (x-y),
2 3
1 4
De este modo:
• Si hay mayoría de puntos en el tercer y en el primer cuadrante, ocurrirá que Sxy ≥ 0, lo que se
puede interpretar como que la variable y tiende a aumentar cuando lo hace x.
• Si la mayoría de puntos están repartidos entre el segundo y cuarto cuadrante entonces Sxy ≤ 0, es
decir, las observaciones y tienen tendencia a disminuir cuando las de x aumentan.
• Si los puntos se reparten con igual intensidad alrededor de (x, y), entonces se observa que Sxy = 0.
Correlación
Este coeficiente permite conocer si entre dos variables cuantitativas existe una asociación lineal. En
la correlación, ambas variables juegan un papel simétrico (no se puede diferenciar entre variable
dependiente o independiente).
BE
Recordando los ejemplos mencionados en el
concepto anterior: si sobre un grupo de per-
sonas se observan los valores que toman las Figura 12. Curvas posibles en la correlación
variables: x = altura medida en centímetros,
y = altura medida en metros, se sabe ya que
y = x/100.
Obtener esta relación es menos evidente cuando lo que se mide sobre el mismo grupo de personas
es: x = altura medida en centímetros, y = peso en kilogramos. La falta de evidencia nace de que no
es cierto que conocida la altura xi de un individuo, sea posible determinar de modo exacto su peso yi
(p. ej.: dos personas que miden 1,70 m pueden tener pesos respectivos de 60 y 65 kg). Sin embargo,
alguna relación entre ellas debe existir, pues parece mucho mas probable que un individuo de 2 m
pese más que otro que mida 1,20 m.
La deducción, a partir de una serie de datos, de este tipo de relaciones entre variables, es lo que se
denomina regresión.
La regresión lineal simple es un paso más en el estudio de la relación entre dos variables cuanti-
tativas. Incluida en la regresión lineal, la covarianza es el producto-momento de las puntuaciones de
desviación de las variables x e y, o dicho de otra forma, es la media de la suma de productos de las
puntuaciones de desviación. Así la covarianza indica la variabilidad que existe entre dos conjuntos
de puntuaciones.
Por tanto:
• Si b > 0, las dos variables aumentan o disminuyen a la vez.
• Si b < 0, cuando una variable crece, la otra decrece.
27
B ioes t adística
Los datos apareados son aquellos en que la misma variable es medida antes y después de una
intervención.
Las pruebas estadísticas utilizadas son las siguientes: la prueba de McNemar (comparación de pro-
porciones), la prueba t de Student para datos apareados y el índice kappa (para valorar la concordan-
cia en estudios de reproducibilidad).
PRUEBA PRUEBA
1.ª VARIABLE
2.ª VARIABLE DE TENDENCIA PARA LA DISTRIBUCIÓN
CUALITATIVA
CENTRAL EN CONJUNTO
2 categorías Prueba de U Mann Kolmogoroff
Cuantitativa
independientes Whitney Smirnow
2 categorías apareadas Cuantitativa T de Wilcoxon
> 2 categorías
Cuantitativa Kruskal Wallis
independientes
> 2 categorías apareadas Cuantitativa Friedman
Coeficiente
1.ª variable 2.ª variable cuantitativa
de correlación
cuantitativa u ordinal u ordinal
de Spearman
TEMA 6
TÉCNICAS DE MUESTREO
Las técnicas de muestreo son el conjunto de procedimientos que permiten llevar a cabo la selección de
muestras a partir de una población.
Existen dos clases de muestreo: el probabilístico (utiliza algún sistema de selección aleatoria) y el no
probabilístico (en el que los elementos que componen la muestra se escogen por métodos en los
que no interviene el azar).
BE
6.1. MUESTREO PROBABILÍSTICO
Los elementos de la muestra se seleccionan siguiendo algún tipo de regla o proceso periódico.
Ejemplo 18
En este caso, la constante de muestreo será 10 (1.000/100) y, por tanto, se utilizará 1 de cada 10 histo-
rias. La primera de ellas se seleccionará al azar entre las 10 primeras visitas (p. ej.: la visita número 6 y
luego la 16, 26, 36… hasta la 96).
Este tipo de muestreo no se puede usar cuando el objeto de estudio esté afectado por un proceso
periódico.
En este tipo de muestreo se divide a la población según ciertas características, como la edad o el
sexo, y luego se selecciona una muestra aleatoria simple de cada uno de los estratos.
Esta muestra puede ser proporcional (cuando la proporción de sujetos de cada uno de los estratos
sigue la misma distribución que ocurre en la población real, muestreo por cuotas) o no proporcional,
si interesa que la proporción de individuos de un determinado grupo sea mayor a la distribución
existente en la población.
Se obtiene una muestra aleatoria simple a partir de agrupaciones naturales: colegios, hospitales;
luego, en una segunda fase, se extrae una muestra de los individuos de dichas agrupaciones. Este
tipo de muestreo es especialmente útil cuando la población es muy dispersa.
Es la técnica no probabilística más utilizada. Consiste en reclutar, por ejemplo, a todos los individuos
que acuden a una consulta durante un periodo determinado (el suficiente como para contar con
todos los individuos correspondientes al tamaño muestral calculado) y que cumplan los criterios de
inclusión establecidos.
TEMA 7
Este intervalo viene definido por la estimación puntual p y por su amplitud, conocida como precisión
de la estimación i, que corresponde a la distancia que separa los límites de este intervalo de su centro
(la estimación puntual):
El tamaño de una muestra se calcula en función del intervalo de confianza elegido y de la pre-
cisión de la estimación que se desee obtener, quedando la fórmula anterior de la siguiente
manera:
Si p y q son conocidas, se sustituyen sus valores en la fórmula; en caso de no conocer este valor se
toman sus valores máximos posibles (p = 0,5 y q = 0,5).
30
M a n u a l C TO d e E n fe r m e r í a
Ejemplo 19
Se desea calcular el número mínimo de individuos de una muestra a partir de la cual se quiere conocer
la prevalencia de la hipertensión arterial en una comunidad, aceptando un riesgo de error del 5% y
pretendiendo una precisión del 2,5%. Como los valores de p y q son desconocidos, se adoptan valores
máximos es decir p = 0,5 y q = 0,5
BE
Para hacer la estimación de una media se debe calcular el tamaño de la muestra en función de la
precisión i y del intervalo de confianza deseado:
Ejemplo 20
Se desea saber cuál debe ser el tamaño mínimo de una muestra para poder realizar la estimación de la
tasa media de glucosa plasmática de una determinada población, con un nivel de confianza del 95% y
pretendiendo una precisión de 2,5 mg. Sabiendo que la desviación típica muestral es de 10 mg:
PROBLEMAS RESUELTOS
Problemas Resueltos
1. Identificar los siguientes tipos de variables: 2. Dadas las siguientes variables, a qué tipo de escala de medi-
ción pertenecen:
- Color de pelo ........................................ V. cualitativa
- N.º de hijos............................................. V. cuantitativa discreta - Glucosuria (-, +, ++, +++) ................. Ordinal
- Tensión arterial sistólica.................... V. cuantitativa continua - Sexo .......................................................... Nominal (dicotómicos)
- N.º de ingresos hospitalarios .......... V. cuantitativa discreta - Peso .......................................................... Razón
- Glucemia ................................................ V. cuantitativa continua - Color de ojos ......................................... Nominal
- Sexo .......................................................... V. cualitativa - Dolor (leve, moderado, severo) ...... Ordinal
- Talla .......................................................... V. cuantitativa continua - Talla .......................................................... Razón
- Nacionalidad ......................................... V. cualitativa -
- N.º de caries........................................... V. cuantitativa discreta 3. Dados los siguientes conjuntos de observaciones:
- Religión ................................................... V. cualitativa a) 3, 4, 2, 1, 3, 3, 6, 5, 9
b) 6, 3, 3, 4, 39, 5
31
B ioes t adística
Calcular la media, la mediana y la moda e identificar la medida 5. Se tiene una muestra de 200 sujetos con una cifra media
de centralización más indicada en cada caso y el por qué de de glucemia de 95 mg/dl y una desviación estándar de 10.
su uso. ¿Cuántos sujetos tendrán una glucemia entre 85 y 115?
b)
mediana = 4, 5
moda = 3
32
M a n u a l C TO d e E n fe r m e r í a
si hay 40 hipertensos, habrá 20 sujetos hipertensos con dieta Por tanto, la probabilidad de obtener alguna cruz es:
hiposódica (la mitad) y 20 sujetos hipertensos que no tienen
dieta hiposódica (la otra mitad). Este problema se puede so-
lucionar con el enunciado únicamente: el número total de in-
dividuos de la muestra es 100, y el de sujetos que cumplen lo
que nos pide el enunciado (hipertenso + dieta hiposódica) es Un enunciado de este estilo (al menos...) se puede resolver
20: calculando el suceso contrario. El suceso contrario a sacar al-
guna cruz (al menos una cruz), es no sacar ninguna cruz. En
este caso sólo lo cumpliría uno de los supuestos: cara-cara. La
probabilidad de no sacar ninguna cruz será:
Pero también se puede solucionar aplicando una fórmula,
dado que se trata de un caso de probabilidad condicionada:
el sujeto tiene que ser primero hipertenso (A) y segundo tener A partir de este resultado:
dieta hiposódica (B/A). Por tanto, lo que nos piden es la P(A
BE
B). Se debe tener en cuenta que la probabilidad de que un su-
jeto sea hipertenso, P(A), es de 0,4, y la probabilidad de que un
sujeto que sea hipertenso tenga dieta hiposódica P(B/A) es 0,5
(se debe recordar que la mitad de los sujetos hipertensos son 11. ¿Cuál es la probabilidad de sacar 5 bolas blancas de un saco
los que tienen dieta hiposódica, el 50%). Por tanto: que contiene 50 bolas blancas y 50 negras, permitiendo ex-
traer un total de 10 bolas y con reposición en cada extrac-
ción?
Hay que aplicar la fórmula que aparece en el Apartado 4.2.2,
dado que se trata de extracciones con reposición, siendo:
Como se puede comprobar, la solución es la misma que la ob- - N.º total de bolas = 100
tenida sin aplicar la fórmula. - N.º bolas blancas = 50, por lo que P(blanca) o P = 0,5
- N.º bolas negras = 50, por lo que P(negra) o (1 - P) = 0,5
8. ¿Cuál es la probabilidad de obtener dos caras al lanzar dos - N.º de extracciones con reposición o n = 10
veces una moneda? - N.º de bolas blancas a sacar o K = 5
Si se lanza dos veces una moneda al aire, lo que se obtenga al Según el enunciado, se tiene que elegir tres cartas de manera
lanzarla la primera vez no condiciona el resultado del segun- consecutiva sin reposición, y sacar un trío (tres cartas iguales).
do lanzamiento (si la primera sale cara, la segunda puede salir En la baraja, las cartas son iguales de 4 en 4 (4 ases, 4 reyes, 4
tanto cara como cruz). Se tiene un caso de sucesos indepen- caballos, etc.). Considérense los ases: la probabilidad de sacar
dientes. La probabilidad de obtener dos caras, en dos lanza- un as es 4/48 (n.º de ases/n.º total de cartas); ahora se realiza una
mientos, es por tanto: segunda extracción, teniendo en cuenta que sólo quedan 3 car-
tas del mismo valor que la extraída en primer lugar, y 47 cartas
en total, por lo que la probabilidad de obtener otro as es 3/47.
Lo mismo ocurre en la tercera extracción: quedan 2 ases y 46
cartas, siendo la probabilidad de sacar otro as 2/46. Son sucesos
9. ¿Cuál es la probabilidad de obtener una cara y una cruz al dependientes, dado que la extracción del primer as influye en
lanzar dos veces una moneda? las siguientes extracciones (se debe recordar que esto no sería
así si existiese reposición, cosa que en este caso no sucede).
Siguiendo el mismo razonamiento de la pregunta anterior
(puesto que se trata de sucesos independientes), la probabili- Por tanto, la probabilidad de sacar tres cartas iguales será:
dad de sacar una cara y una cruz al lanzar dos veces una mone-
da es de:
Siendo:
- P(A1) = probabilidad de sacar el primer as (por ejemplo).
10. ¿Cuál es la probabilidad de obtener alguna cruz al lanzar dos - P(A2/A1) = probabilidad de sacar un segundo as, habiendo
veces una moneda? sacado ya el primero.
- P(A3/A1 y A2) = probabilidad de sacar un tercer as, habien-
En el enunciado se pregunta la probabilidad de obtener algu- do sacado ya un primero y un segundo as.
na cruz (al menos una cruz) al lanzar dos veces una moneda al
aire. Al lanzar dos veces una moneda, los resultados obtenidos Se debe tener en cuenta que la probabilidad de obtener un trío
pueden ser: cara-cruz (c, +), cruz-cara (+, c), cruz-cruz (+, +) y de ases (como en el ejemplo), es la misma que la de obtener cual-
cara-cara (c, c). Tres de estos resultados cumplen con la condi- quier otro trío.
ción del enunciado:
13. En el banco de sangre de un hospital sólo queda sangre Rh-.
A urgencias han llegado tres personas que han sufrido un ac-
cidente. ¿Cuál es la probabilidad de que las tres sean Rh-? Se
sabe que la probabilidad de ser Rh- en España es de un 30%.
33
B ioes t adística
(Se debe recordar que esto en ningún caso quiere decir que
P(A B)2 sea igual al desarrollo de la igualdad antes mencio-
nada).
Pero habrá que restar a las personas que cumplen ambas con-
diciones:
34
M a n u a l C TO d e E n fe r m e r í a
Se sustituye en la fórmula:
En este caso se tiene que el síntoma es CID y las dos patologías en
las que se presenta son: meningitis meningocócica (MM) y me-
ningitis viral (MV).
BE
35
Bibliografía
Bibliografía
• Argimón Pallás JM, Jiménez Villa J. Métodos de investigación clínica y epidemiología. Madrid. 2.ª edición. Harcourt, 2003.
• Canela Soler J. Medicina preventiva y salud pública. Barcelona. Masson, 2003
• Dawson/Trapp. Bioestadística médica. Manual Moderno, 2005.
• Hernández Aguado. Manual de Epidemiología y Salud Pública. Editorial Médica Panamericana.
• Greenberg. Epidemiología médica. 4.ª edición. Manual Moderno, 2005.
• Jiménez Villa J, Argimón Pallás JM, Canela Soler J. Epidemiología fundamental y aplicada (II). Canela Soler J, En: Medicina preventiva y
salud pública, Barcelona, Masson, 2003: 41-84.
• Manual CTO de Epidemiología y Estadística. 6.ª edición 2006.
• Ruiz Morillo. Epidemiología clínica. Editorial Médica Panamericana, 2004.
36