Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Las investigaciones se originan de ideas, surgen por inquietudes al reflexionar sobre algún fenómeno
que ocurre en nuestro entorno. Estas ideas constituyen el primer acercamiento a la realidad que
habrá de investigarse.
Reportes de investigación. Esta fuente se refiere a los productos ya sea verbales o escritos de
investigaciones previamente hechas que den una idea o provoquen una inquietud para investigar más,
debido a que:
• La información esté incompleta.
• No existe unanimidad de criterios.
• La información proporcionada no esté suficientemente comprobada o fundamentada.
• Existan investigaciones correctas pero necesitan comprobación para la permanencia de sus
conclusiones.
Revisión bibliográfica del tema. Una fuente muy común y en ocasiones muy relacionada con el punto
anterior es la de que a partir de la búsqueda en libros y revistas surja la inquietud de investigación,
esto puede deberse a características similares a las del punto anterior o a que no exista información
previa acerca del fenómeno (libros, revistas, periódicos, tesis).
BIOESTADISTICA EN INVESTIGACION
Réplicas de investigación. En muchas ocasiones el interesarse en una investigación ya existente puede
llevar a cuestionar si los resultados son reproducibles dado algún cambio en dicho fenómeno en el
tiempo, o por la publicación de nuevos datos que contrasten con la información previa, lo que podría
modificar los resultados previamente obtenidos.
Avances tecnológicos. Pudiera ser que la inquietud fuera la misma de la fuente pasada, pero ahora se
podría repetir la investigación con instrumentos más recientes o con nuevas tecnologías que amplíen
el horizonte bajo el que se evaluó el problema en el pasado, conduciendo a nueva información.
La fuente de donde surge la idea, no se relaciona con la calidad de las fuentes. Esto es, obtener una
idea al leer un artículo científico no es mejor que obtenerla mediante una conversación o una película.
De hecho una misma fuente sobre un mismo tema puede generar diferentes ideas, las cuales se irán
aclarando y delimitando conforme se sepa más del tema.
BIOESTADISTICA EN INVESTIGACION
Aplicaciones
Estadística
Descriptiva Inferencial
Univariada Multivariada
(involucra dos variables) (más de una VI y una VD)
Métodos de comparación: análisis
Tablas de frecuencias y porcentajes Problemas de asociación o de varianza (ANOVA, MANOVA)
correlación: eventos que se
Gráficas relacionan, no hay VI y VD Métodos de agrupamiento (análisis
Estadística Paramétrica
Está basada en dos supuestos: estimadores que son medidas referentes a la muestra como la
media ( x ) o la varianza s2 y parámetros que son los equivalentes poblacionales de los
estimadores, como la media poblacional () y la varianza poblacional (2).
Estadística No paramétrica Inferencial Paramétrica
La estadística paramétrica, de acuerdo con la tradición experimental, necesita cumplir con
cuatro requisitos para poderse aplicar:
La variable dependiente debe distribuirse normalmente –campana de Gauss.
Homocedasticidad u homogeneidad de varianzas o varianzas iguales: que cuando se comparan
grupos estos tengan la misma dispersión con respecto a la media de la variable dependiente.
Selección aleatoria de la muestra y asignación al azar a las condiciones experimentales.
Que la variable dependiente esté medida a nivel intervalar o de razón.
Estos requisitos deben ser cubiertos para poder generalizar con base en los estimadores y hacer
conclusiones de una muestra a la población.
BIOESTADISTICA EN INVESTIGACION
Estadística No Paramétrica
• Está libre de curva, no necesita distribuirse como la curva normal.
• Se basa en frecuencias, porcentajes, modas y rangos.
• Su nivel de medición es ordinal o nominal.
Si por alguna razón no se cumplieran todos los requisitos para poder utilizar una estadística
paramétrica, es necesario usar pruebas no paramétricas, principalmente las de nivel ordinal, sin
embargo, de acuerdo con Pagano (2008) si se mantiene el supuesto de normalidad –que es el
más importante sobre todo con muestras pequeñas– es posible utilizar una prueba
paramétrica, permitiendo también el aprovechar las bondades de este tipo de pruebas y
principalmente utilizar opciones de análisis multivariados que definitivamente no existen entre
las pruebas no paramétricas.
En los siguientes capítulos se revisarán específicamente los análisis descriptivos, así como las
pruebas estadísticas inferenciales univariadas.
BIOESTADISTICA EN INVESTIGACION
La letra alfa representa el nivel de significancia, o la probabilidad de cometer el error
tipo I (rechazar la hipótesis nula siendo verdadera)
La letra beta se refiere a la probabilidad de cometer el error tipo II (aceptar la hipótesis
nula siendo falsa)
p Probabilidad, representa también el nivel de significancia
μ La media de una distribución o conjunto de valores de una población
̅
La media de una distribución o conjunto de valores de una muestra
σ Desviación estándar de una población
s Desviación estándar de una muestra
σ2 Varianza poblacional
s2 Varianza de una muestra
Md Mediana
Mo Moda
f Frecuencia de un puntaje o categoría
P Proporción
F Prueba F, Análisis de Varianza (ANOVA)
t Prueba t de Student
2
X Chi cuadrada
U Prueba U de Mann-Whitney
KW Prueba de análisis de varianza de un factor de Kruskal-Walis
T Prueba T de rangos asignados de Wilcoxon
Fr Análisis de varianza de dos clasificaciones de rangos de Friedman
Q Prueba Q de Cochran
r Correlación o asociación
H0 Hipótesis nula
H1 Hipótesis alterna
Σ Sumatoria
z Calificación z
Xi Calificación o categorías de respuesta del grupo i
gl Grados de libertad
Ri Rangos asignados a las puntuaciones o categorías del grupo i
N El número de integrantes de una población
n Número de integrantes de una muestra
En los diseños experimentales
X Tratamiento experimental
O Medición (observación) de la variable dependiente con el instrumento elegido
R Asignación aleatoria a los grupos experimental o control
BIOESTADISTICA EN INVESTIGACION
La mente humana no puede extraer fácilmente toda la importancia de una serie de datos
desorganizados, sin la ayuda de técnicas especiales. De manera que cuando los conjuntos de
datos muy grandes deben experimentar un proceso de organización y resumen para que sean
entendibles para las personas que no estén familiarizadas con la investigación.
Es la primera tarea a realizar en el análisis de los datos, ya que su misión es describir los
datos, valores o puntuaciones obtenidos para cada variable y sirve de base para otros análisis
más avanzados. Permite la organización de datos desestructurados de tal manera que sean más
fáciles de interpretar y de conocer las características de una muestra de forma rápida y
resumida
Nivel
Nominal
Ordinal
Intervalar
Razón o proporción
Igual a intervalar, 0
Distancias iguales, absoluto, se puede saber
Propiedades =ó≠ ≠,=,>,< =,≠,>,<,0 la proporción de
relativo diferencia entre cada
calificación
Medidas de Moda, porcentajes, mediana, media,
tendencia central,
moda, porcentaje moda, porcentajes, mediana desviación estándar, varianza, curtosis, sesgo,
dispersión, posición
rango, deciles, cuartiles, percentiles
y distribución
Gráficas
Barras, sectores, pictogramas
Histograma, polígonos de frecuencias
Inferencia estadística
Realizar inferencias estadísticas se refiere a tomar una serie de decisiones que se
utilizan para probar hipótesis,
para lo que se acostumbra adoptar un modelo de decisión.
Este modelo consta diferentes pasos
Establecer la hipótesis nula (H0) –y en contraparte la hipótesis alterna (H1)
Elegir la prueba estadística, de acuerdo con las características del problema
Seleccionar el nivel de significancia que va a utilizarse en la prueba estadística
–usualmente 0.05
Establecer la regla de decisión con base en el nivel de significancia elegido
Concluir el procedimiento decidiendo, de acuerdo con el resultado de la prueba
y la regla de decisión, si se rechaza o se conserva la H0
BIOESTADISTICA EN INVESTIGACION
Inferencia
estadística
Una hipótesis es la respuesta tentativa para la solución de la pregunta de
investigación (Ritchey, 2008). La hipótesis estadística es la que será sometida a
prueba mediante el análisis estadístico inferencial. Por su parte, la hipótesis nula
(H0) es la hipótesis estadística directamente ligada con la prueba de análisis ya que,
dependiendo del resultado, ésta deberá ser rechazada o conservada.
En general, se redacta con la intención de ser rechazada porque ésta niega el
resultado esperado de una investigación al establecerse que no existe una relación
entre las variables involucradas o que no existe influencia de la variable
independiente sobre la dependiente
Complementaria a la H0 se establece la hipótesis alterna (H1), que es una afirmación
en la que se indica que existe relación entre las variables o que la variable
independiente influye sobre la dependiente, aseveración a la que se espera llegar si
la H0 es rechazada al completar el procedimiento de análisis.
BIOESTADISTICA EN INVESTIGACION
Inferencia
estadística
Hipótesis para Problemas de Comparación
En la prueba de hipótesis se trabaja con dos tipos diferentes que deben enunciarse
explícitamente: la hipótesis que debe probarse o hipótesis nula (H0) que se establece con el
propósito de ser rechazada, y la hipótesis alterna (H1) que es la conclusión a la que se espera
llegar.
Con un nivel intervalar o de razón de la variable dependiente se comparan medias ( x ), la
hipótesis nula plantea que no existen diferencias entre las medias:
H0: x1 = x2
y en la hipótesis alterna se plantea que las medias son diferentes:
H1: x1 ≠ x2
Otro planteamiento sería:
H0: x1 – x2 = 0
Cuando se tiene un nivel ordinal de la variable dependiente se comparan medianas (Md),
entonces:
H0: Md1 = Md2
H1: Md1 ¹ Md2
BIOESTADISTICA EN INVESTIGACION
Inferencia
estadística
Hipótesis para Problemas de Comparación
O un nivel nominal de la variable dependiente se comparan proporciones o porcentajes (P):
H0: P1 = P2
H1: P1 ¹ P2
Hipótesis
para Problemas de Asociación
Cuando se tiene un problema de asociación la hipótesis nula niega la correlación entre las
variables que se están relacionando:
H0 : r = 0
La hipótesis alterna afirma que hay correlación entre las variables que se están
relacionando:
H1: r ¹ 0
Construcción
de hipótesis de acuerdo con el nivel de medición
En las hipótesis estadísticas se debe incluir la relación entre la variable dependiente y la
independiente. Para la redacción de dichas hipótesis se toma en cuenta el nivel de medición
utilizado para las variables dependientes en los problemas de comparación.
BIOESTADISTICA EN INVESTIGACION
Inferencia
estadística
Nivel INTERVALAR: Se comparan las medias y también se habla de niveles.
Se desea conocer cómo el nivel de estrés de los sujetos afecta su nivel de irritabilidad hacia sus
compañeros de trabajo. Para ello se conformaron tres grupos, bajo estrés, estrés regular y alto
estrés, con 7 profesionistas cada uno, a quienes se les evaluó su nivel de irritabilidad
preguntándoles en una escala de 0 a 10 que indicaran: “cotidianamente ¿qué tan irritable se
muestra con sus compañeros de trabajo?”
H0: No existen diferencias en el nivel de irritabilidad hacia los compañeros de trabajo entre los
grupos de nivel bajo, regular y alto de estrés.
H1: Existen diferencias en el nivel de irritabilidad hacia los compañeros de trabajo entre los
grupos de nivel bajo, regular y alto de estrés.
BIOESTADISTICA EN INVESTIGACION
Inferencia estadística
Para el caso de los problemas de asociación se identifica la relación entre las variables, y el
concepto de asociación o correlación se debe incluir en las hipótesis.
¿Qué relación hay entre la edad en años de los sujetos y su inteligencia?
H0: No hay asociación entre la edad y la inteligencia.
H1: Existe asociación entre la edad y la inteligencia.
En todos los casos, la hipótesis nula es la que se somete a prueba mediante el análisis estadístico
elegido de acuerdo con las características de cada problema. Cuando no se puede rechazar se
afirma lo expresado en ésta, en caso contrario lo que se dice en la hipótesis alterna. Sin
embargo, es necesario advertir que la decisión de conservarla o rechazarla, después de obtener
los resultados del análisis estadístico, es probabilística más que determinista, como se analiza
más adelante.
BIOESTADISTICA EN INVESTIGACION
Inferencia estadística
Los planteamientos anteriores se refieren a pruebas de dos colas, en los que no es posible
anticipar la dirección de las diferencias, es decir, no se sabe cual grupo es el que tendrá el nivel
o la proporción de casos mayor, o cual es el sentido de la relación entre variables. Las hipótesis
de una dirección se plantearían de la siguiente manera.
Si se tiene un nivel intervalar o de razón de la V. D., tomando como ejemplo que el promedio
mayor es esperado para el primer grupo, en la hipótesis nula se plantearía que:
H0: x1 ≤ x2
Contrario a lo que es lo que se espera encontrar, planteado a través de la hipótesis alterna:
H1: x1 > x2
Cuando el segundo grupo se espera con un promedio mayor en la variable medida
H0: x1 ≥ x2
H1: x1 < x2
BIOESTADISTICA EN INVESTIGACION
Inferencia estadística
Cuando se tienen medianas (nivel ordinal de la V. D.), entonces:
H0: Md1 ≤ Md2
H1: Md1 > Md2
H0: Md1 ≥ Md2
H1: Md1 < Md2
O con proporciones o porcentajes (nivel nominal de la V. D.):
H0: P1 ≤ P2
H1: P1 > P2
H0: P1 ≥ P2
H1: P1 < P2
Para el resto de estos apuntes se presentarán únicamente planteamientos para hipótesis de dos
colas.
BIOESTADISTICA EN INVESTIGACION
El nivel de significancia
La probabilidad (p) de que un evento ocurra oscila entre 0 y 1, donde 0 significa la imposibilidad
de ocurrencia y 1 la certeza de que ocurra el fenómeno. Al lanzar al aire una moneda no
cargada, la probabilidad de que salga “águila” es de 0.5 y la probabilidad de que la moneda
caiga en “sol” también es de 0.5. Con un dado, la probabilidad de obtener cualquiera de sus
lados al lanzarlo es de 1/6=0.1667. La suma de probabilidades siempre es de 1.
Aplicando el concepto de la probabilidad a la distribución muestral, el área de ésta corresponde
a la probabilidad total (p = 1) y consecuentemente cualquier área (porcentaje bajo la curva)
comprendida entre dos puntos de la distribución corresponderá a la probabilidad de la
distribución al convertirla a proporciones (por ejemplo 25% = 0.25).
BIOESTADISTICA EN INVESTIGACION
El nivel de significancia
Para probar hipótesis inferenciales utilizando la media, el
investigador debe evaluar si es alta o baja la probabilidad de que la
media de la muestra esté cerca de la media de la distribución
poblacional. Si es baja, el investigador dudará sobre poder generalizar a
la población. Si es alta el investigador podrá hacer generalizaciones. Es
aquí donde entra el nivel de significancia o nivel a, el cual se refiere a la
probabilidad más alta asumida de equivocarse al rechazar la H0 –
situación conocida como error tipo I.
BIOESTADISTICA EN INVESTIGACION
El nivel de significancia
El nivel de significancia de 0.05, implica que el investigador tiene
un 95% de seguridad o certeza para generalizar y sólo 5% en contra.
Este es el más utilizado en investigación social, psicología y otras áreas
de la salud, aunque se pueden utilizar niveles más bajos (0.01 o 0.001)
cuando se requiere un mayor grado de certeza. Debe ser elegido a priori,
es decir antes de la prueba de hipótesis ya que será utilizado al
establecer la regla de decisión, como se revisará más adelante.
BIOESTADISTICA EN INVESTIGACION
Decisión estadística
La decisión e interpretación del resultado obtenido en un análisis estadístico se basa en
mantener o rechazar la hipótesis nula. Una vez elegida la prueba estadística adecuada al
problema y haber redactado la hipótesis nula, se debe establecer un nivel de significancia o de
certeza para rechazarla sin cometer el error llamado del tipo I o a, que se refiere a rechazar la
hipótesis nula siendo verdadera. En las áreas social, psicología y otras de la salud usualmente se
establece el nivel de significancia en 0.05 que representa el 95% de certeza de que se está
evitando el error tipo I y de poder generalizar los resultados con una menor probabilidad de
equivocarse
Es por esto que, como se mencionó anteriormente, la decisión estadística es una decisión
probabilística, basada en disminuir la probabilidad de ocurrencia del error tipo I.
Si se desea mayor certeza, se debe utilizar otro nivel de significancia –como puede ser 0.01 que
proporciona una certeza de 99% para generalizar los resultados sin error, o 0.001 que equivale
al 99.9%.
BIOESTADISTICA EN INVESTIGACION
Decisión estadística
Existe otro error nombrado como tipo II o b que, contrario del error I, se refiere a aceptar la
hipótesis nula siendo falsa.
En términos de decisión estadística, es más grave cometer el error tipo I, por ejemplo al afirmar
que hay diferencias entre grupos cuando esto no es verdad, una situación a la que es fácil llegar
porque los investigadores esperan que una intervención (V. I.), en la que invirtieron tiempo y
esfuerzo, es la causa más probable de las cambios en la V. D., o porque se cree que la
investigación en que no se reportan diferencias estadísticas disminuye sus posibilidades para ser
aceptada por los editores de las revistas científicas –cuando deberían considerar que eso
potencialmente es un hallazgo con el que se llegaría incluso a refutar teorías existentes o
generar nuevas.
BIOESTADISTICA EN INVESTIGACION
Decisión estadística
Las zonas de rechazo y de aceptación de la hipótesis nula están relacionadas con la curva
normal y las desviaciones z. La zona de rechazo, o probabilidad de cometer el error tipo I, se
representa en los extremos o colas de la curva normal. Para una hipótesis bidireccional se
reparte entre las dos colas de la curva y para la unidireccional se considera sólo la cola positiva
(derecha) o negativa (izquierda) dependiendo del grupo que se espera tenga un nivel o
proporción mayor de la V. D. Entre menor es el área de rechazo se tiene más certeza al rechazar
la H0. El área de aceptación de la H0 es el resto del área bajo la curva.
zona de aceptación al
95% para una prueba
de 2 colas
2.5% 2.5%
Zona de
rechazo
BIOESTADISTICA EN INVESTIGACION
Grados de libertad
Son la libertad de variaciones que puede tener una variable. Por ejemplo, se tienen 4
puntuaciones cuya media es igual a 10, si se separan las tres primeras (7, 12 y 15) la última
estará determinada por las otras, entonces la última puntuación necesariamente es 6. La
cantidad de comparaciones independientes se determina a partir de los grados de libertad, que
normalmente se calculan teniendo el tamaño de la muestra menos uno (gl = n – 1). Sin
embargo los grados de libertad se obtienen de manera diferente para cada prueba, por lo que
se debe estar atento a cada uno de los procedimientos.
SELECCIÓN DEL TIPO DE PRUEBA
SELECCIÓN DEL TIPO DE PRUEBA
SELECCIÓN DEL TIPO DE PRUEBA
SELECCIÓN DEL TIPO DE PRUEBA
SELECCIÓN DE UN TIPO DE PRUEBA
Prueba t de Student para muestras independientes
La prueba t de Student es una prueba paramétrica de comparación de dos
muestras (Downie &Heath, 1973), es decir necesita cumplir las siguientes
características:
• Selección completamente aleatoria de los grupos
• Homocedasticidad (homogeneidad de las varianzas de la variable dependiente
en ambos grupos)
• Distribución normal de la variable dependiente en los dos grupos
• Nivel intervalar de la variable dependiente
Su función es comparar dos grupos de puntuaciones (medias aritméticas) y
determinar que la diferencia no se deba al azar (que las diferencia sea
estadísticamente significativa).
SELECCIÓN DE UN TIPO DE PRUEBA
•Prueba
t de Student para muestras independientes
La prueba t para muestras independientes se calcula mediante la
siguiente fórmula
t=
dónde:
, = medias de los grupos
= error estándar de la diferencia entre las medias
Para calcular el error estándar de la diferencia entre medias:
=
SELECCIÓN DE UN TIPO DE PRUEBA
•Prueba
t de Student para muestras independientes
Para calcular la suma de cuadrados de X:
=-
Para calcular los grados de libertad:
gl = n1 + n2 –2
Problema para explicar el procedimiento para calcular la prueba t para muestras
independientes:
Se desea probar dos métodos de enseñanza del idioma inglés, los grupos fueron
asignados al azar, en el primero se utilizó un método tradicional y el segundo siguió
un método multimedia, al final de cada uno de los cursos se aplicó una prueba de
conocimientos. Los puntajes obtenidos por los asistentes a cada uno de los cursos
se muestran a continuación, donde X1 son las calificaciones del primer grupo
(método tradicional) y X2 las del segundo (método multimedia):
SELECCIÓN DE UN TIPO DE PRUEBA
Prueba t de Student para muestras independientes
Se desea probar dos métodos de enseñanza del idioma inglés, los grupos fueron asignados al azar, en el primero se utilizó un método tradicional y el segundo siguió un método multimedia, al final de cada uno
de los cursos se aplicó una prueba de conocimientos. Los puntajes obtenidos por los asistentes a cada uno de los cursos se muestran a continuación, donde X1 son las calificaciones del primer grupo (método
tradicional) y X2 las del segundo (método multimedia):
X1 X2 X 12 X 22
26 38 676 1444
24 26 576 676
18 24 324 576
17 24 289 576
18 30 324 900
20 22 400 484
18 324
= 20.14 = 27.33
SELECCIÓN DE UN TIPO DE PRUEBA
•
Prueba U de Mann-Whitney
La prueba U de Mann-Whitney pertenece a las pruebas no paramétricas de
comparación de dos muestras independientes (Siegel & Castellan, 1995), es
decir:
Es libre de curva, no necesita una distribución específica
Nivel ordinal de la variable dependiente
Se utiliza para comparar dos grupos de rangos (medianas) y determinar
que la diferencia no se deba al azar (que la diferencia sea estadísticamente
significativa).
Se calcula mediante la siguiente fórmula:
U= -
SELECCIÓN DE UN TIPO DE PRUEBA
•
Prueba U de Mann-Whitney
U= -
dónde:
n1,n2= número de casos de cada grupo
= suma de rangos de cada grupo
nx= número de casos de cada grupo
SELECCIÓN DE UN TIPO DE PRUEBA
•Prueba
U de Mann-Whitney
U= -
Problema para explicar el procedimiento:
Se desea probar si hay diferencias en el nivel de estrés entre enfermeras de
terapia intensiva (X1) y las de urgencias (X2), el nivel de estrés se midió en
una escala de 0 = nada, 1 = bajo, 2 = medio, 3 = alto, 4 = muy alto, las
calificaciones se muestran a continuación:
X1 X2 R1 R2
3 4 11.5 13
2 3 8 11.5
1 2 3.5 8
1 2 3.5 8
0 1 1 3.5
2 2 8 8
1 3.5
åR1 = 39 åR2 = 52
n1 = 7 n2 = 6
SELECCIÓN DE UN TIPO DE PRUEBA
•
Prueba U de Mann-Whitney
U= -
Para cada problema específico se debe determinar el tipo de problema, los grupos a
comparar, si son independientes o relacionados, el nivel de medición, la prueba estadística
que debe utilizarse y plantear la hipótesis nula que se debe probar de acuerdo al nivel de
medición y tipo de problema correspondiente.
Es un problema de Comparación
2 grupos independientes
Nivel de medición ordinal
H0:No hay diferencias en el nivel de estrés entre enfermeras de terapia intensiva y
enfermeras de urgencias
Prueba estadística: Prueba U de Mann Whitney
Regla de decisión: Si el valor de U calculado es menor o igual al de tabla –encontrado
considerando el nivel de significancia elegido a priori*– se rechaza la H0
En primer lugar se debe asignar un rango a cada calificación ordenándolas como si se
tratara de un solo conjunto de datos (se juntan los grupos).
SELECCIÓN DE UN TIPO DE PRUEBA
•Prueba
U de Mann-Whitney
U= -
En este ejemplo vamos a suponer que tenemos datos diagnósticos de
cuatro mujeres y cinco hombres. Todos fueron diagnosticados con diabetes
y tenemos la edad a la cual se les descubrió la enfermedad. Queremos
saber si hay diferencia en la edad entre hombres y mujeres. Los datos son:
Hombres: {19, 22, 16, 29, 24},
Mujeres: {20, 11, 17, 12}.
SELECCIÓN DE UN TIPO DE PRUEBA
•Prueba
U de Mann-Whitney
U= -