Sei sulla pagina 1di 34

¿ Cómo describir e interpretar

los resultados de un estudio


de investigación quirúrgica ?
Variables cuantitativas

Sesión de Residentes
13 de febrero, 2012
ÍNDICE

Diferencia entre población y muestra.

Diferencia entre teoría de la probabilidad y estadística.

Descripción de una variable cuantitativa. La


tendencia actual en utilizar la mediana (índices
basados en ordenaciones) sobre la típica media
(índices basados en momentos).

La gran utilidad del diagrama de cajas (boxplot) al


describir la distribución de caracteres cuantitativos.
POBLACIÓN Y MUESTRA
CUESTIONARIO-AUTOEVALUACION

Población diana es el subconjunto de la población que


se encuentra disponible durante el
estudio

Población accesible son los diferentes índices estadísticos


descriptivos de toda una población

Muestra representativa es una fórmula en la que intervienen


los valores observados en la muestra

Parámetro es el gran conjunto de pacientes al


que se generalizaran los resultados.

Estadístico es un reducido grupo de individuos de


la población seleccionados
aleatoriamente. Integrados por
individuos o sujetos
POBLACIÓN Y MUESTRA

Población, el conjunto completo de individuos a


los cuales se les referirán las conclusiones del
estudio.

– Población diana, que es el gran conjunto de


pacientes al que se generalizaran los resultados.

– Población accesible, que es el subconjunto de la


población diana que se encuentra disponible durante
el estudio.
POBLACIÓN Y MUESTRA
Figura 1
Probabilidad y Estadística: Población y Muestras

Muestra POBLACION
representativa, es un parámetro μ = 66,2 años
reducido grupo de
individuos de la
población Teoría de la
ESTADISTICA
seleccionados PROBABILIDAD
(predicción)
azar
(inferencia)

aleatoriamente.
Integrados por
individuos o sujetos
MUESTRA
estadístico x = 64,7 años
x
x

POBLACIÓN Y MUESTRA
Parámetro, son los Figura 1
diferentes índices Probabilidad y Estadística: Población y Muestras

estadísticos Accesible
descriptivos de toda
una población (μ =
66,2 años ). Valor
único POBLACION
parámetro μ = 66,2 años

Estadístico, que es
una fórmula en la Teoría de la
que intervienen los PROBABILIDAD azar
ESTADISTICA
(inferencia)
valores observados
(predicción)

en la muestra (x =
64,7 años). Valor por
cada muestra MUESTRA
estadístico x = 64,7 años
POBLACIÓN Y MUESTRA
Figura 1
estadística inferencial, Probabilidad y Estadística: Población y Muestras
se busca obtener
conclusiones a partir
de los datos
observados en una
muestra POBLACION
parámetro μ = 66,2 años

Las técnicas
estadísticas se basan
en el hecho de que Teoría de la
esta variabilidad, PROBABILIDAD
(predicción)
azar
ESTADISTICA
(inferencia)
propia del muestreo,
sigue una leyes
conocidas, por lo que
puede ser MUESTRA
cuantificada. estadístico x = 64,7 años
POBLACIÓN Y MUESTRA
CUESTIONARIO-AUTOEVALUACIÓN
Población diana es el subconjunto de la población que
se encuentra disponible durante el
estudio
Población accesible
son los diferentes índices estadísticos
descriptivos de toda una población

Muestra representativa
es una fórmula en la que intervienen
los valores observados en la muestra

Parámetro es el gran conjunto de pacientes al


que se generalizaran los resultados.

Estadístico es un reducido grupo de individuos de


la población seleccionados
aleatoriamente. Integrados por
individuos o sujetos

PUNTUACIÓN: /5
¿Cómo describiremos una
variable cuantitativa?

A partir de momentos

A partir de ordenaciones
VARIABLE CUANTITATIVA BASADA EN MOMENTOS
CUESTIONARIO-AUTOEVALUACIÓN

Correcto
Medidas basadas momentos
Su valor se obtiene tras la suma de todos
Medidas basadas en ordenaciones los datos de la distribución dividida por el
número de casos de la misma
Concepto de Media Incorrecto

Concepto de Varianza La mediana, la moda, La amplitud


intercuartil, la desviación cuartil, rango
Concepto de Desviación estándar
Es la medida de dispersión que se define
como la media de la suma de la diferencia
Variancia entre cada valor de la variable y la media,
elevado al cuadrado
Varianza
media, la variancia, la desviación estándar,
el coeficiente asimetría

Es la raíz cuadrada positiva de la variancia


DESCRIPCIÓN DE DATOS CUANTITATIVOS
BASADOS EN MOMENTOS

Tendencia central (posición): media

Su dispersión (variabilidad): la variancia o


la desviación estándar

Su asimetría (forma) : el coeficiente


asimetría
DESCRIPCIÓN DE DATOS CUANTITATIVOS BASADOS
EN MOMENTOS
LA MEDIA

Figura 2

Su valor se obtiene tras la


suma de todos los datos de la
distribución dividida por el
número de casos de la misma. Tendencia central
Sus unidades de medida son
las misma que las de la
variable que se describe μ=
∑x
N

Parámetro: μ Dispersión:

Estadístico: x
DESCRIPCIÓN DE DATOS CUANTITATIVOS BASADOS
EN MOMENTOS
VARIANCIA

Es la medida de dispersión Figura 2


que se define como la
media de la suma de la
diferencia entre cada valor
de la variable y la media,
elevado al cuadrado
Tendencia central

Parámetro: σ2 ∑x
μ=
N

Estadístico: s2
Dispersión:

Ejemplo: 95,1 años2

No utilizar “Varianza”
DESCRIPCIÓN DE DATOS CUANTITATIVOS BASADOS
EN MOMENTOS
DESVIACION ESTÁNDAR

Figura 2
Es la raíz cuadrada positiva de
la variancia.

Tiene las misma unidades que


la variable que describe.
Tendencia central

Se simboliza por σ DE o por μ=


∑x
SD (“Standard Deviation” en N

inglés)
Dispersión:

Estadístico: s. En nuestro
ejemplo s = 9,75 años (raíz
cuadrada de 95,1 años2)
DESCRIPCIÓN DE DATOS CUANTITATIVOS BASADOS EN MOMENTOS
DESCRIPCIÓN DE UNA DISTRIBUCIÓN
SIMÉTRICA: Media y D.E.

para caracterizar una distribución simétrica, se


da la desviación estándar junto a la media

⎯x = 64,7 años (DE = 9,8 años)

⎯x = 64,7 ± 9,8 años ← incorrecto

(Esta presentación es confusa y debe ser evitada porque no aclara si lo que hay
detrás del signo ± es la desviación estándar, el error estándar o si se trata de un
intervalo )
DESCRIPCIÓN DE DATOS CUANTITATIVOS BASADOS
EN MOMENTOS
ASIMETRIA
Cuando los valores se Figura 3
concentran en posiciones
inferiores o superiores al
promedio de la
distribución, se indica la
presencia de asimetría

Esta es negativa (Γ < 0)


cuando existen valores
anormalmente bajos
respecto a la media

⎛ x − μ⎞
3

∑ ⎜⎝ i σ ⎟⎠
Asimetria: Γ 1=
N
DESCRIPCIÓN DE DATOS CUANTITATIVOS
BASADOS EN MOMENTOS

La media, la variancia y la asimetría se denominan medidas


basadas en momentos porque su cálculo se obtiene a partir de la
diferencia de cada valor de la distribución respecto a la media de la
misma:
– La media es el momento de orden 1
– La variancia el momento de orden 2
– La asimetría el momento de orden 3

Son medidas muy utilizadas para describir distribuciones


cuantitativas simétricas.

Cuando se presenta una marcada asimetría, la media y la


desviación estándar no son apropiados porque se ven afectados
por los valores anormalmente alejados
VARIABLE CUANTITATIVA BASADA EN MOMENTOS
CUESTIONARIO-AUTOEVALUACIÓN

Correcto
Medidas basadas momentos
Su valor se obtiene tras la suma de todos
Medidas basadas en ordenaciones los datos de la distribución dividida por el
número de casos de la misma
Concepto de Media Incorrecto

Concepto de Varianza La mediana, la moda, La amplitud


intercuartil, la desviación cuartil, rango
Concepto de Desviación estándar
Es la medida de dispersión que se define
como la media de la suma de la diferencia
Variancia entre cada valor de la variable y la media,
elevado al cuadrado
Varianza
media, la variancia, la desviación estándar,
el coeficiente asimetría

Es la raíz cuadrada positiva de la variancia


PUNTUACIÓN: /7
VARIABLE CUANTITATIVA BASADA EN ORDENACIONES
CUESTIONARIO-AUTOEVALUACIÓN
Percentiles
Indica el valor central del conjunto
ordenado de observaciones
Cuartiles Se define como la mitad de la amplitud
cuartil

La mediana Es el valor de la variable más frecuente en


la distribución

Son cada uno de los 99 valores de la


La moda variable que particionan los datos
ordenados en 100 grupos de igual tamaño.

Son cada uno de los 3 valores de la


La amplitud intercuartil variable que particionan la muestra
ordenada en 4 grupos de igual tamaño

La desviación cuartil Es una medida de dispersión de valor igual


a la longitud del intervalo que contiene el 50
% central de los individuos de la
distribución
DESCRIPCIÓN DE DATOS CUANTITATIVOS BASADOS EN
ORDENACIONES

Consiste en derivar índices a partir de la


ordenación de los datos (Con este procedimiento los valores
más extremos pierden peso y no afectan el valor del índice descriptivo)

Cuentan con una excelente representación


gráfica: el diagrama de caja (boxplot)

El índice de posición genérico se llama cuantil


DESCRIPCIÓN DE DATOS CUANTITATIVOS BASADOS EN
ORDENACIONES: Cuantiles
Son medidas de posición que se obtienen dividiendo el
conjunto ordenado de datos a describir en q partes
iguales.
A partir de ellos se definen:
– Percentiles (Px): son cada uno de los 99 valores de la variable
que particionan los datos ordenados en 100 grupos de igual
tamaño. El percentil (de orden) k corresponde al valor de la
variable que deja por debajo el k por 100 de los sujetos de la
población

– Cuartiles (Qx): son cada uno de los 3 valores de la variable que


particionan la muestra ordenada en 4 grupos de igual tamaño.
Sus valores corresponden a los percentiles: Q1 = P25 ; Q2 =
P50 ; Q3 = P75
Índices de ordenación que miden la
tendencia central: la mediana y la moda

La mediana (Md), indica el


valor central del conjunto 250
48
ordenado de observaciones. 200
En el caso de nuestro ejemplo
de la figura, es de 25 col/ml y 150
46
45
se corresponde con el valor 100
del percentil 50 (P50),
segundo cuartil (Q2) 50

0
La moda, se representa por -50
Mo, es el valor de la variable N= 19
colonias aisladas /
más frecuente en la
distribución. Nuestro ejemplo
corresponde a 59 años (en 5
ocasiones repetida)
Índices de ordenación que miden la dispersión:
la amplitud intercuartil, la desviación cuartil y
la amplitud o rango

La amplitud intercuartil (IQR) es una medida de


dispersión de valor igual a la longitud del
intervalo que contiene el 50 % central de los
individuos de la distribución.

– Se puede calcular a partir de los percentiles o


cuartiles: IQR=P75-P25 = Q3 - Q1

– En nuestro estudio es de 60 col/ml, lo que indica que


en el 50 % central de los pacientes, el nº col/ml varía
entre unos a otros como máximo en 60 col/ml
Índices de ordenación que miden la dispersión:
la amplitud intercuartil, la desviación cuartil y
la amplitud o rango
La desviación cuartil (QD), se define como la
mitad de la amplitud cuartil

La amplitud o rango, se representa por A y es la


medida de dispersión que corresponde a la
diferencia entre el valor máximo (225 col/ml) y
mínimo (14 col/ml) de la distribución (rango: 211
col/ml)

La moda y la amplitud, aunque son medidas


poco fiables porque en su cálculo intervienen
solo unos pocos valores de la distribución
VARIABLE CUANTITATIVA BASADA EN ORDENACIONES
CUESTIONARIO-AUTOEVALUACIÓN
Percentiles
Indica el valor central del conjunto
ordenado de observaciones
Cuartiles Se define como la mitad de la amplitud
cuartil

La mediana Es el valor de la variable más frecuente en


la distribución

Son cada uno de los 99 valores de la


La moda variable que particionan los datos
ordenados en 100 grupos de igual tamaño.

Son cada uno de los 3 valores de la


La amplitud intercuartil variable que particionan la muestra
ordenada en 4 grupos de igual tamaño

La desviación cuartil Es una medida de dispersión de valor igual


a la longitud del intervalo que contiene el 50
% central de los individuos de la
PUNTUACIÓN: /6 distribución
Diagrama de caja (“boxplot”)
CUESTIONARIO-AUTOEVALUACIÓN
Figura 4

250
Marca la posición de la mediana
48
200

150
46
45
100
Todo valor que se aleja más de 3
50
Mediana
Q3
Amplitud
intercuartil
veces la amplitud intercuartil
Q1
0

-50
N= 19
colonias aisladas / Valores fuera de las patillas

Qué representan las dos bases Representan los cuartiles primero y


tercero (Q1 y Q3).
Qué representa el trazo grueso
horizontal Todo valor de la distribución que se
aleja del cuartil primero (Q1) o del
cuartil tercero (Q3), una distancia
Nombre de los dos trazos horizontales superior a 1,5 veces la amplitud
intercuartil
Valor anómalo
Patillas
Valor alejado

Valor extremo
PUNTUACIÓN: /6
Diagrama de caja (“boxplot”)

Las dos bases representan


los cuartiles primero y Figura 4
tercero (Q1 y Q3), que
señalan el 50 % central de
la distribución 250
48
Un trazo grueso horizontal, 200
en el interior del rectángulo,
150
marca la posición de la 46
45
mediana 100
Q3
50 Amplitud
Dos nuevos trazos Mediana intercuartil
Q1
horizontales, llamados 0
patillas -50
N= 19
colonias aisladas /
Valores fuera de las
patillas: valores anómalos
Diagrama de caja (“boxplot”)
Valor alejado todo valor de la Figura 4
distribución que se aleja del
cuartil primero (Q1) o del
cuartil tercero (Q3), una 250
48
distancia superior a 1,5 veces 200
la amplitud intercuartil
150
46
45
100
Q3
50
Valor extremo todo valor Mediana
Amplitud
intercuartil
Q1
que se aleja más de 3 veces 0

la amplitud intercuartil. El -50


N= 19
sistema SPSS lo representa colonias aisladas /

con un asterisco
Información del Diagrama de caja
(“boxplot”)
Localizar la tendencia Figura 4
central de la distribución
(mediana).
250
Comprobar la dispersión 200
48

del 50 % central de la
distribución (longitud de 150
46
caja, amplitud 100
45

intercualtil).
Q3
50 Amplitud
Mediana intercuartil
Q1
Observar la posible 0
asimetría en el centro -50
de la distribución N= 19
colonias aisladas /
(posición de la mediana
dentro de la caja).
Información del Diagrama de caja
(“boxplot”)
Observar la posible
asimetría de las colas Figura 4

de la distribución
(patillas de diferente 250
longitud). 48
200

150
46
Detectar los valores 100
45

anómalos de la 50 Q3
Amplitud
distribución (valores 0
Mediana
Q1
intercuartil

alejados y extremos) -50


N= 19
colonias aisladas /

Describir la evolución
de una variable a lo
largo del tiempo
Información del Diagrama de caja
(“boxplot”)
Muestran el incremento de los valores del CEA (antígeno
carcino-embrionario) a través del tiempo, de un grupo de
pacientes intervenidos de cáncer colorrectal que han
recidivado en los primeros 18 meses postoperatorios.
50
C
E 40
A
30

20

10

0
3 6 9 12 15 18

Seguimiento cáncer de colon


Figura 4

¿ Índices basados
en momentos u en 250
48

ordenaciones ? 200

150
46
45
100
Los datos que utilizamos
Q3
acostumbran a seguir una 50 Amplitud
distribución asimétrica Mediana
Q1
intercuartil
0

-50
La mediana refleja una forma N= 19
más fidedigna que la media colonias aisladas /
Indices basados en momentos
La amplitud intercuartil (50% de Media Variancia Desv. estand Asimetria
los datos, se encuentra 60 col/ml 50,7895 col/ml
2
3137,509 col /ml
2
56,0135 col/ml
3
2,1180 col /ml
3

(Q1= 18 y Q3 = 78)

Por lo que el valor medio de las Indices basados en ordenaciones


muestras obtenidas oscila más
alrededor del valor de la mediana Mediana Amplitud Amplitud o Máximo Mínimo
= 25 col/ml, que la media (50 25 col/ml
Intercuartil
60 col/ml
rango
211 col/ml 225 col/ml 14 col/ml
col/ml)
Percentiles
P5 P10 P25 (Q1) P50 (Q2) P75 (Q3) P90
Otro ejemplo claro: ESTANCIA 14 col/ml 15 col/ml 18 col/ml 25 col/ml 78 col/ml 136 col/ml
HOSPITALARIA
Diagrama de caja (“boxplot”)
CUESTIONARIO-AUTOEVALUACIÓN
Figura 4

250
Marca la posición de la mediana
48
200

150
46
45
100
Todo valor que se aleja más de 3
50
Mediana
Q3
Amplitud
intercuartil
veces la amplitud intercuartil
Q1
0

-50
N= 19
colonias aisladas / Valores fuera de las patillas

Qué representan las dos bases Representan los cuartiles primero y


tercero (Q1 y Q3).
Qué representa el trazo grueso
horizontal Todo valor de la distribución que se
aleja del cuartil primero (Q1) o del
cuartil tercero (Q3), una distancia
Nombre de los dos trazos horizontales superior a 1,5 veces la amplitud
intercuartil
Valor anómalo
Patillas
Valor alejado

Valor extremo
PUNTUACIÓN: /6
PUNTUACIÓN FINAL
POBLACIÓN Y MUESTRA : / 5
BASADA EN MOMENTOS / 7
BASADA EN ORDENACIONES: / 6
DIAGRAMA DE CAJA : / 6

TOTAL: / 24

Quien haya obtenido 24 / 24


siento haberle hecho perder el tiempo

Potrebbero piacerti anche