Sei sulla pagina 1di 19

Bioestadstica

TABLAS DE CONTIGENCIA DE
DOS FORMAS

Que se busca ?

Introducir parmetros que describen la asociacin


poblacional entre dos variables categricas.

Datos Categoricos:
Consisten en el conteo de frecuencias de ocurrencia de
las observaciones categoricas de la variable respuesta.

Para v. categoricas que tienen solamente dos nivels,


se estudia los odds ratios , las diferencia de
proporciones y la razon de proporciones.
2

TIPOS DE VARIABLES

Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no
se pueden hacer operaciones algebraicas con ellos)

Nominales: Si sus valores no se pueden ordenar


Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)

Ordinales: Si sus valores se pueden ordenar


Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor

Cuantitativas o Numricas
Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con
ellos)

Discretas: Si toma valores enteros


Nmero de hijos, Nmero de cigarrillos, Num. de cumpleaos

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.


Altura, Presin intraocular, Dosis de medicamento administrado, edad
3

Estructura para las tablas


de dos Dimensiones
X /Y
1
2
.
i
.
.
I
+j

1
11

2
12

21

i1

I1

22
..
i2
..

I2

+1

+2

..

j
1j

J
1J

ij

Ij

2J

iJ

IJ

+j

+J

2j

i+
1+
2+
..
i+

I+

Estructura para las tablas de


dos Dimensiones

Una relacin bivariada es definida por la


distribucin conjunta de dos variables
asociadas.
La distribucin de probabilidad { TT ij } es la
distribucion conjunta de X e Y .
Las distribuciones marginales son las filas y
columnas de totales obtenidas mediante la
suma de probabilidades conjuntas.
5

Estructura para las tablas de


dos Dimensiones
{ TT i+ }
denota la distribucin marginal
para la variable fila.
{ TT +j } denota la distribucion marginal para
la variable columna.
donde + denota la suma sobre el indice que
remplaza, esto es:

Estructura para las tablas


de dos Dimensiones

Y donde se verifica que:

Las distribuciones marginales


son
informaciones de una sola variable , y
no intervienen la asociacin entre las
variables.
7

Estructura para las tablas


de dos Dimensiones

En una Tabla de Contingencia ( Person 1904) o


tabla de clasificacin cruzada, una variable (
Y) es una variable respuesta y otra ( X) es una
variable explicativa.
Cuando X es fijo en vez de aleatorio ,la nocin
de distribucin conjunta para X e Y no es
significativa.
Pero para niveles fijos de X e Y tiene una
distribucin de probabilidad.
8

Estructura para las tablas


de dos Dimensiones

Pero para niveles fijos de X e Y tiene una


distribucin de probabilidad.
Ya que TT j/I denota la probabilidad de clasificacion
en la columna j de Y , j= 1,2J
Y donde:

Luego: las propabilidades


forma la distribucin condicional de Y en el nivel de i de
X
9

Estructura para las tablas de


dos Dimensiones
Entonces : un objetivo principal en muchos
estudios
es
comparar
la
distribucin
condicional de Y en varios niveles de las
variables explicativas .
En otras palabras es usar la funcin de
Distribucin condicional ( que es la suma
de probabilidad de clasificacin en una de las
primeras j columna, dado que esta en la fila i.

10

INDEPENDENCIA EN Tablas
de dos Dimensiones

Si
ambas
variables
son
variables
respuestas, se puede describir la asociacin
usando
su
distribucin
conjunta,
Distribucin condicional de X dada la variable
Y, o la distribucin condicional de Y dada X
dada:

11

INDEPENDENCIA EN Tablas
de dos Dimensiones

Las
variables
son
estocsticamente
independientes si todas las probabilidades
conjuntas es igual al producto de sus
probabilidades marginales, esto es:

12

INDEPENDENCIA EN Tablas
de dos Dimensiones

Cuando X e Y son independientes se

Cada distribucin condicional de Y es idntica a


la distribucin marginal de Y.
Luego dos variables son independientes cuando
la probabilidad de respuesta columna j es la
misma en cada fila , para j= 1,2 J.

13

INDEPENDENCIA EN Tablas
de dos Dimensiones

Cuando Y es una respuesta e X una variable


explicativa, la distribucin condicional esta
expresada por :
X / Y

11
1/1

12
1/2

1+
1

12
1/2

22
2/2

2+
1

Total

+1

+2

queda una definicin mas natural de


independencia.
14

Formas de Comparar
proporciones

Las variables de respuesta con dos categoras son


denominadas binarias.
Frecuentemente se comparan varios grupos en una
respuesta binaria Y
vacuna

cura

No cura

A11

A12

A21

A22

A31

A23

A41

A24

15

Diferencias de proporciones
Para sujetos en la fila i
i= 1,2,..del grupo
I, 1/i es la probabilidad respuesta (1). Y
( 1/i ,
2/i ) = ( 1/i
, 1 - 1/i ) es la distribucin
condicional de la respuesta binaria.
Para comparar dos filas : h e i , usando la
diferencia de proporciones seria:
( 1/h _ 1/i ) (2)
, la respuesta en esta
comparacin es equivalente a la comparacin en
(1):

( 2/h - 2/i ) = ( 1 - 1/h ) - ( 1 _ 1/i ) = 1/i


_ 1/h (*)

X / Y

11
1/1

12
1/2

1+
1

21
2/1

22
2/2

2+

+1

+2

Total

Esta diferencia cae entre -1 a +1. Es igual a cero cuando las filas h e i tienen distribuciones
condicionales idnticas.

16

Diferencias de proporciones

Luego la v. respuesta Y es estadsticamente


independiente de la clasificacin de la fila i, cuando
se cumple que : 1/h - 1/i = 0 , para todo par de filas
h e i.
Para tablas de contingencia I x J se puede
comparar las probabilides condicionales de la
respuesta j para las filas h e i , usando la
diferencia
j/h - j /i
17

Diferencias de proporciones
Cuando ambas variables son variables respuestas y
existe una distribucin conjunta
{TT ij }, la comparasion de proporciones dentro de la fila
h e I satisface :
1/h - 1/i = h1 / h+ - i1 / i+

Para el caso 2 x2 :
P(col 1 /fila 1 ) - P(col 1 /fila 2 )= 11 / 1+ - 21 / 2+
18

Odds Ratio=
Con respecto a las tablas 2 x 2
Para la fila 1 , el odds que es la respuesta esta en la columna
1 y esta definido por
11
1/1

11

2 /1

12

12

Para una distribucin conjunta la definicin equivalente es:


i1
i
i2

i= 1,2

Cada i es no negativo, con valor mayor que 1


20

Potrebbero piacerti anche