Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INICIACIN A LA INVESTIGACIN
INDICE
Variables categricas
Variables cuantitativas
NORMALIDAD
Categrica Categrica
Categrica Cuantitativa
Cuantitativa Cuantitativa
Medidas de Asociacin: OR RP RR HR
DEFINICIN:
BARRA DE MENU
BARRA DE
HERRAMIENTAS
TABLA DE
COMANDOS
EFECTUADOS
TABLA DE
VARIABLES
TABLA DE TABLA DE
COMANDOS RESULTADOS
TABLA DE VARIABLES: Se encuentran las variables de la base con sus etiquetas, tipo y
formato.
- En la base Excel las variables deben estar en maysculas o al menos una de las letras. Esto
permite al programa STATA generar etiquetas de las variables.
- En el programa STATA utilizar el comando edit, se ejecutar un editor de variables. En el
editor de variables pegar la base del Excel. Al hacerlo saldr la siguiente tabla:
Lo que significa que tomar a la primera fila como nombres de las variables.
- Para editar la base usar siempre el comando edit, y verificar que todas las variables
- Si observamos una columna de color rojo significa que en esa columna existen letras,
- Si observamos que en uno de los datos hay un punto ., significa que ese dato est vaco
Log file: til para guardar todas las acciones hechas en STATA, por ejemplo: comandos,
modificacin de variables, resultados, etc.
Al abrir el archivo *.smcl en el STATA, se ver todas las acciones hechas desde el momento
en que se inici el Log file hasta donde se guard.
Abrir la base con el comando edit y hacer click derecho sobre la variable y luego en
variable properties y saldr la siguiente ventana
Hacer click:
Luego digite 1 en value y etiquetelo en Label con el nombre de Mujer, Apply (aplicar) y
ok.
En la ventana de Variable Properties, baje la barra de Value Label y seleccione sexo. Luego
Para comprobar la etiqueta escriba el comando tab sexo, y observar los cambios en el
cero y el uno.
V. Descripcin de variables.
Antes de empezar la descripcin de las variables se debe utilizar el comando set more
off, para poder ver la lista de resultados completa.
El comando sum, sirve para ver la lista de todas las variables con sus datos observados,
medias, desviacin estndar, Rangos mnimos y mximos.
De esta forma uno puede empezar la primera tabla descriptiva en cada trabajo.
Utilizamos el comando tab variable_independiente_vertical
variable_dependiente_horizontal
CATEGRICAS NUMRICAS /
/CUALITATIVAS CUANTITATIVAS
NORMAL: MEDIA
FRECUENCIAS Y DESVIACIN
ESTNDAR
NO NORMAL:
PORCENTAJES MEDIANA Y
RANGOS
2) Sesgo y kurtosis: Existe otro comando llamado sktest variable, este combina el
sesgo y kurtosis obtenindose un valor P
- Si P es >0,05 = NORMAL
- Si P es <0,05 = No NORMAL
P = 0.2780 Es NORMAL
4) Shapiro wilk: Es la prueba ms utilizada y definitiva para hallar normalidad. Para ello
utilizamos el comando swilk variable obtenindose un valor P.
- Si P es >0,05 = NORMAL
- SI P es <0.05 = NO NORMAL
P = 0.00680 Es NO NORMAL
NOTA: La media, desviacin estndar, mediana y rangos se obtienen a partir del comando sum
variable, detail
Ejemplo:
NORMAL: T de Student
Categrica - Normalidad de
Cuantitativa la cuantitativa
NO NORMAL: Suma
de rangos de
Wilcoxon o U de Manh-Whitney
Depende el tipo de variables que queremos cruzar, donde se calcular un valor P, siendo
significativo si es <0,05.
Los valores esperados (1.1)(0.5)(5.0)(0.9)(0.5) son menores o igual a cinco (05), esto quiere
decir que el 50% de los valores esperados son menores o igual a cinco, por lo tanto se utiliza
una la prueba No Paramtrica de Exacta de Fisher.
Chi2: Para utilizar la prueba paramtrica de Chi2 cruzaremos dos variables en una tabla y
seguido de una coma aadimos chi2.
El valor P es de 0.042 y es menor que 0.05, esto quiere decir que es significativo. En el ejemplo
se interpreta que existe diferencia estadsticamente significativa entre aprobar y el sexo.
El valor P es de 0.044 y es menor que 0.05, esto quiere decir que es significativo y se interpreta
igual que chi2.
El valor P es 0.1644 y es mayor que 0.05, esto quiere decir que es NO significativo.
El valor P es 0.0675 y es mayor que 0.05, esto quiere decir que es NO significativo.
El valor p es 0.1164 y es mayor que 0.05, esto quiere decir que es NO significativo.
NOTA: El signo del dato 0.0415, indica si la correlacin es positiva o negativa. En el ejemplo
es positivo y quiere decir que a mayor edad mayor nota. Si fuese negativo: a mayor edad
menor nota.
El valor P es 0.0474 y es menor que 0.05, esto quiere decir que es significativo
D) Medidas de Asociacin:
RP: Razn de prevalencias: Estudios Transversales Analticos
OR: Odds Ratio o razn de momios: Estudios de Casos y Controles
RR: Razn de riesgos o riesgo relativo o razn de incidencia: Estudios Cohorte y
Experimentales
HR: Hassar ratio: Estudios en un punto en el tiempo, Longitudinales.
Para las medidas de asociacin se utiliza el mismo comando para todos, y se interpreta de
acuerdo al tipo de estudio.
Ejemplo
tab aprobo:
La variable de inters (SI) representa el 12.85%, esto es mayor que el 10% y por lo tanto se
usar GML.
Primera: Las mujeres tienen 1,37 mayor prevalencia de haber aprobado a comparacin de los
hombres.
Segunda: Las mujeres tienen 0,37 veces ms la prevalencia de haber aprobado a comparacin
de los hombres.
Tercera: Las mujeres tienen el 37% ms prevalencia de haber aprobado a comparacin de los
hombres.
Modelos Lineales Generalizados (GLM): Para entender GLM diremos que la regresin
logstica es como un individuo y el GLM es como una familia de regresiones logsticas.
En otras palabras, GLM es una familia especializada para hacer logstica/estadstica.
Las familias son:
FAMILIA INVERSE GAUSSIAN: Se usa cuando las variables principales son nmero inversos.
FAMILIA BINOMIAL /BERNOLLI: Se usa cuando las variables principales son categricas.
FAMILIA POISSON: Se usa cuando la variable principal es categrica pero se utiliza en casos raros.
Ejemplo:
Ejemplo:
NOTA: Cuando la variable por analizar tiene ms de dos categoras, por ejemplo la variable
estado civil tiene las categoras: soltero (0), casado (1), viudo (2) y divorciado (3). Siendo la
variable de inters aprob, para ello se utiliza se utiliza el comando:
NOTA:
Comando robust: Sirve para ajustar la muestra cuando la poblacin es muy grande.
Comando cluster: Sirve para ajustar el resultado en caso se haya obtenido la muestra de
diferentes sub_muestras. Por ejemplo si se encuest a nueve universidades diferentes.
Ejemplo: Los que recibieron el curso de RCP previamente tienen 3,08 mayor prevalencia de
haber aprobado a comparacin de los que no recibieron el curso de RCP, ajustado al semestre,
recibir el curso de primero auxilios, recibir el curso de inyectables y por cluster de universidad.
GRACIAS
PIURA
SOCIEDAD CIENTFICA DE ESTUDIANTES DE MEDICINA VERITAS Pgina 23