Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Estadstica Descriptiva
DEFINICIONES Estadstica Es la disciplina que se ocupa de la recoleccin, organizacin, resumen, anlisis e interpretacin de los datos. Tambin sirve para obtener inferencias de una poblacin cuando solo se examina una parte de sta.
Bioestadstica Cuando los datos que se analizan proceden de las ciencias biolgicas o mdicas, se utiliza el trmino bioestadstica. La bioestadstica es una herramienta til para la investigacin en el campo de la medicina veterinaria. La persona que utiliza esta herramienta debe saber interpretar y comunicar los resultados a los dems. Antes del anlisis estadstico Debe existir una pregunta de por medio !!! Recordar siempre. CUAL ES LA PREGUNTA?
Inferencia estadstica Es el procedimiento por medio del cual se llega a una conclusin acerca de una poblacin con base en los resultados que se obtienen de una muestra extrada de esa poblacin.
poblacin
muestreo
muestra
Estadstica Descriptiva
Poblacin Es la totalidad de entidades (animales, plantas, clulas) que presentan la caracterstica que se desea evaluar.
Datos La impresin o valor que se obtiene de cada entidad que forma la muestra. En estadstica los datos numricos pueden ser mediciones o conteos.
Notas adicionales sobre poblaciones y muestras Usualmente las poblaciones son MUY GRANDES. Por ejemplo, el peso de todos los grillos en Cd. Victoria o el dimetro de los rboles en la Sierra Madre Oriental.
En ocasiones las poblaciones de inters pueden ser relativamente pequeas. Por ejemplo, la edad de los hombres que han llegado a la luna. En ocasiones se muestrea una poblacin que no existe fsicamente: Poblacin imaginaria (hipottica o potencial). Suponga que se realiza un experimento en el cual se administra un suplemento alimenticio a 40 cerdos y se mide su tasa de crecimiento. Entonces, la poblacin sobre la cual se pueden hacer conclusiones es: la tasa de crecimiento de todos los cerdos a los que se les administre el mismo suplemento alimenticio y bajo las mismas condiciones que prevalecieron durante el experimento.
Variable Una variable es una caracterstica que difiere o vara de una observacin a otra. Esto se debe a la simple razn de que la caracterstica no es la misma cuando se observa en diferentes sujetos (personas, animales, lugares o cosas). Las variables se pueden medir, controlar o manipular en una investigacin.
Estadstica Descriptiva
Variable cualitativa Contiene informacin respecto a los atributos en las entidades de estudio. Cuando el objeto de estudio presenta o no alguna caracterstica de inters. Aqu no se llevan a cabo mediciones en el sentido usual, sin embargo, para su anlisis estadstico se puede contar el nmero de entidades que presentaron cada atributo o caracterstica.
Variable cuantitativa Es la que puede medirse en la forma usual (e.g. con instrumentos). Las mediciones hechas sobre variables cuantitativas conllevan informacin respecto a cantidad. Poseen un orden o rango natural.
Variables cuantitativas discretas Se caracteriza por separaciones o interrupciones en una escala numrica. Usualmente son nmeros enteros provenientes de conteos.
Variables cuantitativas continuas Puede tomar un infinito nmero de valores entre cualquier par de valores especificado. Relacin entre variables: discretas vs continuas continuas vs continuas discretas vs discretas continuas vs discretas cualitativa vs discreta cualitativa vs continua Tarea: Buscar ejemplos de artculos o tesis donde se relacionan variables
Fotocopiar o hacer grfico en una hoja Indicar la variable dependiente y cual la variable independiente Indicar el tipo de variable en cada caso (cuantitativa o cualitativa) En el caso de variables cuantitativas indicar si es discreta o continua
Estadstica Descriptiva
continua vs continua
continua vs cualitativa
Y X
Concentracin de hormona vs longitud
Y a X
tasa de crecimiento vs Raza
discreta vs cualitativa
discreta vs continua
Y a X
No. de muertos vs causa de muerte
Y b X
No. de sobrevivientes vs concentracin de medicamento
Estadstica Descriptiva
Medidas y escalas de medicin Medicin Se define como la asignacin de nmeros a objetos o eventos de acuerdo a un conjunto de acuerdos o escalas. Escala nominal (cualitativa) Consiste en designar o "nombrar" las observaciones o clasificarlas en varias categoras mutuamente excluyentes y colectivamente exhaustivas. Esto quiere decir que las observaciones pueden pertenecer solamente a una sola categora y que las categoras asignadas son todas las existentes posibles, por lo que incluyen a la totalidad de las observaciones. Ejemplos: raza, color, sexo, tipo de sangre. Escala ordinal (cualitativa) Cuando existe un orden de menor a mayor grado en las categoras asignadas, de acuerdo con algn criterio. Ejemplos: grados de intensidad en la coloracin (baja, media, alta), organismos convalecientes que estn bajo algn tratamiento (sin mejora, mejorados, bastante mejorados). Escala de intervalos (cuantitativa) Mediante esta escala no slo es posible ordenar las mediciones, sino que tambin se conoce la distancia entre cualquier par de mediciones. Por ejemplo, la distancia entre 20 y 30 es la misma que entre 30 y 40. Existe un cero, el cual es arbitrario. Ejemplos: escala de temperatura en F o C (donde cero grados no significa ausencia de calor), la hora del da. Escala de razn (cuantitativa) Es una escala de intervalo en la cual las distancias inician con respecto a un cero verdadero (racional). Ejemplos: nmero de veces que aparece un objeto, longitud, peso, tasas (crecimiento, consumo). Exactitud La exactitud de una medicin hace referencia a su cercana al valor que pretende medir. Precisin La precisin est asociada a la cantidad de cifras decimales utilizadas para expresar lo medido.
Estadstica Descriptiva
ESTADSTICA DESCRIPTIVA
Parmetro Medida descriptiva numrica de una poblacin (e.g. media poblacional) usualmente desconocido.
Estadstico Cantidad calculada de las observaciones de una muestra (e.g. media muestral) obtenida de la poblacin.
Estadstica descriptiva Es la rama de la estadstica que se dedica a la organizacin, resumen y descripcin (grfica o numrica) de conjuntos de datos.
medidas de dispersin
Estadstica Descriptiva
Medidas de tendencia central Indican valores con respecto a los cuales los datos tienden a agruparse. Ejemplo: Media, mediana y moda.
Medidas de posicin Dividen a un conjunto ordenado de datos en grupos con la misma cantidad de observaciones. Ejemplo: Percentiles, cuartiles, quintiles, deciles,... (estas medidas se llaman cuantiles).
Medidas de dispersin Indican la mayor o menor concentracin de los datos con respecto a las medidas de tendencia central. Ejemplo: Desviacin estndar (tpica), varianza, coeficiente de variacin, rango, rango intercuartlico.
Medidas sobre la forma de la distribucin stas describen la simetra de la distribucin de los datos. Ejemplo: Sesgo.
Estadstica Descriptiva
Medidas de tendencia central Media (mean). Es la media aritmtica (promedio) de los valores de una variable. Suma de todos datos dividido entre el nmero total de datos.
x=
Media de 2, 2, 3, 7 es:
x
i =1
n
x = 3 .5
Caractersticas de la media
Mediana (median). Es un valor que divide a un grupo ordenado de datos en dos grupos con el mismo nmero de observaciones. Si el nmero de datos es par, se elige la media de los dos datos centrales. Una vez que los datos estn ordenados de menor a mayor, se obtiene la posicin del valor central mediante la frmula: n +1 posicin central = 2 Mediana de 1, 2, 4, 5, 6, 6, 8 = 5 7 +1 = 4, el dato que ocupa la posicin cuatro es el 5. porque 2 Mediana de 1, 2, 4, 5, 6, 6, 8, 9 es: porque
5+6 = 5.5 2
8 +1 = 4.5, por lo tanto la mediana es el promedio de los datos que 2 ocupan la posicin cuatro y cinco.
Estadstica Descriptiva
Caractersticas de la mediana
Diferencia entre la media y mediana cuando existen valores extremos Calcular media y mediana de : 1, 2, 4, 5, 6 Media = 3.6 Mediana = 4 Calcular media y mediana de : 1, 2, 4, 5, 20 Media = 6.4 Mediana = 4 Calcular media y mediana de : 1, 2, 4, 5, 1000 Media = 202.4 Mediana = 4
Moda (mode). Es el valor que ocurre con mayor frecuencia. Si todos los valores son diferentes, no hay moda. Por otra parte, un conjunto de datos puede tener ms de una moda.
distribucin unimodal
distribucin bimodal
distribucin multimodal
10
Estadstica Descriptiva
Medidas de localizacin Percentiles (percentiles) y cuartiles (quartiles). Un percentil es una cifra que indica el porcentaje de una distribucin que es igual o menor a esa cifra. Los percentiles 25, 50 y 75, corresponden al 1, 2 y 3er cuartil, respectivamente. El percentil 50 = 2 cuartil = Mediana
Cuartiles (quartiles): Primer cuartil (Q1) corresponde al dato que ocupa la posicin
Q1 =
n +1 4
n +1 2
3( n + 1) 4
n +1 4
n +1 2
Q2 =
3( n + 1) 4
Q3 =
11
Estadstica Descriptiva
Medidas de dispersin Desviacin estndar (standard deviation). Es una medida de dispersin de los datos con respecto a la media y nos indica cunto tienden a alejarse los datos del promedio. De hecho, es "el promedio de lejana de los datos respecto a la media". Es la medida de dispersin ms frecuentemente utilizada en las ciencias mdicas, se expresa en trminos de las unidades originales. La desviacin estndar de una muestra se obtiene calculando la raz cuadrada de la suma de las desviaciones de los datos con respecto a la media elevadas al cuadrado, dividida entre n-1.
s=
(x
i =1
x)2
n 1
promedio = 20.8
promedio =
20.8
Si los valores estn ms cerca del promedio, la desviacin estndar se hace ms pequea. En distribuciones con alta desviacin estndar, el promedio deja de ser representativo.
12
Estadstica Descriptiva
Varianza (variance). La varianza de una muestra se calcula obteniendo la suma de las desviaciones de los datos con respecto a la media elevadas al cuadrado, dividida entre n-1. Esta medida corresponde al cuadrado de la desviacin estndar (s2).
s2 =
(x
i =1
x)2
n 1
Error estndar (standard error). El error estndar de la media es una medida de dispersin que se calcula de la siguiente manera:
EE =
s n
Coeficiente de variacin. Es una medida de varianza relativa que expresa la desviacin estndar como un porcentaje de la media. Es til para comparar la dispersin de dos conjuntos de datos medidos en diferentes unidades.
s C.V . = 100 x
Rango (range). Corresponde a la diferencia entre el valor mayor y menor en un conjunto de datos. (Rango = valor mximo valor mnimo).
Rango intercuartlico (quartile range). Refleja la variabilidad del 50% central de las observaciones en un conjunto ordenado de datos (variabilidad con respecto a la mediana). Se obtiene mediante la diferencia entre el cuartil 3 y el cuartil 1.
RIC = Q3 Q1
Ejemplo de acuerdo a los datos de la pgina 10 de estos apuntes:
RIC= 3.5
13
Estadstica Descriptiva
Medidas sobre la forma de la distribucin Sesgo (skewness). Es una medida de la simetra de la distribucin de los datos. Si la distribucin es perfectamente simtrica, entonces el sesgo es igual a cero. Pero si el sesgo es claramente diferente de cero, entonces la distribucin es asimtrica.
sesgo =
donde,
nM 3 (n 1)(n 2) s 3
M3 es:
( xi x )
sesgo < 0
sesgo > 0
sesgo = 0