Sei sulla pagina 1di 13

1

Estadstica Descriptiva

DEFINICIONES Estadstica Es la disciplina que se ocupa de la recoleccin, organizacin, resumen, anlisis e interpretacin de los datos. Tambin sirve para obtener inferencias de una poblacin cuando solo se examina una parte de sta.

Bioestadstica Cuando los datos que se analizan proceden de las ciencias biolgicas o mdicas, se utiliza el trmino bioestadstica. La bioestadstica es una herramienta til para la investigacin en el campo de la medicina veterinaria. La persona que utiliza esta herramienta debe saber interpretar y comunicar los resultados a los dems. Antes del anlisis estadstico Debe existir una pregunta de por medio !!! Recordar siempre. CUAL ES LA PREGUNTA?

Inferencia estadstica Es el procedimiento por medio del cual se llega a una conclusin acerca de una poblacin con base en los resultados que se obtienen de una muestra extrada de esa poblacin.

poblacin

muestreo

muestra

Estadstica Descriptiva

Poblacin Es la totalidad de entidades (animales, plantas, clulas) que presentan la caracterstica que se desea evaluar.

Muestra Es un subconjunto de datos obtenidos de la poblacin en estudio.

Datos La impresin o valor que se obtiene de cada entidad que forma la muestra. En estadstica los datos numricos pueden ser mediciones o conteos.

Notas adicionales sobre poblaciones y muestras Usualmente las poblaciones son MUY GRANDES. Por ejemplo, el peso de todos los grillos en Cd. Victoria o el dimetro de los rboles en la Sierra Madre Oriental.

En ocasiones las poblaciones de inters pueden ser relativamente pequeas. Por ejemplo, la edad de los hombres que han llegado a la luna. En ocasiones se muestrea una poblacin que no existe fsicamente: Poblacin imaginaria (hipottica o potencial). Suponga que se realiza un experimento en el cual se administra un suplemento alimenticio a 40 cerdos y se mide su tasa de crecimiento. Entonces, la poblacin sobre la cual se pueden hacer conclusiones es: la tasa de crecimiento de todos los cerdos a los que se les administre el mismo suplemento alimenticio y bajo las mismas condiciones que prevalecieron durante el experimento.

Variable Una variable es una caracterstica que difiere o vara de una observacin a otra. Esto se debe a la simple razn de que la caracterstica no es la misma cuando se observa en diferentes sujetos (personas, animales, lugares o cosas). Las variables se pueden medir, controlar o manipular en una investigacin.

Estadstica Descriptiva

Variable cualitativa Contiene informacin respecto a los atributos en las entidades de estudio. Cuando el objeto de estudio presenta o no alguna caracterstica de inters. Aqu no se llevan a cabo mediciones en el sentido usual, sin embargo, para su anlisis estadstico se puede contar el nmero de entidades que presentaron cada atributo o caracterstica.

Variable cuantitativa Es la que puede medirse en la forma usual (e.g. con instrumentos). Las mediciones hechas sobre variables cuantitativas conllevan informacin respecto a cantidad. Poseen un orden o rango natural.

Variables cuantitativas discretas Se caracteriza por separaciones o interrupciones en una escala numrica. Usualmente son nmeros enteros provenientes de conteos.

Variables cuantitativas continuas Puede tomar un infinito nmero de valores entre cualquier par de valores especificado. Relacin entre variables: discretas vs continuas continuas vs continuas discretas vs discretas continuas vs discretas cualitativa vs discreta cualitativa vs continua Tarea: Buscar ejemplos de artculos o tesis donde se relacionan variables

Fotocopiar o hacer grfico en una hoja Indicar la variable dependiente y cual la variable independiente Indicar el tipo de variable en cada caso (cuantitativa o cualitativa) En el caso de variables cuantitativas indicar si es discreta o continua

Estadstica Descriptiva

Variable dependiente (Y) Variable independiente (X)

A la variable dependiente tambin se le llama variable de respuesta

Ejemplos grficos de relacin entre variables

continua vs continua

continua vs cualitativa

Y X
Concentracin de hormona vs longitud

Y a X
tasa de crecimiento vs Raza

discreta vs cualitativa

discreta vs continua

Y a X
No. de muertos vs causa de muerte

Y b X
No. de sobrevivientes vs concentracin de medicamento

Estadstica Descriptiva

Medidas y escalas de medicin Medicin Se define como la asignacin de nmeros a objetos o eventos de acuerdo a un conjunto de acuerdos o escalas. Escala nominal (cualitativa) Consiste en designar o "nombrar" las observaciones o clasificarlas en varias categoras mutuamente excluyentes y colectivamente exhaustivas. Esto quiere decir que las observaciones pueden pertenecer solamente a una sola categora y que las categoras asignadas son todas las existentes posibles, por lo que incluyen a la totalidad de las observaciones. Ejemplos: raza, color, sexo, tipo de sangre. Escala ordinal (cualitativa) Cuando existe un orden de menor a mayor grado en las categoras asignadas, de acuerdo con algn criterio. Ejemplos: grados de intensidad en la coloracin (baja, media, alta), organismos convalecientes que estn bajo algn tratamiento (sin mejora, mejorados, bastante mejorados). Escala de intervalos (cuantitativa) Mediante esta escala no slo es posible ordenar las mediciones, sino que tambin se conoce la distancia entre cualquier par de mediciones. Por ejemplo, la distancia entre 20 y 30 es la misma que entre 30 y 40. Existe un cero, el cual es arbitrario. Ejemplos: escala de temperatura en F o C (donde cero grados no significa ausencia de calor), la hora del da. Escala de razn (cuantitativa) Es una escala de intervalo en la cual las distancias inician con respecto a un cero verdadero (racional). Ejemplos: nmero de veces que aparece un objeto, longitud, peso, tasas (crecimiento, consumo). Exactitud La exactitud de una medicin hace referencia a su cercana al valor que pretende medir. Precisin La precisin est asociada a la cantidad de cifras decimales utilizadas para expresar lo medido.

Estadstica Descriptiva

ESTADSTICA DESCRIPTIVA

Parmetro Medida descriptiva numrica de una poblacin (e.g. media poblacional) usualmente desconocido.

Estadstico Cantidad calculada de las observaciones de una muestra (e.g. media muestral) obtenida de la poblacin.

Estadstica descriptiva Es la rama de la estadstica que se dedica a la organizacin, resumen y descripcin (grfica o numrica) de conjuntos de datos.

medidas de tendencia central

medidas de dispersin

Tipos de estadstica Frecuentista (paramtrica y no paramtrica) Bayesiana


medidas de posicin medidas sobre la forma de la distribucin

Estadstica Descriptiva

Medidas de tendencia central Indican valores con respecto a los cuales los datos tienden a agruparse. Ejemplo: Media, mediana y moda.

Medidas de posicin Dividen a un conjunto ordenado de datos en grupos con la misma cantidad de observaciones. Ejemplo: Percentiles, cuartiles, quintiles, deciles,... (estas medidas se llaman cuantiles).

Medidas de dispersin Indican la mayor o menor concentracin de los datos con respecto a las medidas de tendencia central. Ejemplo: Desviacin estndar (tpica), varianza, coeficiente de variacin, rango, rango intercuartlico.

Medidas sobre la forma de la distribucin stas describen la simetra de la distribucin de los datos. Ejemplo: Sesgo.

Estadstica Descriptiva

Medidas de tendencia central Media (mean). Es la media aritmtica (promedio) de los valores de una variable. Suma de todos datos dividido entre el nmero total de datos.

x=
Media de 2, 2, 3, 7 es:

x
i =1

n
x = 3 .5

2+ 2+3+ 7 , por lo tanto 4

Caractersticas de la media

Conveniente cuando la distribucin es simtrica Es muy sensible a valores extremos

Mediana (median). Es un valor que divide a un grupo ordenado de datos en dos grupos con el mismo nmero de observaciones. Si el nmero de datos es par, se elige la media de los dos datos centrales. Una vez que los datos estn ordenados de menor a mayor, se obtiene la posicin del valor central mediante la frmula: n +1 posicin central = 2 Mediana de 1, 2, 4, 5, 6, 6, 8 = 5 7 +1 = 4, el dato que ocupa la posicin cuatro es el 5. porque 2 Mediana de 1, 2, 4, 5, 6, 6, 8, 9 es: porque
5+6 = 5.5 2

8 +1 = 4.5, por lo tanto la mediana es el promedio de los datos que 2 ocupan la posicin cuatro y cinco.

Estadstica Descriptiva

Caractersticas de la mediana

Es conveniente cuando los datos son asimtricos No es sensible a valores extremos

Diferencia entre la media y mediana cuando existen valores extremos Calcular media y mediana de : 1, 2, 4, 5, 6 Media = 3.6 Mediana = 4 Calcular media y mediana de : 1, 2, 4, 5, 20 Media = 6.4 Mediana = 4 Calcular media y mediana de : 1, 2, 4, 5, 1000 Media = 202.4 Mediana = 4

Moda (mode). Es el valor que ocurre con mayor frecuencia. Si todos los valores son diferentes, no hay moda. Por otra parte, un conjunto de datos puede tener ms de una moda.

distribucin unimodal

distribucin bimodal

distribucin multimodal

Note que en una distribucin normal la media = mediana = moda

10

Estadstica Descriptiva

Medidas de localizacin Percentiles (percentiles) y cuartiles (quartiles). Un percentil es una cifra que indica el porcentaje de una distribucin que es igual o menor a esa cifra. Los percentiles 25, 50 y 75, corresponden al 1, 2 y 3er cuartil, respectivamente. El percentil 50 = 2 cuartil = Mediana

Cuartiles (quartiles): Primer cuartil (Q1) corresponde al dato que ocupa la posicin

Q1 =

n +1 4
n +1 2
3( n + 1) 4

n +1 4

Segundo cuartil (Q2) corresponde al dato que ocupa la posicin

n +1 2

Q2 =

Tercer cuartil (Q3) corresponde al dato que ocupa la posicin

3( n + 1) 4

Q3 =

11

Estadstica Descriptiva

Medidas de dispersin Desviacin estndar (standard deviation). Es una medida de dispersin de los datos con respecto a la media y nos indica cunto tienden a alejarse los datos del promedio. De hecho, es "el promedio de lejana de los datos respecto a la media". Es la medida de dispersin ms frecuentemente utilizada en las ciencias mdicas, se expresa en trminos de las unidades originales. La desviacin estndar de una muestra se obtiene calculando la raz cuadrada de la suma de las desviaciones de los datos con respecto a la media elevadas al cuadrado, dividida entre n-1.

s=

(x
i =1

x)2

n 1

Desviacin estndar = 1.4

promedio = 20.8

promedio =

20.8

Si los valores estn ms cerca del promedio, la desviacin estndar se hace ms pequea. En distribuciones con alta desviacin estndar, el promedio deja de ser representativo.

12

Estadstica Descriptiva

Varianza (variance). La varianza de una muestra se calcula obteniendo la suma de las desviaciones de los datos con respecto a la media elevadas al cuadrado, dividida entre n-1. Esta medida corresponde al cuadrado de la desviacin estndar (s2).

s2 =

(x
i =1

x)2

n 1

Error estndar (standard error). El error estndar de la media es una medida de dispersin que se calcula de la siguiente manera:

EE =

s n

Coeficiente de variacin. Es una medida de varianza relativa que expresa la desviacin estndar como un porcentaje de la media. Es til para comparar la dispersin de dos conjuntos de datos medidos en diferentes unidades.

s C.V . = 100 x
Rango (range). Corresponde a la diferencia entre el valor mayor y menor en un conjunto de datos. (Rango = valor mximo valor mnimo).

Rango intercuartlico (quartile range). Refleja la variabilidad del 50% central de las observaciones en un conjunto ordenado de datos (variabilidad con respecto a la mediana). Se obtiene mediante la diferencia entre el cuartil 3 y el cuartil 1.

RIC = Q3 Q1
Ejemplo de acuerdo a los datos de la pgina 10 de estos apuntes:

Q1= 2.75 y Q3= 6.25


entonces: RIC= 6.25-2.75

RIC= 3.5

13

Estadstica Descriptiva

Medidas sobre la forma de la distribucin Sesgo (skewness). Es una medida de la simetra de la distribucin de los datos. Si la distribucin es perfectamente simtrica, entonces el sesgo es igual a cero. Pero si el sesgo es claramente diferente de cero, entonces la distribucin es asimtrica.

sesgo =
donde,

nM 3 (n 1)(n 2) s 3

M3 es:

( xi x )

s3 es la desviacin estndar elevada al cubo


n es el nmero de datos

sesgo < 0

sesgo > 0

distribucin sesgada a la izquierda (con sesgo negativo)

distribucin sesgada a la derecha (con sesgo positivo)

distribucin sin sesgo

sesgo = 0

Potrebbero piacerti anche