Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
La estadística tiene que ver con la
recopilación, presentación, análisis y uso
de datos para tomar decisiones y resolver
problemas.
Cualquier persona recibe información en
forma de datos a través de los periódicos,
la televisión u otros medios; y a menudo
es necesario obtener alguna conclusión a
partir de la información contenida en los
datos.
Los métodos empleados para resumir y
organizar datos se denominan 2
2 ; mientras que los métodos
para tomar decisiones se denominan
22
2 .
El término
se refiere a los
elementos del universo respecto al cual se
quieren obtener conclusiones o tomar
decisiones. A cada elemento se le puede
asociar una medición que bien puede ser
numérica o cualitativa dependiendo de la
característica que se quiera estudiar. El
término 2 se refiere al subconjunto
de observaciones seleccionadas de la
población de interés
ariables:
A cada característica de los elementos de una
población se le llama variables. Nos
encontraremos con varios tipos de variables:
cualitativas y cuantitativas.
Las variables cualitativas son aquellas que se
refieren a categorías o atributos de los
elementos (individuos) estudiados. Las variables
cuantitativas son aquellas cuyos datos son de
tipo numérico.
TIPOS DE ARIABLES CUALITATIAS
: Sólo hay dos categoría, que son
excluyentes una de la otra
Ejemplo: enfermo-sano, muerto-vivo, mujer-
hombre
tiene mas de dos categorías y no hay
orden entre ellas.
Ejemplo: color de los ojos, grupo sanguíneo
tiene varias categorías y hay orden
entre ellas.
Ejemplo: grado tumoral, calificación del riesgo
en anestesia.
|
|
números infinito no numerables de
elementos. Tiene asociado el concepto de
medida
Ejemplo: Presión arterial, Edad, peso.
2 números finitos o infinitos
numerables de elementos. Se asocia con el
concepto de conteo.
Ejemplo: N° de hijos, N° de casos de
tuberculosis por estado.
Hay ocasiones en las que las medidas
cuantitativas continuas son transformadas
en ordinales mediante la utilización de uno
o varios puntos de corte.
Ejemplo: La variable peso es codificada
en varias categorías y se utiliza en
términos como: Bajo-peso, peso-normal,
Sobrepeso, Obesidad
Las descripciones numéricas de datos suelen
ser importantes. Dado un conjunto de n
observaciones x = x = = xn
La estadística descriptiva nos puede ayudar
mediante resúmenes numéricos, que son
medidas de 2
2
2
o también
llamadas de posición y 2 2 2
x x xn
Xx
i
i
X
n n
2 22
Es intuitiva y fácil de calcular.
Su valor puede que no coincida con ninguno de los
valores de la muestra
La suma de las diferencias de cada valor de la
muestra con la media su resultado es cero, es decir,
n
X x x
i
i
2
se suele definir como el valor
³más intermedio´ una vez que los datos
han sido ordenados en forma creciente.
Se suele denotar por Me. La forma más
general de calcular la mediana es la
siguiente:
x n si n es impar
Me x x
n n
si n es par
La mediana es aquel valor que deja el
cincuenta por ciento de los datos por
debajo y otro cincuenta por encima.
Cabe destacar que es preferible el uso de
la mediana como medida descriptiva del
centro cuando se quiere reducir o eliminar
el efecto de valores extremos en un
conjunto de datos (muy grandes o muy
pequeños).
Es una medida de tendencia central que
se puede utilizar sea cual sea el tipo de
variable a estudiar. La moda de un
conjunto de observaciones es el valor que
más se repite, aquel cuya frecuencia
absoluta es máxima. Puede ser única, que
haya más de una, o que no exista.
22
Se define como la raíz n-ésima del producto
de todos los valores numéricos, es decir,
n
G o x x
n xn o n xi
i o
2
Se define como el número de
observaciones de la muestra dividido por la
suma del inverso de cada una de las
observaciones, es decir,
n
A o n
X
io
x i
La localización o tendencia central de un
conjunto de datos no necesariamente
proporciona información suficiente para
describirlos adecuadamente. Debido a que no
todos los valores son semejantes, la variación
entre ellos se considera importante. Se puede
decir que un conjunto de datos tiene una
dispersión reducida si los mismos se aglomeran
estrechamente en torno a alguna medida de
localización de interés y se dice que tiene una
dispersión grande si se esparcen ampliamente
alrededor de alguna medida de localización de
interés.
Las medidas descriptivas más comunes
de 2
son: el
, la
,
la 2
2
y el
2.
|
de la muestra es la medida de
variabilidad más sencilla entre todas las
mencionadas; y se define como la diferencia
entre la observación más grande y la más
pequeña : r o x ´ x
Aunque es una medida muy fácil de
calcular, ignora toda la información de la
muestra entre las observaciones más
grande y más pequeña. Sin embargo, vale
la pena resaltar que el rango se utiliza
mucho en aplicaciones estadísticas al
control de calidad, donde lo común es
emplear muestras con tamaños n = 4 o
n = 5 ya que en estos casos la pérdida de
información no se considera relevante.
En general, se desea una medida de
variabilidad que dependa de todas las
observaciones y no sólo de unas pocas;
así que parece razonable medir la
variación en términos de las desviaciones
relativas a alguna medida de localización
(generalmente esta medida es la media)
Para el conjunto de datos ß ßß
Las diferencias x x = x x = = xn x
Determinan las desviaciones de la media.
Dado que la suma de estas desviaciones es
cero, se utiliza como medida de variabilidad
el promedio de los cuadrados de tales
desviaciones.
n
X x ´ x
i o
i
s o
n
Sin embargo, como sólo hay n-1
desviaciones independiente se
conviene en dividir entre n-1, es
decir,
n
X
i o
xi ´ x
S o
n ´
i
g ;
s
Los resultados pueden ser los siguientes:
4 È (distribución simétrica; existe la misma
concentración de valores a la derecha y a la
izquierda de la media)
4 M (distribución asimétrica positiva; existe
mayor concentración de valores a la derecha de
la media que a su izquierda)
4 ë (distribución asimétrica negativa; existe
mayor concentración de valores a la izquierda
de la media que a su derecha)
El 22
22 analiza el
grado de concentración que presentan los
valores alrededor de la zona central de la
distribución.
Se definen 3 tipos de distribuciones según
su grado de curtosis:
2 presenta un grado
de concentración medio alrededor de los valores
centrales de la variable (el mismo que presenta
una distribución normal).
2: presenta un elevado
grado de concentración alrededor de los valores
centrales de la variable.
presenta un reducido
grado de concentración alrededor de los valores
centrales de la variable.
El 22
22 viene definido
por la siguiente fórmula:
n
nX xi ´ x
i o
g o
´;
s
Los resultados pueden ser los siguientes:
È (
2 .
M
2).
ë
.