Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INTRODUCCIÓN
¿Qué es la Estadística?
Estadística es la ciencia de:
– Recolectar
– Describir
– Organizar Datos
– Interpretar
con el fin de transformar dichos datos en
información y conseguir una toma de decisiones
más eficiente.
La Estadística en la formación de un Ingeniero
6
OBJETIVO:
- Resumir la información contenida en un conjunto de
datos, usando para ello métodos gráficos y
medidas numéricas que informan de lo más
relevante.
Porcent. Porcent.
Frec. (válido) acum.
0 419 27,8 27,8
1 255 16,9 44,7
2 375 24,9 69,5 >50%
3 215 14,2 83,8
4 127 8,4 92,2
5 54 3,6 95,8
6 24 1,6 97,3
7 23 1,5 98,9
Ocho+ 17 1,1 100,0
Total 1509 100,0
Datos agrupados:
• Diagramas de barras
– Alturas proporcionales a las
frecuencias (abs. o rel.)
• Pictogramas
– El área de cada modalidad debe
ser proporcional a la frecuencia.
B.2) Gráficos para v. cuantitativas continuas
• Diagrama de puntos
- Para conjuntos con menos de 25 datos
• Diagrama de tallo-hojas
- Para conjuntos de datos de tamaño moderado
• Histograma
- Para conjuntos con gran número de datos. Es la representación
gráfica de la tabla de frecuencias para datos agrupados en clases. El
área que hay bajo el histograma entre dos puntos cualesquiera indica
la cantidad (porcentaje o frecuencia) de individuos en dicho intervalo.
B.3) Diagramas acumulados
x i
X i 1
n
Para datos agrupados:
k
m f i i
X i 1
n
Donde: mi: punto medio de la clase i
fi: frecuencia absoluta de la clase i
k: cantidad de clases
Mediana
• Es el valor que ocupa la posición central
de un conjunto de observaciones, una vez
que han sido ordenados en forma
ascendente o descendente.
• Divide al conjunto de datos en dos partes
iguales.
Cálculo de la mediana
• Para datos no agrupados:
– Si n es impar: posición donde se ubica la
mediana es igual a (n+1)/2.
– Si n es par: (n+1)/2 no es entero, por lo tanto
la mediana será igual al promedio de las dos
posiciones centrales.
Cálculo de la mediana
1
Mo Lim Cm
1 2
Donde: Lim: límite inferior de la clase modal.
1: diferencia entre fi de la clase modal y la
anterior.
2: diferencia entre fi de la clase modal y la
posterior.
Cm: amplitud de la clase modal (clase de mayor
frecuencia).
Medidas de dispersión, variación
o variabilidad.
• Rango.
• Varianza.
• Desviación Típica.
• Coeficiente de variación.
Medidas de dispersión: Rango
n
k
i fi
m 2
s i 1
x
2 2
n
Medidas de dispersión:
Desviación Típica
• Es la raíz cuadrada de la varianza.
• Notación: s, .
s s 2
Medidas de dispersión: Coeficiente de
Variación
s
CV 100%
x
Medidas de Forma
• Son medidas numéricas que permiten
determinar la forma que tiene la curva de
los datos, por lo tanto, sirven para
corroborar lo que los gráficos muestran.
Coeficiente de Pearson
-Asimetría
Medidas
Coeficiente de Fisher
de forma
-Kurtosis o apuntamiento
Medidas de Forma: Asimetría
• Permiten estudiar la forma de la curva,
dependiendo de cómo se agrupan los
datos.
Medidas de Forma: Asimetría
ASP
> 0, X>Md Asimétrica Positiva
x X
n
4
i
CK i 1
4
3 Datos No Agrupados
ns
M
k
4
i X fi
CK i 1
4
3 Datos Agrupados
ns
Interpretación:
=0 Mesocúrtica
CK >0 Leptocúrtica
<0 Platicúrtica
ESTADISTICA BIVARIABLE
• En este punto vamos a tratar diferentes formas de
describir la relación entre dos variables cuando estas son
numéricas.
40
Estudio conjunto de dos variables
• A la derecha tenemos una posible manera de recoger
los datos obtenido observando dos variables en
varios individuos de una muestra.
Altura Peso
en cm. en Kg.
– En cada fila tenemos los datos de un individuo
162 61
– Cada columna representa los valores que toma una 154 60
variable sobre los mismos. 180 78
158 62
– Las individuos no se muestran en ningún orden
particular. 171 66
169 60
• Dichas observaciones pueden ser representadas en 166 54
un diagrama de dispersión (‘scatterplot’). En ellos, 176 84
cada individuos es un punto cuyas coordenadas son
los valores de las variables. 163 68
... ...
100
90
80 Pesa 76 kg.
70
30
140 150 160 170 180 190 200
Relación entre variables.
100
90
80
70
60
50
40
30
140 150 160 170 180 190 200
Predicción de una variable en función de la otra
Aparentemente el peso aumenta 10Kg por cada 10 cm de altura... o sea,
el peso aumenta en una unidad por cada unidad de altura.
100
90
80
70
10 kg.
60
50
40 10 cm.
30
140 150 160 170 180 190 200
Relación directa e inversa
330 100
Relació
n Relació
inversa n
perfecta Variables
directa
incorrelad
casi
as
perfecta
-1 0 +1
Entrenando el ojo: correlaciones positivas
330 130
120
280 110
230 100
90
180 80
70
130 60
80 50
r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,8 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Entrenando el ojo: correlaciones negativas
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Preguntas frecuentes
• ¿Si r=0 eso quiere decir que no las variables son
independientes?
– En la práctica, casi siempre sí, pero no tiene
por qué ser cierto en todos los casos.
– Lo contrario si es cierto: Independencia
implica incorrelación.
x
k
i m f i i
X i 1
X i 1
n n