Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADÍSTICA
MATEMÁTICAS 1º BACHILLERATO CCSS
ÍNDICE
1. Definiciones básicas
2. Distribuciones unidimensionales
Distribuciones de frecuencias agrupadas
Parámetros estadísticos unidimensionales
3. Distribuciones bidimensionales
Tabla de doble entrada
Parámetros estadísticos bidimensionales
Recta de regresión
1. DEFINICIONES BÁSICAS
Muestra: número de datos que tomamos de la población para realizar un estudio
Cuando la variable es continua y toma muchos valores, conviene agrupar sus valores en
intervalos de clase. Los intervalos, por regla general, están cerrados por la izquierda y abiertos
por la derecha (excepto el último). Su amplitud (ai) está definida por un límite superior (Li) y
un límite inferior (li), que pueden emplearse para calcular la marca de clase (ci) —el punto
medio del intervalo que es representativo del mismo. La marca de clase se utiliza para calcular
la frecuencia de clase (ni), que sería equivalente a la frecuencia absoluta; y también la
frecuencia relativa de clase (fi) y las frecuencias acumuladas (Ni y Fi).
DE CENTRALIZACIÓN
Media aritmética (𝒙 ̅): cociente entre la suma de todos los datos y el número de datos.
Mediana: valor que, al ordenar las observaciones de menor a mayor, ocupa el lugar
central, dividiendo al conjunto en dos partes iguales. Si el tamaño de la muestra es
impar, la mediana es un dato; si es par, la mediana son dos datos.
Moda: valor de mayor frecuencia.
DE POSICIÓN
DE DISPERSIÓN
Rango o recorrido: diferencia entre el valor mayor y el menor de todos los datos.
Desviación (respecto de la media): diferencia en valor absoluto entre un valor de la
variable y la media aritmética (|xi–x|).
Desviación media: media aritmética de la suma de desviaciones.
∑𝑛𝑖=1 |𝑥𝑖 − 𝑥̅ |
𝐷𝑥̅ =
𝑁
Para datos agrupados, se usa la marca de clase ci en el lugar de xi y se multiplica por
la frecuencia absoluta de cada intervalo.
2
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖 ∑𝑛𝑖=1 𝑥𝑖 2 𝑓𝑖
𝜎 = = − 𝑥̅ 2
𝑁 𝑁
Es una tabla bidimensional de frecuencias en la que se ordenan los datos de las variables que
se creen correlacionadas. Explicamos su elaboración con un ejemplo:
NOTA DE
5 5 2 5 9 10 8 4 1 6
MATEMÁTICAS
NOTA DE FÍSICA 8 6 3 6 0 4 3 4 9 5
Esas son las notas de matemáticas y física (x e y respectivamente) de diez alumnos de una
clase. El que ha sacado un 10 en una ha sacado un 4 en la otra, y así.
Escribiremos en cada casilla el número de veces que se repita para par. Así, para todos los
pares es «1» salvo para (5, 6), combinación que se repite para dos alumnos.
x
0 1 2 3 4 5 6 7 8 9 10 fy
y
0 1 1
1
2
3 1 1 2
4 1 1 2
5 1 1
6 2 2
7
8 1 1
9 1 1
10
fx 1 1 1 3 1 1 1 1 10
fx y fy son las frecuencias marginales de cada variable, es decir, el número de veces que se
repite cada valor de la misma (la distribución que se obtiene al estudiar independientemente
cada variable). En la casilla inferior derecha está el número de pares contabilizados.
Para pasar una tabla de doble entrada a una de entrada simple, sólo tenemos que
«priorizar» una variable, y construir la tabla a partir de ella:
xi yi fi xi · fi yi · fi xi · yi · fi
1 9 1 1 9 9
2 3 1 2 3 6
4 4 1 4 4 16
5 6 2 10 12 60
5 8 1 5 8 40
6 5 1 6 5 30
8 3 1 8 3 24
9 0 1 9 0 0
10 4 1 10 4 40
10 55 44 225
Para cada variable podemos calcular de forma independiente los mismos parámetros que para
las distribuciones unidimensionales: media, mediana, moda, varianza, desviación media,
desviación típica… Para las distribuciones bidimensionales hay un algunos parámetros
específicos.
Por definición, la recta de regresión pasa por el centro de gravedad (𝑥̅ , 𝑦̅) —ya tenemos
un punto con el que construir la ecuación de la recta. Su pendiente será el cociente entre la
covarianza y la varianza de la variable x. Ya podemos obtener la ecuación punto-pendiente:
𝜎𝑥𝑦
𝑦 − 𝑦̅ = (𝑥 − 𝑥̅ )
𝜎𝑥
BIBLIOGRAFÍA
Vitutor
http://centros.edu.xunta.es/iesaslagoas/metodosesta/0documentos/T02_bidimensional
_03.pdf