Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
• Al publicar los datos y las técnicas que usaron para analizarlos e interpretarlos, los
investigadores dan a otros la oportunidad de revisar los datos y de usarlos en
investigaciones futuras.
Estadística
• Es la ciencia que se ocupa de la recopilación y ordenación de los datos que se pueden
valorar numéricamente, para obtener, a partir de ellos, conclusiones basadas en el
cálculo de probabilidades.
• Constituye un valioso e importante instrumento para la reunión, organización,
análisis e interpretación de los datos referentes a fenómenos relativos a la sociedad y
se divide en dos áreas: estadística descriptiva y la estadística inferencial.
Población
• Es un conjunto de personas (objetos) que tienen una característica observable en
común.
• El concepto de población, no necesariamente se refiere a un conjunto de datos no a
personas.
Población
Muestra
• Es un subconjunto de una población.
Parámetro vs estadístico
• Un parámetro se define como cualquier
resumen de los elementos de una
población.
a. Distribución de frecuencias 50
45
b. Gráficas 40
35
d. Medidas de dispersión 20
15
10
e. Puntaciones z
5
0
Ciclo 1 Ciclo2
Industrial Sistemas Civil Electrónica
Distribución de frecuencias y gráficas
• Es un conjunto de datos ordenados en sus respectivas categorías, en donde pueden
agregarse frecuencias, frecuencias acumuladas, porcentajes, porcentajes acumulados,
proporciones, proporciones acumuladas, puntos medios, etc., todos ellos con
determinadas funciones y las gráficas son la representación esquemática de esos
datos.
La presentación de resultados puede hacerse en
tres formas:
I. Serie simple o serie de frecuencias unitarias.
5 9
6 8
7 7
Serie de frecuencias
• Cuando el número de datos es grande, conviene transformar la serie simple de
frecuencias de la siguiente manera:
Calificaciones 3 4 5 6 7 8 9 10 Total
Frecuencias 1 2 4 6 7 9 7 3 39
Serie de clases y frecuencias
• Son las medidas que determinan o explican cual es el centro de la distribución de los
datos que se están analizando, ofrecen los valores centrales de un fenómeno estudiado
y tratan de encontrar un número que represente el promedio de un grupo
determinado, que generalmente se encuentra localizado a la mitad o centro de la
distribución de unos datos.
• Las principales medidas de tendencia central son la moda, la mediana y la media.
Moda (Mo) Edad
5
• La moda es el valor más repetido en 6
una distribución. Se representa 6
con Mo.
7
• Es posible encontrar la moda de 8
variables cualitativas y cuantitativas.
8 Moda
• La moda de la distribución 1, 2, 2, 3, 3, 8
3, 5, 5 es 3.
9
9
19
Edad
Moda (Mo) 8
5
6
• En algunas ocasiones, cuando son dos
los valores que aparecen con mayor 6
Moda
frecuencia, se dice que la distribución 6
es bimodal. 7
Bimodal
8
8 Moda
8
8
9
9
19
Moda (Mo) Edad Frecuencia
(f)
6 2
• Serie de frecuencias 7 3
8 5
9 8 Moda
10 3
11 4
12 6
Moda (Mo). Métodos para calcularla
• Posición de la mediana = N + 1
2
Mediana (Me)
• Donde N es el número total de los datos de la distribución (total de observaciones).
Cuando el total de los datos de una serie simple es un número impar, la fórmula nos
da el lugar de la mediana.
3 4 4 5 6 8 8 8 10
• Posición de la mediana : 9 + 1 / 2 = 5
• 𝐸𝑗𝑒𝑚𝑝𝑙𝑜:
• 8, 10, 9, 9, 7,8
• X = 8 + 10 + 9 + 9 + 7 + 8 = 51 / 6 = 8,5
Media (𝑥). Serie de frecuencias
• Cuando el número de datos es grande, se transforma la serie simple simple en una
serie de frecuencias y se utiliza la siguiente fòrmula:
Edad (x) F fX
3 3 9
4 3 12
5 6 30
6 5 30
7 5 45
8 7 56
9 6 72
10 9 90
11 4 44
12 2 24
Promedio de edad de los niños es 7.8 50 394
Media (𝑥). Serie de clases y frecuencias
• Se utiliza la siguiente fòrmula:
Edad (x) F fX
3 3 9
4 3 12
5 6 30
6 5 30
7 5 45
• En el ejemplo anterior, se aumentan 2 8 7 56
columnas; una que corresponde la 9 6 72
punto medio (P.M) y otra de 10 9 90
multiplicar la frecuencia (f) por el P.M
11 4 44
12 2 24
50 394
Promedio de edad de los niños es 7.8
Media (𝑥). Serie de clases y frecuencias
Edad F P.M fP.M
Sustituyendo en la fòrmula se obtiene:
(x)
3-4 6 3.5 21
5-6 11 5.5 60.5
7-8 12 7.5 90
9-10 15 9.5 142.5
11-12 6 11.5 69
Total 50 383.0
Medidas de dispersión
• Las MTC no son suficientes para
describir la distribución de los datos,
ya que definen el valor característico
para una variable hacia el centro de
distribución, pero no indican como
están situados los datos con respecto al
centro.
• Las medidas que revelan la dispersión
de los datos reciben el nombre de
medidas de dispersión o
desviación, determinan el carácter
homógeneo o heterógeneo de un
conjunto de datos, presentan una
imagen clara de la distribución .
Rango o amplitud
• Es la medida de
dispersión más
elemental y es la
diferencia entre los
valores máximo y
mínimo de una serie de
valores adoptados por
una variable.
• Depende de los valores
extremos.
Rango o amplitud
• Tiene el inconveniente
de analizar los valores
con respecto a la
media, lo que impide
tener una idea precisa
de la dispersión.
• Por lo tanto, se
considera una medida
preliminar de la
dispersión.
Desviación estándar (s, 𝜎)
• Es la MD de mayor
uso y con ella se
determina que tanto se
desvía cada dato en
promedio con respecto
a la media aritmética.
Desviación estándar (s, 𝜎)
• El promedio de
alejamiento de cada valor
respecto a la media se
expresa en términos
lineales.
• Al aumentar la
desviación estándar, el
grado de dispersión de
los datos será mayor y
viceversa.
Varianza (s2)
60
s= =6.6666 varianza
9
s = Distribución estándar
40 - 50
z= = 1.0
10
Puntuaciones z
I. La distribución de la o las
características que son de interés
para nuestro estudio dentro de la
población debe ser normal.
II. Los datos deben estar a nivel de
medición nominal, ordinal o
intervalar.
III. Cuando 2 o más poblaciones se
estudian deben tener varianza
homogénea.
Estadística paramétrica
Estadística Paramétrica
Coeficiente de correlación de
Pearson y regresión lineal
Prueba T
Prueba de contraste de la diferencia
de proposiciones
Análisis de varianza unidireccional
(ANOVA DE 1 VÍA)
Análisis de varianza factorial
(Anova)
Análisis de covarianza (Ancova)
Estadística No Paramétrica
Se aceptan distribuciones no
normales.
Las variables no necesariamente
tienen que estar medidas en nivel
por intervalo o de razón.
Se pueden analizar datos nominales
u ordinales.
Pruebas No Paramétricas
La ji cuadrada (x2)
• Los coeficientes de correlación e
independencia para tabulaciones
cruzadas.
• Prueba de Mann-Whitney
Pruebas No Paramétricas
Agregar un
título de
diapositiva (5)