Sei sulla pagina 1di 23

Manual de Usuario L.

I Erik Francisco Gómez Silva

A
G
O
-
D
I
C

2 ESTADISTICA
0
1 DESCRIPTIVA
7
PROFR.
LIC. ERIK FRANCISCO GÓMEZ SILVA
ACTUALIZADO JUNIO 2017

Página 0
Manual de Usuario L.I Erik Francisco Gómez Silva
Definiciones de Estadística

Se llama Estadística a la rama de las matemáticas que se sirve de un conjunto de métodos, normas, reglas
y principios para la observación, toma, organización, descripción, presentación y análisis del comportamiento de
un grupo de datos para la conclusión sobre un experimento o fenómeno.

Estadística según Kerlinger De Landsheere.

Rama de las matemáticas que estudia los datos cuantitativos reunidos por observación con el fin de
estudiar y comparar las fuentes de varianza de los fenómenos, de aceptar o de rechazar las hipótesis que afectan
a las relaciones entre los fenómenos y de ayudar a hacer unas inferencias a partir de las observaciones.

Estadística según Mario Tamayo.

Es la técnica o proceso matemático de recolección, descripción, organización, análisis e interpretación de


datos numéricos. Constituye un instrumento fundamental de medida y de investigación dada su capacidad de
expresión cuantitativa.

Estadística según Ander Egg.

En el lenguaje corriente, el término se suele usar en dos sentidos diferentes. En plural (estadísticas), como
sinónimo de ordenación de datos numéricos (por ejemplo, estadísticas de viviendas construidas por intermedio
del banco hipotecario); en singular, el término se aplica a la ciencia estadística, cuyo objeto es el de recopilar,
presentar, analizar e interpretar datos, referentes a hechos, con el fin de estudiar fenómenos susceptibles de
expresión numérica.

Estadística según C. Monroy Olivares

Referente a los métodos para la obtención de datos, su análisis y resumen, así como la deducción de las
consecuencias a partir de las muestras obtenidas de los eventos.

Clasificación de la Estadística

La estadística tiene básicamente dos divisiones:

La Estadística Descriptiva: es la parte de la Estadística que estudia las técnicas y métodos que sirven para la
observación, toma, organización, descripción, presentación y análisis de datos.

La Estadística Descriptiva: Es aquella que utiliza técnicas y medidas que indican las características de los datos
disponibles. Comprende el tratamiento y análisis de datos que tienen por objeto resumir y describir los hechos
que han proporcionado la información, y que por lo general toman la forma de tablas, gráficos, cuadros e índices.

Se llama descriptiva por ser su fin primordial la descripción de las características principales de los datos
obtenidos. Mario Tamayo.

Página 1
Manual de Usuario L.I Erik Francisco Gómez Silva
La Estadística Inferencial o Analítica: es la parte de la Estadística mediante la cual se intenta dar explicación,
concluir o inferir sobre los experimentos y fenómenos observados, mediante el auxilio de la probabilidad,
estadística descriptiva y distribución de probabilidad, por lo que resulta una herramienta de suma utilidad para
la toma de decisiones.

La Estadística Inferencial: Es el conjunto de técnicas y cálculos que auxilian al investigador sobre la posible
influencia de la variable independiente sobre los resultados y a generalizarlos a la población de la cual se tomó
la muestra para el estudio. Mario Tamayo.

DEFINICIONES FUNDAMENTALES

Se le llama Población a la cantidad total de cualquier conjunto completo de datos, objetos, individuos o
resultados que tengan alguna característica en común que se va a observar o analizar en un problema o
experimento. Denotaremos al tamaño de la población por “N”.

"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos
sacar conclusiones". Levin & Rubin (1996).

Se le llama Muestra a cualquier subconjunto de elementos de la población. El interés de la Estadística es


proporcionar métodos que permitan elegir una muestra de datos representativos destinado a suministrar
información acerca de una población, será fundamental que los elementos deben tener todas las características
de la población. Detonaremos al tamaño de la muestra por “n”.

"Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin & Rubin (1996).

CLASIFICACION DE LA MUESTRA

Muestra aleatoria. Es la parte que se obtiene de la población, cuando a todos se les da igual oportunidad de ser
seleccionado.
- Muestra aleatoria representativa. Es cuando intervienen diferentes tipos de sujetos, que forman la
población sometido a estudio.
- Muestra aleatoria adecuada. Es adecuada cuando es suficientemente grande, para permitir un
cierto grado de confianza en la estabilidad de las características estudiadas.

Muestra no aleatoria. Es cuando los elementos participantes no son seleccionados al azar.

Se le llama Variable a la cualidad o cantidad medible de cualquier suceso o acción que presente o
experimente un cambio, la podemos representar mediante un símbolo (X) y al cual se le puede asignar un valor
cualquiera de un conjunto determinado de datos.

Le llamamos Variable Aleatoria a aquella variable cuyos cambios no pueden ser determinados antes de que estos
se presenten; es decir, están destinados a la suerte. También se le conoce como Variable Probabilista, Cabalística,
de Azar o a la Suerte.

Página 2
Manual de Usuario L.I Erik Francisco Gómez Silva
TIPOS DE VARIABLE

Para su estudio, las variables aleatorias se han clasificado según la naturaleza de los valores que toman en:

1. Variables Cuantitativa:
a) Variables Numéricas Discretas (Una variable discreta siempre es numérica. Por ejemplo, el número de
quejas de los clientes o el número de fallas o defectos).
b) Variable Numérica Continua (Una variable continua puede ser numérica o de fecha/hora. Por ejemplo, la
longitud de una parte o la fecha y hora en que se recibe un pago).
c) Variable Numérica Constante

2. Variables Cualitativa:
a) Variables Categóricas

Variable Cuantitativa Continua. Es la que acepta valores enteros o fraccionarios; teóricamente es la que
puede tomar cualquier valor dentro de un intervalo de valores.

Variable Cuantitativa Discreta. Es la que puede tomar valores enteros únicamente.


Variable Cuantitativa Constante. Es la que acepta solamente un tipo de valor.
Variable Cualitativa Categórica. Es la que admite valores que consisten en categorías de clasificación.

Rango. Es el recorrido a trayectoria que hace la variable. Y puede ser Incluyente o Excluyente.

Rango Incluyente. Es la diferencia que existe entre el puntaje mayor menos el puntaje menor más uno.
Rango Excluyente. Es la diferencia que existe entre el puntaje mayor menos el puntaje menor.

MOMENTOS DE LA ESTADISTICA

1. COLECCIÓN DE DATOS. Generalmente cuando el rango es pequeño y el número de datos también, a la


población o muestra se le llama colección de datos.

Ejemplo:
Lista de calificaciones de un alumno.
7,8,9,10,6,9,7

2. DATOS ORDENADOS EN TABLAS DE FRECUENCIAS. Cuando se estudia un conjunto de datos para su


más fácil manejo, se ordena en forma ascendente o descendente en espacios rectangulares llamadas
“tablas de distribución de frecuencias”. Entiendo por frecuencia de un dato, como el número de veces que
aparece en la población o muestra.

Una distribución de frecuencias se realiza cuando se proporciona un conjunto de mayor de datos y el


rango sea pequeño o cuando existe un número pequeño de datos diferentes entre sí.

La tabla admite otros tipos de frecuencias:

a) Frecuencia Acumulada. Se define para cada dato como la suma de sus frecuencias más las frecuencias
de datos menores que él. Es la suma de la frecuencia con el dato que sigue.

Página 3
Manual de Usuario L.I Erik Francisco Gómez Silva

b) Frecuencia Relativa. Se define para cada dato como el cociente de sus frecuencias entre el número total
de datos, también es denominado frecuencia porcentual. Su fórmula es f.r= (f/n)*100
c) Frecuencia Relativa Acumulada. Se define por cada dato como el cociente de su frecuencia acumulada
entre el número total de datos, y es denominado también porcentual acumulativo. Es la suma de la f.r con
el dato siguiente.

Ejemplo:

En una escuela secundaria de la Modelo hay 400 alumnos de primer grado y se desea saber las calificaciones
finales en la materia de Educación Física. Para su estudio se seleccionaron de los diferentes grupos a 60
estudiantes al azar y se registraron los siguientes datos.

70 80 60 80 60 80 60 60 70 60
50 60 80 60 90 90 70 90 70 50
80 70 80 70 70 60 100 90 70 100
80 90 60 80 60 80 60 90 60 60
60 100 80 100 80 80 70 100 80 80
60 70 60 50 90 60 90 50 80 80

Frecuencia Frecuencia Frecuencia


Datos(x) Tabulador Frecuencia(f) Acumulada Relativa (f.r) Relativa Inferencia
(f.a) Acumulada(f.r.a) =f*N/n

Es importante el manejo de redondeo donde debajo de .5 se conserva el número entero y mayor a .5 aumenta el
siguiente número entero.

a) Realiza la tabla de distribución de frecuencia.


b) Realiza la tabla de inferencia estadística.
c) Contesta las preguntas con inferencias.

1. ¿Cuántos alumnos tuvieron calificaciones menores de 80 puntos?


2. ¿Qué porcentaje de alumnos reprobaron?
3. ¿Cuál es el porcentaje que representan los alumnos con calificaciones de 90 puntos o menos?
4. ¿Cuántos alumnos podrán obtener una calificación igual a 70 puntos?
5. ¿Cuáles son las frecuencias aproximadas de los 400 alumnos?

Página 4
Manual de Usuario L.I Erik Francisco Gómez Silva

Ejercicio 1. (Alumno)

Se desea saber las edades en años cumplidos de jóvenes de secundaria en el municipio de Chichimila con 500
personas, por lo tanto se seleccionaron al azar 50 de ellos, registrando los siguientes datos:

12 13 12 17 14
13 13 17 12 13
13 13 16 12 13
14 16 15 13 14
12 16 15 14 15
15 15 14 14 15
15 14 13 14 16
12 12 12 14 13
12 13 13 13 13
14 13 13 15 15

a) Realiza la tabla de distribución de frecuencia.


b) Realiza la tabla de inferencia estadística.
c) Realiza 3 afirmaciones o cuestiones con inferencias.

3. DATOS AGRUPADOS EN TABLAS DE FRECUENCIAS. Una tabla de esta naturaleza se utiliza cuando el
rango es mayor y el número total de datos también, entonces indica que es posible que exista un número
mayor de datos diferentes entre sí, por lo tanto para simplificar su manejo, se agrupan en los llamados
intervalos de clase y su correspondiente amplitud o tamaño.

Para organizar los datos en intervalos de clase, aunque no existen reglas definidas se emplean
generalmente de cinco a quince clases.

PROCEDIMIENTO PARA CALCULAR EL NUMERO DE INTERVALOS Y AMPLITUD.

a) Determinar el valor de “n”.


b) Calcular el Rango Incluyente y Excluyente.
c) Dividir el rango entre un número impar o par tal que el cociente sea un entero y se aproxime a 15.
d) El cociente entero será el número de intervalos en clase.
e) El número par o impar seleccionado será la amplitud o tamaño de los intervalos.

Ejemplo: En una población de 700 personas se desea conocer las edades en años cumplidos y se han seleccionado
en forma aleatoria a 60 elementos, registrándose los siguientes datos:

22 13 20 16 24 18 10 15 33 17
3 14 8 27 32 25 23 28 7 27
19 32 18 29 22 26 14 25 27 14
9 24 14 35 15 30 18 33 35 21
23 13 20 4 17 32 10 16 31 12
9 14 11 37 12 19 17 20 21 15

Página 5
Manual de Usuario L.I Erik Francisco Gómez Silva

Calcular.

a) Numero de intervalos y amplitud


b) Tabla de distribución de frecuencias
c) Inferencia estadística

Intervalo Tabulación f f.a f.r f.r.a l.r.i l.r.s i.e

Interpretación de resultados

1. ¿Cuántos intervalos se utilizaron para la tabla de frecuencias?


2. ¿Cuántas personas se encuentran entre 28 y 32 años?
3. ¿Cuántas personas tienen 17 años o menos?
4. ¿Cuál es el porcentaje que representan las personas mayores 27 años?
5. Sabiendo que existen 12 personas de 18 y 22 años, entonces, ¿Cuántos habrá en la población?

CON RELACIÓN A LA TABLA DE FRECUENCIAS, TENEMOS LOS SIGUIENTES CONCEPTOS.

1. LIMITE DE CLASE. A los extremos de intervalos de clase, se les llama límite inferior y límite superior
respectivamente.
2. MARCA DE CLASE. Es el punto medio de la amplitud de los intervalos, y se determinan mediante la
semisuma de los Límites Reales o los Límites Inferiores o Superiores de clase.
3. AMPLITUD DE INTERVALO. El tamaño de clase se determina como la diferencia que existe entre los
Límites Reales.
4. LÍMITE REAL. Cuando los Límites de Clase se ajustan de tal manera que, el Límite Superior de un intervalo
coincida con el Límite Inferior del intervalo siguiente, se llama Límite Real.

REPRESENTACIÓN GRÁFICA.

Para un análisis más objetivo es conveniente representar el comportamiento de un conjunto de datos por
medio de graficas o diagramas adecuadas que resulten dar información más concisa y clara que una distribución
de frecuencias; podemos decir que las gráficas, los datos estadísticos se presentan en términos de magnitudes
interpretativas visualmente.

GRÁFICA EN DATOS ORDENADOS

a) Histograma: Es una gráfica compuesta de una serie de rectangulares. La frecuencia se ordena de acuerdo
al número mayor. La línea que comienza el rectángulo siempre empieza dejando un espacio y termina
aumentándole un dato más.

Página 6
Manual de Usuario L.I Erik Francisco Gómez Silva

Ejemplo:
16
x f 14
12
12 9
10
13 16
f 8
14 10 6
15 9 4
16 4 2
17 2
Datos

b) Polígono de Frecuencia. Es una gráfica que se obtiene uniendo por medio de un segmento de rectas los
puntos medios de las bases superiores de los rectángulos de un histograma.

Ejemplo:
16
x f 14
12
12 9
10
13 16
f 8
14 10 6
15 9 4
16 4 2
17 2
Datos

c) Pictograma. Es una gráfica que sustituye los polígonos de un histograma por figuras representativas.

Ejemplo:
16
x f 14
12
12 9
10
13 16
f 8
14 10 6
15 9 4
16 4 2
17 2
Datos

Página 7
Manual de Usuario L.I Erik Francisco Gómez Silva

d) Polígono Acumulativo. Es un diagrama escalonado y se obtiene para cada dato señalado un punto de
altura proporcional a su frecuencia acumulada, a partir de dichos puntos se dibujan escalones.

x f f.a 40
12 9 35
13 16 30
14 10 25
15 9 f.a 20
16 4 10
15
17 2
5

Datos

e) Disco grama o Diagrama de Pastel. Para este tipo de diagrama se utiliza para su representación el
área de una circunferencia, razón por la cual también es denominada grafica de sectores circulares.

Su fórmula es: Grados = (Circunferencia total / 100) * f.r

x f f.a Grados
12 9
13 16
14 10
15 9
16 4
17 2

GRAFICACIÓN DE EN DATOS AGRUPADOS EN CLASE

1) Histograma.

x f mc 15
3-7 3 12
8-12 8 f 9
13-17 15 6
18-22 12 3
23-27 10
28-32 7 mc
33-37 5

Página 8
Manual de Usuario L.I Erik Francisco Gómez Silva

2) Polígono de Frecuencia
3) Pictograma
4) Polígono Acumulativo (Ojiva)

x f l.r.s f.r.a
3-7 3
8-12 8
13-17 15
18-22 12
23-27 10
28-32 7
33-37 5

5) Diagrama de Pastel

MEDIDAS DE TENDENCIA CENTRAL. Las medidas de centralización se definen como los promedios o los puntos
de equilibrio de una población o muestra, por lo tanto su valor tiende a situarse en el centro de un conjunto de
datos ordenados según su magnitud.

Se establece diversos tipos de medidas de posición central, los más conocidos y usuales son los siguientes: LA
MEDIA ARITMETICA, LA MEDIANA Y LA MODA.

MEDIA ARITMÉTICA. El promedio aritmético es una medida de posición central que se obtiene sumando todos
los valores de las variables y dividiendo dicha suma entre el total de datos. Este tipo de media toma en cuenta los
valores que se encuentran en los extremos de los datos.

a) Media Aritmética en una colección de datos. En una colección de n datos x1, x2, x3, … xn el promedio de
xn se determina mediante la siguiente formula:

Ẋ= ∑ x
n
Página 9
Manual de Usuario L.I Erik Francisco Gómez Silva

Ejemplo:

Hallar la media aritmética de las siguientes calificaciones: 7,8,10,10,9,5

b) Media Aritmética en dato ordenado. Si los datos son x1, x2, x3, … xk se registran con frecuencia f1, f2, f3, …
fk, veces respectivamente, entonces la media aritmética se determina mediante la siguiente formula:

Ẋ= ∑ f.x
n

Ejemplo:

Calcular la media aritmética de las edades en años cumplidos de 60 personas de una asociación que
presentan problemas de maltrato familiar.

x f f.x
18 12
20 10
24 18
30 13
32 7

c) Media Aritmética de datos agrupados en clase. Si los datos agrupados en clase y Mc1, Mc2, Mc3, … Mcn,
representa los puntos medio de cada uno de los intervalos y se presentan con f1, f2, f3, … fk, entonces la media
aritmética se obtiene mediante la siguiente formula:

Ẋ= ∑ f. (mc)
n

Ejemplo:

Hallar la media aritmética de las calificaciones de un grupo de alumnos, teniendo en cuenta la siguiente
tabla.

x f mc f.(mc)
50-59 8
60-69 10
70-79 15
80-89 6
90-99 4

Página 10
Manual de Usuario L.I Erik Francisco Gómez Silva

MEDIANA. Es la medida de posición central que divide a la población o muestra en dos partes iguales:

a) Mediana en una colección de datos. Sea x1, x2, x3, … xn … una colección de n datos ordenados según su
magnitud, entonces la mediana es el valor del dato central si n es impar; o la media aritmética de los dos
valores centrales si n es par. Su fórmula es:

Si “n” es impar.

Ẋ= n+1 lugar
2

Si “n” es par.

Ẋ= n y el siguiente lugar
2

Ejemplo:

6,10,15,20,25,30,40,60,100

6,6,6,8,9,10,12,13,20,25,26,28

b) Mediana en datos ordenados. Si los valores x1, x2, x3, … xk aparecen con frecuencia f1, f2, f3, … fk,
respectivamente, entonces la media se termina empleando las dos definiciones anteriores.

Si “n” es impar.

Ẋ= n+1 lugar
2

Si “n” es par.

Ẋ= n y el siguiente lugar
2
Ejemplo:

x f f.a
50 8
60 10
70 15
80 12
90 5
100 4
Página 11
Manual de Usuario L.I Erik Francisco Gómez Silva

Ejercicio:

x f f.a
12 6
13 15
14 9
15 10
16 7
17 4

c) Mediana de datos agrupados en clase. Para determinar la mediana en datos agrupados en clases, se
utiliza la fórmula de interpolación lineal que se establece a continuación, además de las anteriores.

Formula l.r.i:

n - f.a.A
Ẋ= l.r.i 2 .i
f.m

Si “n” es impar.

Ẋ= n+1 lugar
2

Si “n” es par.

Ẋ= n y el siguiente lugar
2
Ejemplo:

x f f.a
50-59 8
60-69 10
70-79 15
80-89 6
90-100 4

Página 12
Manual de Usuario L.I Erik Francisco Gómez Silva

Ejercicio:

Las edades de años cumplidos de un grupo de atletas, en la siguiente. De la misma hallar la mediana.

x f f.a
15-19 10
20-24 12
25-29 6
30-34 8
35-39 15
40-44 6

MODA. Es el valor de la variable a la cual le corresponde la mayor frecuencia, es decir, es el valor común. La
definición indica que si la frecuencia son tales que la mayor de ellas, solamente corresponde a un dato, entonces
únicamente hay una moda, pero si, la frecuencia mayor corresponde a más de un dato, entonces hay más de una
moda, y si todos los datos tienen igual frecuencia, entonces conviene decir que los datos no tienen moda, por lo
tanto la moda puede existir, incluso si lo existe puede no ser única.

a) Moda en una colección de datos:

Ejemplos:

5,6,6,7,8,9,10

5,5,5,6,7,8,8,8,8,9,9,10

3,4,5,6,6,6,7,8,8,9,9,9,10,10

7,7,7,8,8,8,9,9,9,10,10,10

b) Moda en datos ordenados. Cuando los datos están organizados en tablas de frecuencias, se observa con
mayor facilidad el valor o los valores de mayor frecuencia a la cual corresponde la moda.

x f x f x f
5 8 50 11 12 2
6 10 60 4 13 2
7 15 70 3 14 2
8 12 80 15 15 2
9 4 90 8 16 2
10 3 100 15 17 2

Página 13
Manual de Usuario L.I Erik Francisco Gómez Silva

c) Moda en datos agrupados en clase. Si los datos aparecen en intervalos de clase, la moda se determina
utilizando la siguiente formula:

Ẋ= l.r.i + d1 .i
d1 + d2

d1= f. mayor – f. superior


d2= f. mayor – f. intermedia inferior

Ejemplo:

x f
50-59 4
60-69 6
70-79 12
80-89 5
90-100 3

Ejercicio:

x f
20-26 3
27-33 6
34-40 4
41-50 1
51-60 2
61-70 8

CUARTILES. Se denomina cuartiles a los valores que dividen a la población o muestra en 4 partes iguales,
denominados Q1, Q2, Q3, respectivamente. El valor de Q2 es equivalente a la mediana.

a) Cuartiles en una colección de datos. Para determinar los cuartiles en datos enlistados se utilizan las
siguientes definiciones.

Página 14
Manual de Usuario L.I Erik Francisco Gómez Silva

Si “n” es impar. Si “n” es par.

Q1 = n+1 lugar Q1 = n lugar


4 4

Q2 = n+1 lugar Q2 = n y el siguiente lugar


2 2

Q3 = 3(n+1) lugar Q3 = 3.n lugar


4 4

Ejemplo:

Hallar el Q1, Q2, Q3, de los siguientes datos.

8, 9, 10, 12, 15, 16, 18, 20, 23, 25, 30, 40.

b) Cuartiles ordenados en datos de frecuencia. Los cuartiles en datos ordenados en tablas de frecuencias, se
obtienen utilizando las definiciones anteriores. Del inciso a).

Ejemplo:

x f f.a
50 11
60 4
70 4
80 15
90 8
100 15

Página 15
Manual de Usuario L.I Erik Francisco Gómez Silva

c) Cuartiles en datos agrupados en clase. Para determinar Q1, Q2, Q3, se utilizan las fórmulas de interpolación
lineal que aparecen a continuación. Además de las formulas anteriores.

n
Q1= l.r.i + 4 - f.aA .i
fQ1

n
Q2= l.r.i + 2 - f.aA .i
fQ2

3.n
Q3= l.r.i + 4 - f.aA .i
fQ3

Ejemplo:

x f f.a
50-59 8
60-59 10
70-79 15
80-89 12
90-99 6

Página 16
Manual de Usuario L.I Erik Francisco Gómez Silva

Ejercicio: Calcular, la media aritmética, la mediana, la moda, cuartil 3.

x f f.a mc
8-14 13
15-21 12
22-28 15
29-35 17
36-42 20
43-49 8
50-56 10

MEDIDAS DE DISPERSIÓN. La magnitud en que los valores tienden a extenderse alrededor de un valor medio, se
llama dispersión o variación de datos.

Se utilizan distintos tipos de medidas de dispersión, entre los más usuales se encuentran los siguientes: rango,
desviación media, desviación típica o estándar, varianza.

1. RANGO. Es la diferencia entre el puntúale mayor y el puntaje menor de un conjunto de datos.

a) Rango en una colección de datos.

Ejemplo:

5, 6, 7, 8, 9, 10 rango= 10-5 = 5

b) Rango en datos ordenados.

x f
50 2
60 8
70 10
80 15
90 4
100 6

Página 17
Manual de Usuario L.I Erik Francisco Gómez Silva

c) Rango en datos agrupados en clase.

x F
13-18 6
19-24 4
25-30 3
31-36 10
37-42 8
43-48 2

2. DESVIACIÓN MEDIA. Es el promedio de las desviaciones de un conjunto de n datos, denominados X1, X2,
X3,…, Xn.

a) Desviación media en una colección de datos. La desviación media en datos enlistados se determina
empleando la siguiente formula:

D.M = ∑ | x – x |
n

Ejemplo:

Hallar la desviación media de los siguientes datos: 2, 3, 6, 8, 11.

ẋ= 30 = 6
5

D.M = |2-6| + |3-6| + |6-6| + |8-6| + |11-6| = 14 = 2.8


5 5

b) Desviación media de datos ordenados. Si X1, X2, X3,…, Xk. representan los valores cuya frecuencia son f1, f2,
f3,…, fk. respectivamente, entonces la desviación media se determina mediante la fórmula siguiente:

D.M = ∑ f. | x – x |
n

Página 18
Manual de Usuario L.I Erik Francisco Gómez Silva

Ejemplo:

Calcular la desviación media de las siguientes calificaciones:

x f f.x |x-ẋ| f. |x-ẋ|


50 4 200 22.85
60 8 480 12.85
70 12 840
80 10 800
90 6 540
100 2 200
42 3060
Med. = 3060/42 72.85

c) Desviación media en datos agrupados en clase. La desviación media en datos agrupados en clase,
donde mc1, mc2, mc3,…., mc7, representan los puntos medios de cada uno de los intervalos, y se representan
con f1, f2, f3,…, fk, respectivamente, entonces dicho valor se obtiene mediante la siguiente formula.

D.M = ∑ f. | mc – x |
n
Ejemplo:

Hallar la desviación media de edades en años cumplidos de un grupo de alumnos de la Modelo. De acuerdo
a la siguiente tabla.

x f m.c f.(mc) |mc-ẋ| f.|mc-ẋ|


50-59 4
60-69 8
70-79 12
80-89 10
90-99 6

Página 19
Manual de Usuario L.I Erik Francisco Gómez Silva

3. DESVIACÓN TIPICA O ESTANDAR. La desviación típica o estándar es la raíz cuadrada del cuadro medio
de las desviaciones de un conjunto de datos. Se representan por S o ơ.

La varianza de un conjunto de n datos, se define como el cuadrado de la desviación estándar.

a) Desviación estándar en una colección de datos. La desviación típica de una serie de n datos
representada por X1, X2, X3,…, Xn. se determina mediante la siguiente formula:

Desviación estándar.

∑(𝑥 − 𝑥̌)2
𝑆= √
𝑛

Varianza.

∑(𝑥 − 𝑥̌)2
𝑆2 =
𝑛

Ejemplo:

Hallar la desviación estándar y la varianza de los siguientes datos:

4, 5, 6, 7, 8

b) Desviación típica en datos ordenados en tablas de frecuencias. Cuando los datos están organizados
en tablas de frecuencias, sabiendo que X1, X2, X3,…, Xk. representan las variables con f1, f2, f3,…, fk, como
frecuencias, entonces dicho valor de obtiene con la formula siguiente:

Desviación estándar.

∑ 𝑓. (𝑥 − 𝑥̌)2
𝑆= √
𝑛

Varianza.

2
∑ 𝑓. (𝑥 − 𝑥̌)2
𝑆 =
𝑛

Página 20
Manual de Usuario L.I Erik Francisco Gómez Silva

Ejemplo:

Calcular la desviación típica y la varianza de las calificaciones que corresponden a un estudiante de 3°


Tercer cuatrimestre de psicología.

x f f.x (x-ẋ) (x-ẋ)2 f.(x-ẋ)2


5 2
6 4
7 5
8 10
9 8
10 6

c) Desviación estándar y varianza en datos agrupados en clase. Cuando los datos aparecen en
intervalos de clase f1, f2, f3,…, fk, son las frecuencias respectivas, entonces la seriación estándar se determina
mediante la fórmula siguiente:

Desviación estándar.

∑ 𝑓. (𝑚𝑐 − 𝑥̌)2
𝑆= √
𝑛

Varianza.

2
∑ 𝑓. (𝑚𝑐 − 𝑥̌)2
𝑆 =
𝑛

Ejemplo:

Hallar la desviación típica o estándar y la varianza de los salarios de trabajadores de la secretaría de


salud de Valladolid.

x f mc f.(mc) (mc-ẋ) (mc-ẋ)2 f.(mc-ẋ)2


100-140 8
141-180 10
181-220 15
221-260 9
261-300 6

Página 21
Manual de Usuario L.I Erik Francisco Gómez Silva

Ejercicio:

Distribución de frecuencias de los puntajes de CI de 150 estudiantes de Tercer Semestre de la Modelo.

x f
85-89 9
90-94 11
95-99 14
100-104 20
105-109 27
110-114 22
115-119 19
120-124 16
125-129 12

Página 22

Potrebbero piacerti anche