Estadística General - Carmelino.almestar - Villegas

Ing.
Carmelino Almestar Villegas
Tarapoto
2018
Presentación
El presente material fue elaborado pensando en los estudiantes que quieren

aprender Estadística de una forma práctica,
La Estadística estudia la organización de la información. Asimismo la Estadística

descriptiva es un conjunto de técnicas usadas para describir las características
fundamentales de los datos recolectados en un experimento o estudio
Las sesiones que incluye el presente módulo son: introducción a la estadística,

tablas de distribución de frecuencias y gráficos estadísticos, medidas de tendencia
central, medidas de posición y medidas de forma, medidas de dispersión y
estadística inferencial y probabilidades.
El presente módulo contiene una serie de ejercicios y casos propuestos, para que el
estudiante resuelva juntamente con las tutorías del docente de la materia.
El autor
CONTENIDO
Presentación ...................................................................................................... 2
Clase 1. Introducción a la Estadística ............................................................... 3
Clase 2: Tablas de distribución de frecuencias y gráficos estadísticos .............. 5
Clase 3. Medidas de tendencia central .............................................................. 9
Clase 4. Medidas de posición y medidas de forma .......................................... 12
Clase 5. Medidas de dispersión ....................................................................... 16
Clase 6. Estadística inferencial y probabilidades ............................................. 19
Referencias ...................................................................................................... 22
Clase 1. Introducción a la Estadística
La Estadística es una parte de la Matemática aplicada que proporciona

métodos para la recolección, organización, descripción, análisis e interpretación de
datos y para la utilización de los mismos en la toma de decisiones (Crespo, 1995,
citado por Madeiros, 2007).
Estadística es el conjunto de métodos o técnicas que permiten analizar un

conjunto de observaciones o datos (Baccini, 2010).
La Estadística descriptiva es un conjunto de técnicas usadas para describir

las características fundamentales de los datos recolectados en un experimento o
estudio (Corain, s.f.).
2. Desarrollo
A continuación se describen los conceptos fundamentales de la estadística:
2.1. Población
La población se define como la totalidad de los elementos o individuos que

tienen características similares y sobre los cuales se desean realizar inferencias o
generalizaciones (Vargas, 2007).
Al examinar un grupo cualquiera, considerando todos los elementos, estamos

tratando de la población o universo; esto no siempre es posible. En este caso,
examinamos una pequeña parte de la población llamada muestra (Madeiros, 2007).
2.2. Muestra
Es una parte seleccionada de la población objeto de estudio y sobre la cual se

van a realizar las mediciones (Vargas, 2007).
2.3. Variables y sus clasificaciones
Una variable es una característica observable o medible en un objeto o sujeto

de estudio, que puede adoptar diferentes valores o expresarse en varias categorías
(Vargas, 2007).
3
En la Figura 1 se muestra la clasificación de variables.
Figura 1. Clasificación de variables en estadística

Fuente: Vargas (2007)
3. Análisis de casos
Responder las siguientes cuestiones:
 Definir con sus propias palabras: Estadística, población, muestra

 Dar un ejemplo de cada clase de variable en el campo su carrera.
4
Clase 2: Tablas de distribución de frecuencias y gráficos estadísticos
2. Desarrollo
2.1. Frecuencia absoluta simple
Se llama así al número de veces que una observación aparece, en un

conjunto de valores observados. La suma de todas estas frecuencias es igual total
de datos observados. Se denota por la letra “efe” minúscula .
2.2. Frecuencia absoluta acumulada
Es igual a la suma de frecuencias absolutas simples inferiores o iguales a la

frecuencia absoluta acumulada que se quiere encontrar. Se denota por una “efe”
mayúscula. Para calcularla se emplea esta fórmula:
2.3. Frecuencia relativa simple
Es el cociente entre la frecuencia absoluta simple y el número total de

observaciones. La suma total de frecuencias relativas simples es igual a uno y se
denota por una “hache” minúscula. La fórmula a emplearse es:
2.4. Frecuencia relativa acumulada
Es igual a la suma de frecuencias relativas simples inferiores o iguales a la

frecuencia relativa acumulada que se quiere encontrar. Se denota por una “hache”
mayúscula. Para calcularla se emplea esta fórmula:
5
2.5. Frecuencia relativa simple porcentual
Es igual a la frecuencia relativa simple multiplicada por “100”. La suma de

frecuencias relativas porcentuales es igual a 100%. Se calcula así:
2.6. Frecuencia relativa acumulada porcentual
Es igual a la frecuencia relativa acumulada multiplicada por 100. Su fórmula

de cálculo es:
2.7. Distribución de frecuencias de una variable discreta
Es un arreglo de los valores observados de una variable (X1, X2,…, Xn) y sus
respectivas frecuencias. Para una variable discreta, la tabla de distribución de
frecuencias, es como sigue.
Valores de X fi Fi hi Hi hi% Hi %
X1 f1 F1 h1 H1 h1*100 H1*100
X2 f2 F2 h2 H2 h2*100 H2*100
. . . . . . .
. . . . . . .
. . . . . . .
xk fk FK=n hk Hk=1.00 hk*100 Hk=100%
Total n 1 100%
2.8. Distribución de frecuencias para datos agrupados
Es una tabla donde los datos originales se agrupan en intervalos de clase.
A continuación definiremos algunos términos:
 Intervalo de clase
Conformado por un límite inferior (LI) y un límite superior (LS).
 Amplitud de intervalo (C): Es la diferencia entre el LS y el LI.

 Marca de clase : Es la semisuma del LS y el LI.
2.9. Pasos para elaborar una tabla de distribución de frecuencias
 Rango (R)
Es la diferencia entre el valor máximo y el valor mínimo.
6
 Determinar el número de intervalos (k)
Se puede utilizar la regla de Sturges
Donde, n: Total de datos.
 Determinar la amplitud de intervalo (C): Se utiliza esta fórmula.
 Formación de los intervalos
Se forma el primer intervalo con el valor mínimo más la amplitud de intervalo.

Esto se va llenando en la tabla de distribución de frecuencias.
3. Asignación
3.1 Construir la tabla de distribución de frecuencias para los siguientes datos, que
representan las notas de 15 estudiantes de la asignatura Estadística I. Interpretar
también: f2, f4, F2, F3, h1, h4, H4, h1%, H2%
18 12 14 14 16 12 12 16 18 16 16 10 18 16 16
3.2 Se está realizando el control de calidad, para lo cual se pesa 10 productos,

dando como resultado los siguientes pesos en gramos: 100 99 100 98 99
99 102 102 99 98
Construir la tabla de distribución de frecuencias e interpretar lo siguiente: f 1, F2, F4,

h4, H3, h2%, H3%
3.3 Se tiene los ingresos diarios en soles, de 20 personas de cierta ciudad.
30 35 20 31 32 40 36 26 45 34
38 29 33 25 35 30 24 30 37 28
Construir la tabla de distribución de frecuencias e interpretar lo siguiente: f 1, F2, h4,

H3, h2%, H4%.
7
3.4 Los siguientes datos son las notas de Estadística I de 30 estudiantes de la
carrera profesional de Administración en el año 2018.
13 11 17 16 17
18 8 14 13 14
19 15 11 17 18
17 19 15 18 16
18 20 14 19 17
10 12 15 20 18
Construir la tabla de distribución de frecuencias e interpretar lo siguiente: f 6, F3, h6,

H4, h5%, H5%.
8
Clase 3. Medidas de tendencia central
Las medidas de tendencia central son estadísticos que permiten hallar el valor
numérico que indica el “centro” de un conjunto de datos, señalando la característica
que destaca en la información. Las medidas de tendencia central son: Media;
Mediana y Moda.
2. Desarrollo
2.1. La media o promedio aritmético ( )
Es el valor central más estable.
a) Media para datos no agrupados (en serie)
Para obtener la media se suma todos los datos y se divide entre el número de
datos que se han sumado.
b) Media para datos agrupados (en intervalos)
Para obtener la media, se sigue la fórmula:
2.2. La mediana (Me)
Es el estadígrafo que representa el punto medio de los datos, en el cual cae

el 50% de puntuaciones.
a) Mediana para datos no agrupados (en serie)
Es el valor medio si la serie de números es impar, o la semisuma de los

valores medios si la serie es par. Los datos deben estar ordenados en forma
creciente.
b) Mediana para datos agrupados (en intervalos)
Cuando se tiene datos agrupados en intervalos la mediana se obtiene con la

siguiente fórmula:
9
[ ]
Donde
: Límite inferior del intervalo de la clase mediana

: Amplitud interválica
: Número total de datos
: Frecuencia absoluta acumulada anterior a la clase mediana
: Frecuencia absoluta simple de la clase mediana
2.3. La moda (Mo)
Nos indica el valor o cualidad que se repite con mayor frecuencia dentro de la
información. Es útil cuando la variable en estudio es de escala nominal.
a) Moda para datos no agrupados (en serie)
Es el valor que más se repite en la serie.
b) Moda para datos agrupados (en intervalos)
Cuando se tiene datos agrupados en intervalos la moda se obtiene con la

siguiente fórmula:
[ ]
Donde:
: Límite inferior del intervalo de la clase mediana

3.1. Calcular la media, mediana y moda para los siguientes datos que representan
las notas de once estudiantes de la asignatura Estadística.
10 12 9 10 8 11 13 14 15 16 17
10
3.2. Se está realizando el control de calidad de un producto, para lo cual se pesa
diez muestras, dando como resultado los siguientes datos en gramos: 100 99
100 98 99 99 101 102 103 98. Calcular la media, mediana y moda.
3.3. La siguiente tabla, muestra las notas de 100 estudiantes que rindieron un
examen de admisión a la UNSM. La escala de puntaje es de 0 a 100.
Puntaje yi fi Fi yi *fi
0-20 10
20-40 20
40-60 40
60-80 20
80-100 10
TOTAL 100
Calcular la media, mediana y moda, e interpretar.
3.3. Los siguientes datos son las notas de Estadística de 30 estudiantes de la

carrera profesional de Administración en el año 2018 de la UPeU.
13 11 17 16 17
18 9 14 13 14
19 15 11 17 18
17 19 7 18 16
18 20 14 19 17
10 12 15 20 18
Calcular la media, mediana y moda, e interpretar.
11
Clase 4. Medidas de posición y medidas de forma
2. Desarrollo
2.1. Medidas de posición
Las medidas de posición son estadígrafos que dividen a la información en

partes iguales, pueden ser de tres clases: Cuartiles, deciles y percentiles.
2.2. Cuartiles
Dividen a la información en cuatro partes iguales y cada una se llama cuartil.

Cuando se tiene datos no agrupados los cuartiles 1 y 3 se calculan con las
siguientes fórmulas:
( )
( )
El cuartil 2 se calcula con la fórmula de la mediana.
Para datos agrupados se calcula mediante la siguiente fórmula.
[ ]
Donde:
: 1, 2 ó 3
: Límite inferior del intervalo de la clase cuartílica
: Frecuencia absoluta acumulada anterior a la clase cuartílica
: Frecuencia absoluta simple de la clase cuartílica.
a) Deciles
Dividen a la información en diez partes iguales y cada una se llama decil. Se

calcula mediante la siguiente fórmula.
[ ]
12
Donde:
: 1, 2, 3,..,9
: Límite inferior del intervalo de la clase decílica
: Frecuencia absoluta acumulada anterior a la clase decílica
: Frecuencia absoluta simple de la clase decílica.
b) Percentiles
Dividen a la información en 100 partes iguales y cada una se llama percentil.

Se calcula mediante la siguiente fórmula.
[ ]
Donde
: 1, 2, 3,..,99
: Límite inferior del intervalo de la clase percentílica
: Frecuencia absoluta acumulada anterior a la clase percentílica
: Frecuencia absoluta simple de la clase percentílica.
2.3. Medidas de forma
Son aquellas que permiten identificar la forma cómo están distribuidos los
datos.
2.4. Coeficiente de asimetría
Permite identificar hacia dónde se acumula la información. Se obtiene con

esta fórmula:
Donde
13
Decisión
2.5. Coeficiente de curtosis
Indica el grado de aplastamiento que tiene la distribución. Se calcula con esta

fórmula:
Donde:
Decisión:
3.1. Se tiene el ingreso de nueve trabajadores de la empresa X. Calcular los

cuartiles, D3, D4, D7, D9, P10, P31, P78, P90, P90.
3.2. Los siguientes datos son las notas de Estadística de 30 estudiantes de la

carrera profesional de Administración en el año 2018 de la UPeU.
14
13 11 17 16 17
18 9 14 13 14
19 15 11 17 18
17 19 7 18 16
18 20 14 19 17
10 12 15 20 18
Calcular Se tiene el ingreso de nueve trabajadores de la empresa X. Calcular los

cuartiles, D3, D4, D7, D9, P10, P31, P78, P90, P90, As y K.
3.3. Se tiene la siguiente tabla de frecuencias de los ingresos mensuales (en soles)
de 2000 personas en el distrito de Morales.
Ingreso Yi fi Fi Yi* fi Yi2 Yi2* fi
500-700 160
700-900 300
900-1100 1 000
1100-1300 400
1300-1500 140
TOTAL 2 000
Calcular e interpretar
 Q1, Q2, Q3
 D3, D7, D9
 P10, P37, P90
 As, K
15
Clase 5. Medidas de dispersión
Las medidas de dispersión son estadígrafos que miden el grado de concentración

o de dispersión de los valores de la variable, con respecto al promedio de la
distribución. Las principales medidas de dispersión son: varianza, desviación
estándar y coeficiente de variación.
2. Desarrollo
2.1. Rango (R)
Es la diferencia entre el valor máximo y el valor mínimo del conjunto de datos.

Su fórmula es:
2.2. Rango intercuartílico (RI)
Es la diferencia entre el cuartil 3 y el cuartil 1. Su fórmula es:
2.3. Varianza
Es una medida que cuantifica el grado de dispersión de los valores de una

variable, con respecto a su media aritmética.
 Si el valor de , es muy alto, se dice que los datos son dispersos.

 Si el valor de , es muy pequeño se dice que los datos son homogéneos.
2.4. Cálculo de la varianza para datos no agrupados
Para calcular la varianza con datos simples se utiliza la siguiente fórmula:
∑ ̅
Donde:
∑
ñ
̅
16
2.5. Cálculo de la varianza para datos agrupados
Para calcular la varianza con datos agrupados se utiliza la siguiente fórmula:
∑ ̅
Donde
ñ
̅
2.6. Desviación estándar
Es la raíz cuadrada de la varianza, cuya fórmula es:
√ .
Donde
2.7. Coeficiente de variación (CV)
Resulta de dividir la desviación estándar entre la media aritmética ̅ y

luego multiplicar por 100%. Su fórmula es:
 Si CV, es menor a 33% los datos son homogéneos.

 Si CV, es mayor a 33% los datos son heterogéneos.
3.1. Calcular e interpretar s2, s, cv, para los siguientes datos: 2, 4, 6, 8, 10

3.2. Calcular e interpretar s2, s, cv, para la siguiente serie de datos:
20, 10, 15, 12, 16, 16, 14, 12
17
3.3. Se tiene la siguiente tabla de frecuencias de los ingresos mensuales (en soles)
de 60 personas en el barrio Partido Alto.
Ingreso Yi fi Yi* fi Yi2 Yi2* fi
500-700 8
700-900 12
900-1100 16
1100-1300 10
1300-1500 14
Total 60
Calcular: s2, s, cv, e interpretar.

3.4. Los siguientes datos son los tiempos de duración (en meses) de 50 aparatos
electrónicos. Calcular: s2, s, cv, e interpretar
Duración Yi fi Yi* fi Yi2 Yi2* fi
1-6 7
6-11 20
11-16 12
16-21 11
Total 50
18
Clase 6. Estadística inferencial y probabilidades
1. Definición de términos
1.1. Estadística inferencial
Conjunto de métodos con los que se hace la generalización o la inferencia sobre una
población utilizando una muestra.
La inferencia puede contener conclusiones que pueden no ser ciertas en forma

absoluta, por lo que es necesario que éstas sean dadas con una medida de
confiabilidad que es la Probabilidad.
1.2. Población
Es el conjunto de elementos (personas, objetos, etc), que contienen una o más

características observables de naturaleza cualitativa o cuantitativa, que se pueden
medir en ellos.
1.3. Parámetros
Es una medida descriptiva que resume una característica de la población. Los más
utilizados son: µ y σ2.
1.4. Teoría de las probabilidades
Es una rama de las matemáticas que es eminentemente útil para las personas de
negocios. La evaluación de la información obtenida de las muestras depende de la
teoría de probabilidades.
Sabemos que la estadística representa un método para la toma de decisiones frente

a la incertidumbre y como tal se basa en la teoría de las probabilidades, pues la
probabilidad es la medida de la incertidumbre y de los riesgos asociados con ella.
2. Análisis de la teoría de probabilidades
2.1. Experimento aleatorio
Es todo proceso que consiste de la ejecución de un acto (o prueba) una o más

veces, cuyo resultado en cada prueba depende del azar y en consecuencia no se
puede predecir con certeza.
Ejemplo: Lanzar un dado y observar el número que aparece en la cara superior.
2.2. Espacio muestral

19
Es el conjunto no vacío, al que denotaremos por Ω, el cual contiene como elementos
todos los resultados posibles del experimento, dichos elementos son llamados
puntos muestrales.
2.3. Suceso o evento
Se denomina evento a cualquier subconjunto del espacio muestral. Se denota con

letras mayúsculas (A; B; C…)
Ejemplo: Obtener 3 puntos al lanzar un dado.
2.4. Probabilidad
Es una función que permite medir la incertidumbre de los sucesos aleatorios.
2.5. Fórmulas para determinar probabilidades
2.6. Probabilidad de un evento
Sea Ω, el espacio muestral asociado a un experimento aleatorio, la probabilidad del

evento A, es el número real P(A), que cumple lo siguiente:
2.7. Fórmula de probabilidad de un evento
2.8. Distribución normal
Es la distribución de mayor importancia, puesto que se presenta en muchos casos

reales como peso, talla, producción, etc. La distribución normal, tiene por parámetros
µ (media) y σ2 (varianza). La distribución normal estándar utiliza la tabla de
distribución normal estandarizada así como la siguiente fórmula:
3.1. Determine el espacio muestral al lanzar un dado y observar los resultados.
3.2. Determine el espacio muestral al lanzar 2 monedas y observar los resultados.
20
3.3. Determine el espacio muestral al lanzar un dado y una moneda
simultáneamente y observar los resultados.
3.4. Determine el espacio muestral al lanzar 2 dados y observar los resultados.
3.5. Se lanza un dado y se observa el resultado. Calcular la probabilidad de obtener:
a. 3 puntos
b. Al menos 5 puntos
c. Un número par
d. Un número mayor que seis
3.6. Se lanza dos monedas y se observa el resultado. Calcular la probabilidad de

obtener:
a. Ninguna cara
b. Una cara
c. Dos caras
d. Dos sellos
e. Cara y sello
3.7. Calcular la probabilidad de obtener un rey de un naipe de 52 cartas, al extraer

una carta al azar.
21
Referencias
Córdova, M. (2005). Estadística descriptiva e inferencial. Recuperado el 05 de

agosto de 2018 de https://es.slideshare.net/jhonyfern/estadistica-descriptiva-
e-inferencial-manuel-cordova-zamora-1
Rustom, A. (2012). Estadística descriptiva, probabilidad e inferencia. Recuperado el

05 de agosto de 2018 de
http://repositorio.uchile.cl/bitstream/handle/2250/120284/Rustom_Antonio_Est
adistica_descriptiva.pdf?sequence=1
22

Estadística General - Carmelino.almestar - Villegas

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Estadística General - Carmelino.almestar - Villegas

Caricato da

Copyright:

Formati disponibili

Ing.

Carmelino Almestar Villegas

El presente material fue elaborado pensando en los estudiantes que quieren

La Estadística estudia la organización de la información. Asimismo la Estadística

Las sesiones que incluye el presente módulo son: introducción a la estadística,

Clase 1. Introducción a la Estadística ............................................................... 3

Clase 2: Tablas de distribución de frecuencias y gráficos estadísticos .............. 5

Clase 3. Medidas de tendencia central .............................................................. 9

Clase 4. Medidas de posición y medidas de forma .......................................... 12

Clase 5. Medidas de dispersión ....................................................................... 16

Clase 6. Estadística inferencial y probabilidades ............................................. 19

La Estadística es una parte de la Matemática aplicada que proporciona

Estadística es el conjunto de métodos o técnicas que permiten analizar un

La Estadística descriptiva es un conjunto de técnicas usadas para describir

A continuación se describen los conceptos fundamentales de la estadística:

La población se define como la totalidad de los elementos o individuos que

Al examinar un grupo cualquiera, considerando todos los elementos, estamos

Es una parte seleccionada de la población objeto de estudio y sobre la cual se

2.3. Variables y sus clasificaciones

Una variable es una característica observable o medible en un objeto o sujeto

Figura 1. Clasificación de variables en estadística

Responder las siguientes cuestiones:

 Definir con sus propias palabras: Estadística, población, muestra

2.1. Frecuencia absoluta simple

Se llama así al número de veces que una observación aparece, en un

2.2. Frecuencia absoluta acumulada

Es igual a la suma de frecuencias absolutas simples inferiores o iguales a la

2.3. Frecuencia relativa simple

Es el cociente entre la frecuencia absoluta simple y el número total de

2.4. Frecuencia relativa acumulada

Es igual a la suma de frecuencias relativas simples inferiores o iguales a la

Es igual a la frecuencia relativa simple multiplicada por “100”. La suma de

2.6. Frecuencia relativa acumulada porcentual

Es igual a la frecuencia relativa acumulada multiplicada por 100. Su fórmula

2.7. Distribución de frecuencias de una variable discreta

Es una tabla donde los datos originales se agrupan en intervalos de clase.

A continuación definiremos algunos términos:

Conformado por un límite inferior (LI) y un límite superior (LS).

 Amplitud de intervalo (C): Es la diferencia entre el LS y el LI.

2.9. Pasos para elaborar una tabla de distribución de frecuencias

Es la diferencia entre el valor máximo y el valor mínimo.

Donde, n: Total de datos.

 Determinar la amplitud de intervalo (C): Se utiliza esta fórmula.

 Formación de los intervalos

Se forma el primer intervalo con el valor mínimo más la amplitud de intervalo.

3.2 Se está realizando el control de calidad, para lo cual se pesa 10 productos,

Construir la tabla de distribución de frecuencias e interpretar lo siguiente: f 1, F2, F4,

3.3 Se tiene los ingresos diarios en soles, de 20 personas de cierta ciudad.

Construir la tabla de distribución de frecuencias e interpretar lo siguiente: f 1, F2, h4,

Construir la tabla de distribución de frecuencias e interpretar lo siguiente: f 6, F3, h6,

2.1. La media o promedio aritmético ( )

Es el valor central más estable.

a) Media para datos no agrupados (en serie)

b) Media para datos agrupados (en intervalos)

Para obtener la media, se sigue la fórmula:

2.2. La mediana (Me)

Es el estadígrafo que representa el punto medio de los datos, en el cual cae

a) Mediana para datos no agrupados (en serie)

Es el valor medio si la serie de números es impar, o la semisuma de los

b) Mediana para datos agrupados (en intervalos)

Cuando se tiene datos agrupados en intervalos la mediana se obtiene con la

: Límite inferior del intervalo de la clase mediana

a) Moda para datos no agrupados (en serie)