Sei sulla pagina 1di 23

Ing.

Carmelino Almestar Villegas

Tarapoto

2018
Presentación

El presente material fue elaborado pensando en los estudiantes que quieren


aprender Estadística de una forma práctica,

La Estadística estudia la organización de la información. Asimismo la Estadística


descriptiva es un conjunto de técnicas usadas para describir las características
fundamentales de los datos recolectados en un experimento o estudio

Las sesiones que incluye el presente módulo son: introducción a la estadística,


tablas de distribución de frecuencias y gráficos estadísticos, medidas de tendencia
central, medidas de posición y medidas de forma, medidas de dispersión y
estadística inferencial y probabilidades.

El presente módulo contiene una serie de ejercicios y casos propuestos, para que el
estudiante resuelva juntamente con las tutorías del docente de la materia.

El autor
CONTENIDO

Presentación ...................................................................................................... 2

Clase 1. Introducción a la Estadística ............................................................... 3

Clase 2: Tablas de distribución de frecuencias y gráficos estadísticos .............. 5

Clase 3. Medidas de tendencia central .............................................................. 9

Clase 4. Medidas de posición y medidas de forma .......................................... 12

Clase 5. Medidas de dispersión ....................................................................... 16

Clase 6. Estadística inferencial y probabilidades ............................................. 19

Referencias ...................................................................................................... 22
Clase 1. Introducción a la Estadística

La Estadística es una parte de la Matemática aplicada que proporciona


métodos para la recolección, organización, descripción, análisis e interpretación de
datos y para la utilización de los mismos en la toma de decisiones (Crespo, 1995,
citado por Madeiros, 2007).

Estadística es el conjunto de métodos o técnicas que permiten analizar un


conjunto de observaciones o datos (Baccini, 2010).

La Estadística descriptiva es un conjunto de técnicas usadas para describir


las características fundamentales de los datos recolectados en un experimento o
estudio (Corain, s.f.).

2. Desarrollo

A continuación se describen los conceptos fundamentales de la estadística:

2.1. Población

La población se define como la totalidad de los elementos o individuos que


tienen características similares y sobre los cuales se desean realizar inferencias o
generalizaciones (Vargas, 2007).

Al examinar un grupo cualquiera, considerando todos los elementos, estamos


tratando de la población o universo; esto no siempre es posible. En este caso,
examinamos una pequeña parte de la población llamada muestra (Madeiros, 2007).

2.2. Muestra

Es una parte seleccionada de la población objeto de estudio y sobre la cual se


van a realizar las mediciones (Vargas, 2007).

2.3. Variables y sus clasificaciones

Una variable es una característica observable o medible en un objeto o sujeto


de estudio, que puede adoptar diferentes valores o expresarse en varias categorías
(Vargas, 2007).
3
En la Figura 1 se muestra la clasificación de variables.

Figura 1. Clasificación de variables en estadística


Fuente: Vargas (2007)

3. Análisis de casos

Responder las siguientes cuestiones:

 Definir con sus propias palabras: Estadística, población, muestra


 Dar un ejemplo de cada clase de variable en el campo su carrera.

4
Clase 2: Tablas de distribución de frecuencias y gráficos estadísticos

2. Desarrollo

2.1. Frecuencia absoluta simple

Se llama así al número de veces que una observación aparece, en un


conjunto de valores observados. La suma de todas estas frecuencias es igual total
de datos observados. Se denota por la letra “efe” minúscula .

2.2. Frecuencia absoluta acumulada

Es igual a la suma de frecuencias absolutas simples inferiores o iguales a la


frecuencia absoluta acumulada que se quiere encontrar. Se denota por una “efe”
mayúscula. Para calcularla se emplea esta fórmula:

2.3. Frecuencia relativa simple

Es el cociente entre la frecuencia absoluta simple y el número total de


observaciones. La suma total de frecuencias relativas simples es igual a uno y se
denota por una “hache” minúscula. La fórmula a emplearse es:

2.4. Frecuencia relativa acumulada

Es igual a la suma de frecuencias relativas simples inferiores o iguales a la


frecuencia relativa acumulada que se quiere encontrar. Se denota por una “hache”
mayúscula. Para calcularla se emplea esta fórmula:

5
2.5. Frecuencia relativa simple porcentual

Es igual a la frecuencia relativa simple multiplicada por “100”. La suma de


frecuencias relativas porcentuales es igual a 100%. Se calcula así:

2.6. Frecuencia relativa acumulada porcentual

Es igual a la frecuencia relativa acumulada multiplicada por 100. Su fórmula


de cálculo es:

2.7. Distribución de frecuencias de una variable discreta

Es un arreglo de los valores observados de una variable (X1, X2,…, Xn) y sus
respectivas frecuencias. Para una variable discreta, la tabla de distribución de
frecuencias, es como sigue.

Valores de X fi Fi hi Hi hi% Hi %
X1 f1 F1 h1 H1 h1*100 H1*100
X2 f2 F2 h2 H2 h2*100 H2*100
. . . . . . .
. . . . . . .
. . . . . . .
xk fk FK=n hk Hk=1.00 hk*100 Hk=100%
Total n 1 100%
2.8. Distribución de frecuencias para datos agrupados

Es una tabla donde los datos originales se agrupan en intervalos de clase.

A continuación definiremos algunos términos:

 Intervalo de clase

Conformado por un límite inferior (LI) y un límite superior (LS).

 Amplitud de intervalo (C): Es la diferencia entre el LS y el LI.


 Marca de clase : Es la semisuma del LS y el LI.

2.9. Pasos para elaborar una tabla de distribución de frecuencias

 Rango (R)

Es la diferencia entre el valor máximo y el valor mínimo.

6
 Determinar el número de intervalos (k)
Se puede utilizar la regla de Sturges

Donde, n: Total de datos.

 Determinar la amplitud de intervalo (C): Se utiliza esta fórmula.

 Formación de los intervalos

Se forma el primer intervalo con el valor mínimo más la amplitud de intervalo.


Esto se va llenando en la tabla de distribución de frecuencias.

3. Asignación

3.1 Construir la tabla de distribución de frecuencias para los siguientes datos, que
representan las notas de 15 estudiantes de la asignatura Estadística I. Interpretar
también: f2, f4, F2, F3, h1, h4, H4, h1%, H2%

18 12 14 14 16 12 12 16 18 16 16 10 18 16 16

3.2 Se está realizando el control de calidad, para lo cual se pesa 10 productos,


dando como resultado los siguientes pesos en gramos: 100 99 100 98 99
99 102 102 99 98

Construir la tabla de distribución de frecuencias e interpretar lo siguiente: f 1, F2, F4,


h4, H3, h2%, H3%

3.3 Se tiene los ingresos diarios en soles, de 20 personas de cierta ciudad.

30 35 20 31 32 40 36 26 45 34
38 29 33 25 35 30 24 30 37 28

Construir la tabla de distribución de frecuencias e interpretar lo siguiente: f 1, F2, h4,


H3, h2%, H4%.

7
3.4 Los siguientes datos son las notas de Estadística I de 30 estudiantes de la
carrera profesional de Administración en el año 2018.

13 11 17 16 17
18 8 14 13 14
19 15 11 17 18
17 19 15 18 16
18 20 14 19 17
10 12 15 20 18

Construir la tabla de distribución de frecuencias e interpretar lo siguiente: f 6, F3, h6,


H4, h5%, H5%.

8
Clase 3. Medidas de tendencia central

Las medidas de tendencia central son estadísticos que permiten hallar el valor
numérico que indica el “centro” de un conjunto de datos, señalando la característica
que destaca en la información. Las medidas de tendencia central son: Media;
Mediana y Moda.

2. Desarrollo

2.1. La media o promedio aritmético ( )

Es el valor central más estable.

a) Media para datos no agrupados (en serie)

Para obtener la media se suma todos los datos y se divide entre el número de
datos que se han sumado.

b) Media para datos agrupados (en intervalos)

Para obtener la media, se sigue la fórmula:

2.2. La mediana (Me)

Es el estadígrafo que representa el punto medio de los datos, en el cual cae


el 50% de puntuaciones.

a) Mediana para datos no agrupados (en serie)

Es el valor medio si la serie de números es impar, o la semisuma de los


valores medios si la serie es par. Los datos deben estar ordenados en forma
creciente.

b) Mediana para datos agrupados (en intervalos)

Cuando se tiene datos agrupados en intervalos la mediana se obtiene con la


siguiente fórmula:

9
[ ]

Donde

: Límite inferior del intervalo de la clase mediana


: Amplitud interválica
: Número total de datos
: Frecuencia absoluta acumulada anterior a la clase mediana
: Frecuencia absoluta simple de la clase mediana
2.3. La moda (Mo)

Nos indica el valor o cualidad que se repite con mayor frecuencia dentro de la
información. Es útil cuando la variable en estudio es de escala nominal.

a) Moda para datos no agrupados (en serie)

Es el valor que más se repite en la serie.

b) Moda para datos agrupados (en intervalos)

Cuando se tiene datos agrupados en intervalos la moda se obtiene con la


siguiente fórmula:

[ ]

Donde:

: Límite inferior del intervalo de la clase mediana


: Amplitud interválica

3. Análisis de casos

3.1. Calcular la media, mediana y moda para los siguientes datos que representan
las notas de once estudiantes de la asignatura Estadística.

10 12 9 10 8 11 13 14 15 16 17

10
3.2. Se está realizando el control de calidad de un producto, para lo cual se pesa
diez muestras, dando como resultado los siguientes datos en gramos: 100 99
100 98 99 99 101 102 103 98. Calcular la media, mediana y moda.

3.3. La siguiente tabla, muestra las notas de 100 estudiantes que rindieron un
examen de admisión a la UNSM. La escala de puntaje es de 0 a 100.

Puntaje yi fi Fi yi *fi
0-20 10
20-40 20
40-60 40
60-80 20
80-100 10
TOTAL 100

Calcular la media, mediana y moda, e interpretar.

3.3. Los siguientes datos son las notas de Estadística de 30 estudiantes de la


carrera profesional de Administración en el año 2018 de la UPeU.
13 11 17 16 17
18 9 14 13 14
19 15 11 17 18
17 19 7 18 16
18 20 14 19 17
10 12 15 20 18

Calcular la media, mediana y moda, e interpretar.

11
Clase 4. Medidas de posición y medidas de forma

2. Desarrollo

2.1. Medidas de posición

Las medidas de posición son estadígrafos que dividen a la información en


partes iguales, pueden ser de tres clases: Cuartiles, deciles y percentiles.

2.2. Cuartiles

Dividen a la información en cuatro partes iguales y cada una se llama cuartil.


Cuando se tiene datos no agrupados los cuartiles 1 y 3 se calculan con las
siguientes fórmulas:

( )

( )

El cuartil 2 se calcula con la fórmula de la mediana.

Para datos agrupados se calcula mediante la siguiente fórmula.

[ ]

Donde:

: 1, 2 ó 3
: Límite inferior del intervalo de la clase cuartílica
: Amplitud interválica
: Número total de datos
: Frecuencia absoluta acumulada anterior a la clase cuartílica
: Frecuencia absoluta simple de la clase cuartílica.

a) Deciles

Dividen a la información en diez partes iguales y cada una se llama decil. Se


calcula mediante la siguiente fórmula.

[ ]

12
Donde:

: 1, 2, 3,..,9
: Límite inferior del intervalo de la clase decílica
: Amplitud interválica
: Número total de datos
: Frecuencia absoluta acumulada anterior a la clase decílica
: Frecuencia absoluta simple de la clase decílica.

b) Percentiles

Dividen a la información en 100 partes iguales y cada una se llama percentil.


Se calcula mediante la siguiente fórmula.

[ ]

Donde

: 1, 2, 3,..,99
: Límite inferior del intervalo de la clase percentílica
: Amplitud interválica
: Número total de datos
: Frecuencia absoluta acumulada anterior a la clase percentílica
: Frecuencia absoluta simple de la clase percentílica.
2.3. Medidas de forma

Son aquellas que permiten identificar la forma cómo están distribuidos los
datos.

2.4. Coeficiente de asimetría

Permite identificar hacia dónde se acumula la información. Se obtiene con


esta fórmula:

Donde

13
Decisión

2.5. Coeficiente de curtosis

Indica el grado de aplastamiento que tiene la distribución. Se calcula con esta


fórmula:

Donde:

Decisión:

3. Análisis de casos

3.1. Se tiene el ingreso de nueve trabajadores de la empresa X. Calcular los


cuartiles, D3, D4, D7, D9, P10, P31, P78, P90, P90.

3.2. Los siguientes datos son las notas de Estadística de 30 estudiantes de la


carrera profesional de Administración en el año 2018 de la UPeU.

14
13 11 17 16 17
18 9 14 13 14
19 15 11 17 18
17 19 7 18 16
18 20 14 19 17
10 12 15 20 18

Calcular Se tiene el ingreso de nueve trabajadores de la empresa X. Calcular los


cuartiles, D3, D4, D7, D9, P10, P31, P78, P90, P90, As y K.

3.3. Se tiene la siguiente tabla de frecuencias de los ingresos mensuales (en soles)
de 2000 personas en el distrito de Morales.
Ingreso Yi fi Fi Yi* fi Yi2 Yi2* fi
500-700 160
700-900 300
900-1100 1 000
1100-1300 400
1300-1500 140
TOTAL 2 000

Calcular e interpretar
 Q1, Q2, Q3
 D3, D7, D9
 P10, P37, P90
 As, K

15
Clase 5. Medidas de dispersión

Las medidas de dispersión son estadígrafos que miden el grado de concentración


o de dispersión de los valores de la variable, con respecto al promedio de la
distribución. Las principales medidas de dispersión son: varianza, desviación
estándar y coeficiente de variación.

2. Desarrollo

2.1. Rango (R)

Es la diferencia entre el valor máximo y el valor mínimo del conjunto de datos.


Su fórmula es:

2.2. Rango intercuartílico (RI)

Es la diferencia entre el cuartil 3 y el cuartil 1. Su fórmula es:

2.3. Varianza

Es una medida que cuantifica el grado de dispersión de los valores de una


variable, con respecto a su media aritmética.

 Si el valor de , es muy alto, se dice que los datos son dispersos.


 Si el valor de , es muy pequeño se dice que los datos son homogéneos.
2.4. Cálculo de la varianza para datos no agrupados

Para calcular la varianza con datos simples se utiliza la siguiente fórmula:

∑ ̅

Donde:

ñ
̅

16
2.5. Cálculo de la varianza para datos agrupados

Para calcular la varianza con datos agrupados se utiliza la siguiente fórmula:

∑ ̅

Donde

ñ
̅

2.6. Desviación estándar

Es la raíz cuadrada de la varianza, cuya fórmula es:

√ .

Donde

2.7. Coeficiente de variación (CV)

Resulta de dividir la desviación estándar entre la media aritmética ̅ y


luego multiplicar por 100%. Su fórmula es:

 Si CV, es menor a 33% los datos son homogéneos.


 Si CV, es mayor a 33% los datos son heterogéneos.

3. Análisis de casos

3.1. Calcular e interpretar s2, s, cv, para los siguientes datos: 2, 4, 6, 8, 10


3.2. Calcular e interpretar s2, s, cv, para la siguiente serie de datos:
20, 10, 15, 12, 16, 16, 14, 12

17
3.3. Se tiene la siguiente tabla de frecuencias de los ingresos mensuales (en soles)
de 60 personas en el barrio Partido Alto.
Ingreso Yi fi Yi* fi Yi2 Yi2* fi
500-700 8
700-900 12
900-1100 16
1100-1300 10
1300-1500 14
Total 60

Calcular: s2, s, cv, e interpretar.


3.4. Los siguientes datos son los tiempos de duración (en meses) de 50 aparatos
electrónicos. Calcular: s2, s, cv, e interpretar
Duración Yi fi Yi* fi Yi2 Yi2* fi
1-6 7
6-11 20
11-16 12
16-21 11
Total 50

18
Clase 6. Estadística inferencial y probabilidades

1. Definición de términos

1.1. Estadística inferencial

Conjunto de métodos con los que se hace la generalización o la inferencia sobre una
población utilizando una muestra.

La inferencia puede contener conclusiones que pueden no ser ciertas en forma


absoluta, por lo que es necesario que éstas sean dadas con una medida de
confiabilidad que es la Probabilidad.

1.2. Población

Es el conjunto de elementos (personas, objetos, etc), que contienen una o más


características observables de naturaleza cualitativa o cuantitativa, que se pueden
medir en ellos.

1.3. Parámetros

Es una medida descriptiva que resume una característica de la población. Los más
utilizados son: µ y σ2.

1.4. Teoría de las probabilidades

Es una rama de las matemáticas que es eminentemente útil para las personas de
negocios. La evaluación de la información obtenida de las muestras depende de la
teoría de probabilidades.

Sabemos que la estadística representa un método para la toma de decisiones frente


a la incertidumbre y como tal se basa en la teoría de las probabilidades, pues la
probabilidad es la medida de la incertidumbre y de los riesgos asociados con ella.

2. Análisis de la teoría de probabilidades

2.1. Experimento aleatorio

Es todo proceso que consiste de la ejecución de un acto (o prueba) una o más


veces, cuyo resultado en cada prueba depende del azar y en consecuencia no se
puede predecir con certeza.

Ejemplo: Lanzar un dado y observar el número que aparece en la cara superior.

2.2. Espacio muestral


19
Es el conjunto no vacío, al que denotaremos por Ω, el cual contiene como elementos
todos los resultados posibles del experimento, dichos elementos son llamados
puntos muestrales.

2.3. Suceso o evento

Se denomina evento a cualquier subconjunto del espacio muestral. Se denota con


letras mayúsculas (A; B; C…)

Ejemplo: Obtener 3 puntos al lanzar un dado.

2.4. Probabilidad

Es una función que permite medir la incertidumbre de los sucesos aleatorios.

2.5. Fórmulas para determinar probabilidades

2.6. Probabilidad de un evento

Sea Ω, el espacio muestral asociado a un experimento aleatorio, la probabilidad del


evento A, es el número real P(A), que cumple lo siguiente:

2.7. Fórmula de probabilidad de un evento

2.8. Distribución normal

Es la distribución de mayor importancia, puesto que se presenta en muchos casos


reales como peso, talla, producción, etc. La distribución normal, tiene por parámetros
µ (media) y σ2 (varianza). La distribución normal estándar utiliza la tabla de
distribución normal estandarizada así como la siguiente fórmula:

3. Análisis de casos

3.1. Determine el espacio muestral al lanzar un dado y observar los resultados.

3.2. Determine el espacio muestral al lanzar 2 monedas y observar los resultados.

20
3.3. Determine el espacio muestral al lanzar un dado y una moneda
simultáneamente y observar los resultados.

3.4. Determine el espacio muestral al lanzar 2 dados y observar los resultados.

3.5. Se lanza un dado y se observa el resultado. Calcular la probabilidad de obtener:

a. 3 puntos
b. Al menos 5 puntos
c. Un número par
d. Un número mayor que seis

3.6. Se lanza dos monedas y se observa el resultado. Calcular la probabilidad de


obtener:

a. Ninguna cara
b. Una cara
c. Dos caras
d. Dos sellos
e. Cara y sello

3.7. Calcular la probabilidad de obtener un rey de un naipe de 52 cartas, al extraer


una carta al azar.

21
Referencias

Córdova, M. (2005). Estadística descriptiva e inferencial. Recuperado el 05 de


agosto de 2018 de https://es.slideshare.net/jhonyfern/estadistica-descriptiva-
e-inferencial-manuel-cordova-zamora-1

Rustom, A. (2012). Estadística descriptiva, probabilidad e inferencia. Recuperado el


05 de agosto de 2018 de
http://repositorio.uchile.cl/bitstream/handle/2250/120284/Rustom_Antonio_Est
adistica_descriptiva.pdf?sequence=1

22

Potrebbero piacerti anche