Sei sulla pagina 1di 56

ESTADISTICA

UNIDAD 1: INTRODUCCIÓN A LA
ESTADISTICA DESCRIPTIVA
Definición de
Estadística

Conjunto de teorías y métodos que han sido


desarrollados para tratar la recopilación, organización
y análisis de datos o hechos numéricos, con el fin de
sacar conclusiones. (Esperanza Moret)
Clasificación de la Estadística
Estadística Descriptiva.
Tiene por objetivo fundamental la
descripción numérica de un conjunto de
datos. No generaliza las conclusiones
obtenidas a otros grupos de datos.
Según el tipo de
investigación
Estadística Inferencial.
Usa la información aportada por una
muestra para sacar conclusiones de la
población de la cual ha sido extraída;
siempre recordando que existe la
probabilidad de hacerlo en forma errada
Universo y Población
Algunos autores no establecen diferencias entre los conceptos de
universo y población. Por ejemplo, Pardo Merino, propone la
siguiente definición: “Una población (o universo) es un conjunto
de elementos (sujetos, objetos, entidades abstractas, etc.) que
poseen una o más características específicas en común.”
Por el contrario, otros autores si establecen
diferencias entre tales conceptos.
Población, universo y muestra

Universo: se define como el conjunto de sujetos o elementos


que tienen una característica común, observable y susceptible de
ser medida.

Población: conjunto de todas las mediciones u observaciones


hechas sobre una o varias de las características de los
elementos del universo.

Muestra: subconjunto de elementos del universo o la


población.
Ejemplo
Universo Población

• Edad
Estudiantes
regulares del • Rendimiento

Instituto de • Carrera
Estudios • Ingresos
Universitarios.
Etc.
Variables. Clasificación.
Variable: característica de un sujeto u objeto que varía de un
elemento a otro.
Las variables se pueden clasificar de acuerdo al nivel de
medición.
Escala Nominal

Escalas Escala Ordinal


de
medición Escala de Intervalo

Escala de Razón
Escala Nominal
1. Se clasifica a los sujetos en categorías, mutuamente
excluyentes y totalmente exhaustivas, tal que todos los
sujetos clasificados en la misma categoría son equivalentes
respecto a la variable que se está midiendo.
2. Sólo tiene sentido la relación de igualdad-desigualdad.
3. Se pueden usar números, letras o símbolos para identificar a
cada categoría de la variable.
4. No se puede realizar ninguna operación aritmética en esta
escala.
Escala Nominal
Algunos ejemplos de variables medidas en la escala nominal:

Masculino M
Género
Femenino F

Soltero 1

Estado Casado 2
civil Divorciado 3
Viudo 4
Escala Ordinal

1. Se usa cuando es posible establecer una relación de orden


entre las distintas categorías de la variable. Es decir,
prevalece la relación de orden “mayor que” (>).
2. Se pueden usar letras o números para identificar a cada
categoría de la variable. Los números o letras usados deben
reflejar el orden de las categorías.
3. No se pueden realizar operaciones aritméticas entre los
números asignados a las distintas categorías. Tales números
solo reflejan una relación de orden.
Escala Ordinal
Dos ejemplos de variables medidas en la escala ordinal:

Preescolar 1

Nivel de Educación Básica 2


Instrucción Media y Diversificada 3
Superior 4
Escala Ordinal

Mala D

Calidad de Regular C
un servicio Buena B
Excelente A
Escala de Intervalo.

1. Posee una unidad de medida constante y arbitraria.


2. Posee un cero “arbitrario”, es decir, no indica la
ausencia de la característica que se está midiendo.
3. Prevalece la relación de orden “mayor que” (>).
4. Entre los valores de la variable solo es posible
realizar la suma y la resta como operaciones
aritméticas.
Escala de Intervalo
Tres ejemplos de variables medidas en una escala de
intervalo:
1. La temperatura de una ciudad medida en grados
Fahrenheit o Celsius.
2. La altura de las ciudades usando como referencia
el nivel del mar.
3. El rendimiento académico medido en una escala
del 0 al 10.
Para cada variable mencionada el cero es “arbitrario”.
Escala de Razón.
1. Posee una unidad de medida constante y
arbitraria.
2. Posee un cero “absoluto”, es decir, este valor
indica la ausencia de la característica que se está
midiendo.
3. Prevalece la relación de orden “mayor que” (>).
4. Se pueden realizar todas las operaciones
aritméticas entre los valores de la variable.
Escala de Razón

Algunas variables medidas en la escala de razón:


1. Edad.
2. Peso.
3. Estatura.
4. Tiempo invertido por un estudiante en realizar una
tarea.
5. Ingreso familiar.
DESCRIPCIÓN DE LOS
DATOS

DISTRIBUCIONES DE
FRECUENCIAS Y
REPRESENTACIONES
GRÁFICAS
DISTRIBUCIÓN DE FRECUENCIAS
Agrupamiento de datos en categorías
mutuamente excluyentes que indican el
número de observaciones en cada
categoria

Estadística I 18
EJEMPLO

Los siguientes datos obtenidos de una muestra


de hogares presentan las cantidades semanales
(en USD) que se gastan en comestibles (n=45)

271 363 159 76 227 337 295 319 250


279 205 279 266 199 177 162 232 303
192 181 321 309 246 278 50 41 335
116 100 151 240 474 297 170 188 320
429 294 570 342 279 235 434 123 325

Estadística I 19
Pasos…
1.Determinar el número de clases k
2k  n
El número de clases es la menor potencia a la que se eleva 2 de tal
manera que el resultado sea igual o próximo mayor que el número de
datos n

Ejemplo:

5 6
2  32 2  64
64  45
6 clases

Estadística I 20
Pasos…
2. Determinar el intervalo o amplitud de
clase
i = ancho del intervalo de clase
HL
i  H = mayor valor observado
k L = menor valor observado
k = número de clases

Ejemplo:
271 363 159 76 227 337 295 319 250
279 205 279 266 199 177 162 232 L 303
192 181 321 309 246 278 50 41 335
116 100 151 240 474 297 170 188 320
429 294 570 342 279 235 434 123 325
H
21
Pasos…
2. Determinar el intervalo o amplitud de clase
Ejemplo:

570  41
i   88,17  90
6
En la práctica este valor se redondea hacia arriba o algún
múltiplo de 10 o 100

El ancho de cada
clase será de 90

Estadística I
Pasos…
3. Establecer los límites de cada clase
• Límites nominales: indican valores incluidos en la clase
• Límites exactos: puntos específicos para separar clases adyacentes en una escala de
medición continua

Ejemplo: Tomando en cuenta limites exactos

Gatos en
comestibles
(USD)
{40, 130) Ls  Li  i 40 + 90
{130, 220)
{220, 310)
{310, 400) i  Ls  Li
{400, 490)
{490, 580)
Pasos…
4. Contar el número de elementos en cada clase

FECUENCIA: Número de observaciones en cada clase

Gatos en
Ejemplo: comestibles Hogares en cada clase FRECUENCIA
(USD)
{40, 130) IIIII I 6
{130, 220) IIIII IIIII 10
{220, 310) IIIII IIIII IIIII II 17
{310, 400) IIIII III 8
{400, 490) III 3
{490, 580) I 1
45

Estadística I
¿Cuántos hogares
gastan semanalmente en
comestibles entre 220 y 310
Gatos en USD?
comestibles FRECUENCIA
(USD)
{40, 130) 6
{130, 220) 10 Nos valemos de la
{220, 310) 17
{310, 400) 8
frecuencia absoluta:
{400, 490) 3 Son 17 hogares
{490, 580) 1
45
Marcas de Clase

Es el punto medio de cada clase. Se lo encuentra al


sumar límite inferior y superior de la clase, y
dividiendo el resultado entre dos
Xm 
Ls  Li 
Ejemplo: 2
Gatos en
MARCA DE
comestibles FRECUENCIA
CLASE
(USD)
{40, 130) 6 85
{130, 220) 10 175
220  310 530
{220, 310) 17 265 Xm    265
2 2
{310, 400) 8 355
{400, 490) 3 445
{490, 580) 1 535
45

Estadística I
Distribución de frecuencias relativas
• Se convierte la frecuencia en porcentaje
• Cada frecuencia de clase se divide entre el
número total de observaciones f
fr 
n
Ejemplo:

Gatos en
FRECUENCIA
comestibles FRECUENCIA
RELATIVA
(USD)
{40, 130) 6 0,13
{130, 220) 10 0,22 17
{220, 310) 17 0,38 fr   0,38
45
{310, 400) 8 0,18
{400, 490) 3 0,07
{490, 580) 1 0,02
45 1,00

Estadística I 27
Gatos en
FRECUENCIA
comestibles FRECUENCIA
RELATIVA ¿Qué
(USD)
porcentaje de hogares
{40, 130) 6 0,13 gastan semanalmente
{130, 220) 10 0,22 en comestibles entre
{220, 310) 17 0,38 310 y 400 USD?

{310, 400) 8 0,18 Nos valemos de


{400, 490) 3 0,07 la frecuencia relativa:
{490, 580) 1 0,02 El 18% de
45 1,00 los hogares

Estadística I 28
Frecuencias acumuladas y relativas acumuladas
• Se basa en el principio de “o más” o “y menor que”
• Es la suma de frecuencias a partir del menor valor de la variable

f
Ejemplo: fr 
n
Gatos en FRECUENCIA
FRECUENCIA FRECUENCIA
comestibles FRECUENCIA RELATIVA
ACUMULADA RELATIVA
(USD) ACUMULADA
{40, 130) 6 6 0,13 0,13
0,13  0,22
{130, 220) 10 16 0,22 0,35
{220, 310) 17 33 0,38 0,73 0,35  0,38
{310, 400) 8 41 0,18 0,91 0,73  0,18
{400, 490) 3 44 0,07 0,98 0,91 0,07
{490, 580) 1 45 0,02 1 0,98  0,02
45 1,00

Estadística I 29
Gatos en FRECUENCIA ¿Cuántos hogares gastan
FRECUENCIA FRECUENCIA semanalmente en comestibles
comestibles FRECUENCIA RELATIVA
ACUMULADA RELATIVA menos de 220 USD?
(USD) ACUMULADA

{40, 130) 6 6 0,13 0,13


Nos valemos de la frecuencia
{130, 220) 10 16 0,22 0,35 absoluta acumulada:
{220, 310) 17 33 0,38 0,73
16 hogares
{310, 400) 8 41 0,18 0,91
{400, 490) 3 44 0,07 0,98 ¿Qué porcentaje de hogares gastan
{490, 580) 1 45 0,02 1 semanalmente en comestibles
45 1,00 menos de 400 USD?

Nos valemos de la frecuencia


relativa:
El 91% de los hogares
Representación gráfica de distribuciones de
frecuencias
HISTOGRAMA: clases en el eje horizontal y frecuencias en
el eje vertical

Estadística I 31
Representación gráfica de distribuciones de
frecuencias
POLÍGONO DE FRECUENCIAS: relaciona marcas de
clase y frecuencias

Estadística I
Gráficas de líneas

Cambio de una variable a través del tiempo

Estadística I 33
Gráficas de barras horizontales o
verticales
Representa cualquiera de los niveles de
medición.

34
Gráficas Circulares

Muestran los datos de nivel nominal

Estadística I 35
MEDIDAS DE TENDENCIA
CENTRAL
Las medidas de tendencia central son valores que
representan un conjunto de datos.

-Media
-Mediana
-Moda
DATOS NO AGRUPADOS
MEDIA… X
X 
Ejemplo: n

Calcule el valor medio (o promedio) del ingreso anual de


una muestra de empleados de la empresa “La Favorita”: 10.500,
8.720, 11.350, 9.520 y 12.350 USD

10500  8720  11350  9520  12350


X
5
52440
X 
5
X  10488USD

Estadística I 37
MEDIANA
Cuando hay valores extremos (muy grandes
o pequeños) la media puede no ser
representativa
Mediana corresponde al punto medio de
los datos después de ordenarlos
50% de las observaciones son mayores que
la mediana y 50% son menores

Estadística I 38
MEDIANA
Si el número de datos es par, la mediana es la media
aritmética de los datos situados en la mitad
n
Pos med 
2

Si el número de datos es impar, la mediana es el


valor que se sitúe justo en la mitad
n 1
Pos med 
2

Estadística I 39
MEDIANA

Ejemplo:
Edades de una muestra de 8 Edades de una muestra de 9
estudiantes de Estadística I estudiantes de Estadística I
(PAR) (IMPAR)

8 9 1
Pos med   4 Pos med  5
2 2
23 23
23 23
24 Mediana 24
28 28  30 25
 29 Mediana
30 2 28
32 30
34 32
41 34
41
Estadística I 40
MODA
Valor que aparece con mayor frecuencia
Ejemplo:

Edades de personas que asisten a una tienda de videos de un


centro comercial a las 10 am

12 8 17 21 11 17 14 8 17

21 28

Moda
Estadística I 41
DATOS AGRUPADOS

Media: X
 fX m

 Mediana:
 CLASE MEDIANA: clase cuya frecuencia
acumulada es igual o próxima mayor a la mitad de
los datos Li: límite inferior de la clase mediana
n: nro. de datos de la muestra
n FAa: frecuencia acumulada de la
 FAa
2 i 
clase que antecede a la clase
M e  Li  mediana
f f: frecuencia clase mediana
i: ancho intervalo de clase mediana

Estadística I 42
 Moda:
 CLASE MODAL: es la clase que contiene la
mayor frecuencia

Li: límite inferior de la clase modal


1 : diferencia entre frecuencia
de clase modal y clase que la
1 antecede
M o  Li  i  2 : diferencia entre frecuencia
1   2 de clase modal y clase que le
sigue
i: ancho del intervalo

Estadística I 43
Ejemplo:
En una muestra de 50 ciudades de EEUU con poblaciones que se encuentran
entre 100.000 y 1´000.000 habitantes, se encontró la siguiente distribución de
frecuencias para el costo diario de una habitación de hospital.

Costo de una
habitación de hospital FRECUENCIA
(USD)
{100, 200) 1
{200, 300) 9
{300, 400) 20
{400, 500) 15
{500, 600) 5
50

Estadística I 44
Media
Costo de una
habitación de hospital FRECUENCIA Xm f*Xm
(USD)
{100, 200) 1 150 150
{200, 300) 9 250 2250
{300, 400) 20 350 7000
{400, 500) 15 450 6750
{500, 600) 5 550 2750
50 18900

X
 fX m

18900
 378
El costo medio de una habitación de
hospital en las 50 ciudades de la
n 50 muestra es de 378 USD

Estadística I 45
Mediana CLASE MEDIANA:
Costo de una Frecuencia acumulada
FRECUENCIA
habitación de FRECUENCIA es igual o próxima
ACUMULADA
hospital (USD) mayor a la mitad de los
{100, 200) 1 1 datos
{200, 300) 9 10
{300, 400) 20 30
{400, 500) 15 45
{500, 600) 5 50
50
n 50
 FAa  10
M e  Li  2 i   300  2 100
f 20
El costo mediano de una habitación de
Me 375 USD hospital en las 50 ciudades de la muestra es
de 375 USD

46
Moda
Costo de una
habitación de FRECUENCIA
CLASE MODAL
hospital (USD)
Mayor frecuencia
{100, 200) 1
{200, 300) 9 1
{300, 400) 20
{400, 500) 15 2
{500, 600) 5
50

M o  Li 
1
i   300  20  9
100
1   2 20  9  20  15
El costo modal de una habitación doble en las
Me 369 USD 50 ciudades de la muestra es de 369 USD

47
Medidas de dispersión, variación o
variabilidad.

• Son valores numéricos que indican o describen la


forma en que las observaciones están dispersas o
diseminadas, con respecto al valor central.

• Son importantes debido a que dos muestras de


observaciones con el mismo valor central pueden
tener una variabilidad muy distinta.
Varianza

Medidas de
dispersión,
variación o Coeficiente
Rango variabilidad. de
variación

Desviación Típica.
Medidas de dispersión: Rango
Rango (amplitud o recorrido):
• Está determinado por los dos valores
extremos de los datos muestrales, es
simplemente la diferencia entre la mayor y
menor observación.
• Es una medida de dispersión absoluta, ya
que depende solamente de los datos y
permite conocer la máxima dispersión.
Medidas de dispersión: Rango

• Casi no se emplea debido a que depende


únicamente de dos valores.
• No proporciona una medida de variabilidad
de las observaciones con respecto al centro
de la distribución.
• Notación: R
Medidas de dispersión: Varianza
• Es un valor numérico que mide el grado de
dispersión relativa porque depende de la
posición de los datos x1,x2,…,xn con
respecto a la media.
• Es el promedio al cuadrado de las
desviaciones de cada observación con
respecto a la media.
• Notación: s2, 2, var(X)
Medidas de dispersión: Varianza
• Si la varianza de un conjunto de observaciones es
grande se dice que los datos tiene una mayor
variabilidad que un conjunto de datos que tenga un
varianza menor.

 x  x
n
2
i
s2  i 1
n
n

i
x 2
2
s 
2 i 1
x
n
Medidas de dispersión: Desviación Típica

• Es la raíz cuadrada de la varianza.


• Notación: s, .

s s 2
Medidas de dispersión: Coeficiente de
Variación

• Es una medida de dispersión relativa que


permite comparar el nivel de dispersión de dos
muestras de variables estadísticas diferentes.
• No tiene dimensiones.
• Notación: CV

s
CV  100%
x
GRACIAS POR SU ATENCION!!!

Mtro. José Manuel López Olvera

Estadística I 56

Potrebbero piacerti anche