Sei sulla pagina 1di 88

Unidad I.

Conceptos Básicos y
Estadística Descriptiva

Prof. Eliana Guzmán U.


Semestre A-2009
Concepto de Estadística
 Se refiere a un conjunto de
métodos para manejar la
obtención, presentación y
análisis de observaciones
numéricas.

Tema 1. Introducción
Concepto de Estadística
 Sus fines son describir al conjunto
de datos obtenidos y tomar
decisiones o realizar
generalizaciones acerca de las
características de todas las

Tema 1. Introducción
observaciones bajo consideración.
Áreas que conforman a la Estadística

 Estadística Descriptiva (Deductiva):


es la encargada de la organización,
condensación, presentación de los
datos en tablas y gráficos y del
cálculo de medidas numéricas que

Tema 1. Introducción
permitan estudiar los aspectos más
importantes de los datos.

DESCRIBIR
Áreas que conforman a la Estadística

 Estadística Inferencial o Inferencia


Estadística: está definida por un
conjunto de técnicas, mediante las
cuales se hacen generalizaciones o
se toman decisiones en base a

Tema 1. Introducción
información parcial obtenida
mediante técnicas descriptivas.

INFERIR
Áreas de Aplicación de la Estadística
 El uso de la Estadística es muy amplio.
Resulta difícil nombrar un área en la cual no
se emplee.
 Los métodos estadísticos han encontrado
aplicación en:
 Gobierno
 Negocios

Tema 1. Introducción
 Ciencias Sociales
 Ingeniería
 Ciencias Física y Naturales
 Control de Calidad
 Procesos de Manufactura
 Muchos otros campos de la actividad intelectual.
Áreas de Aplicación de la Estadística

 Esto se debe a la creciente facilidad


con la cual se pueden manejar
grandes cantidades de datos
numéricos, debido al uso de …

Tema 1. Introducción
Conceptos de Población y Muestra
 Población: es la colección de todas
las posibles mediciones u
observaciones que pueden hacerse
de una variable bajo estudio.

Tema 1. Introducción
Conceptos de Población y Muestra
 Se clasifica en dos categorías:
 Finita: es aquella que incluye una
cantidad limitada contable de
observaciones, individuos o medidas.
Siempre que sea posible alcanzar
(contar) el número total de todas las

Tema 1. Introducción
posibles mediciones, se considera como
finita la población.
Conceptos de Población y Muestra
 Infinita:es aquella que incluye un gran
conjunto de observaciones o
mediciones que no pueden alcanzarse
por conteo. Al menos, hipotéticamente,
no existe límite en cuanto al número de
observaciones que el experimento

Tema 1. Introducción
puede generar.
Conceptos de Población y Muestra
 Muestra:
 es un conjunto de mediciones u
observaciones tomadas a partir de una
población.
 es un subconjunto de la población.

Tema 1. Introducción
Conceptos de Población y Muestra
 Muestra aleatoria: se considera
aleatoria siempre y cuando cada
observación, medición o individuo
de la población tenga la misma
probabilidad de ser seleccionado.

Tema 1. Introducción
Tipos de datos y escalas de medida
 Variables:
 son las características o lo que se
estudia de cada individuo de la
muestra. Ej: sexo, edad, peso,
estatura, color de ojos, estado civil,
temperatura, cantidad de nacimientos,

Tema 1. Introducción
presión, grosor, diámetro, ...
 Datos:
 son los valores que toma la variable en
cada caso.
Tipos de datos
 Cualitativos: son datos que solo toman
valores asociados a las cualidades o
atributos, clasificándolos en una de varias
categorías, es decir, no son valores
numéricos. Ej:
 Sexo: f/m.

Tema 1. Introducción
 Hábito de fumar: Fumador/No fumador
 Color de ojos: negro, azul, marrón, …
 Religión: católica, evangélica, …
 Estado civil: soltero, casado, divorciado,…
Tipos de datos
 Cuantitativos: provienen de variables que
pueden medirse, cuantificarse o
expresarse numéricamente. Ejemplos:
 Peso
 Edad
 Estatura

Tema 1. Introducción
 Presión
 Humedad
 Intensidad de un sismo
 Cantidad de hermanos
Escalas de medida
 Tipos de variables cuantitativas:
 Discretas: es aquella que solo puede
tomar un número finito o infinito
numerable de valores. Ejemplo:
cantidad de hermanos.
 Continuas: es la variable que puede

Tema 1. Introducción
tomar cualquier valor en una escala
continua. Ejemplo: cantidad de líquido
contenido en un recipiente.
Escalas de medida

 Escala Nominal.
Variables Cualitativas
 Escala Ordinal.
 Escala de Intervalos.
 Escala de Razón o Proporción. Variables Cuantitativas

Tema 1. Introducción
 Escala Absoluta.
Escalas de medida

 Escala nominal: los datos se


pueden agrupar en categorías que
no mantienen una relación de
orden entre si, por lo tanto no
están definidas las operaciones
lógicas (>, <, ≤ , ≥ ) sino solo las

Tema 1. Introducción
de igualdad o diferencia.
 Ejemplos: color de ojos, sexo,
profesión, estado civil, religión.
Escalas de medida
 Escala ordinal: existe un cierto
orden o jerarquía entre las
categorías (>, <, ≤ , ≥ ).
 Ejemplos: grados militares,
organigrama de una empresa,

Tema 1. Introducción
escalafón de los profesores
universitarios, grados de disnea,
estadiaje de un tumor.
Escalas de medida

 Escala de Intervalos: valores numéricos de las


variables y además de las relaciones de orden
(>, <, ≤ , ≥ ), se pueden establecer distancias, es
decir, tienen sentido las operaciones de suma y
resta. Tiene dos propiedades:
 Existe una unidad de medida que se mantiene
constante para todos los valores que toma la variable.

Tema 1. Introducción
 Existe un valor patrón u origen relativo que no significa
la ausencia de valor en la variable.
Escalas de medida
 Ejemplo: temperatura, nivel de
ruido, movimientos sísmicos.

Tema 1. Introducción
Escalas de medida
 Escala de razón o proporción: es la
más completa y general de todas las
escalas. Se caracteriza porque los
valores de la variable son números
entre los cuales, además de las
relaciones de orden (>, <, ≤ , ≥ ) y

Tema 1. Introducción
distancia (+,-), se pueden establecer
múltiplos y proporciones.
 Ejemplos: peso, altura, volumen…
Escalas de medida
 Escala Absoluta: se caracteriza
porque los valores que toma la
variable son el resultado de contar y
por lo tanto, está constituida por los
enteros positivos y el cero.
 Ejemplos: número de hermanos,

Tema 1. Introducción
cantidad de autos vendidos,
cantidad de accidentes en una
intersección, cantidad de hijos,…
Datos Univariantes y Multivariantes
 Univariantes o unidimensionales:
sólo recogen información sobre una
característica (Ej: edad de los
alumnos de una clase).
 Bivariantes o bidimensionales:
recogen información sobre dos

Tema 1. Introducción
características de la población. (Ej:
edad y estatura de los alumnos de
una clase).
Datos Univariantes y Multivariantes

 Multivariantes o pluridimensionales:
recogen información sobre tres ó
más características. (Ej: edad,
estatura y peso de los alumnos de
una clase).

Tema 1. Introducción
Abusos que se pueden cometer con la
Estadística

 Conclusiones erróneas debido a que los


datos son numéricamente insuficientes.
 Representaciones gráficas engañosas
(escalas).
 Datos muestrales no representativos:
Muestra que no incluye a elementos de toda la

Tema 1. Introducción

población.
 Ciertas categorías de personas no responden
correctamente.
 Respuestas voluntarias (sesgadas).
Organización de los datos

 Una vez que se ha


realizado la
recolección de los

Tema 2. Estadística Descriptiva


datos, se obtienen
datos en bruto, los
cuales rara vez son
significativos sin
una organización y
tabulación.
Organización de los datos
 Formas de organizar los datos:
 Un arreglo: es la forma más sencilla de
organizar los datos en bruto, consiste en

Tema 2. Estadística Descriptiva


colocar las observaciones en orden según su
magnitud: ascendente o descendente.
 Poco práctica cuando se tiene una gran
cantidad de datos.
Organización de los datos
 Una distribución de frecuencias: es un arreglo de
los datos que permite expresar la frecuencia de
ocurrencias de las observaciones en cada una de
las clases, mostrando el patrón de la distribución
de manera más significativa.

Tema 2. Estadística Descriptiva


Clase Pto. fi Fi fri FRi
Medio
Organización de los datos

 La Distribución de Frecuencias:
 Se recomienda su uso cuando se tienen
grandes cantidades de datos (n).

Tema 2. Estadística Descriptiva


 Su construcción requiere, en primer
lugar, la selección de los límites de los
intervalos de clase.
 Para definir la cantidad de intervalos de
clase (k), se puede usar:
 La regla de Sturges: k = 1 + 3.3log(n)
 k = √n
Organización de los datos
 La cantidad de clases no puede ser tan
pequeño (menos de 5) o tan grande (más
de 20), que la verdadera naturaleza de la
distribución sea imposible de visualizar.

Tema 2. Estadística Descriptiva


 La amplitud de todas las clases deberá ser
la misma. Se recomienda que sea impar y
que los puntos medios tengan la misma
cantidad de cifras significativas que los
datos en bruto.
 Los límites de las clases deben tener una
cifras significativas más que los datos en
bruto.
Organización de los datos
 Determinar:
 Punto medio = (Li+Ls)/2.
 Frecuencia absoluta de la clase (fi).

Tema 2. Estadística Descriptiva


 Frecuencia acumulada de la clase (Fi).
 Frecuencia relativa de la clase (fri):
 fri = fi/n
 Frecuencia relativa acumulada de la clase
(FRi).
Ejemplos de Distribución de
Frecuencias

Tema 2. Estadística Descriptiva


Representación gráfica de los datos

 Los gráficos permiten visualizar en forma


global y rápida el comportamiento de los
datos.

Tema 2. Estadística Descriptiva


 Para datos cuantitativos agrupados en
clases, comúnmente se utilizan tres
gráficos:
 Histogramas.
 Polígono de frecuencias.
 Ojiva o Polígono de frecuencias acumuladas.
Representación gráfica de los datos

Histograma
Representación gráfica de los datos

Tema 2. Estadística Descriptiva


Histograma y Polígono de Frecuencias
Representación gráfica de los datos

Tema 2. Estadística Descriptiva


Ojiva
Representación gráfica de los datos

 Para datos cualitativos se usan:


 Curvas

 Barras

Tema 2. Estadística Descriptiva


 Sectores
Representación gráfica de los datos

Barras

Barras
Representación gráfica de los datos

Curvas
Representación gráfica de los datos
Sectores, torta o circular

Tema 2. Estadística Descriptiva


Ejemplos de construcción
de gráficos

Tema 2. Estadística Descriptiva


Medidas de tendencia central o
posición

 Corresponden a valores que


generalmente se ubican en la parte
central de un conjunto de datos.

Tema 2. Estadística Descriptiva


 Forma como los datos pueden
condensarse en un solo valor
central alrededor del cual todos los
datos muestrales se distribuyen.
Medidas de tendencia central o
posición

 Las medidas de tendencia central


más importantes son:
 Media:Aritmética y Aritmética

Tema 2. Estadística Descriptiva


ponderada.
 Mediana.

 Moda.
Media Aritmética
 Es la suma de todas las observaciones dividida entre
el número total de observaciones.
 Expresada de forma más intuitiva, podemos decir
que la media aritmética es la cantidad total de la

Tema 2. Estadística Descriptiva


variable distribuida a partes iguales entre cada
observación. (wikipedia)
 Por ejemplo, si en una habitación hay tres personas,
la media de dinero que tienen en sus bolsillos sería
el resultado de tomar todo el dinero de los tres y
dividirlo a partes iguales entre cada uno de ellos. Es
decir, la media es una forma de resumir la
información de una distribución (dinero en el bolsillo)
suponiendo que cada observación (persona) tendría
la misma cantidad de la variable. (wikipedia)
Cálculo de la media aritmética
 Para datos no agrupados:

∑x i

Tema 2. Estadística Descriptiva


X= i =1

n
 Para datos agrupados:
k

∑m f i i
X= i =1
n
Donde: mi: punto medio de la clase i
fi: frecuencia absoluta de la clase i
Mediana
 Es el valor que ocupa la posición
central de un conjunto de
observaciones, una vez que han

Tema 2. Estadística Descriptiva


sido ordenados en forma
ascendente o descendente.
 Divide al conjunto de datos en dos
partes iguales.
Cálculo de la mediana
 Para datos no agrupados:
 Si n es impar: posición donde se ubica
la mediana es igual a (n+1)/2.

Tema 2. Estadística Descriptiva


 Si n es par: (n+1)/2 no es entero, por
lo tanto la mediana será igual al
promedio de las dos posiciones
centrales.
Cálculo de la mediana
 Datos agrupados: clase mediana es la
que contiene a la observación que
ocupa la posición n/2.

Tema 2. Estadística Descriptiva


n +1
− F ( xm −1 )
Md = Lm + 2 Cm
f ( xm )

Donde: Lm: límite inferior de la clase mediana.


F(xm-1 ): frecuencia acumulada de la clase
anterior a la clase mediana.
f(xm): frecuencia absoluta de la clase mediana.
Cm: amplitud de la clase mediana.
Moda
 Observación o clase que tiene la
mayor frecuencia en un conjunto de
observaciones.

Tema 2. Estadística Descriptiva


 Un conjunto de datos puede ser
unimodal, bimodal o multimodal.
 Es la única medida de tendencia
central que se puede determinar
para datos de tipo cualitativo.
Cálculo de la moda
 Para datos no agrupados: es simplemente
la observación que más se repite.
 Para datos agrupados:

Tema 2. Estadística Descriptiva


∆1
Mo = Lim + Cm
∆1 + ∆ 2
Donde: Lim: límite inferior de la clase modal.
∆ 1: diferencia entre fi de la clase modal y la
anterior.
∆ 2: diferencia entre fi de la clase modal y la
posterior.
Cm: amplitud de la clase modal (clase de mayor
frecuencia).
Relación entre la media, la mediana y
la moda

Tema 2. Estadística Descriptiva


Cuando los datos son sesgados es mejor emplear la Md
Propiedades, ventajas y desventajas
de la media

Propiedades:
 La suma de las diferencias entre las
media muestral y el valor de cada
observación es cero.

Tema 2. Estadística Descriptiva


 La media de una constante es la
constante.
 Si todas las observaciones x se
i
multiplican por una constante a, la X
también se debe multiplicar por ese
mismo valor constante.
Propiedades, ventajas y desventajas
de la media

 Si se somete a una variable


estadística X a un cambio de origen
y escala, Y = a + bX, la media

Tema 2. Estadística Descriptiva


aritmética de dicha variable X varía
en la misma proporción.
 La media de la suma de dos
variables es igual a la suma de sus
medias.
Propiedades, ventajas y desventajas
de la media

Ventajas:
 Emplea en su cálculo toda la
información disponible.

Tema 2. Estadística Descriptiva


 Se expresa en las mismas unidades
que la variable en estudio.
 Es el centro de gravedad de toda la
distribución, representando a todos
los valores observados.
 Es una valor único.
Propiedades, ventajas y desventajas
de la media

 Se trata de un concepto familiar


para la mayoría de las personas.
 Es útil para llevar a cabo

Tema 2. Estadística Descriptiva


procedimientos estadísticos como la
comparación de medias de varios
conjuntos de datos.
Propiedades, ventajas y desventajas
de la media

Desventajas:
 Se ve adversamente afectada por valores
extremos, perdiendo representatividad.

Tema 2. Estadística Descriptiva


 Si el conjunto de datos es muy grande
puede ser tedioso su cálculo manual.
 No se puede calcular para datos
cualitativos.
 No se puede calcular para datos que
tengan clases de extremo abierto, tanto
superior como inferior.
Ventajas y desventajas de la mediana

Ventajas:
 Fácil de calcular si el número de
observaciones no es muy grande.

Tema 2. Estadística Descriptiva


 No se ve influenciada por valores
extremos, ya que solo influyen los
valores centrales.
 Fácil de entender.
Ventajas y desventajas de la mediana

 Se puede calcular para cualquier


tipos de datos cuantitativos, incluso
los datos con clase de extremo

Tema 2. Estadística Descriptiva


abierto.
 Es la medida de tendencia central
más representativa en el caso de
variables que solo admiten la escala
ordinal.
Ventajas y desventajas de la mediana

Desventajas:
 No utiliza en su “cálculo” toda la
información disponible.

Tema 2. Estadística Descriptiva


 No pondera cada valor por el
número de veces que se ha
repetido.
 Hay que ordenar los datos antes de
determinarla.
Ventajas y desventajas de la moda
Ventajas:
 No requiere cálculos.
 Puede usarse para datos tanto

Tema 2. Estadística Descriptiva


cuantitativos como cualitativos.
 Fácil de interpretar.
 No se ve influenciada por valores
extremos.
 Se puede calcular en clases de
extremo abierto.
Ventajas y desventajas de la moda
Desventajas:
 Para conjuntos pequeños de datos su
valor no tiene casi utilidad, si es que

Tema 2. Estadística Descriptiva


de hecho existe. Solo tiene significado
en el caso de una gran cantidad de
datos.
 No utiliza toda la información
disponible.
 No siempre existe, si los datos no se
repiten.
Ventajas y desventajas de la moda
 En ocasiones, el azar hace que una
sola observación se no
representativa se el valor más

Tema 2. Estadística Descriptiva


frecuente del conjunto de datos.
 Difícil de interpretar si los datos
tiene 3 o más modas.
Medidas de dispersión, variación o
variabilidad.

 Son valores numéricos que indican


o describen la forma en que las
observaciones están dispersas o

Tema 2. Estadística Descriptiva


diseminadas, con respecto al valor
central.
Medidas de dispersión, variación o
variabilidad.

 Son importantes debido a que dos


muestras de observaciones con el
mismo valor central pueden tener

Tema 2. Estadística Descriptiva


una variabilidad muy distinta.
Medidas de dispersión, variación o
variabilidad.

 Rango.
 Varianza.
Desviación Típica.

Tema 2. Estadística Descriptiva


 Coeficiente de variación.
Medidas de dispersión: Rango
Rango (amplitud o recorrido):
 Está determinado por los dos
valores extremos de los datos

Tema 2. Estadística Descriptiva


muestrales, es simplemente la
diferencia entre la mayor y menor
observación.
 Es una medida de dispersión
absoluta, ya que depende
solamente de los datos y permite
conocer la máxima dispersión.
Medidas de dispersión: Rango
 Casi no se emplea debido a que
depende únicamente de dos
valores.

Tema 2. Estadística Descriptiva


 No proporciona una medida de
variabilidad de las observaciones
con respecto al centro de la
distribución.
 Notación: R
Medidas de dispersión: Varianza
 Es un valor numérico que mide el
grado de dispersión relativa porque
depende de la posición de los datos

Tema 2. Estadística Descriptiva


x1,x2,…,xn con respecto a la media.
 Es el promedio al cuadrado de las
desviaciones de cada observación
con respecto a la media.
 Notación: s2, σ 2, var(X)
Medidas de dispersión: Varianza
 Si la varianza de un conjunto de
observaciones es grande se dice que los
datos tiene una mayor variabilidad que

Tema 2. Estadística Descriptiva


un conjunto de datos que tenga un
varianza menor.
∑ ( x − x)
n
2
i
s2 = i =1
n
n

∑ i
x 2
2
s =
2 i =1
−x
n
Medidas de dispersión: Desviación
Típica

 Es la raíz cuadrada de la varianza.


 Notación: s, σ .

Tema 2. Estadística Descriptiva


s= s 2
Medidas de dispersión: Coeficiente de
Variación

 Es una medida de dispersión relativa que


permite comparar el nivel de dispersión
de dos muestras de variables estadísticas

Tema 2. Estadística Descriptiva


diferentes.
 No tiene dimensiones.
 Notación: CV

s
CV = ×100%
x
Ventajas y Desventajas del Rango

Ventajas:
 Útil cuando se quiere conocer la
extensión de las variaciones

Tema 2. Estadística Descriptiva


extremas (valor máximo de la
dispersión).
 Fácil de calcular.
Ventajas y Desventajas del Rango

Desventajas:
 No es una MD con respecto al
centro de la distribución.

Tema 2. Estadística Descriptiva


 Solo emplea dos valores en su
cálculo.
 No se puede calcular en
distribuciones de límite de clase
abierto.
Propiedades, Ventajas y Desventajas
de la Varianza

Propiedades:
1. Siempre es mayor o igual a cero y
menor que infinito.

Tema 2. Estadística Descriptiva


2. La varianza de una constante es
cero.
3. Si a una variable X la sometemos a
Y=a+bX, la varianza de Y será
Var(Y) = b2Var(X)
Propiedades, Ventajas y Desventajas
de la Varianza

Ventajas:
 Es útil cuando se compara la variabilidad
de dos o más conjuntos de datos.

Tema 2. Estadística Descriptiva


 Utiliza toda la información disponible.

Desventajas:
 No proporciona ayuda inmediata cuando
se estudia la dispersión de un solo
conjunto de datos.
 Difícil de interpretar por tener sus
unidades elevadas al cuadrado.
Ventajas y Desventajas de la
Desviación Típica

Ventajas:
 Esta expresada en las mismas
unidades que la variable en estudio.

Tema 2. Estadística Descriptiva


 Utiliza todas las observaciones en
su cálculo.
 Fácil de interpretar.

Desventajas:
 No tiene.
Ventajas y Desventajas del Coeficiente
de Variación

Ventajas:
 Es la única MD que permite
comparar el nivel de dispersión de

Tema 2. Estadística Descriptiva


dos muestras de variables
diferentes.
 Emplea toda la información
disponible en su cálculo.
 Fácil de calcular.
Ventajas y Desventajas del Coeficiente
de Variación

Desventaja:
 No es una MD con respecto al
centro de la distribución de los

Tema 2. Estadística Descriptiva


datos.
Medidas de Forma
 Son medidas numéricas que
permiten determinar la forma que
tiene la curva de los datos, por lo

Tema 2. Estadística Descriptiva


tanto, sirven para corroborar lo que
los gráficos muestran.
Coeficiente de Pearson
-Asimetría
Medidas Coeficiente de Fisher
de forma
-Kurtosis o apuntamiento
Medidas de Forma: Asimetría
 Permiten estudiar la forma de la
curva, dependiendo de cómo se
agrupan los datos.

Tema 2. Estadística Descriptiva


Medidas de Forma: Asimetría
Coeficiente de Asimetría de Pearson:
 Fácil de calcular e interpretar.

( )
 Cálculo:

Tema 2. Estadística Descriptiva


3 X − Md
ASP =
s
o Interpretación:
= 0, X=Md Simétrica

ASP > 0, X>Md Asimétrica Positiva

< 0, X<Md Asimétrica Negativa


Medidas de Forma: Asimetría
Coeficiente de Asimetría de Fisher:
 No es de fácil cálculo, pero si su
interpretación.

Tema 2. Estadística Descriptiva


∑ (x − X )
n
3
i
ASF = i =1
3
Datos NO agrupados
ns

∑ (M )
k
3
i − x × fi
ASF = i =1 Datos Agrupados
ns3
Medidas de Forma: Asimetría

o Interpretación:
= 0, Simétrica

Tema 2. Estadística Descriptiva


ASF > 0, Asimétrica Positiva

< 0, Asimétrica Negativa


Medidas de Forma: Kurtosis
 Miden si los valores de la
distribución están más o menos
concentrados alrededor de los

Tema 2. Estadística Descriptiva


valores medios de la muestra (zona
central de la distribución).
 Se definen tres tipos de distribución
según su grado de Kurtosis:
Medidas de Forma: Kurtosis

 Mesocúrtica: grado de concentración


medio alrededor de los valores
centrales de la variable.

Tema 2. Estadística Descriptiva


 Leptocúrtica: grado de concentración
elevado.
 Platicúrtica: grado de concentración
reducido.
Medidas de Forma: Kurtosis

∑ (x − X )
n
4
i
CK = i =1
4
−3 Datos No Agrupados
ns

Tema 2. Estadística Descriptiva


∑ (M )
k
4
i − X × fi
CK = i =1
4
−3 Datos Agrupados
ns
Interpretación:

=0 Mesocúrtica

CK >0 Leptocúrtica

<0 Platicúrtica
Referencias:
 Wikipedia(http
://es.wikipedia.org/wiki/Wikipedia:Porta
)
 Walpole y Myers. Probabilidad y
Estadística. Mc Graw-Hill.
 Triola, Mario F. Estadística. Pearson.

Potrebbero piacerti anche