Sei sulla pagina 1di 49

ESTADSTICA BSICA I

PROFESOR
FRANCISCO JAVIER RODRGUEZ
Matemtico
Universidad de Antioquia
Qu es la estadstica?

Mtodos y procedimientos destinados a recoger,


clasificar, resumir, hallar regularidades, analizar los
datos y realizar inferencias con el fin de ayudar a la
toma de decisiones y en su caso formular
predicciones.
CLASIFICACIN

ESTADSTICA ESTADSTICA
DESCRIPTIVA INFERENCIAL

Describe, analiza y A partir del clculo de


representa un grupo de probabilidades y datos
datos utilizando mtodos muestrales, efecta
numricos y grficos que estimaciones, decisiones,
resumen y presentan la predicciones u otras
informacin contenida generalizaciones sobre un
en ellos. conjunto mayor de datos.
DEFINICIONES Y CONCEPTOS
BSICOS
Individuos o elementos: Personas u objetos que contienen
cierta informacin que se desea estudiar.

Poblacin: Conjunto de individuos o elementos que cumplen


ciertas propiedades comunes.

Muestra: Subconjunto representativo de una poblacin.

Muestreo: Mtodos para la recoleccin de la muestra.

Datos: Conjunto de valores de una variable para cada uno de


los elementos de la muestra.
DEFINICIONES Y CONCEPTOS
BSICOS
Variable: Caracterstica que toma diferentes valores en diferentes
personas, lugares o cosas.
Ordinales
Variables cualitativas
Nominales

Discretas
Variables cuantitativas
Continuas

Parmetro: Medicin numrica que describe algunas caractersticas


de una poblacin.

Estadstico: Medicin numrica que describe algunas caractersticas


de la muestra.
Qu incluye un problema
estadstico?
Definicin clara del objetivo del experimento y de la
poblacin pertinente.

Diseo del experimento o procedimiento del muestreo.

Recoleccin y anlisis de los datos.

El procedimiento para hacer inferencias acerca de la


poblacin, basado en la informacin muestral.

La provisin de una medida de bondad (confiabilidad)


para la inferencia.
MUESTREO
Se utiliza cuando surgen preguntas de cmo seleccionar la
informacin y qu tan grande debe ser el tamao de la
muestra para que las conclusiones e inferencias acerca de
alguna caracterstica de una poblacin sean
representativas.

Poblacin pequea Censo

Poblacin grande Muestreo


CLASIFICACIN
Sin reposicin
TIPOS DE MUESTREO
Con reposicin

Muestreo Aleatorio Simple

ALGUNOS MTODOS Muestreo Aleatorio Sistemtico

DE MUESTREO Muestreo Aleatorio Estratificado

Muestreo Aleatorio por rea o


Conglomerados
ESTADSTICA
DESCRIPTIVA
DATOS
CUALITATIVOS
ESTADSTICA DESCRIPTIVA

DATOS CUALITATIVOS

Se miden en escala

Nominal Ordinal

Se representan en

Grficos Tablas

Diagramas de Barras Frecuencia

Diagramas de Sectores Contingencia


ANLISIS DE VARIABLES
CUALITATIVAS

Ejemplo:
Se recolectaron datos
sobre el nivel acadmico
de 120 empleados de
una empresa
REPRESENTACIN TABULAR
FRECUENCIA
FRECUENCIA FRECUENCIA
CLASE FRECUENCIA RELATIVA
RELATIVA ACUMULADA
ACUMULADA

Bachiller 40 0,33 40 0,33

Tcnico 27 0,23 67 0,56

Tecnlogo 27 0,23 94 0,78

Profesional 20 0,17 114 0,95

Posgrado 6 0,05 120 1,00

En un conjunto de datos, se define moda como el valor de mayor


frecuencia. En nuestro ejemplo, Bachiller es la clase modal.
DIAGRAMA DE BARRAS
45

40

35

30

25

20

15

10

0
Bachiller Tcnico Tecnlogo Profesional Posgrado
DIAGRAMA DE SECTORES
FRECUENCIAS RELATIVAS

0.05

0.17
0.33 Bachiller
Tcnico
Tecnlogo
Profesional
0.23 Posgrado

0.23
TABLAS DE CONTINGENCIA
La empresa del ejemplo anterior consta de tres plantas y sus
empleados estn distribuidos de la siguiente forma:
Diagrama de Barras:

18
16
14
12 Bachiller
Tcnico
10
Tecnlogo
8
Profesional
6 Posgrado
4
2
0
Planta A Planta B Planta C
Diagrama de Barras:

45
40
35
Posgrado
30 Profesional
25 Tecnlogo
20 Tcnico
15 Bachiller
10
5
0
Planta A Planta B Planta C
DATOS
CUANTITATIVOS
ESTADSTICA DESCRIPTIVA

DATOS CUANTITATIVOS

Se dividen en

Discretos Continuos

Se miden en escalas

Razn Intervalos

Se representan en Se resumen en medidas de

Grficos Tablas Centralidad Variabilidad

Frecuencia Media Varianza


Histogramas
Agrupada

Boxplot Mediana Rango


Frecuencia no
Agrupada Coeficiente de
Diagramas de Moda
Dispersin Variacin
A) ESTADSTICOS DESCRIPTIVOS

1. Medidas de Tendencia Central:

Media Aritmtica

Mediana: Es el valor que divide los datos en dos partes


iguales cuando estos se presentan en orden de
magnitud creciente o decreciente.

Moda: Valor que ocurre con mayor frecuencia.


A) ESTADSTICOS DESCRIPTIVOS

2. Medidas de Colocacin:

Percentiles
Cuartiles

3. Medidas de Dispersin:

Rango:

Varianza:
ESTADSTICA BSICA I

A) ESTADSTICOS DESCRIPTIVOS

3. Medidas de Dispersin:

Rango Semi-intercuartil:

Coeficiente de Variacin:

Desviacin Estndar :
B) REPRESENTACIN DE DATOS

Ejemplo:
Se recolectaron datos
sobre las notas
correspondientes a los
cursos de matemticas
de un grupo de 50
estudiantes.
TABLA DE FRECUENCIAS

Al resumir grandes cantidades de datos, es til distribuir


los datos en clases o categoras y determinar el nmero
de individuos que pertenecen a cada clase, llamado
frecuencia de clase. Una disposicin tabular de los datos
por clases junto con las correspondientes frecuencias
de clase, se llama distribucin de frecuencias. Los datos
as organizados en clases como en la anterior
distribucin de frecuencias se llaman datos agrupados.
TABLA DE FRECUENCIAS
Reglas Generales Para la Distribucin de Frecuencias:

Si k es el nmero de clases y n el tamao de la muestra, entonces


se recomienda que:

Si R es el rango de los datos y k es el nmero de clases, entonces


como tamao o extensin de un intervalo de clase se toma el
valor , de tal manera que

Las fronteras de clase son cerradas por el lado izquierdo.


TABLA DE FRECUENCIAS
Para nuestro ejemplo, la tabla de frecuencias correspondiente a
matemticas es:
GRFICOS
Histograma

Histograma - Matemticas
18
16
14
12
Frecuencia

10
8
6 Frecuencia
4
2
0
1,41 1,86 2,31 2,76 3,21 3,66 4,11 y
mayor...
Clase
GRFICOS
Boxplot

Proporciona informacin
sobre el centro, la
dispersin y la simetra de
un conjunto de
observaciones. En l se
pueden ubicar valores como
los cuartiles, la media, la
mediana y los valores
mximo y mnimo de los
datos
Definiciones bsicas
Poblacin: Conjunto de elementos que se quiere estudiar.
Habitantes de una ciudad.
Televisores fabricados en una factora.
Alumnos de primero de bachillerato.

Muestra: Cualquier subconjunto de una poblacin. El


nmero de elementos de una muestra se llama tamao.

Variable estadstica : Cada uno de los rasgos o


caractersticas que se quiere estudiar de los elementos de
la poblacin, susceptible o no de medida.
Color del pelo: negro, castao, rubio o pelirrojo
Sexo: hombre o mujer
Miembros asalariados de una familia: 0, 1 , 2 , 3 ,4 ,
Alturas de alumnos:178, 169, 172, 183,
30
Definiciones bsicas
Individuo: Cada uno de los elementos que componen una
poblacin y/o muestra .
Es sinnimo de unidad bsica o ltima del muestreo

Carcter : Propiedad o cualidad que presentan los


elementos de una poblacin que se desea estudiar .
Cualitativo cuando no puede medirse numricamente
Cuantitativo cuando puede medirse numricamente (Variable)

Estadstico : Es una medida descriptiva de una muestra


Ingreso promedio de los trabajadores
Frecuencia de venta de productos

31
Tipos de Estadstica
La Estadstica descriptiva o deductiva:
Trata del recuento, ordenacin y clasificacin de
los datos obtenidos de las observaciones:
Construccin de tablas, grficos y clculo de parmetros.

La Estadstica inferencial o inductiva:


Utiliza los resultados de la estadstica
descriptiva y se apoya en el clculo de
probabilidades para la obtencin de
conclusiones sobre una poblacin a partir de los
resultados obtenidos de una muestra.
32
Variables cualitativas y cuantitativas
Ordinales Escalas
Etapas

Cualitativas
(Cualidades ,
Colores
categoras o Lugares
atributos) Nominales
Profesiones


Variables Discretas Nmero de hijos
(Unidades Pginas de un libro
Cuantitati vas completas )

(Aquellas
medibles Edad
numricamente) Continuas Peso
(Cualquier Talla
valor en un Tiempo
rango) 33
Tipos de Variables Cualitativas
Dicotmicas: Slo hay dos categora, que son
excluyentes una de la otra
Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre

Nominal: tiene mas de dos categoras y no hay orden


entre ellas.
Ejemplo: color de los ojos, grupo sanguneo

Ordinal: tiene varias categoras y hay orden entre ellas.


Ejemplo: grado tumoral, calificacin del riesgo en
anestesia.

34
Tipos de Variables Cuantitativas
Continuas: nmeros infinito no numerables
de elementos. Tiene asociado el concepto de
medida, en unidades a veces fraccionarias.
Ejemplo: Presin arterial, Edad, peso.

Discretas: nmeros finitos o infinitos


numerables de elementos. Se asocia con el
concepto de conteo.
Ejemplo: N de hijos, N de casos de
35
tuberculosis por estado.
Presentaciones estadsticas y
representaciones grficas
Son los mtodos empleados para organizar y presentar las
observaciones , con el objeto de mostrar la mxima
informacin con una rpida visualizacin , manejo de
esttica y sencillz operativa . Pueden ser de dos tipos:
Tablas:
Forma sencilla y clara de agrupar la informacin
Pueden ser sencillas o complejas segn la cantidad de datos
Es importante el manejo lgico de la disposicin
Grficos:
Permiten visualizar la informacin y sus relaciones
Es una forma ilustrativa y clara de los datos
Es una forma creativa y artstica de presentacin
36
Diferentes tipos de medidas
Las descripciones numricas de datos son
importantes. Dado un conjunto de n
observaciones :
x1 , x2 ,....., xn
La estadstica descriptiva nos ayuda
mediante el manejo de medidas de
tendencia central relativas a la posicin de
los datos y medidas de dispersin relativas
a la variabilidad de los datos.

37
Medidas de Tendencia Central
Las medidas descriptivas ms comunes de
tendencia central o posicin son: la media
aritmtica y la mediana

Existen otras medidas de tendencia central


que en ocasiones pueden resultar de inters
tales como : la moda, los cuartiles, los
deciles, los percentiles, la media armnica, la
media geomtrica y la media ponderada.

38
Media Aritmtica

La media aritmtica es simplemente el


promedio (tambin llamada media muestral
ya que generalmente se calcula en relacin a
una muestra).
Se calcula de la siguiente forma: si las
observaciones de una muestra de tamao n
son x1, x2,,xn entonces:
n

x
x 1 x 2 ... x n i 1
i

X
n n

39
Mediana

La mediana se suele definir como el valor ms


intermedio o central una vez que los datos han
sido ordenados en forma creciente. Se suele
denotar por Me. La forma ms general de
calcular la mediana es la siguiente:

x n 1 2 si n es impar

Me x
n 2 x ( n 2) 1
si n es par
2
40
Moda
La moda de un conjunto de observaciones es el
valor que ms se repite, aquel cuya frecuencia
absoluta es mxima.
Puede ser nica, que haya ms de una, o que
no exista.
Cuando hay ms de una , la distribucin de los
datos se denomina acorde : bimodal , trimodal,
polimodal, etc.

41
Uso de : Media , Mediana y Moda
Nos brindan una idea muy clara de la posicin de los
parmetros dentro de una distribucin de datos.

La media tiene el uso ms frecuente y sencillo ,


tales como : talla media del mexicano,
temperatura histrica promedio , etc.
La mediana es representativa en poblaciones
heterogneas , tales como : distribucin de
salarios , peso medio, etc.
La moda literalmente tiene que ver con estar de
moda o lo que ms se lleva , tal como: nmero de
individuos por casa en Mxico, cantidad de
42
usuarios de ciertos equipos celulares , etc.
Relacin entre : Media,Mediana y Moda
La forma de distribucin de las observaciones puede variar ,
causando desviaciones de estas mediciones centrales , por eso
es conveniente el empleo conjunto de la media y la mediana en
una poblacin o muestra.

La media se usa para distribuciones simtricas que


no tienen sesgo , mientras que la mediana es ms
representativa cuando se tienen datos de
distribucin sesgada. 43
Medidas de Dispersin
Las medidas descriptivas ms
comunes de dispersin son:
el rango, la varianza y la
desviacin estndar .

Existen otras medidas de


dispersin que en ocasiones
pueden resultar de inters
tales como : rango semi-
intercuartilar , rango percentilar
y coeficiente de variacin.
44
Rango
El rango de la muestra es la medida de variabilidad ms sencilla entre todas las mencionadas
Como valor se define como la diferencia entre la observacin ms grande y la ms pequea :

Indica el ancho, recorrido o amplitud de valores . Tiene como sus lmites el valor mayor y el
menor en la distribucin de datos.

r xmax xmin

45
Varianza

Es una medida significativa de la dispersin de las


observaciones alrededor de la media.
Se define como el promedio de las desviaciones
respecto a su media , elevadas al cuadrado :
n n

(x x)
i
2
(x x)
i
2

s
2 i 1
s 2 i 1
n n

46
Desviacin estndar

Es una medida significativa de la dispersin de las


observaciones alrededor de la media.
Se define como la raz cuadrada del promedio de las
desviaciones respecto a su media , elevadas al
cuadrado ; es decir la raz cuadrada de la varianza :
n

(x x)
i
2

i 1
n

47
Utilidad de las medidas de dispersin
Las medidas centrales solo nos indican el valor
medio alrededor del cual se agrupan nuestros
datos , pero las de dispersin nos detallan la
variacin de las observaciones en cuanto a
forma y extensin.

Nos muestran claramente la distancia entre los


datos y la media aritmtica, adems de que
dependen de todas las observaciones.

Son nicas de una serie de datos y por eso se


denominan absolutas , pero pierden sentido de
comparacin , para lo cual hay que usar el
coeficiente de variacin (desviacin estndar
sobre la media en porcentaje) . 48
BIBLIOGRAFA

1) Spiegel, Murray R. y Stephens, Larry J. (2001).


Estadstica serie Schaum. Mxico: McGraw-Hill, pp. 1
124
2) Domnguez, Jorge. (2009). Estadstica y probabilidad. El
Mundo de los datos y el azar. Mxico: Oxford University
Press. Unidad 3: Resumen y organizacin de datos, pp. 76
a 129.

49

Potrebbero piacerti anche