Sei sulla pagina 1di 28

Introduccin a la

Estadstica Descriptiva

Juan Moncada Herrera


Dpto. de Cs. Matemticas y Fsica
Universidad Catlica de Temuco

Poblacin

EL CONTEXTO:

Conocer

Problema

Observar
Variables

Muestra

Individuo
Unidad de observacin
Registro de
observacin
Pgina 2

LOS ELEMENTOS DE BASE:

Muestra

Individuo
Unidad de observacin

Variables

Cualitativas

Cuantitativas

Pgina 3

LOS ELEMENTOS DE BASE:


Muestra

Individuo
Unidad de observacin

Variables

Cualitativas
- Nominales
- Ordinales

Cuantitativas
- Discretas
- Continuas

Pgina 4

LOS ELEMENTOS DE BASE:

Variables

Cualitativas

Cuantitativas

- Nominales

- Discretas
- Continuas

- Ordinales

Indiv.

Tabla de datos

X1

Xp
Materia prima del
anlisis estadstico

n
Pgina 5

SU OBJETIVO: Anlisis de la Tabla de Datos


Indiv.

X1

Xp

RESUMEN O SNTESIS
Lo ms representativo
Lo ms relevante

Lo esencial

La forma

Lo ms tpico

La estructura

La diversidad

RETORNO A LOS DATOS


Pgina 6

SU OBJETIVO: Anlisis de la Tabla de Datos


Indiv.

X1

Xp

RESUMEN O SNTESIS

NUMRICO

GRFICO
Pgina 7

ANALIZANDO LA TABLA DE DATOS:

RESUMEN O SNTESIS

NUMRICO

GRFICO

FORMA
Simetra
Curtosis
POSICIN
Valores extremos
Cuartiles, quintiles deciles

Pgina 8

ANALIZANDO LA TABLA DE DATOS:

RESUMEN O SNTESIS

NUMRICO

GRFICO

TENDENCIA CENTRAL
Promedio o media
Moda, mediana
DISPERSIN
Rango
Desviacin estndar

Pgina 9

ANALIZANDO LA TABLA DE DATOS: Recursos grficos

RESUMEN O SNTESIS

NUMRICO

GRFICO

Grfico de sectores:
Variables cualitativas
Frecuencias

Vestuario
Alimentacin
Ocio

Informa de:
Distribucin

Transporte

Pgina 10

ANALIZANDO LA TABLA DE DATOS: Recursos grficos

RESUMEN O SNTESIS

NUMRICO

GRFICO
45
40

Grfico de barras:
Variables cualitativas
Frecuencias

Informa de:
Distribucin

35
30
25
20
15
10
5
0
Vestuario

Alimentacin

Ocio

Transporte

Pgina 11

ANALIZANDO LA TABLA DE DATOS: Recursos grficos

RESUMEN O SNTESIS

NUMRICO

GRFICO
36
32

Histograma:
Gran cantidad de observaciones

Informa de:
Forma, tendencia central

Frecuencia

Variables cuantitativas continuas

28
24
20
16
12
8
4
0
0

0,3 0,6 0,9 1,2 1,5 1,8 2,1 2,4 2,7 3


Valores de la variable

Pgina 12

ANALIZANDO LA TABLA DE DATOS: Recursos grficos

RESUMEN O SNTESIS

NUMRICO

GRFICO
3

Variables cuantitativas continuas


Informa de:
Forma, posicin

2,4
2,1
1,8
1,5
1,2
0,9
0,6
0,3
0

Peso

Box-Plot:

Valores de la variable

2,7

Pgina 13

ANALIZANDO LA TABLA DE DATOS: Recursos grficos

RESUMEN O SNTESIS

NUMRICO

GRFICO
Variacin mensual del IPC

3,0
2,8

Lineas:
Variables cuantitativas

2,6
2,4
2,2
2,0
1,8

Informa de:
Tendencia

1,6
1,4
1,2
1,0
1

10 11

12

Mes del ao

Pgina 14

ANALIZANDO LA TABLA DE DATOS: Recursos numricos

MEDIDAS NUMRICAS DE RESUMEN


Tendencia central:
Media:

1 n
X xi
n i 1

Mediana:

X0.5 = Valor central (promedio de valores centrales) de la serie


ordenada de X

Moda:

Valor(es) ms frecuente(s) de X (datos cuantitativos y


cualitativos)

Pgina 15

ANALIZANDO LA TABLA DE DATOS: Recursos numricos

MEDIDAS NUMRICAS DE RESUMEN


Dispersin:
Rango: R(X) = Max(X) min(X)

Desviacin estndar:

1
2
(
x

x
)
i
n 1

Coeficiente de variacin: CV ( X )

S
X

100%

Pgina 16

ANALIZANDO LA TABLA DE DATOS: Recursos numricos

MEDIDAS NUMRICAS DE RESUMEN


Posicin:
Cantidad acumulada de informacin
0%
|
min
Max

25%
|
Q1

Primer cuartil

50%
|

Q2
Segundo cuartil - mediana

75%
|

100%
|

Q3
Tercer cuartil

Serie creciente de valores observados


Pgina 17

ANALIZANDO LA TABLA DE DATOS: Recursos numricos

EL RETORNO A LOS DATOS


Regla emprica de Chebyshev:
Si la distribucin de los datos es simtrica en torno de su media, entonces:
Aproximadamente el 67% de los datos se encuentra a una distancia igual a
una desviacin tpica de la media.
Aproximadamente el 95% de los datos se encuentra a una distancia de dos
desviaciones tpicas de la media.
Aproximadamente el 99% de los datos se encuentra a tres desviaciones
tpicas de la media.

Pgina 18

ANALIZANDO LA TABLA DE DATOS: Recursos informticos

RECURSOS INFORMTICOS
ALTERNATIVAS COMERCIALES

ALTERNATIVAS GRATUITAS O LIBRES

Programa R
Calculadora con
modo estadstico

Planilla de OpenOffice
MS Excel
Programa SPSS

Programa PAST
Pgina 19

SINTETIZANDO:

TODO Resumen debe INFORMAR de:


La FORMA de la distribucin
Simtrica
No simtrica

La TENDENCIA CENTRAL de la distribucin


Media
Mediana
Moda
Pgina 20

SINTETIZANDO:

TODO Resumen debe INFORMAR de:


La DISPERSIN de la distribucin
Desviacin estndar (Desviacin tpica)
Coeficiente de variacin
Rango

La POSICIN
Valores extremos (Mnimo, Mximo)
Percentiles (Cuartiles, Quintiles, Deciles)

Pgina 21

SINTETIZANDO:

Para
Informacin cualitativa o discreta
El Resumen puede ser:
Numrico
Tablas de frecuencias
Moda

Grfico
Barras
Circular - Sectores
Pictogramas

Pgina 22

SINTETIZANDO:

Para
Informacin Continua
El Resumen puede ser:
Numrico
Tendencia central

Dispersin

Grfico
Posicin

Media

Rango

Cuartiles

Mediana

Varianza

Quintiles

Moda

D. estndar

Deciles

Histograma
Polgono de frecuencias
Box-plot (Grfico de Cajas)
Ojiva

C. Variacin Percentiles

Pgina 23

ESTADSTICA DESCRIPTIVA: Mirando un conjunto de datos

UN EJEMPLO
Rendimiento de alumnos de primero de secundaria
segn cuatro niveles de autoestima
Nivel de autoestima
Nivel1

Nivel2

Nivel3

Nivel4

56

292

291

24

Min

4,3

3,87

3,67

4,27

Max

5,93

6,13

6,3

6,17

Mean

5,03446

5,0874

5,21608

5,18583

Variance

0,171756

0,207481

0,224896

0,345547

Stand. dev

0,414435

0,455501

0,474232

0,587833

Grupo Nivel 1 menos disperso

Median

5,015

5,1

5,23

5,15

Mediana similar a media: Simetra

25 prcntil

4,7

4,77

4,93

4,69

75 prcntil

5,33

5,4225

5,57

5,5825

= 663 estudiantes
Rendimiento similar

Pgina 24

ESTADSTICA DESCRIPTIVA: Mirando un conjunto de datos

UN EJEMPLO
Rendimiento de alumnos de primero de secundaria
en Nivel 3 de autoestima
54
48
Frecuencia

42
36
30
24

Rendimiento ligeramente
cargado a valores superiores

18
12
6
0
3,2 3,6

4,4 4,8 5,2 5,6

6,4

Promedio en Nivel 3 de Autoestima


Pgina 25

ESTADSTICA DESCRIPTIVA: Mirando un conjunto de datos

UN EJEMPLO
Rendimiento de alumnos de primero de secundaria
segn cuatro niveles de autoestima
6,4

Grficos de caja permitiendo una


lectura comparativa del
rendimiento, segn nivel de
autoestima.

5,6
5,2
4,8
4,4

En Nivel 3 se observan dos out


liers o valores atpicos.

4
3,6
Nivel4

Nivel3

Nivel2

3,2
Nivel1

Promedios

Qu grupo requiere
intervencin pedaggica?
Pgina 26

RECURSOS DE APOYO:
SUGERENCIAS BIBLIOGRFICAS:
1. Webster A. (2000): Estadstica aplicada a los negocios y la economa.
McGraw-Hill, Colombia.
2. Lind, Marchal & Wathen (2008): Estadstica aplicada a los negocios y la economa.
McGraw-Hill, Mxico.

3. Canavos G. (1988): Probabilidad y Estadstica. Aplicaciones y mtodos.


McGraw-Hill, Mxico.
4. Walpole, Myers, Myers & Ye (2007): Probabilidad y estadstica para ingeniera
y ciencias. Pearson-Prentice Hall, Octava edicin, Mxico.
SOFTWARE ESTADSTICO GRATUTO O LIBRE:
1. Programa PAST. Website: http://folk.uio.no./ohammer/past/
2. Programa R. Website: www.r-project.org
3. Programa OpenOffice. Website: www.openoffice.org

Pgina 27

Introduccin a la
Estadstica Descriptiva

Juan Moncada Herrera


Dpto. de Cs. Matemticas y Fsica
Universidad Catlica de Temuco

Potrebbero piacerti anche