Sei sulla pagina 1di 32

2

oría de probabilidad Diego Profesor Andrés Asistente Alvarez Marí versidad Sede Nacional Manizales de Colo
oría de probabilidad
Diego Profesor Andrés Asistente Alvarez Marí
versidad Sede Nacional Manizales de Colo

Contenido

Qué es la estadística?

● ● Qué Qué Qué es es es la la la teoría estadística estadística de probabilidades? descriptiva? inferencial

Estadística

colección, explicación) Es la rama el matemática y análisis, la representación la relacionada interpretación de datos. con (o la

6

fenómenos matemática un modelo abstracto aleatorios; relacionada y esta sus con conclusiones se el desarrolló análisis d deducciones La teoría conclusiones estadística de probabilidad están son se inferencias basa basados a en problemas la en aplicación basadas axiomas reale e observaciones.

Ramas de la estadística

La estadística se divide en dos ramas:

● ● Estadística Estadística descriptiva inferencial

Estadística descriptiva

La estadística descriptiva se dedica a los partir pueden visualización métodos de ser los resumidos de y fenómenos resumen recolección, en de en forma datos estudio. numérica originados descripción, Los datos y/o a gráfica.

7

8

Estadística inferencial

Esta comprende los métodos y procedimientos para población, deducir propiedades a partir de una (hacer pequeña inferencias) parte de la de misma una bajo datos (muestra). estudio. y extraer Se Estas usa inferencias para inferencias modelar acerca pueden patrones de la población tomar en los la hipótesis), (estimación), forma de respuestas estimaciones pronósticos a de preguntas de características futuras si/no observaciones, (prueba numéricas de descripciones modelamiento de regresión). de de relaciones asociación entre variables (correlación) (análisis o

Estadística Estadística descriptiva inferencial vs.

La estadística diferencia inferencial entre la estadística es que la primera descriptiva intenta y la resumir que la los segunda datos de se forma usa cuantitativa para sustentar mientras afirmaciones representada por sobre los datos la recopilados. población que está

p Diego Profesor Andrés Asistente Alvarez Marí versidad Sede Nacional Manizales de Colo
p
Diego Profesor Andrés Asistente Alvarez Marí
versidad Sede Nacional Manizales de Colo

10

Contenido

● ● ● ● Medidas Medidas Medidas Definiciones de de de dispersión tendencia tendencia básicas central no central ● ● Representación Momentos gráfica de la información

Histogramas

un la por población. muestreo razones prácticas Los o experimento. datos se se analiza coleccionan Las una observacio muestra median ciertas estadísticas. de la muestra características aleatoria de se la usan muestra para llamadas calcular

Población: es el conjunto de elementos de observaciones. toda referencia la información sobre La el población que que se caracteriza realizan es la colección todas un las de

fenómeno. Muestra subconjunto población estadística representativo (o aleatoria): de individuos es un de la

Muestreo: selecciona población una es la muestra técnica a por partir la cual de una se

Una función estadística a un conjunto es el de resultado datos. de aplicar una

Información básica de datos de un conjunto

Mínimo y máximo

● ● Tendencia Percentil Dispersión central

Momentos

básica de datos de un conjunto ● Mínimo y máximo ● ● Tendencia Percentil Dispersión central
básica de datos de un conjunto ● Mínimo y máximo ● ● Tendencia Percentil Dispersión central
11, 23, 25, 27, 29, 1200
11, 23, 25, 27, 29, 1200

11, 23, 25, 27, 29, 1200

11, 23, 25, 27, 29, 1200
Medidas de tendencia central localización Las medidas del de centro tendencia de los central datos
Medidas de tendencia central localización Las medidas del de centro tendencia de los central datos
Medidas de tendencia central localización Las medidas del de centro tendencia de los central datos

Medidas de tendencia central

localización Las medidas del de centro tendencia de los central datos miden la

Mediana Media aritmética (o promedio)

● ● Media Moda geométrica

● ● Media Media acotada armónica (o media truncada)

21

27

27 Media geométrica total, cantidades La media o cuando geométrica son los multiplicadas números es relevante
27 Media geométrica total, cantidades La media o cuando geométrica son los multiplicadas números es relevante

Media geométrica

total, cantidades La media o cuando geométrica son los multiplicadas números es relevante son para cuando de producir naturaleza varias un la inversión exponencial, población financiera. mundial como por o las ejemplo tasas de el crecimiento interés de una de La media media aritmética geométrica a los valores es menos extremos. sensible que la

Observe que MATLAB y MS algoritmos EXCEL utilizan para diferentes calcular la moda 36
Observe que MATLAB y MS algoritmos EXCEL utilizan para diferentes calcular la moda 36
Observe que MATLAB y MS algoritmos EXCEL utilizan para diferentes calcular la moda 36
Observe que MATLAB y MS
algoritmos EXCEL utilizan para diferentes calcular la moda
36

después de eliminar el porcentaje de los excluir datos. extremos Puede del inferior análisis utilizar los y superior esta valores función extremos. de los cuando puntos desee de porcentaje es el número fraccionario de puntos de

de porcentaje es el número fraccionario de puntos de Otras medidas de tendencia central ● Media

Otras medidas de tendencia central

Media generalizada

http://en.wikipedia.org/wiki/Generalized_mean

Media ponderada

http://en.wikipedia.org/wiki/Weighted_mean

Punto medio

http://en.wikipedia.org/wiki/Midrange

Root mean square (RMS)

http://en.wikipedia.org/wiki/Root_mean_square

39

 

Notas varias

inferior media La media geométrica, a la armónica media aritmética. que es siempre a su vez inferior es siempre a la

Ver: http://en.wikipedia.org/wiki/Inequality_of_arithm etic_and_geometric_means

 

http://en.wikipedia.org/wiki/Pythagorean_means

 

40

 

Medidas de dispersión

La dispersión de los datos se puede atribuir a observaciones inherente obra pequeñas deficiente, al diferencias material, y en errores las de así mediadas. construcción, como humanos, a errores variabilidad a mano en las de Las un conjunto medida de de dispersión datos. Una miden medida la variabilidad de dispersión de es todos medida un los número que dátos las real observaciones son no idénticos, negativo, son y se que más incrementa es diversas. cero si a

 

41

 

Medidas de dispersión

● ● Desviación Varianza estándar

 

● ● Desviación Desviación mediana media

● ● Rango Rango Rango (o (o (o recorrido) recorrido) recorrido) intercuartil interdecil

42

hacer usar (denominador inferencias acerca n ), SIEMPR de muestral debe utilizar (denominador la desviación
hacer usar (denominador inferencias acerca n ), SIEMPR de muestral debe utilizar (denominador la desviación

hacer usar (denominador inferencias acerca n), SIEMPR de muestral debe utilizar (denominador la desviación n-1). La e

51

No con confundir la covarianza!
No con confundir la
covarianza!

estándar han sido empleadas de manera extensa

Otras medidas de dispersión

Momento central de cualquier orden

http://en.wikipedia.org/wiki/Moment_(mathematics)

Diferencia media

http://en.wikipedia.org/wiki/Mean_difference

Desviación estándar geométrica

http://en.wikipedia.org/wiki/Geometric_standard_deviation

ingresar Insertar Haga Alt+F11 →Módu el códig p Copy+Paste Grabar como cód .xl Como la
ingresar Insertar Haga Alt+F11 →Módu el códig p
Copy+Paste Grabar como cód .xl
Como la desviación la función mediana para calcul no
existe debemos usando en Visual MS crear EXCEL Basic la función 2007, for
Applications (VBA)

56

Valor atípico (outlier)

Un valor atípico es una observación que es datos Las numéricamente estadísticas que incluyen distante derivadas valores del de resto los atípicos de conjuntos los datos. serán de cálculo frecuentemente una habitación, de la temperatura si engañosas. la mayoría media Por tienen de ejemplo, 10 entre objetos en 20 en el y 25ºC, los datos pero puede hay un ser horno 23, a 350°C, pero la la temperatura mediana de media mejor objeto la que será temperatura la 55. media. En este de la caso, muestra la mediana al azar refleja de un

55

Valor atípico (outlier)

del datos Los resto valores que de pertenecen la atípicos muestra pueden establecida. a una población ser indicativos diferente de constituye subjetivo. No existe una un valor definición atípico; matemática este es un de ejercicio lo que

diferente de constituye subjetivo. No existe una un valor definición atípico; matemática este es un de

59

59 Momentos ● Coeficiente de asimetría – Ver: http://en.wikipedia.org/wiki/Skewness ● Curtosis – Ver:

Momentos

Coeficiente de asimetría

Ver: http://en.wikipedia.org/wiki/Skewness

Curtosis

Ver: http://en.wikipedia.org/wiki/Kurtosis

asimetría – Ver: http://en.wikipedia.org/wiki/Skewness ● Curtosis – Ver: http://en.wikipedia.org/wiki/Kurtosis
Datos Suponga el consumo que en los siguientes m3 de agua números por día representan
Datos Suponga el consumo que en los siguientes m3 de agua números por día representan

Datos

Suponga el consumo que en los siguientes m3 de agua números por día representan de una población ascendentemente). dichos datos. (observe Elabore que el están histograma ordenados de

2298

3205

3325

3609

3918

3992

4057

4188 4289

4363 4377 4448 4450 4524

4536 4565

4657 4591 4666 4670 4724

4763 4737

4816 4784 4817 4852 4887

4905 4908

4941 4923 4993 4998 5035

5041 5058

5152 5142 5152 5330 5535

2298
2298

4289 4188

4565 4536

4763 4737

4908 4905

5058 5041

3205

3325

4377 4363 4448 4450 4524

4657 4591 4666 4670 4724

4816 4784 4817 4852 4887

4941 4923 4993 4998 5035

5152 5142 5152 5330 5535

5152 5142 5152 5330 5535

3609

3918

3992

4057

 
   
 
5152 5142 5152 5330 5535 3609 3918 3992 4057     3. Establecer clases/intervalos la longitud

3. Establecer clases/intervalos la longitud (bins) de las

Establecer dividido entre la el longitud número de de clase: clases es igual al rango Lóngitud de la clase = 3237/7 = 462.4

Tenga en cuenta

● ● La observaciones La frecuencia normalización relativa contenidas del histograma refleja en la una proporción clase de la

Cuando área de los los rectángulos intervalos de representa clase son las idénticos, el frecuencias. de los intervalos Sin embargo, es diferente, cuando las áreas la longitud no representan ajustar la altura la frecuencia. de los rectángulos Por lo tanto para se que debe sus áreas sean proporcionales a la frecuencia.

de El eje frecuencia Y tiene unidades por m 3 /día
de El eje frecuencia Y tiene unidades por m 3 /día
tanto para se que debe sus áreas sean proporcionales a la frecuencia. de El eje frecuencia
de El eje frecuencia Y tiene unidades por m 3 /día
de El eje frecuencia Y tiene unidades por m 3 /día

Histogramas con MS EXCEL

http://www.bloggpro.com/creating-histograms-in-excel/ MS EXCEL 2003:

http://www.bloggpro.com/creating-a-simple-histogram-in-excel-2007/ MS EXCEL 2007:

http://www.google.com/search?q=histograms+excel+2007 or just GOOGLE IT!

frecuencia 6. Graficar relativa la distribución acumulada de

Se obtiene graficando en el eje vertical la contra sobre frecuencia el el eje límite relativa horizontal inferior acumulada y de uniendo la siguiente de todos una clase clase los puntos consecutivos.

de El eje frecuencia Y tiene unidades únicamente Percentil 80 Número de clases ● No
de El eje frecuencia Y tiene unidades únicamente
Percentil 80
Número de clases
● No existe una forma única de escoger el
número a algunas criterio de recomendaciones del intervalos. analista. Sin Esto embargo, (las por cuales lo tanto existen se deja
generalmente forma de los datos): hacen suposiciones sobre la
● El de número observaciones de clases depende del número total
ndación:
ott ral (1979): s es la desvia edman-Diaconis artil (1981):

ott ral (1979): s es la desvia

ott ral (1979): s es la desvia edman-Diaconis artil (1981):

edman-Diaconis artil (1981):

edman-Diaconis artil (1981):
ott ral (1979): s es la desvia edman-Diaconis artil (1981):
ott ral (1979): s es la desvia edman-Diaconis artil (1981):
ott ral (1979): s es la desvia edman-Diaconis artil (1981):
Referencias bibliográficas ● Sturges, J. American H. A. Statistical (1926). “The Association: choice of 65–66.
Referencias bibliográficas
● Sturges, J. American H. A. Statistical (1926). “The Association: choice of 65–66. a class interval”.
● Scott, histograms”. D. W. (1979). Biometrika. “On optimal 66 (3): 605–610 and data-based
Freedman, histogram Zeitschrift verwandte für as Gebiete. D. a Wahrscheinlichkeitstheorie and density Diaconis, 57 estimator: (4): 453–476 P. (1981). L2 theory”. “On und the
● Shimazaki selecting the H. bin and size Shinomoto of a time S. histogram” (2007), “A Neural method for
Computation. 19(6), 1503-1527

Ejemplo con diferentes clases de tamaños

Considere en el año 2000: el siguiente ejemplo del Censo de USA “Journey to work and place of work”

del Censo de USA “Journey to work and place of work” (minutos) Intervalo (minutos) Ancho Cantidad

(minutos) Intervalo

(minutos) Ancho

Cantidad (miles)

Cantidad(miles)/ Ancho (minutos)

(minutos) Intervalo (minutos) Ancho Cantidad (miles) Cantidad(miles)/ Ancho (minutos)
(minutos) Intervalo (minutos) Ancho Cantidad (miles) Cantidad(miles)/ Ancho (minutos)
(minutos) Intervalo (minutos) Ancho Cantidad (miles) Cantidad(miles)/ Ancho (minutos)
(minutos) Intervalo (minutos) Ancho Cantidad (miles) Cantidad(miles)/ Ancho (minutos)

[0,5)

5

4180

836

[5,10)

5

13687

2737

[10,15)

5

18618

3723

[15,20)

5

19634

3926

[20,25)

5

17981

3596

[25,30)

5

7190

1438

[30,35)

5

16369

3273

[35,40)

5

3212

642

[40,45)

5

4122

824

[45,60)

15

9200

613

, curva número El área es bajo de igual casos la al = 124 millones.
,
curva número El área es bajo de igual casos la al
= 124 millones.
Este cantidad/ancho la tabla. diagrama usa de

(minutos) Intervalo

[0,5)

[5,10)

(minutos) Ancho

Cantidad (miles)

Cantidad/Total/A ncho (minutos)

5

4180

0.01

5

13687

0.02

ncho (minutos) 5 4180 0.01 5 13687 0.02 [10,15) [15,20) [20,25) [25,30) [30,35) [35,40)
ncho (minutos) 5 4180 0.01 5 13687 0.02 [10,15) [15,20) [20,25) [25,30) [30,35) [35,40)

[10,15)

[15,20)

[20,25)

[25,30)

[30,35)

[35,40)

[40,45)

[45,60)

5

18618

0.03

5

19634

0.03

5

17981

0.03

5

7190

0.01

5

16369

0.03

5

3212

0.01

5

4122

0.01

15

9200

0

17981 0.03 5 7190 0.01 5 16369 0.03 5 3212 0.01 5 4122 0.01 15 9200
17981 0.03 5 7190 0.01 5 16369 0.03 5 3212 0.01 5 4122 0.01 15 9200
17981 0.03 5 7190 0.01 5 16369 0.03 5 3212 0.01 5 4122 0.01 15 9200
, El es área igual bajo a 1 la curva Este cantidad/total/ancho de la diagrama
,
El es área igual bajo a 1 la curva
Este cantidad/total/ancho de la diagrama tabla. usa
Generalización de histograma Existen polinomios otro ortogonales métodos basados de Legendre. en la utilización Ver

Generalización de histograma

Existen polinomios otro ortogonales métodos basados de Legendre. en la utilización Ver por de ejemplo:

probability of X.B. rock Li y F.Q. masses distributions Gong using (2009). to engineering Legendre A method orthogonal properties for fitting polynomials. 4, July 2009, Pages Structural 335-343 Safety. Volume 31, Issue

interval Applying [-1,1] the Gram-Schmidt with the usual L^2 process inner to product the functions gives the 1, x, Legendre x^2, on polynomials the

Otras funciones de MS EXCEL

Otras funciones de MATLAB

Otras representar formas gráficas los datos de