Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Estudiantes
266
Presentado a
Margarita Gómez
PROGRAMA PSICOLOGIA
ABRIL 2018
DUITAMA
INTRODUCCIÓN
El presente trabajo colaborativo de estadística descriptiva la cual es una herramienta importante con la
cual se analiza series de datos y que nos permite recolectar, presentar y caracterizar con un fin específico
de investigación. Luego comprender el estado general de una población en sí, ahorrando trabajo e
inversión y tiempo. De esta manera la estadística descriptiva es significativa en nuestra vida personal,
profesional y social, ya que es un elemento vital para la presentación y representación de datos de
diferentes investigación con objeto de estudio.
El contenido del trabajo es referente a una base de datos del desempleo en Colombia , donde se presentan
la medidas univariantes, de tendencia central, y de dispersión en cuales se muestran los distintas
resultados acerca de las variables continuas y discreta más relevante seleccionadas por este grupo de
trabajo.
JUSTIFICACIÓN
De acuerdo con los lineamientos y lecciones expuestas, se plasma un plan de trabajo para analizar un
problema de estudio empleando la estadística descriptiva, metodología con la cual se hallará e identificara
el análisis, métodos y conceptos que serán de gran utilidad y darán certeza de un correcto análisis de
investigación estadística, gracias a los estudios, medidas univariantes de tendencia central y medidas
univariantes de dispersión y diagramas realizados y la información suministrada. La recolección de la
información organizada debidamente siempre ha sido un método determinante para identificar problemas
y poder dar alternativas de solución. El conocimiento del contexto y los detalles de las situaciones que
caracterizan a una población permite determinar cuáles serán las prioridades al momento de iniciar un
trabajo que culmine en la solución a la situación problemática. En ese orden de ideas, se presenta el informe
con datos específicos que tiene que ver con las características de un estudio realizado con información
obtenida de la base de datos suministrada del desempleo en Colombia.
OBJETIVOS
OBJETIVO GENERAL
OBJETIVOS ESPECÍFICOS
Familiarizar a los estudiantes con los conceptos básicos en estadística y aprender a identificar estos
elementos en las futuras bases de datos que el aprendiz vaya a emplear para estudios estadísticos.
Aprendan a identificar y clasificar las diferentes variables cualitativas, nominales y ordinales y
Cuantitativas, discretas y continuas.
Desarrollar habilidades para la elaboración de diversas graficas estadísticas como son las tablas
de frecuencia, histograma de frecuencias, y polígono de frecuencias.
Poner en práctica diversas herramientas para estudios estadísticos como el Excel con el fin de
enriquecer conocimientos.
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL
VARIABLE DISCRETA
Variable discreta:
Elegir una variable cuantitativa discreta que sea representativa: Elaborar una tabla de frecuencias para
datos NO agrupados, representarla gráficamente, calcular las medidas de tendencia central: media, mediana,
moda, los cuartiles, deciles 5 y 7; percentiles 30, 50 e interpretar sus resultados.
12(2004)+12(2005)+12(2006)+12(2007)+12(2008)+12(2009)+12(2010)+12(2011)+12(2013)+12(2014)+12(2015)+
= 12(2016)+3(2017)
159
= 319.611
159
= 2.010,132075
Aproximadamente =2010
Se puede concluir que el promedio de los años en los que se realizaron los estudios fue el año 2010.
Mediana:
X 1 al 12: 2004
X 13 al 24: 2005
X 25 al 36: 2006
X 37 al 48:2007
X 49 al 60: 2008
X 61 al 72: 2009
X 73 al 84: 2010
X 85 al 96: 2011
X 97 al 108: 2012
X 109 al 120: 2013
X 121 al 132: 2014
X 133 al 144: 2015
X 145 al 156: 2016
X 157 al 159: 2017
Moda: La moda para los datos de los años son los datos 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013,
2014, 2015, 2016, 2017 con repeticiones de 12 veces.
Lo que se puede concluir es que el estado hizo 12 veces el estudio cada año, con lo cual los datos son más exactos.
Cuartiles:
=1(159+1)/4
=160/4
=40 Dato número 40: 2007
3er Cuartil= 3(n+1)/4
=3(159+1)/4
=3(160)/4
=480/4
=120 Dato número 120: 2013
Deciles 5 y 7:
Decil 5: A(n+1) donde n es el número total de datos y A es el decil que se desee hallar.
10
=5(159+1)
10
=5(160)
10
=800
10
=80 es el dato 80 por lo tanto el decil 5 es hasta el dato 2010.
Decil 7:
=7(159+1)
10
=7(160)
10
=1120
10
=112 es el dato 112 de la lista por lo tanto el decil 7 es hasta el dato 2013.
Percentiles 30 y 50:
Px= nk
100
Percentil 30:
P30 = 159*30
100
P30 =4770
100
P30 =47,7 El dato es el número 48 es decir el percentil 30 va hasta el dato 2007
Percentil 50:
P50 =159*50
100
P50 = 7950
1
0
0
P50 =79,5 El dato es el numero 80 es decir el percentil 50 va hasta el dato 2010.
Lo que se puede deducir es que algunos datos de los percentiles, deciles, cuartiles, tienen el
mismo dato que de la mediana, también se puede deducir que el 50 % de los datos de los
años comprende del 2004 hasta el 2010 aproximadamente 80 datos, además que el 30% de los
datos comprende del 2004 al 2007 aproximadamente 48 datos, que el decil5 equivale también al
50%, y el decil 7 comprende de 112 datos es decir del año 2004 al 2013, el segundo cuartil es
igual a la mediana, el primer cuartil comprende de 40 datos del 2004 al 2007, y el tercer cuartil
comprende de 120 datos es decir del año 2004 al año 2013.
Histográma de Frecuencia
35
30
25
Frecuencia
20
15
10
5
0
10
Polígino de Frecuencias
35
30
25
Frecuencia
20
15
10
5
0
Clase Frecuencia
2282952.576 1
2713048.873 1
3143145.17 8
3573241.466 5
4003337.763 14
4433434.06 20
4863530.356 27
5293626.653 29
5723722.949 31
6153819.246 21
11
6583915.543 18
7014011.839 11
7444108.136 4
y mayor... 5
Para esta variable las medidas de tendencia central se hallaron los siguientes
resultados en los cuales, de 159 datos, que son los meses transcurridos
entre enero de 2004 y marzo de 2017, se halló que:
*Explicación de datos:
-Mediana: 4.921.421
12
En conclusión, entre 2.282.953 y 4.921.421 de personas estuvieron sin
empleo entre el 50% de los 159 meses de la muestra. El otro 50% se
interpreta que hubo entre 4.921.421 y 7.874.204 de personas sin empleo.
-La moda para esta variable no aplica, puesto que ningún valor se repite, es
por esto que tampoco aplica la tabla de frecuencias.
*Explicación de datos:
-Cuartil 1: 4.411.976
-Cuartil 3: 5.890.311
13
-Dato máximo: 7.874.204
14
El decil número 7 que significa la división en 10 partes iguales nuestra
muestra, significando que cada parte representa el 10% y en ese porcentaje
hubo 5.749.360 de personas que estuvieron sin empleo.
15
MEDIDAS DE DISPERSIÓN
VARIABLE DISCRETA
Elegir una variable cuantitativa Continua que sea representativa y siguiendo los
lineamientos, diseñar una tabla de frecuencia para datos agrupados a partir del (rango,
número de Intervalos, amplitud), representarla gráficamente por medio de un histograma de
frecuencias, un polígono de frecuencias, calcular las medidas de tendencia central,
determinar el tipo de asimetría, los cuartiles, deciles 5 y 7; percentiles 25, 50 (Interpretar sus
resultados).
La variable cuantitativa que se escoge es incertidumbre empresarial.
Para la tabla de frecuencia se halla el número de intervalos de la siguiente manera:
Numero de intervalos (K) = (LOG (159)*3,322+1)
= 2,20*3,322+1
= 7,31*1
= 8,31
Por lo tanto se aproxima a 8, es decir que la tabla de frecuencia tendrá 8 intervalos.
Ahora se determinara el tamaño de cada intervalo:
El valor (valor) mínimo de los datos es 0,2 y el valor (dato) máximo es 17,1.
Rango = dato mayor – dato menor
= 17,1-0,2
= 16,9
Para hallar el tamaño (amplitud A) de cada intervalo se divide el rango entre el número de
intervalos:
16
Se obtiene la siguiente tabla:
n 159
Min 0,2
Max 17,1
Rango 16,9
K 8,313041247 8
A 2,1125
17
Histograma de frecuencia
18 18 18
20 15 14 14
12 12
AXIS TITLE
15 11 11
7 8
10
FRECUENCIA
5 1
0 Series1
CLASE
Polígono de frecuencias.
18
Promedio o Media aritmética:
= 1380,09
159
= 8,67
Mediana:
Como la mitad del número total de datos es el dato 79.5 la mediana está en el intervalo 6,575-8,7
Se utiliza la ecuación:
Me=24,5 *2,1125+6,575
24
Me=1,020*2,1125+6,575
Me= 2,1565+6,575
Me= 8,7315
19
Se puede concluir que la tasa incertidumbre empresarial estaba un 50% menor a 8,73% y el otro
50% de las tasas obtenidas fueron mayores a 8,73%
Moda:
Mo= 0,4571*2,1125+6,575
Mo=0,9657+6,575
Mo=7,54
Cuartiles:
Cuartil 1
El cuartil 1 es igual al percentil 25.
K(n/100) 39,75
n 159
Fk-1 23
fk 16
Ak 2,1125
Lk 2,325
Q1= 4,53652344
Cuartil 2
20
El cuartil 2 es igual al percentil 50
K(n/100) 79,5
n 159
Fk-1 55
fk 24
Ak 2,1125
Lk 6,575
Q2= 8,73151042
Cuartil 3
El cuartil 3 es igual al percentil 75
K(n/100) 119,25
n 159
Fk-1 98
fk 24
Ak 2,1125
Lk 10,825
Q3= 12,6954427
Deciles:
Decil 5:
D5= 8,73151042
Decil 7:
21
El decil 7 es igual al percentil 70.
k(n/100) 111,3
n 159
Fk-1 98
fk 24
Ak 2,1125
Lk 10,825
D7= 11,9956771
Percentiles:
Percentil 25:
K(n/100) 39,75
n 159
Fk-1 39
fk 16
A 2,1125
Lk 4,45
P25% 4,55
Percentil 50:
K(n/100) 79,5
n 159
Fk-1 79
fk 19
A 2,1125
Lk 8,7
50% 8,76
22
Se puede concluir que el 25% de los datos obtenidos en la tasa de incertidumbre empresarial es del
0,2 al 4,55%, además se puede concluir que el 50% de los datos obtenidos van desde 0,2 hasta
8,76%, que el 70% de los datos obtenidos van desde el 0,2% hasta el 11,9%.
Dispersión
La desviación típica de la variable que nos indica cuánto pueden alejarse los
valores respecto al promedio (media) es de 1,115,918 de personas
23
CONCLUSIONES
24
REFERENCIAS BIBLIOGRÁFICAS
Matus, R., Hernández, Martha, and García, E.. Estadística. México, D.F., MX:
Instituto Politécnico Nacional, 2010. ProQuest ebrary. Web. 1 July 2016.
Recuperado
de: http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?docID=1
0365616&p00=conceptos+generales+estad%C3%ADstica+descriptiva&ppg=12
25