Sei sulla pagina 1di 25

TRABAJO COLABORATIVO

Unidad 1: Paso 3. Análisis de la información

Estudiantes

Mónica Bibiana Fernández Ramírez Cod: 46.453.618

Walter Jair Peña Cód: 1.057.596.125

Grupo del curso

266

Presentado a

Margarita Gómez

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

ESCUELA DE CIENCIAS SOCIALES, ARTES, Y HUMANIDADES ECSAH

PROGRAMA PSICOLOGIA

ABRIL 2018
DUITAMA
INTRODUCCIÓN

El presente trabajo colaborativo de estadística descriptiva la cual es una herramienta importante con la
cual se analiza series de datos y que nos permite recolectar, presentar y caracterizar con un fin específico
de investigación. Luego comprender el estado general de una población en sí, ahorrando trabajo e
inversión y tiempo. De esta manera la estadística descriptiva es significativa en nuestra vida personal,
profesional y social, ya que es un elemento vital para la presentación y representación de datos de
diferentes investigación con objeto de estudio.

El contenido del trabajo es referente a una base de datos del desempleo en Colombia , donde se presentan
la medidas univariantes, de tendencia central, y de dispersión en cuales se muestran los distintas
resultados acerca de las variables continuas y discreta más relevante seleccionadas por este grupo de
trabajo.
JUSTIFICACIÓN

De acuerdo con los lineamientos y lecciones expuestas, se plasma un plan de trabajo para analizar un
problema de estudio empleando la estadística descriptiva, metodología con la cual se hallará e identificara
el análisis, métodos y conceptos que serán de gran utilidad y darán certeza de un correcto análisis de
investigación estadística, gracias a los estudios, medidas univariantes de tendencia central y medidas
univariantes de dispersión y diagramas realizados y la información suministrada. La recolección de la
información organizada debidamente siempre ha sido un método determinante para identificar problemas
y poder dar alternativas de solución. El conocimiento del contexto y los detalles de las situaciones que
caracterizan a una población permite determinar cuáles serán las prioridades al momento de iniciar un
trabajo que culmine en la solución a la situación problemática. En ese orden de ideas, se presenta el informe
con datos específicos que tiene que ver con las características de un estudio realizado con información
obtenida de la base de datos suministrada del desempleo en Colombia.
OBJETIVOS

OBJETIVO GENERAL

 Desarrollar competencias en el estudiante en el área de la estadística que contribuya y fortalezca el


desarrollo de su aprendizaje en sus respectivas carreras profesionales.

OBJETIVOS ESPECÍFICOS

 Familiarizar a los estudiantes con los conceptos básicos en estadística y aprender a identificar estos
elementos en las futuras bases de datos que el aprendiz vaya a emplear para estudios estadísticos.
Aprendan a identificar y clasificar las diferentes variables cualitativas, nominales y ordinales y
Cuantitativas, discretas y continuas.

 Desarrollar habilidades para la elaboración de diversas graficas estadísticas como son las tablas
de frecuencia, histograma de frecuencias, y polígono de frecuencias.

 Poner en práctica diversas herramientas para estudios estadísticos como el Excel con el fin de
enriquecer conocimientos.
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL
VARIABLE DISCRETA

Estudiante 1: Mónica Bibiana Fernández Ramírez

Variable discreta:

Elegir una variable cuantitativa discreta que sea representativa: Elaborar una tabla de frecuencias para
datos NO agrupados, representarla gráficamente, calcular las medidas de tendencia central: media, mediana,
moda, los cuartiles, deciles 5 y 7; percentiles 30, 50 e interpretar sus resultados.

Frecuencia Frecuencia Frecuencia


Frecuencia Frecuencia Porcentual Frecuencia Absoluta Relativa Porcentual
Datos (Año) absoluta (f) Relativa (fr) (%) Acumulada(F) Acumulada(Fr) Acumulada (%)
2.004 12 0,075471698 7,547169811 12 0,075471698 7,547169811
2.005 12 0,075471698 7,547169811 24 0,150943396 15,09433962
2.006 12 0,075471698 7,547169811 36 0,226415094 22,64150943
2.007 12 0,075471698 7,547169811 48 0,301886792 30,18867925
2.008 12 0,075471698 7,547169811 60 0,377358491 37,73584906
2.009 12 0,075471698 7,547169811 72 0,452830189 45,28301887
2.010 12 0,075471698 7,547169811 84 0,528301887 52,83018868
2.011 12 0,075471698 7,547169811 96 0,603773585 60,37735849
2.012 12 0,075471698 7,547169811 108 0,679245283 67,9245283
2.013 12 0,075471698 7,547169811 120 0,754716981 75,47169811
2.014 12 0,075471698 7,547169811 132 0,830188679 83,01886792
2.015 12 0,075471698 7,547169811 144 0,905660377 90,56603774
2.016 12 0,075471698 7,547169811 156 0,981132075 98,11320755
2.017 3 0,018867925 1,886792453 159 1 100
TOTAL 159 1 100 159 1 100
Media:
= suma de datos
Número total de datos

12(2004)+12(2005)+12(2006)+12(2007)+12(2008)+12(2009)+12(2010)+12(2011)+12(2013)+12(2014)+12(2015)+
= 12(2016)+3(2017)
159

= 319.611
159

= 2.010,132075

Aproximadamente =2010

La media aritmética en la variable año es 2010

Se puede concluir que el promedio de los años en los que se realizaron los estudios fue el año 2010.

Mediana:
X 1 al 12: 2004
X 13 al 24: 2005
X 25 al 36: 2006
X 37 al 48:2007
X 49 al 60: 2008
X 61 al 72: 2009
X 73 al 84: 2010
X 85 al 96: 2011
X 97 al 108: 2012
X 109 al 120: 2013
X 121 al 132: 2014
X 133 al 144: 2015
X 145 al 156: 2016
X 157 al 159: 2017

Para número de datos impar:


Med= X(n+1)/2 siendo n el número total de datos.
Med= X (159+1)/2
Med= X (160)/2
Med= X80
Por lo tanto la mediana es 2010
Se puede concluir que la mitad de los estudios los hicieron desde el año 2004 hasta el año 2010 y la otra mitad de los
estudios desde el año 2010 hasta el año 2017.

Moda: La moda para los datos de los años son los datos 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013,
2014, 2015, 2016, 2017 con repeticiones de 12 veces.

Lo que se puede concluir es que el estado hizo 12 veces el estudio cada año, con lo cual los datos son más exactos.

Cuartiles:

Mediana (cuartil 2) = 2.010

1er Cuartil= 1(n+1)

=1(159+1)/4
=160/4
=40 Dato número 40: 2007
3er Cuartil= 3(n+1)/4
=3(159+1)/4
=3(160)/4
=480/4
=120 Dato número 120: 2013

Deciles 5 y 7:
Decil 5: A(n+1) donde n es el número total de datos y A es el decil que se desee hallar.
10

=5(159+1)
10
=5(160)
10
=800
10
=80 es el dato 80 por lo tanto el decil 5 es hasta el dato 2010.

Decil 7:
=7(159+1)
10
=7(160)
10
=1120
10
=112 es el dato 112 de la lista por lo tanto el decil 7 es hasta el dato 2013.

Percentiles 30 y 50:

Px= nk
100
Percentil 30:
P30 = 159*30
100
P30 =4770
100
P30 =47,7 El dato es el número 48 es decir el percentil 30 va hasta el dato 2007
Percentil 50:
P50 =159*50
100
P50 = 7950
1
0
0
P50 =79,5 El dato es el numero 80 es decir el percentil 50 va hasta el dato 2010.

Lo que se puede deducir es que algunos datos de los percentiles, deciles, cuartiles, tienen el
mismo dato que de la mediana, también se puede deducir que el 50 % de los datos de los
años comprende del 2004 hasta el 2010 aproximadamente 80 datos, además que el 30% de los
datos comprende del 2004 al 2007 aproximadamente 48 datos, que el decil5 equivale también al
50%, y el decil 7 comprende de 112 datos es decir del año 2004 al 2013, el segundo cuartil es
igual a la mediana, el primer cuartil comprende de 40 datos del 2004 al 2007, y el tercer cuartil
comprende de 120 datos es decir del año 2004 al año 2013.

Estudiante 2: Walter Jair Peña


Medidas De Tendencia Central y Dispersión para la variable discreta

Variable Personas sin Empleo

Histográma de Frecuencia
35
30
25
Frecuencia

20
15
10
5
0

Personas sin empleo

10
Polígino de Frecuencias
35
30
25
Frecuencia

20
15
10
5
0

Personas sin empleo

Clase Frecuencia

2282952.576 1

2713048.873 1

3143145.17 8

3573241.466 5

4003337.763 14

4433434.06 20

4863530.356 27

5293626.653 29

5723722.949 31

6153819.246 21

11
6583915.543 18

7014011.839 11

7444108.136 4

y mayor... 5

Para esta variable las medidas de tendencia central se hallaron los siguientes
resultados en los cuales, de 159 datos, que son los meses transcurridos
entre enero de 2004 y marzo de 2017, se halló que:

-La media de la variable son en promedio 4.945.286 personas que estuvieron


sin empleo en este periodo de tiempo que fue establecido por la base de
datos brindada.

-La mediana de la variable:

*Explicación de datos:

-Dato mínimo: 2.282.953

-Mediana: 4.921.421

-Dato máximo: 7.874.204

12
En conclusión, entre 2.282.953 y 4.921.421 de personas estuvieron sin
empleo entre el 50% de los 159 meses de la muestra. El otro 50% se
interpreta que hubo entre 4.921.421 y 7.874.204 de personas sin empleo.

-La moda para esta variable no aplica, puesto que ningún valor se repite, es
por esto que tampoco aplica la tabla de frecuencias.

-Los cuartiles de la variable, es decir la división de la variable en 4 partes


iguales, dándonos 3 cuartiles, que serían los puntos de división y en el cual
también uno de los cuartiles es la mediana o la mitad de los datos de la
variable siendo en este caso y en todos los casos estadísticos el cuartil
número 2, se establece rangos en este caso de personas que estuvieron
desempleadas en un periodo de tiempo que se expondrá a continuación:

Las interpretaciones de datos comprenden valores entre 25%, 50%, 75% y


100%

*Explicación de datos:

-Dato mínimo: 2.282.953

-Cuartil 1: 4.411.976

-Mediana y cuartil número 2: 5.193.946

-Cuartil 3: 5.890.311

13
-Dato máximo: 7.874.204

En el cuartil número 1 es decir, entre el dato mínimo de la variable y el


primer punto de división, podemos indicar, tras la explicación de datos
anterior, hubo entre 2.282.953 y 4.411.976 de personas sin empleo.
Representando lo anterior el 25% de la interpretación mediante los 159
meses de la muestra. El otro 75% restante se interpreta que hubo entre
4.411.976 y 7.874.204 de personas sin empleo.

En el cuartil número 2, que a su vez es el decil número 5 que es también el


percentil número 50, y la mediana de la variable, representa que entre:
2.282.953 de personas (siendo este el dato mínimo de la variable) y
4.921.421 de personas, (siendo este las demás medidas de posición antes
mencionadas), estuvieron sin empleo. En esta interpretación de los datos
sería el 50% de la variable. El otro 50% se interpreta que hubo entre
4.921.421 y 7.874.204 (siendo este último valor el máximo de la variable)
de personas que estuvieron sin empleo.

En el cuartil número 3, representa que hubo entre 2.282.953 (siendo este el


dato mínimo de la variable) y 5.890.311 (siendo este el cuartil número 3), de
personas que estuvieron sin empleo. Lo anterior representando el 75% en
esta interpretación de datos de la variable. El otro 25% se interpreta que
hubo entre 5.890.311 y 7.874.204 de personas sin empleo.

14
El decil número 7 que significa la división en 10 partes iguales nuestra
muestra, significando que cada parte representa el 10% y en ese porcentaje
hubo 5.749.360 de personas que estuvieron sin empleo.

El percentil que significa la división de nuestra muestra en 100 partes


iguales, donde cada una representa el 1% y en ese porcentaje hubo
4.601.425 de personas que estuvieron sin empleo.

15
MEDIDAS DE DISPERSIÓN
VARIABLE DISCRETA

Estudiante 1: Mónica Bibiana Fernández Ramírez

Elegir una variable cuantitativa Continua que sea representativa y siguiendo los
lineamientos, diseñar una tabla de frecuencia para datos agrupados a partir del (rango,
número de Intervalos, amplitud), representarla gráficamente por medio de un histograma de
frecuencias, un polígono de frecuencias, calcular las medidas de tendencia central,
determinar el tipo de asimetría, los cuartiles, deciles 5 y 7; percentiles 25, 50 (Interpretar sus
resultados).
La variable cuantitativa que se escoge es incertidumbre empresarial.
Para la tabla de frecuencia se halla el número de intervalos de la siguiente manera:
Numero de intervalos (K) = (LOG (159)*3,322+1)
= 2,20*3,322+1
= 7,31*1
= 8,31
Por lo tanto se aproxima a 8, es decir que la tabla de frecuencia tendrá 8 intervalos.
Ahora se determinara el tamaño de cada intervalo:
El valor (valor) mínimo de los datos es 0,2 y el valor (dato) máximo es 17,1.
Rango = dato mayor – dato menor
= 17,1-0,2
= 16,9
Para hallar el tamaño (amplitud A) de cada intervalo se divide el rango entre el número de
intervalos:

Amplitud intervalo= Rango/Número de intervalos.


=16,9/8
=2,1125
La amplitud de cada intervalo es de 2,1125

16
Se obtiene la siguiente tabla:
n 159
Min 0,2
Max 17,1
Rango 16,9
K 8,313041247 8
A 2,1125

Se halla el límite inferior y superior de cada intervalo:


Límite
Numero de clases inferior Límite superior Marca de clase
1 0,2 2 1,2625
2 2 4,45 3,3875
3 4,45 7 5,5125
4 7 8,7 7,6375
5 8,7 11 9,7625
6 11 12,95 11,8875
7 12,95 15 14,0125
8 15 17,2 16,1375

A partir de estos datos se halla la tabla de frecuencias:


Frecuencia Frecuencia
Frecuencia Frecuencia absoluta relativa Frecuencia porcentual
Intervalo absoluta relativa acumulada acumulada acumulada
0,2-2,325 23 0,144654088 23 0,144654088 14,46540881
2,325-4,45 16 0,100628931 39 0,245283019 24,52830189
4,45-6,575 16 0,100628931 55 0,34591195 34,59119497
6,575-8,7 24 0,150943396 79 0,496855346 49,68553459
8,7-10,825 19 0,119496855 98 0,616352201 61,63522013
10,825-12,95 24 0,150943396 122 0,767295597 76,72955975
12,95-15,075 20 0,125786164 142 0,893081761 89,3081761
15,075-17,2 17 0,106918239 159 1 100
TOTAL 159 1 159 1 100

17
Histograma de frecuencia

tasa de incertidumbre empresarial

18 18 18
20 15 14 14
12 12
AXIS TITLE

15 11 11
7 8
10

FRECUENCIA
5 1
0 Series1

CLASE

Polígono de frecuencias.

Tasa de incertidumbre empresarial


20
18
16
14
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8 9 10 11 12 13

Medidas de tendencia central

18
Promedio o Media aritmética:

= 1380,09
159
= 8,67

Quiere indicar que el promedio en la medida de la incertidumbre empresarial fue de 8,67%

Mediana:

Como la mitad del número total de datos es el dato 79.5 la mediana está en el intervalo 6,575-8,7
Se utiliza la ecuación:

Me= 79,5- 55 *2,1125+6,575


24

Me=24,5 *2,1125+6,575
24

Me=1,020*2,1125+6,575

Me= 2,1565+6,575

Me= 8,7315

19
Se puede concluir que la tasa incertidumbre empresarial estaba un 50% menor a 8,73% y el otro
50% de las tasas obtenidas fueron mayores a 8,73%
Moda:

Mo= 16__ * 2,1125 + 6,575


16+19

Mo= 0,4571*2,1125+6,575
Mo=0,9657+6,575
Mo=7,54

Se puede concluir que la tasa de incertidumbre empresarial dominante fue 7,54.


Asimetría:
La variable estadística posee asimetría negativa.

Cuartiles:

Cuartil 1
El cuartil 1 es igual al percentil 25.
K(n/100) 39,75
n 159
Fk-1 23
fk 16
Ak 2,1125
Lk 2,325

Q1= 4,53652344
Cuartil 2
20
El cuartil 2 es igual al percentil 50
K(n/100) 79,5
n 159
Fk-1 55
fk 24
Ak 2,1125
Lk 6,575

Q2= 8,73151042

Cuartil 3
El cuartil 3 es igual al percentil 75
K(n/100) 119,25
n 159
Fk-1 98
fk 24
Ak 2,1125
Lk 10,825

Q3= 12,6954427
Deciles:

Decil 5:

El decil 5 es igual al percentil 50.


n/2 79,5
n 159
Fk-1 55
fk 24
Ak 2,1125
Lk 6,575

D5= 8,73151042
Decil 7:

21
El decil 7 es igual al percentil 70.

k(n/100) 111,3
n 159
Fk-1 98
fk 24
Ak 2,1125
Lk 10,825

D7= 11,9956771

Percentiles:

Percentil 25:
K(n/100) 39,75
n 159
Fk-1 39
fk 16
A 2,1125
Lk 4,45

P25% 4,55
Percentil 50:
K(n/100) 79,5
n 159
Fk-1 79
fk 19
A 2,1125
Lk 8,7

50% 8,76

22
Se puede concluir que el 25% de los datos obtenidos en la tasa de incertidumbre empresarial es del
0,2 al 4,55%, además se puede concluir que el 50% de los datos obtenidos van desde 0,2 hasta
8,76%, que el 70% de los datos obtenidos van desde el 0,2% hasta el 11,9%.

Estudiante 2: Walter Jair Peña

Dispersión

-El rango de la variable establece que es el intervalo entre el valor máximo y


el valor mínimo; por ello, se halló que ese intervalo es de 5,591,252 de
personas.

La varianza de la variable es de 1,245,273,304,148

La desviación típica de la variable que nos indica cuánto pueden alejarse los
valores respecto al promedio (media) es de 1,115,918 de personas

El coeficiente de evaluación es de 0.22%

Lo anterior concluye que los datos de la variable y la muestra de ellos nos


indica que los valores no tienen una dispersión considerable del
promedio/media.

23
CONCLUSIONES

Luego de realizar un análisis de los aspectos generales sobre el contenido


temático de la Unidad II, y de haber realizado una lectura responsable, juiciosa
y consciente del módulo, la guía de trabajo colaborativo y la rúbrica de
evaluación, y haber aplicado conscientemente los conocimientos teórico-
prácticos del curso de Estadística Descriptiva, se pueden extraer las siguientes
conclusiones y aspectos fundamentales:
La Estadística Descriptiva brinda herramientas para elaborar con cuidado la
observación de hechos y fenómenos de la población en general, para tomar
una muestra y aplicar sus herramientas en la obtención de resultados, que
fortalecerán el quehacer profesional en la obtención, análisis y conclusiones
de una investigación, que ayudará a contribuir con el manejo de información,
para ayudar en el contexto de la proyección social con el fin de lograr una
mejor calidad de vida.
La interdisciplinariedad de la Estadística, radica en la importancia que posee
en relación con el manejo de la información de cualquier área del saber, gracias
a que arroja resultados, tomados desde un componente teórico – práctico,
para la aprehensión del conocimiento de cualquier profesional, de una manera
cercana mediante la solución de problemas, que requieren interpretación
estadística, en donde la sociedad actual se encuentra dominada por el
conocimiento, más específicamente por la información, requiere de ésta
disciplina que ayude a facilitar el manejo de la misma de una forma pertinente,
ordenada gráficamente en la obtención de resultados y conclusiones acordes
al proceso de investigación con el cual se esté trabajando.

24
REFERENCIAS BIBLIOGRÁFICAS

 García, J.E (2005).Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo.


Página 26 -51 Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052300007&v=2.1&u=una
d&it=r&p=GVRL&sw=w&asid=03f8699ec7ccf10e8745c0ceb7b85bf1

 Montero, J. M. (2007). Características de Una Distribución de Frecuencias.


Statistical Descriptive. Cengage Learning Paraninfo, S.A. Paginas 18-57.
Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=una
d&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0

 García, M.S.(2004).Introducción a la estadística económica y


empresarial. Paraninfo. Páginas 74 – 98. Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900012&v=2.1&u=una
d&it=r&p=GVRL&sw=w&asid=4a9b0a469e755a4327207c94b4c0d549

 Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto


Politécnico Nacional. Retrieved from Recuperado
de:http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?docID=10
436604

 Matus, R., Hernández, Martha, and García, E.. Estadística. México, D.F., MX:
Instituto Politécnico Nacional, 2010. ProQuest ebrary. Web. 1 July 2016.
Recuperado
de: http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?docID=1
0365616&p00=conceptos+generales+estad%C3%ADstica+descriptiva&ppg=12

 Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y


estadística 1. Distrito Federal, MÉXICO: Grupo Editorial Patria. Retrieved
from Recuperado de
:http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?docID=112
30886&p00=conceptos+generales+estad%C3%ADstica+descriptiva&ppg=6

25

Potrebbero piacerti anche