Sei sulla pagina 1di 6

Consigna: Extraer entre 50 y 100 datos de internet y confeccionar una tabla de

frecuencias y una gráfica.

Desarrollo
Se utiliza la información del Censo 2010 para saber las edades de las personas y la
cantidad de casos en la Provincia de Córdoba. (entre 0 y 110 años)
Edad Casos 28 53950 57 31721 86 6152
0 52789 29 52943 58 31155 87 5199
1 52957 30 55345 59 30828 88 4224
2 53279 31 52563 60 32224 89 3523
3 50754 32 51001 61 29077 90 3010
4 51889 33 49322 62 28617 91 2084
5 53015 34 46315 63 27594 92 1505
6 53033 35 46361 64 26533 93 1253
7 54372 36 43520 65 26761 94 927
8 52684 37 43275 66 24024 95 644
9 53373 38 42354 67 22630 96 519
10 55526 39 41325 68 22129 97 312
11 55069 40 41025 69 21063 98 228
12 54858 41 38536 70 21864 99 154
13 53998 42 37336 71 18683 100 86
14 57916 43 35803 72 17816 101 48
15 56009 44 35692 73 17336 102 31
16 55114 45 37345 74 16777 103 27
17 55306 46 37068 75 16631 104 14
18 58442 47 37441 76 14628 105 5
19 58624 48 36499 77 14202 106 2
20 58337 49 35848 78 13909 107 2
21 53872 50 36736 79 13106 108 3
22 53713 51 33263 80 13129 109 4
23 54014 52 33107 81 10936 110 7
24 54546 53 33006 82 9848 Total 3308876
25 52330 54 32941 83 8850
26 50540 55 32603 84 8041
27 50805 56 31922 85 7192

Para organizar la información, definiremos el número de intervalos (k) a través de la siguiente


fórmula 𝑘 = 1 + 3,332log⁡(𝑛). Aclarando que 𝑛 = cantidad de datos.
Entonces,

𝑘 = 1 + 3,332 log(110)
𝑘 = 7,8019
Conviene realizar la distribución en 7 intervalos (número impar). Seguido a esto, definimos la
𝑅
amplitud 𝐶 = ⁡ 𝑘 donde 𝑅 = Rango (límite superior – inferior) y 𝑘 = número de intervalos.

Entonces,
110−0
Rango = 7
= 15,71

Con los datos de la muestra, se procede a organizar la información en los siguientes intervalos:

Entre 0 y 16 Entre 16 y 32 Entre 32 y 48 Entre 48 y 64 Entre 64 y 80 Entre 80 y 96 Entre 96 y 112


52789 55114 51001 36499 26533 13129 519
52957 55306 49322 35848 26761 10936 312
53279 58442 46315 36736 24024 9848 228
50754 58624 46361 33263 22630 8850 154
51889 58337 43520 33107 22129 8041 86
53015 53872 43275 33006 21063 7192 48
53033 53713 42354 32941 21864 6152 31
54372 54014 41325 32603 18683 5199 27
52684 54546 41025 31922 17816 4224 14
53373 52330 38536 31721 17336 3523 5
55526 50540 37336 31155 16777 3010 2
55069 50805 35803 30828 16631 2084 2
54858 53950 35692 32224 14628 1505 3
53998 52943 37345 29077 14202 1253 4
57916 55345 37068 28617 13909 927 7
56009 52563 37441 27594 13106 644
Total 861521 870444 663719 517141 308092 86517 1442
Con estos datos, ya podemos empezar a confeccionar una tabla de frecuencias:

Edades Frecuencia Marca Frecuencia Frecuencia Frecuencia


absoluta de clase acumulada desacumulada relativa en %
0 – 16 861521 8 861521 3308876 26,04
16 – 32 870444 24 1731965 2447355 26,31
32 – 48 663719 40 2395684 1576911 20,06
48 – 64 517141 56 2912825 913192 15,63
64 – 80 308092 72 3220917 396051 9,31
80 – 96 86517 88 3307434 87959 2,61
96 – 110 1442 104 3308876 1442 0,04
Total 3308876 17739222 100%

Con esta tabla vamos a obtener los siguientes datos:

1. Media
𝑋𝑖 .𝑓𝑖
𝜇 =⁡∑ 𝑛

(8𝑥861521)+(24𝑥870444)+(40𝑥663719)+(56𝑥517141)+(72𝑥308092)+(88𝑥86517)+(104𝑥1442)
𝜇= 3308876

𝜇 = 34,22236675

2. Mediana

Para obtenerla usaremos como referencia la fila que cuente con el resultado posterior al
siguiente en la Frecuencia Acumulada
3308876+1
𝑀𝑒 = 2
= 1654438,5 por lo tanto, usaremos la segunda fila como referencia

Dicho esto, aplicamos:


𝑁
−𝐹(𝑖−1)
𝑀𝑒𝑑𝑖𝑎𝑛𝑎⁡(𝑀𝑒) = ⁡ 𝐿𝑖 + 2
. ∆𝑋
𝑓𝑖

Entonces,
3308876
2
−861521
𝑀𝑒 = ⁡16 + . 16 = 30,57494336
870444

3. Con la misma fila, obtenemos la Moda


𝑑1
𝑀𝑜𝑑𝑎⁡(𝑀𝑜) = ⁡ 𝐿𝑖 + ∆𝑋. 𝑑
1 +𝑑2

Teniendo en cuenta que 𝑑1 = 𝑣𝑎𝑙𝑜𝑟⁡𝑑𝑒⁡𝑙𝑎⁡𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎⁡𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎⁡𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 y 𝑑2 =


𝑣𝑎𝑙𝑜𝑟⁡𝑑𝑒⁡𝑙𝑎⁡𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎⁡𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎⁡𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟
861521
𝑀𝑜 = ⁡16 + 16. = 24,9915
861521+663719
Con estos datos, podemos crear los siguientes gráficos:

Diagrama de sectores

Edades 0 – 16 16 – 32 32 – 48
48 – 64 64 – 80 80 – 96 96 – 112

Diagrama de barras
1000000
900000
800000
700000
600000
500000
400000
300000
200000
100000
0
0 – 16 16 – 32 32 – 48 48 – 64 64 – 80 80 – 96 96 – 112
Histograma y polígono de frecuencias absolutas
1,000,000

900,000

800,000

700,000

600,000

500,000

400,000

300,000

200,000

100,000

0
8 24 40 56 72 88 104

Frecuencia acumulada
3500000

3000000

2500000

2000000

1500000

1000000

500000

0
0 – 16 16 – 32 32 – 48 48 – 64 64 – 80 80 – 96 96 – 112
Frecuencias acumuladas y desacumuladas
3500000

3000000

2500000

2000000

1500000

1000000

500000

0
0 – 16 16 – 32 32 – 48 48 – 64 64 – 80 80 – 96 96 – 112

Frecuencia acumulada Frecuencia desacumulada

Referencias
INDEC: https://redatam.indec.gob.ar
http://saberprogramas.com/histograma-poligono-frecuencias-excel/