Sei sulla pagina 1di 9

Introduo

O fenmeno da urbanizao vem tomando propores cada vez maiores com


o passar dos anos. Durante as etapas do processo econmico, pode ser observada
uma ulterior expanso das reas urbanas e de outras instalaes industriais
modernas, baseada na constante necessidade de mo de obra, de servios e de
outros bens manufaturados (ROSTOW, 1974).
Atualmente, os crescentes nveis de urbanizao so causados pelo
crescimento natural da populao e pela migrao da populao rural para as
cidades. Durante os ltimos cinquenta anos, ocorreu um grande xodo de
populaes rurais para reas urbanas, e esse processo de concentrao de pessoas
e atividades em reas urbanas deve prolongar-se nesse sculo. As foras
propulsoras desse fenmeno incluem as oportunidades e os servios oferecidos,
principalmente empregos e educao.
No artigo O Futuro das Cidades, Maria da Glria Gohn traz algumas
interessantes informaes sobre perspectivas da urbanizao para este milnio:
Segundo projeo da ONU, em 2025 teremos 61% da populao mundial
vivendo em cidades. Em 1975 este ndice era de 37%. Das 21 maiores
metrpoles do mundo 14 esto em pases subdesenvolvidos. Esse
percentual dever aumentar 89% em 2025. Ou seja, as projees indicam
uma multiplicao das grandes cidades nas regies pobres, num cenrio
radicalmente diferente de 50 anos atrs quando apenas 100 aglomeraes
urbanas tinha mais de 1 milho de habitantes, e a maioria delas localizavase em pases ricos. Ainda segundo a ONU, em 2025 haver 527 grandes
cidades sendo 2/3 delas localizadas nos pases menos desenvolvidos
(Gohn, 1999).

Uma vez em que h essa grande concentrao populacional em cidades com


ampla oferta de atividades, no somente o surgimento delas que deve ser de
nosso interesse, mas tambm o modo como ocorre seu processo de expanso para
outras reas, formando-se, ento, grandes metrpoles ou mesmo megalpoles.
Dessa forma, possvel selecionar alguns aspectos que influenciam o impacto de
tais mudanas. A partir disso, ser analisada a maneira como o fenmeno da
urbanizao se relaciona com o nvel de escolaridade e com o PIB per capita (tendo
esse como base a paridade do poder de compra).

Anlise descritiva dos dados


Para realizao da tarefa, foi escolhido o banco de dados Standard Data na
sua verso de 20 de dezembro de 2013, proveniente do Quality of Government
Institute, da Universidade de Gotemburgo, na Sucia. A base de dados rene
informaes de diversas outras bases de dados. Assim, os anos no so
exatamente os mesmos, mas possvel realizar testes e anlises sem maiores
problemas.
A varivel dependente Y a ser analisada a wdi_urban, referente ao ano de
2009 e retirada do banco de dados do Banco Mundial, que possui 191 observaes
(isto , observaes de 191 pases) e mede a porcentagem da populao urbana de
cada pas. Abaixo est a estatstica descritiva elaborada pelo Excel:
wdi_urban
Mdia
Erro padro
Mediana
Desvio padro
Varincia da amostra
Intervalo
Mnimo
Mximo
Soma
Contagem

55,33529
1,691511
55,713
23,37715
546,4912
89,6114
10,3886
100
10569,04
191

Tabela 1: estatstica descritiva gerada pelo Excel da varivel dependente

Pela anlise descritiva isolada da varivel dependente, interessante notar


que seu desvio padro e sua varincia dentro da amostra tem peso significativo,
uma vez que a ausncia de tal caracterstica poderia ser prejudicial na varivel,
implicitamente apreendido que no desejvel que essas medidas de disperso
sejam constantes.
As variveis independentes X analisadas sero duas:
1) Varivel wdi_gdpc, que, assim como a varivel Y, tambm do ano de 2009
e provm do banco de dados do Banco Mundial, com a diferena de que
essa conta com menos observaes, 179; ela mede o PIB per capita com
base na paridade de poder de compra (PPC), em dlares internacionais
constantes de 2005, ou seja, aqui a varivel medida em unidade monetria.

Segundo a descrio do codebook do Standard Data (aqui, com traduo


minha) o PIB PPC o produto interno bruto convertido em dlares
internacionais, utilizando as taxas de paridade de poder de compra.
2) Varivel bl_asy25mf do ano de 2010, foi retirada do Barron-Lee Data Set
2011, contm 143 observaes, e traz a mdia dos anos de escolaridade no
total da populao com 25 anos ou mais (medida, portanto, em valores
decimais).
Abaixo seguem alguns dados de estatstica descritiva das duas variveis:
wdi_gdpc
Mdia
Erro padro
Mediana
Desvio padro
Varincia da amostra
Intervalo
Mnimo
Mximo
Soma
Contagem

12100,97
984,2703
7160,115
13168,64
1,73E+08
67659,25
303,3885
67962,64
2166074
179

Tabela 2: estatstica descritiva gerada pelo Excel da varivel independente wdi_gdpc

bl_asy25mf
Mdia
Erro padro
Mediana
Desvio padro
Varincia da amostra
Intervalo
Mnimo
Mximo
Soma
Contagem

7,813079
0,242902
8,349539
2,904687
8,437205
12,06748
1,202597
13,27008
1117,27
143

Tabela 3: estatstica descritiva gerada pelo Excel da varivel independente bl_asy25mf

Bem como a varivel Y, as variveis X aqui apresentadas tambm mostram


varincia e desvio padro com valores assaz significativos dentro de suas
respectivas amostras, embora em menores propores e diferentes.

Desta maneira, possvel inferir que tanto a varivel dependente quanto as


independentes apresentam relevncia prpria para seguinte anlise conjunta de
regresso mltipla.

Correlao
Outra forma que ilustra a pertinncia da escolha de tais variveis pode ser

20

Urban Population (%)


40
60

80

100

observada no grfico abaixo:

0.00

5.00
10.00
Average Schooling Years, Female and Male (25+)

15.00

Imagem 1: grfico de disperso, gerado pelo Stata, da relao entre a varivel dependente
wdi_urban (eixo Y do plano) e a varivel independente bl_asy25mf (eixo X do plano)1

Nota-se, a partir da disperso dos dados no grfico (cada ponto representando uma
observao), que a distribuio se mostra na sua maioria ainda que no
exatamente forme uma linha crescente e positiva, comprovando que h relao
entre as duas variveis.
1 Comando do Stata para gerar o grfico: scatter wdi_urban bl_asy25mf

Para melhor entender isso, observemos abaixo a tabela de correlao da


. correl wdi_urban wdi_gdpc bl_asy25mf

varivel dependente(obs=138)
e das variveis independentes:

wdi_ur~n wdi_gdpc bl~y25mf


wdi_urban
wdi_gdpc
bl_asy25mf

1.0000
0.6791
0.6099

1.0000
0.6077

1.0000

Tabela 4: correlao, gerada pelo Stata, entre a varivel Y e as variveis X2

Tendo como conceito percebido de que o valor r do coeficiente de correlao est


sempre entre -1 e +1, sendo que, quanto mais prximo do zero, menor a sua
associao, a tabela capaz de nos mostrar de que h notvel correlao na
anlise, tanto entre a varivel Y com a varivel wdi_urban (r = 0,6791) quanto entre
a varivel Y e a varivel wdi_gdpc (r = 0,6099).

Anlise de regresso
Antes de tudo, iremos observar a tabela de regresso mltipla e depois
analisar, por partes, seus resultados:

. reg wdi_urban wdi_gdpc bl_asy25mf


Source

SS

df

MS

Model
Residual

38900.9951
35501.5011

2
135

19450.4976
262.974082

Total

74402.4962

137

543.083914

wdi_urban

Coef.

wdi_gdpc
bl_asy25mf
_cons

.0008057
2.500416
27.56178

Std. Err.
.0001233
.5985222
4.124868

t
6.53
4.18
6.68

Number of obs
F( 2,
135)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

138
73.96
0.0000
0.5228
0.5158
16.216

P>|t|

[95% Conf. Interval]

0.000
0.000
0.000

.0005618
1.316723
19.40406

.0010496
3.684109
35.7195

Tabela 5: regresso mltipla, gerada pelo Stata, da varivel Y com as variveis X3


2 Comando no Stata para gerar a tabela de correlao: correl wdi_urban wdi_gdpc
bl_asy25mf
3 Comando no Stata para gerar a regresso mltipla: reg wdi_urban wdi_gdpc bl_asy25mf

Em primeiro lugar, possvel deduzir um modelo estimado para essa


regresso, que ser o seguinte:
Y = + 1(wdi_gdpc) + 2(bl_asy25mf) + ,
em que:
Y = varivel dependente
= constante
1 = coeficiente de inclinao da reta referente varivel wdi_gdpc ( = 0,008057)
2 = coeficiente de inclinao da reta referente varivel bl_asy25mf ( = 2,500416)
= erro.
Aps esse passo, podemos avanar na questo do teste de hipteses, em
que assumimos nossa hiptese nula H0 como a inexistncia de relevncia das
variveis independentes explicando a varivel dependente, e H1 (hiptese
alternativa) como a existncia da relevncia das variveis independentes explicando
a varivel dependente.
Os resultados da regresso nos ajudam a entender por que, nesse caso,
rejeitamos H0:
1) A Prob > F, que indica a validade do nosso modelo, de 0,0000, e quando o
resultado dessa estatstica 0, rejeita-se H0;
2) O p>|t| (p-valor) de cada varivel de 0,00, ou seja, menor do que o da
significncia do teste (admitimos = 0,05%), essa situao tambm afirma
que se rejeita H0;
3) A estatstica F mostra que a varincia entre os grupos maior que a varincia
dentro dos grupos, e, portanto, rejeita-se H0.
Sobre as outras estatsticas presentes na regresso, podemos ainda falar da
importncia do coeficiente de determinao R (R-squared) e tambm dos
coeficientes que so obtidos para cada varivel independente X.
R se refere proporo de variao total da varivel dependente Y que
explicada pela variao das variveis independentes X, sendo assim o R nos indica
a qualidade do modelo que est sendo testado. Com o resultado da regresso,

observa-se que o valor de R = 0.5228, ou seja, significa que 52,28% da variao de


Y explicada pelos Xs. No entanto, quando se trata de regresso mltipla, preciso
levar em conta o peso que cada varivel independente tem para explicar a varivel
dependente; por conseguinte, a estatstica que proporciona que seja entendido de
maneira mais clara essa influncia das variveis o R ajustado (Adj R-squared) 4.
Na regresso, nota-se que o valor do R-ajustado de 0,5158, depreendendo-se
disso que 51,58% do modelo explicativo. interessante que os valores de ambas
estatsticas no sejam to dspares, pois isso comprova que as variveis X no
apresentam influncias to diferentes.
J sobre os coeficientes das variveis independentes, repara-se o seguinte:
para a varivel wdi_gdpc, que se prope a explicar o peso da PIB per capita com
base no PPC sobre a populao urbana, temos o coeficiente no valor de 0,008057;
disso, infere-se que a varivel tenha importncia para a variao de Y, que embora
seja pequena, ainda assim expressiva. A segunda varivel independente,
bl_asy25mg, que se dispe a demonstrar a relevncia dos anos de estudos na
populao com 25 anos ou mais, possui o coeficiente com valor de 2,500416; assim,
conclui-se que essa varivel apresente, tambm, visvel importncia para entender o
fenmeno da urbanizao.
Ademais dessas estatsticas, se faz necessria, de igual forma, a anlise dos
erros da regresso. Abaixo segue o grfico com a disperso dos mesmos:

4 til ressaltar que o valor de R ajustado sempre ser menor que R.

40
20
Residuals
-20
0
-40
-60
20

40

60
Fitted values

80

100

Imagem 2: grfico de disperso dos erros, gerado pelo Stata5

Com esse grfico, exemplifica-se que os erros esto, de certa forma, bem
distribudos, o que contribui para afirmar a validade e a qualidade do modelo
proposto, uma vez que a situao perfeita da distribuio dos erros que eles
fiquem espalhados de forma aleatria em torno da reta que corresponde ao resduo
zero, formando uma mancha de largura uniforme, pois h que se esperar que os
erros sejam independentes, de mdia nula e de varincia constante, atendendo as
condies para afirmar a hiptese alternativa.

Consideraes finais
Acerca das dificuldades para o desenvolvimento da pesquisa, preciso
ressaltar que ainda h uma grande falta (ou mesmo inexistncia) de dados de outras
variveis que possam corroborar e, ainda mais, explicar outros fenmenos que
acontecem nas grandes cidades de todo o mundo. No comeo, a inteno era tentar
relacionar taxa de homicdios com nvel de desemprego, educao, renda e tambm
5 Comando no Stata para gerar o grfico de disperso dos erros (primeiro, h que
se colocar o comando predict erro, residuals): rvfplot

populao urbana; no entanto, devido a carncia de dados organizados num nico


banco, o estudo teve que ser direcionado a falar de outro problema, que no podia
apresentar dados insuficientes no somente sobre homicdios, mas sobre outros
crimes tambm.
H estudos tericos que se prope a explicar, de alguma forma, essas
relaes de renda, escolaridade e urbanizao, embora muitos sejam destinados
casos de especficas capitais, o que dificultou para encontrar uma situao global
que servisse para conectar integralmente o tema.
Ao fim e ao cabo as elucidaes acima buscaram explicar a forma como nvel
de educao e paridade por poder de compra per capita ajudam a explicar o
processo de urbanizao. Como fica claro, atravs dos resultados dos testes, da
visualizao dos grficos, a hiptese aqui proposta pode, com muita clareza, ser
aceita com pertinente grau de magnitude.

Referncias
GOHN,

Maria

da

Glria.

Futuro

das

Cidades.

Disponvel

em:

<http://www.lite.fe.unicamp.br/revista/gohn.html> Acesso em 02 de dezembro de


2014.
ROSTOW, Walt Whitman. Etapas de desenvolvimento econmico. Traduo:
Octavio Alves Filho. Rio de Janeiro, Zahar, 1974.
SCHETTINI, Daniela. Notas de aula (disciplina de Mtodos Empricos de Pesquisa
I/II).
Teorell, Jan, Nicholas Charron, Stefan Dahlberg, Sren Holmberg, Bo Rothstein,
Petrus Sundin & Richard Svensson. 2013. The Quality of Government Dataset,
version 20Dec13. University of Gothenburg: The Quality of Government Institute,
<http://www.qog.pol.gu.se>. Acesso em 30 de novembro de 2014.

Potrebbero piacerti anche