Sei sulla pagina 1di 50

RedesComplexas:

teoria, algoritmos e aplicaes em computao teoria,algoritmoseaplicaesemcomputao


Bloco#3
Introduoa Redes
2
o
semestrede2009
VirglioA.F.Almeida
Agosto de 2009 Agostode2009
D d Ci i d C Departamento de Cincia da Computao
Universidade Federal de Minas Gerais
Redes de Informao? RedesdeInformao?
Rede:umacoleode entidades queesto interconectadas
Umaarestaentredoisnsdenotaumainteraoentreas
duasentidades.
Vemosessainteraocomosinformationexchange,daa
ideia de Redes de Informao ideiadeRedesdeInformao
O t b l Otermobemgeral
Por que interessa? Porqueinteressa?
Redesestoemtodasreas
Cadavezmaisumnmeromaiordesistemaspodesermodeladocomo
redes e mais dados so coletados redesemaisdadossocoletados
Modelosdegrafostradicionaisnoseaplicamaoscasosreais
Redesemlargaescalanecessitamdenovosferramentasde
anlise
Umanovarea:scienceofnetworks
Envolvemltiplasdisciplinas:computao,fsica,biologia,economia,
sociologia,matemtica,etc.
JonKleinberg:
2008ACMInfosysFoundationAwardRecipient
"....Socialnetworkanalysisisanareathatreachesbackquitealongtimeandhas
been a very active area in sociology anthropology and other disciplines in the social beenaveryactiveareainsociology,anthropologyandotherdisciplinesinthesocial
sciences.Whencomputerscientistsbeganthinkingaboutthisinthelate1990'swe
hadalotofexpertisetodrawon.Therearetwoissuesgoingonhere.Oneiswhy
are computer scientists drawn to this? The second point is because of all this data arecomputerscientistsdrawntothis?....Thesecondpointisbecauseofallthisdata
thekindsofsocialnetworkquestionsthatyouaskarerelatedbutsomewhat
distinctfromwhatsociologistswouldhave....Theinterestingchallengenowistotry
to combine these two sets of research " tocombinethesetwosetsofresearch...
"....Ithinktherearesomeinterestingthemeshere.Oneisinaggregatethe
d t f i f ti d i t ti tt d ll ti quadrantsofinformationcanproduceveryinterestingpatternsandcollective
traces.Secondlythesocialeffectsaregoingtobecomeimportantdesignprinciples
forbiginformationalthreadslikeWikipediaorFlickr,etc....Theyhaveboth
technological and social mechanisms working together so in computer science we technologicalandsocialmechanismsworkingtogethersoincomputersciencewe
aregoingtohavetothinkaboutdesignprinciplesthatincorporatesomeof
these....Thefinalinterestingquestionisthatbyitsverynature,researchhasalarge
stockpile of information and that raises questions about privacy " stockpileofinformationandthatraisesquestionsaboutprivacy....
Tipos de redes Tiposderedes
Redessociais
Redes de conhecimento (informao) Redesdeconhecimento (informao)
Redestecnolgicas
Redesbiolgicas
Redes Sociais RedesSociais
Aresta denota/representa umarelaosocial
Redesdeconhecidos
Rededeatores
R d d Rededecoautores
Rededediretores
Rededechamadastelefonicos
R d d il Rededeemail
RededeInstantMessaging
Redesdecontatossexuais
Redes de amigos em social media software Redesdeamigosemsocialmediasoftware
Redesdeconhecimento (informao)
Nsarmazenam informao,arestas associam informao
R d d it ( i t d ) Rededecitao (orientada)
A Web(orientada)
R d P P RedesPeertoPeer
Redesdepalavras
d d f Rede deconfianatrust
Redede...
Redes tecnolgicas Redestecnolgicas
Redesconstrudasparadistribuiodecommodity
A Internet
routerlevel,ASlevel
Rededeenergiaeltrica
Rededelinhasareas
Redetelefnica
Rededetransporte
Estrada,ruas,estradadeferro
GrafosdeSoftware
Redes biolgicas Redesbiolgicas
Sistemasbiolgicos representadoscomoredes
RedesdeinteraoProteinaProteina
Redesdegenes
RedesdotipoFoodWeb
RedesNeurais
E agora? Eagora?
Omundoestacheioderedes!Eagora????
Entendersuastopologiasemedirsuaspropriedades
Estudarsuadinmicadeevoluo
Criarmodelosrealistas
Criar algoritmosqueaproveitemaestruturaerelaesdas
redes
KonigsbergBridgeProblem:Doesthereexistanysinglepaththatcrosses
allsevenbridgesexactlyonceeach?
Abstrao: grafo g
Networkanalysis:twoquestions
1)Whenisanodeanode?
2)Whenisanedgeanedge?
Science,vol 325,2009
ErdsRenyi Random graphs Erds RenyiRandomgraphs
O d l G Omodelo G
n,p
n:nmerode vrtices
0 p 1 0p1
Paragerarumaamostra/sample,aleatoriamente,selecionasen
inicialmentedesconexosvrticeseparacadapar (i,j),gereumaaresta
(i j) independentemente com probabilidade p (i,j)independentementecomprobabilidade p.
OmodeloG
n,m
oconjuntodetodososgrafosconsistindode
,
nnodosem arestas.
Paragerarumaamostradegrafouniformemente,demaneira
aleatria,simplestementeatribuisemarestasentreparesescolhidos , p p
aleatoriamentedennodos/vrticeinicialmentenoconectados.
Distribuiodegrausemumgrafoaleatrio
Adistribuiosegueuma binomial

( )
k n
k
p 1 p
k
n
p) k; B(n; p(k)

= =
Assumindo z=np fixo,qdo n B(n,k,p) pode ser
aproximada por uma distribuio de Poisson aproximada por uma distribuio de Poisson
z
k
e
k!
z
z) P(k; p(k)

= =
Altamenteconcentradaemtornodamdia, comumacauda
i i l
k!
quecaiexponencialmente.
d b l Exerccio:demonstrarqueabinomialconvergeparaPoisson
quandon
Grafos randmicos e a realidade Grafosrandmicosearealidade
Umateoriaeleganteestudadaexaustivamente.
f d i id d d l d GrafosRandomicostemsidousadoscomomodelosgeradores
deoutrosgrafos.
N t t t lid d Noentanto,nocapturamarealidade
Propriedades das Redes PropriedadesdasRedes
Distribuiodosgraus
FenmenodoSmallworld
ClusteringCoefficient
Mixingpatterns (assortative/dissortative)
Betweenness
Communidades e clusters
Distribuio dos graus Distribuiodosgraus
frequencia
f
k
= frao de ns com grau k
= probabilidade de n selecionado
f
k
aleatoriamente ter grau k
grau k
f
k
Problema: determineadistribuiodeprobabilidadequemelhorajuste
(best fit) a um conjunto de dados experimentais de uma rede
g
(bestfit)aumconjuntodedadosexperimentaisdeumarede.
Proponhaumacoletadedadosefaaofitting!
Distribuies Powerlaw DistribuiesPower law
O d di t ib i d d i i i d Ograudedistribuioderedesreaisseguenamaioriadasvezesuma
funodotipopowerlaw:
p(k) = Ck
-
Distribuio de cauda pesada (Heavytail distribution)
p(k) Ck
Distribuiodecaudapesada(Heavy taildistribution)
Existeumafraodensnodesprezvelquetemgrausmuitoaltos (hubs)
scalefree:mdianoinformativaenotemcaractersticasdeescala.
Numcontrastegritantecomgrafosrandomicos!
Altamenteconcentradoemtornodamdia
Aprobabilidadedenscomgrausmuitoaltosexponencialmentepequena.
Assinatura Powerlaw AssinaturaPower law
Di ib i P l l li h DistribuioPowerlawlevaaumalinharetanum
grficologlog.
log p(k) = - logk + logC
frequencia
log frequencia

Grau: vrias ordens de grandeza
log grau
: expoente power-law (tipicamente 2 3)
Exemplos Exemplos
[Newman 2003]
Um exemplo de grafo randmico Umexemplodegraforandmico
R d Al t i Di t ib i d G Rede Aleatria ----------------------------- Distribuio de Grus
Distribuio Exponential DistribuioExponential
b d l d l d l b Observadaemalgumasredestecnolgicasoudecolaborao
p(k) = e
-k
Identificadaporumaretano grficologlinear.
log p(k) = - k + log
log frequencia

grau
EstatsticasColetivas(M.Newman2003)
Clustering coefficient (Transitividade) Clusteringcoefficient (Transitividade)
d d d d d l (l l l ) f Medeadensidadedetringulos(localclusters)nografo
Duasformasdemedir:
2
= =
v
v
e
E
C
) 1 ( *
2

=

=
v v
v
v
k k
k
C
v C
1
C
(2)
=
2

Arazodasmdias
v C
n
C =

i
(1)
i n no centrados triangulos
C

=
i
i
(1)
i n no centradas triplas
C
clusteringcoefficient local
n
i
= 4
Nmero max de conexes
4*3/2 = 6
3 conexes presentes
C
i
= 3/6 = 0.5
i
link presente
link ausente
link presente
Clustering coefficient para grafos randomicos Clusteringcoefficientparagrafosrandomicos
Aprobabilidadededoisdeseusvizinhosseremtambemvizinhos p,
independente da estrutura local independentedaestruturalocal
clusteringcoefficientC=p
Estatsticas Coletivas (M. Newman 2003) EstatsticasColetivas(M.Newman2003)
Mtricas de rede Mtricasderede
d h d
ij
=menorcaminhoentre iej
Diametro:
ij
j i
d max = = G d d
Comprimentomdiodocaminho:
j
j i,

>
=
j i
ij
d
1)/2 - n(n
1
l
MdiaHarmonica
>j i
1)/2 n(n

>

=
j i
1 -
ij
d
1)/2 - n(n
1
1
l
>j i
1)/2 n(n
EstatsticasColetivas(M.Newman2003)
Mixing patterns Mixingpatterns
d l b b l d d d d Assumasequesetemvrios tipos dens.Qualaprobabilidadededois
nsdediferentetiposseremconectados?assortativemixing
E : mixing matrix
p(i,j) = probabilidade de mixing

=
j) (i
j) E(i,
j) p(i,

j i,
j) E(i,
j) p( ,
p(j | i) = probabilidade condicional de mixing
j) E(i

=
j
j) E(i,
j) E(i,
i) | p(j
Propriedades das redes Propriedadesdasredes
Mixingpatterns
a.k.a.assortativemixing
1958 i h t S F i 1958casaisheterosemSanFrancisco:
Mixing Coefficients MixingCoefficients
Mi i P MixingPatterns
Comoquantificar?
S j E # d t t d ti ti i j Seja E
ij
=#dearestas conectandoverticestipos i e j
E =matrizcomelements E
ij
Assim a matriz normalizada Assim,amatriznormalizada
||E|| d d l l E ||E||=somadetodoselelmentosE
Elemento e
ij
de e =frao dearestasentre iandj
Mixing coefficient Mixingcoefficient
Newman2003

= p(i j) a

=
j
i
p(i,j) a

=
i
p(j,i) b

=
i i
i i ii
b a e
r
j
r=0.621
Caractersticas:

i
i i
b a - 1
r

r=1matriz diagonal
1 =

i
ii
e

b
Altamente
Assortatitva,
Por que?
r=0matriz uniforme

=
i
i i
i
ii
b a e
Quais fatores?
Correlao de graus Correlaodegraus
Nsdegrausaltostendemaseconectaransaltos?
PastorSatorasetal.
E i P d d l t f fi d Exerccio:Paraosdadosquevocecoletou,faaumgrficodogru
mdiodosvizinhosemfunodogru.
Newman
Computeocoeficientedecorrelaodosgrausdeduasextremidades p g
deumaaresta
assortative/disassortative
Primeiraaproximao
Assortatividade
Primeira aproximao
Propriedade do n = seu grau
Assortative networks Disassortative networks
Redes reais sempre exibem uma das duas tendncias,
redes similares exibme comportamentos similares . p
Social networks Techological networks
MedidasdeCorrelaoGrauaGrau
Graumediodosvizinhosproximosdensdegrauk
Probablilidade que um vertice k esteja conectado a k
) ' ( k k P
Probablilidadequeumverticekestejaconectadoak
Probabilidade
N N k P
k
/ ) ( =
Paraefeitosdeclculoemredesreais,maisfciltrabalharcomograumediodos
vizinhosmaisproximosdek,definidopor:
Para se analisar assortative faz em funo de k ou seja
) ' ( ' ) (
'
k k P k k Knn
k

=
Paraseanalisarassortative,fazemfunodek,ouseja
Se knn uma funo crescente de k:
Assortative Assortative
Se knn uma funo decrescente de k:
Disassortative
Se nenhum dos casos acima: Non assortative
Conectividade da Internet ConectividadedaInternet
Relaes de conectividade Relaes de conectividade
Pastor Satorras, Vazquez &Vespignani,
PRL 87, 258701 (2001)
Media do grau dos vizinhos mais prximos
F d l d
< k (k)> k (k|k)
Funo de correlao de graus
< k
nn
(k)> =
k
k p(k|k)
Consequenciasdaassortatividade: Di i de E id i Consequencias da assortatividade: - Disseminaode Epidemias,
Comunidades Isoladas....
Newman, PRE, bf 67 : 026126 , (2003).
Quantifying social vs. antisocial behavior in email networks
Gomes Luiz H ; Bettencourt Luis M A ; Almeida Virgilio A F ; Gomes, Luiz H.; Bettencourt, Luis M. A.; Almeida, Virgilio A. F.;
Almeida, Jussara M.; Castro, Fernando D. O.
http://adsabs.harvard.edu/abs/2006physics...1141G p p y
n
K
n
n
KK
Estatsticas Coletivas (M. Newman 2003) EstatsticasColetivas(M.Newman2003)
Betweenness mede a centralidade de ns Betweenness mede a centralidade de ns
B
A
O betweenness b
i
do n i o nmero de
caminhos mnimos entre pares de ns que passa ca os os e t e pa es de s que passa
pelo n i.
Betweenness mede a centralidade de ns Betweenness mede a centralidade de ns
B
A
betweenness = load = Betweenness centrality
L
h,,j
no. Total de shortest paths de h a j e L
h,i,,j
o no. total de shortest paths
,,j , ,,j
que passa pelo vrtice i. Assim, ,
j h j i h i
L L b
, , ,
/

=
The betweenness distribution also follows a
truncated power law
) / ( ) ( b b b b P

) / ( ) (
x
b b g b b P

Aeroportos: cidades mais conectadas no so as mais centrais Aeroportos: cidades mais conectadas no so as mais centrais
Cidades Mais Cidades Mais
conectadas
Mais Mais
centrais
Cidades mais centrais so importantes! Cidades mais centrais so importantes!
Cidades Cidades
mais
centrais
Referncias (1) e (2) da bibliografia: estudar! Referncias(1)e(2)dabibliografia:estudar!
) h d f f l k 1)M.E.J.Newman,Thestructureandfunctionofcomplexnetworks,
SIAMReviews,45(2):167256,2003
2)M.E.J.Newman.D.J.Watts,andS.H.Strogatz,Randomgraph
d l f i l k S b 9 2002 l 99 S l modelsofsocialnetworks,PNAS February19,2002vol.99no.Suppl 1
25662572
Is the path length enough? Isthepathlengthenough?
R d h h di Randomgraphshavediameter
logn
d =
logz
d =
d=logn/loglognwhenz=(logn)
Shortpathsshouldbecombinedwithother
properties p p
easeofnavigation
highclusteringcoefficient g g
Exemplo Exemplo
1 4
3
3 3
2
5
8
3
6 1 1
3
C
(1)
=
+ +
=
Exemplo Exemplo
1 4
( )
13 1
(2)
1
3
4
( )
30
13
6 1 1 1
5
1
C
(2)
= + + =
2
3
5
8
3
C
(1)
=
Osdoisclusteringcoefficientslevamamedidasdiferentes
8