Introducao A Teoria Ergodica

Introdu cao ` a Teoria Erg odica
Krerley Oliveira e Marcelo Viana

ii
Prefacio
Em termos simples, a Teoria Erg odica e a disciplina matematica que estuda
sistemas din amicos munidos de medidas invariantes. Come caremos por dar as
deni coes precisas destas no coes e algumas das principais motiva coes para o
seu estudo. No nal deste prefacio faremos alguns comentarios sobre a hist oria
desta disciplina.
Sistemas dinamicos
Ha v arias deni coes, mais ou menos gerais, do que e um sistema dinamico. Nos
nos restringiremos a dois modelos principais. O primeiro deles, ao qual nos
referiremos na maior parte do tempo, s ao as transformacoes f : M M em
algum espaco metrico ou topol ogico M. Heuristicamente, pensamos em f como
associando a cada estado x M do sistema o estado f(x) M em que o sistema
se encontrar a uma unidade de tempo depois. Trata-se portanto de um modelo
de din amica com tempo discreto.
Tambem consideraremos uxos, que sao modelos de sistemas dinamicos a
tempo contnuo. Lembre que um uxo em M e uma famlia f
t
: M M, t R
de transformacoes satisfazendo
f
0
= identidade e f
t
f
s
= f
t+s
para todo t, s R. (1)
Fluxos aparecem, por exemplo, associados a equa coes diferenciais: tome como
f
t
a transforma cao que associa a cada ponto x o valor no tempo t da solu cao
da equacao que passa por x no tempo zero.
Num caso e no outro, sempre iremos supor que o sistema din amico e pelo
menos mensuravel: na maior parte dos casos ser a ate contnuo, ou mesmo difer-
enciavel.
Medidas invariantes
Sempre consideraremos medidas denida na -algebra de Borel do espaco M.
Dizemos que e uma probabilidade se (M) = 1. Na maior parte dos casos
trataremos com medidas nitas, isto e, tais que (M) < . Neste caso sempre
podemos transformar numa probabilidade : para isso basta denir
(E) =
(E)
(M)
para cada conjunto mensur avel E M.
iii
iv
Em geral, uma medida diz-se invariante pela transforma cao f se
(E) = (f
1
(E)) para todo conjunto mensur avel E M. (2)
Heuristicamente, isto signica que a probabilidade de um ponto estar num dado
conjunto e a probabilidade de que a sua imagem esteja nesse conjunto s ao
iguais. Note que a deni cao (2) faz sentido, uma vez que a pre-imagem de um
conjunto mensur avel por uma transforma cao mensuravel ainda e um conjunto
mensuravel.
No caso de uxos, substitumos (2) por
(E) = (f
t
(E)) para todo mensuravel E M e todo t R. (3)
Porque medidas invariantes ?
Como em todo ramo da Matematica, parte importante da motiva cao e intrnseca
e estetica: estas estruturas matematicas tem propriedades profundas e surpreen-
dentes que conduzem ` a demonstracao de belssimos teoremas. Igualmente fasci-
nante, ideias e resultados da Teoria Erg odica se aplicam em outras areas da
Matematica que a priori nada tem de probabilstico, por exemplo a Combi-
nat oria e a Teoria dos N umeros.
Outra raz ao e que muitos fen omenos importantes na Natureza e nas ciencias
experimentais sao modelados por sistemas dinamicos que deixam invariante al-
guma medida interessante. O exemplo mais importante, historicamente, veio
da Fsica: sistemas hamiltonianos, que descrevem a evolu cao de sistemas con-
servativos na mec anica newtoniana, s ao descritos por uxos que preservam uma
medida natural, a medida de Liouville. Ali as veremos que sistemas dinamicos
muito gerais possuem medidas invariantes.
Ainda outra motiva cao fundamental para que nos interessemos por medidas
invariantes e que o seu estudo pode conduzir a informa cao importante sobre
o comportamento din amico do sistema, que dicilmente poderia ser obtida de
outro modo. O teorema de recorrencia de Poincare e uma excelente ilustracao
do que acabamos de dizer.
Breve apresentacao hist orica
A palavra erg odico e a concatena cao de duas palavras gregas, ergos = trabalho
e odos = caminho, e foi introduzida por Boltzmann, no seculo XIX, no seu
trabalho sobre a teoria cinetica dos gases. Os sistemas em que Boltzmann,
Maxwell, Gibbs, os principais fundadores da teoria cinetica, estavam interessa-
dos sao descritos por um uxo hamiltoniano, ou seja, uma equa cao diferencial
da forma
_
dq
1
dt
, . . . ,
dq
n
dt
,
dp
1
dt
, . . . ,
dp
n
dt
_
=
_
H
p
1
, . . . ,
H
p
n
,
H
q
1
, . . . ,
H
q
n
_
.
Boltzmann acreditava que as orbitas tpicas do uxo preenchem toda a superfcie
de energia H
1
(c) que as contem. A partir desta hip otese ergodica, ele deduzia
v
que as medias temporais de grandezas observaveis (fun coes) ao longo de orbitas
tpicas coincidem com as respectivas medias espaciais na superfcie de energia,
um fato crucial para a sua formula cao da teoria cinetica.
De fato, esta hipotese e claramente falsa e, com o tempo, tornou-se usual
chamar hip otese ergodica a sua consequencia de igualdade das medias tempo-
rais e espaciais. Sistemas para os quais esta igualdade vale foram chamados
erg odicos. E pode dizer-se que uma boa parte da Teoria Erg odica, tal como ela
se desenvolveu ao longo do seculo XX, foi motivada pelo problema de decidir se
a maioria dos sistemas hamiltonianos, especialmente aqueles que aparecem na
teoria cinetica dos gases, sao erg odicos ou n ao.
Um avan co fundamental ocorreu nos anos trinta, quando von Neumann e
Birkho provaram que medias temporais existem para quase toda orbita. Es-
petacularmente, em meados dos anos cinquenta, Kolmogorov provou que muitos
sistemas hamiltonianos nao sao erg odicos. Este resultado foi muito expandido
por Arnold e por Moser, no que veio a ser chamado teoria KAM em homenagem
aos tres.
Por outro lado, ainda nos anos trinta, E. Hopf tinha dado os primeiros exem-
plos importantes de sistemas hamiltonianos ergodicos, os uxos geodesicos de
superfcies com curvatura negativa. O seu resultado foi generalizado por Anosov,
nos anos sessenta, para variedades de qualquer dimensao. De fato, Anosov
tratou uma classe bem mais geral de sistemas, tanto com tempo contnuo como
com tempo discreto, que sao chamados sistemas de Anosov, ou globalmente
hiperb olicos.
Nos anos setenta, Sinai desenvolveu a teoria das medidas de Gibbs dos sis-
temas de Anosov, conservativos ou dissipativos, que foi logo em seguida es-
tendida por Ruelle e por Bowen para sistemas chamados Axioma A, ou uni-
formemente hiperbolicos, constituindo uma das maiores realiza coes da teoria
erg odica diferenciavel. N ao podemos deixar de mencionar, nesta breve lista de
contribui coes fundamentais, a introdu cao da no cao de entropia por Kolmogorov
e Sinai no nal dos anos cinquenta, e a demonstracao, por Ornstein cerca de
dez anos depois, de que a entropia e um invariante completo para deslocamentos
(shifts) de Bernoulli.
Krerley Oliveira
1
e Marcelo Viana
2
1
Departamento de Matematica, Universidade Federal de Alagoas, Campus A. C. Simoes
s/n, 57072-090 Maceio, Brasil. krerley@mat.ufal.br.
2
IMPA, Estrada D. Castorina 110, 22460-320 Rio de Janeiro, Brasil viana@impa.br.
vi
Conte udo
0 Elementos de Teoria da Medida 1
0.1 Espa cos mensur aveis . . . . . . . . . . . . . . . . . . . . . . . . . 1
0.2 Espa cos de medida . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.3 Integra cao em espa cos de medida . . . . . . . . . . . . . . . . . . 6
0.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1 Teorema de Recorrencia de Poincare 13
1.1 Vers ao mensuravel . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2 Vers ao topol ogica . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3 Recorrencia para medidas innitas . . . . . . . . . . . . . . . . . 15
1.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2 Exemplos de Medidas Invariantes 17
2.1 Expans ao decimal . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Sistemas conservativos . . . . . . . . . . . . . . . . . . . . . . . . 19
2.3 Deslocamentos (shifts) de Bernoulli . . . . . . . . . . . . . . . 21
2.4 Transforma cao de Gauss . . . . . . . . . . . . . . . . . . . . . . . 22
2.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3 Existencia de Medidas Invariantes 27
3.1 Alguns exemplos simples . . . . . . . . . . . . . . . . . . . . . . . 27
3.2 A topologia fraca
no espaco das medidas . . . . . . . . . . . . . 28

3.3 Demonstracao do Teorema de Existencia . . . . . . . . . . . . . . 32
3.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4 Teorema Erg odico de Birkho 37
4.1 Enunciados e coment arios . . . . . . . . . . . . . . . . . . . . . . 37
4.2 Demonstracao do teorema ergodico . . . . . . . . . . . . . . . . . 39
4.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5 Ergodicidade 43
5.1 Exemplos e aplica coes . . . . . . . . . . . . . . . . . . . . . . . . 44
5.2 Equivalencia Espectral . . . . . . . . . . . . . . . . . . . . . . . 51
5.3 Propriedades de medidas erg odicas . . . . . . . . . . . . . . . . . 54
vii
viii CONTE
UDO
5.4 Teorema de decomposicao erg odica . . . . . . . . . . . . . . . . . 56
5.5 Teorema de desintegracao . . . . . . . . . . . . . . . . . . . . . . 60
5.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
6 Sistemas Misturadores 67
6.1 Deni coes e exemplos . . . . . . . . . . . . . . . . . . . . . . . . 67
6.2 Deslocamentos de Markov . . . . . . . . . . . . . . . . . . . . . . 69
6.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
7 Entropia Metrica 77
7.1 Entropia de uma parti cao . . . . . . . . . . . . . . . . . . . . . . 77
7.2 Entropia de um sistema erg odico . . . . . . . . . . . . . . . . . . 80
7.3 Teorema de Kolmogorov-Sinai . . . . . . . . . . . . . . . . . . . . 83
7.4 Equivalencia ergodica . . . . . . . . . . . . . . . . . . . . . . . . 83
7.5 Equivalencia Espectral . . . . . . . . . . . . . . . . . . . . . . . . 84
7.6 A entropia como invariante . . . . . . . . . . . . . . . . . . . . . 85
7.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
8 Entropia Topol ogica 89
8.1 Deni cao via coberturas . . . . . . . . . . . . . . . . . . . . . . . 89
8.2 Deni cao via conjuntos geradores . . . . . . . . . . . . . . . . . . 91
8.3 Entropia de uxos . . . . . . . . . . . . . . . . . . . . . . . . . . 92
8.4 Pressao topol ogica . . . . . . . . . . . . . . . . . . . . . . . . . . 93
8.5 Princpio variacional . . . . . . . . . . . . . . . . . . . . . . . . . 94
8.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
9 Transforma coes Expansoras 97
9.1 Lema de distor cao . . . . . . . . . . . . . . . . . . . . . . . . . . 98
9.2 Medidas absolutamente contnuas . . . . . . . . . . . . . . . . . . 100
9.3 Existencia de medidas erg odicas . . . . . . . . . . . . . . . . . . . 101
9.4 Unicidade e conclusao da prova . . . . . . . . . . . . . . . . . . . 102
9.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
10 Estados de Equilbrio 105
10.1 Deni cao de Estado de Equilbrio . . . . . . . . . . . . . . . . . . 105
10.2 Transforma coes expansivas . . . . . . . . . . . . . . . . . . . . . . 106
10.3 Transforma coes expansoras . . . . . . . . . . . . . . . . . . . . . 110
10.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
11 Aplicacoes em Teoria dos N umeros 123
11.1 Teorema de Szemeredi . . . . . . . . . . . . . . . . . . . . . . . . 123
11.2 Teorema de Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
11.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
CONTE
UDO ix
12 Resultados em Teoria Erg odica Diferenciavel 137
12.1 Fluxos geodesicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
12.2 Hiperbolicidade n ao-uniforme . . . . . . . . . . . . . . . . . . . . 137
12.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
x CONTE
UDO
Captulo 0
Elementos de Teoria da
Medida
Neste captulo inicial recordamos algumas no coes e resultados b asicos da Teo-
ria da Medida que s ao uteis para o que segue. As demonstracoes podem ser
encontradas nos livros de Castro [Cas04], Fernandez [Fer02] ou Rudin [Rud87].
0.1 Espacos mensuraveis
Comecamos por introduzir as no coes de algebra e -algebra de subconjuntos.
Em seguida denimos espa cos mensur aveis e apresentamos uma tecnica de
construcao de -algebras. Seja M um conjunto.
Denicao 0.1. Uma algebra de subconjuntos de M e uma famlia B de subcon-
juntos que contem M e e fechada para as opera coes elementares de conjuntos:
A B implica A
c
= M A B
A B e B B implica A B B.
Ent ao AB = (A
c
B
c
)
c
e A B = AB
c
tambem estao em B, quaisquer
que sejam A, B B. Alem disso, por associatividade, a uni ao e a interseccao
de qualquer n umero nito de elementos de B tambem estao em B.
Denicao 0.2. Uma algebra diz-se uma - algebra de subconjuntos de M se
tambem for fechada para uni oes enumer aveis:
A
j
B para j = 1, 2, . . . , n, . . . implica
_
j=1
A
j
B.
Observa cao. B tambeme fechada para intersec coes enumer aveis: se A
j
B
para j = 1, 2, . . . , n, . . . ent ao
j=1
A
j
=
_

_
j=1
A
c
j
_
c
B.
1
2 CAP
ITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

Denicao 0.3. Um espaco mensuravel e uma dupla (M, B) onde M e um
conjunto e B e uma -algebra de subconjuntos de M. Os elementos de B sao
chamados conjuntos mensur aveis.
Em seguida apresentamos alguns exemplos de -algebras remetendo para os
exerccios o estudo de outros exemplos.
Exemplo 0.4. Seja M um conjunto qualquer.
1. Denotemos por 2
M
a famlia de todos os subconjuntos de M. Ent ao
B = 2
M
e claramente uma -algebra.
2. B = , M e tambem uma -algebra.
Note que se B e uma algebra de um conjunto M ent ao , M B 2
M
.
Portanto , M e a menor algebra e 2
M
e a maior algebra de um conjunto
M. Considere uma famlia n ao-vazia B
i
: i 1 qualquer de -algebras (1 e
um conjunto qualquer, que serve apenas para indexar os elementos da famlia).
Ent ao a intersec cao
B =
iI
B
i
e tambem uma -algebra (veja o Exerccio 0.1). Agora, dado um conjunto
qualquer c de subconjuntos de M, podemos aplicar esta ideia à famlia de todas
as -algebras que contem c. Note que esta famlia e nao vazia, uma vez que
contem a -algebra 2
M
, pelo menos. De acordo com a observa cao anterior, a
interseccao de todas estas -algebras e tambem uma -algebra, e e claro que
contem c. Alem disso, do modo que e construda, ela esta contida em todas as
-algebras que contem c. Portanto e a menor -algebra que contem c.
Denicao 0.5. A - algebra gerada por uma famlia c de subconjuntos de M e
a menor -algebra que contem a famlia c.
No caso em que M vem munido da estrutura de espaco topologico, h a uma
escolha natural para c, nomeadamente, o conjunto dos subconjuntos abertos.
Isto nos conduz à no cao de - algebra de Borel.
Denicao 0.6. Seja (M, ) um espaco topologico, isto e, M um conjunto e
a famlia dos subconjuntos abertos de M. Ent ao a - algebra de Borel de M
e a -algebra gerada por , ou seja, a menor -algebra que contem todos os
subconjuntos abertos.
0.2 Espacos de medida
Agora introduzimos o conceito de medida e analisamos algumas das suas pro-
priedades fundamentais. Em seguida apresentamos alguns resultados sobre
construcao de medidas. Finalmente, analisamos duas importantes classes de
medidas: medidas de Lebesgue em espacos euclideanos e medidas produto em
espaco de sequencias.
0.2. ESPAC OS DE MEDIDA 3
Denicao 0.7. Uma medida num espaco mensuravel (M, B) e uma fun cao
: B [0, +] que satisfaz:
1. () = 0;
2. (
j=1
A
j
) =
j=1
(A
j
) para quaisquer A
j
B disjuntos dois-a-dois.
A tripla (M, B, ) e chamada espaco de medida. Quando (M) = 1 dizemos que
e uma medida de probabilidade e (M, B, ) e um espaco de probabilidade.
A segunda propriedade na deni cao de medida e chamada a -aditividade.
Dizemos que uma fun cao : B [0, +] e nitamente aditiva se:
(
N
_
j=1
A
j
) =
N
j=1
(A
j
)
para qualquer famlia nita A
1
, . . . , A
N
B de subconjuntos disjuntos dois-a-
dois. Note que toda medida e, automaticamente, nitamente aditiva.
Exemplo 0.8. Seja M um conjunto e consideremos a -algebra B = 2
M
. Dado
qualquer p M, consideremos a funcao
p
: 2
M
[0, +] denida por:
p
(A) =
_
1 , se p A
0 , se p / A
.
Temos que
p
e uma medida, que e usualmente designada por delta de Dirac no
ponto p.
Em seguida apresentamos um resultado muito util na constru cao de medidas.
Teorema 0.9 (Extensao). Seja B
0
uma algebra de subconjuntos de M e seja
0
: B
0
[0, +] uma fun c ao nita, nitamente aditiva. Entao existe uma
unica fun cao nita, nitamente aditiva : B [0, +] que e uma extens ao de
0
(isto e, restrita a B
0
coincide com
0
) ` a - algebra B gerada por B
0
. Se
0
e -aditiva ent ao tambem o e.
Em geral, ao aplicar este resultado o mais difcil e vericar a -aditividade.
O criterio mais usado para esse efeito e expresso no seguinte resultado. A sua
demonstracao e proposta como Exerccio 0.7.
Teorema 0.10 (-aditividade). Seja B
0
uma algebra e seja
0
: B
0
[0, +]
uma fun c ao nitamente aditiva com
0
(M) = 1. Suponha que
lim
n
0
(
n
j=1
A
j
) = 0 (1)
para toda a sequencia A
1
A
j
de conjuntos mensur aveis tal que
j=1
A
j
= . Entao
0
e -aditiva.
4 CAP

O resultado seguinte nos diz que todo o elemento B da -algebra gerada por
uma algebra e aproximado por algum elemento B
0
da algebra, no sentido em
que a medida da diferenca simetrica BB
0
= B B
0
B
0
B e pequena.
Teorema 0.11 (Aproximacao). Seja (M, B, ) um espa co de probabilidade e
seja B
0
uma algebra que gera a - algebra B. Entao para todo o > 0 e todo
B B existe B
0
B
0
tal que (BB
0
) < .
0.2.1 Medida de Lebesgue
A medida de Lebesgue corresponde ao que entendemos por volume de sub-
conjuntos de R
d
. Para constru-la, recorremos ao Teorema de Extensao 0.9.
Consideremos M = [0, 1] e seja B
0
a famlia de todos os subconjuntos da forma
B = I
1
I
N
onde I
1
, . . . , I
N
sao intervalos disjuntos dois-a-dois.

E f acil ver
que B
0
e uma algebra de subconjuntos de M. Alem disso, temos uma fun cao
0
: B
0
[0, 1] denida nesta algebra por
0
_
I
1
I
N
_
= [I
1
[ + +[I
N
[ ,
onde [I
j
[ representa o comprimento de I
j
. Note que
0
(M) = 1. Alem
disso, a -algebra gerada por B
0
coincide com a -algebra de Borel de M, j a
que todo aberto pode ser escrito como uni ao enumer avel de intervalos disjuntos
dois-a-dois. Pelo Teorema 0.9, existe uma unica probabilidade denida na
-algebra de [0, 1] que e uma extensao de
0
à -algebra B gerada por B
0
.
Chamamos de medida de Lebesgue em [0, 1]. Mais geralmente, denimos
medida de Lebesgue no cubo M = [0, 1]
d
de qualquer dimens ao d 1 da
seguinte maneira: chamamos ret angulo em M qualquer subconjunto da forma
R = I
1
I
d
onde os I
j
sao intervalos, e denimos
0
(R) = [I
1
[ [I
d
[ .
Em seguida, consideramos a algebra B
0
dos subconjuntos de [0, 1]
d
da forma
B = R
1
R
N
, onde R
1
, . . . , R
N
sao ret angulos disjuntos dois-a-dois, e
denimos
0
(B) =
0
(R
1
) +
0
(R
N
)
para todo B nessa algebra. A medida de Lebesgue em M = [0, 1]
d
e a extensao
de
0
à -algebra gerada por B
0
, que coincide com a -algebra de Borel de
M. Finalmente, denimos a medida de Lebesgue num espa co euclidiano R
d
decompondo o espa co em cubos de lado unit ario
R
d
=
_
m1Z

_
m
d
Z
[m
1
, m
1
+ 1) [m
d
, m
d
+ 1)
e denindo, para cada subconjunto mensur avel E,
(E) =
m1Z

m
d
Z
_
E [m
1
, m
1
+ 1) [m
d
, m
d
+ 1)
_
.
0.2. ESPAC OS DE MEDIDA 5
Exemplo 0.12 (Medida de Volume em S
1
). Considere a aplica cao sobre-
jetora : [0, 1] S
1
denida por:
(t) = e
2it
.
A medida de Lebesgue em S
1
e a medida denida por (A) = m(
1
(A)).
Observe que com esta denicao, a medida de A e igual a medida de R
(A), onde
R
: S
1
S
1
denota a rota cao de angulo . Na verdade, m odulo multiplica cao
por um n umero positivo, e a unica medida que satisfaz essa condicao para
todo .
Exemplo 0.13. Seja : [0, 1] R uma fun cao contnua e positiva. Dena a
medida
num intervalo [a, b] por:
([a, b]) =
_
b
a
(x) dx.
Observe que
e aditiva e com o auxlio dos Teoremas 0.10 e 0.9 podemos

estender
para toda -algebra dos Borelianos de [0, 1]. A medida
tem
a seguinte propriedade especial: se um conjunto A [0, 1] tem medida de
Lebesgue 0 entao
(A) = 0. Essa propriedade nos diz que
e absolutamente
contnua com respeito à medida de Lebesgue. A densidade de
em relacao a
m e igual a . Estudaremos tais medidas com mais detalhes na Seccao 0.3.2.
Exemplo 0.14. Vamos agora exibir uma medida que, apesar de ser positiva
em qualquer aberto, n ao e absolutamente contnua com respeito a medida de
Lebesgue. Para isso, considere uma enumeracao r
1
, r
2
, . . . do conjunto Q dos
racionais. Dena por:
(A) =
riA
1
2
i
.
Observe que a medida de qualquer aberto da reta e positiva, pois necessaria-
mente A contem algum i, e, apesar disso, (Q) = 1. Em particular, n ao e
absolutamente contnua com respeito a medida de Lebesgue.
O exemplo anterior nos motiva a denir o suporte de uma medida:
Denicao 0.15. Seja (M, B, ) um espaco de medida e M um espaco topologico.
O suporte da medida e o fecho do conjunto de pontos x M tais que para
qualquer vizinhan ca aberta V
x
contendo x, temos que (V
x
) > 0.
Fica como exerccio para o leitor mostrar que o suporte de uma medida e
sempre um conjunto fechado (10.6).
0.2.2 Medida produto no espa co das sequencias
Consideremos os espa cos de probabilidade (M
i
, B
i
,
i
), com i Z. Vamos con-
struir uma probabilidade no conjunto
M =
i=
M
i
6 CAP

das sequencias bilaterais (x
i
)
i=
com x
i
M
i
para cada i. Mais precisa-
mente, a medida ser a denida na - algebra produto B das -algebras B
i
, que
e caracterizada do seguinte modo: dados inteiros m n e conjuntos A
j
B
j
para m j n, consideremos
[m; A
m
, . . . , A
n
] = (x
i
)
iZ
: x
j
A
j
para m j n.
Estes subconjuntos de M sao chamados cilindros. A famlia B
0
das uni oes ni-
tas de cilindros disjuntos dois-a-dois e uma algebra. Por deni cao, a -algebra
produto B e a -algebra gerada por B
0
. Para construir a medida procede-
mos do seguinte modo: primeiramente, consideramos a aplica cao denida na
famlia dos cilindros por
([m; A
m
, . . . , A
n
]) =
n
j=m
j
(A
j
).
Em seguida estendemos à algebra B
0
, estipulando que a imagem de qualquer
uni ao nita de cilindros disjuntos dois-a-dois e igual ` a soma das imagens dos
cilindros. Esta extens ao est a bem denida e e nitamente aditiva. Ent ao,
recorrendo aos Teoremas 0.10 e 0.9, obtemos uma medida de probabilidade
em (M, B) que estende .
Denicao 0.16. O espaco de probabilidade (M, B, ) construdo acima e de-
signado produto direto dos espacos (M
i
, B
i
,
i
).
Existe um caso particular importante, que corresponde ` a situa cao onde os
espacos (M
i
, B
i
,
i
) sao todos iguais a um dado (X, (, ), em que X = 1, . . . , d
e um conjunto nito e ( = 2
X
e a -algebra de todos os subconjuntos de X.
Neste caso basta considerar apenas cilindros elementares, isto tais que cada A
j
consiste de um unico ponto de X. De fato, todo cilindro e uma uni ao nita
disjunta de tais cilindros elementares. Obtemos entao subconjuntos de M da
forma
[m; a
m
, . . . , a
n
] = (x
i
)
i=
M : x
m
= a
m
, . . . , x
n
= a
n
onde a
j
1, . . . , d. A medida e designada medida de Bernoulli denida por
e e caracterizada por ([m; a
m
, . . . , a
n
]) = (a
m
) (a
n
).
0.3 Integra cao em espacos de medida
Nesta secao denimos a nocao de integral de uma fun cao em relacao a uma me-
dida e apresentamos teoremas fundamentais da Teoria da Medida. Para tanto,
introduziremos algumas classes de fun coes. Ao longo desta secao (M, B, ) sera
sempre um espaco de medida.
Denicao 0.17. Seja B(R) a -algebra de Borel de R. Uma fun cao f : M R
diz-se mensur avel se f
1
(D) B para todo D B(R).
0.3. INTEGRAC

AO EM ESPAC OS DE MEDIDA 7
O espaco das fun coes mensuraveis possui diversas propriedades muito uteis.
Vamos enuncia-las como proposicao:
Proposi cao 0.18. Sejam f
1
, f
2
fun coes mensur aveis e c
1
, c
2
R. Entao
tambem s ao mensur aveis as seguintes fun coes:
1. entao (c
1
f
1
+c
2
f
2
)(x) = c
1
f
1
(x) +c
2
f
2
(x)
2. (f
1
f
2
)(x) = f
1
(x) f
2
(x)
3. maxf
1
, f
2
(x) = maxf
1
(x), f
2
(x)
Dizemos que uma fun cao s : M R e simples se existem constantes
1
, . . . ,
k
R e conjuntos A
1
, . . . , A
k
B disjuntos dois-a-dois tais que
s =
k
j=1
k
A
A
k
,
onde A
A
e a fun cao caracterstica do conjunto A, isto e, A
A
(x) e igual a 1 se
x A e zero caso contr ario. Introduzimos agora a no cao de integral. Para tal
comecamos por denir integral de uma fun cao simples.
Denicao 0.19. Seja s uma fun cao simples da forma acima. Ent ao a integral
de s em relacao a e dado por:
_
s d =
k
j=1
k
(A
k
).
E f acil vericar que esta deni cao e coerente: se duas combina coes lineares
de fun coes caractersticas denem uma mesma funcao simples, os valores das
integrais obtidos a partir das duas combina coes coincidem. O pr oximo passo
e denir integral de uma fun cao mensuravel qualquer. Para isso, trataremos
primeiro do caso da fun cao ser n ao-negativa. Necessitamos do seguinte resul-
tado, que nos diz que qualquer funcao mensuravel e o limite de uma sequencia
de fun coes simples mensuraveis:
Teorema 0.20. Seja f : M [, ] uma fun cao mensur avel. Entao existe
uma sequencia s
1
, s
2
, . . . de fun coes simples mensur aveis tal que
lim
k
s
k
(x) = f(x) para todo o x M.
Se f 0 entao a sequencia pode ser escolhida de modo que 0 s
1
s
2
.
A demonstra cao deste teorema e proposta como Exerccio 0.16. Ele torna
possvel a seguinte
8 CAP

Denicao 0.21. Seja f : M [0, ] uma fun cao mensuravel n ao-negativa.
Ent ao
_
fd = lim
n
_
s
n
d,
onde s
1
s
2
. . . e uma sequencia de fun coes simples crescentes para f, isto
e, lim
n
s
n
(x) = f(x) para todo x M.
E f acil vericar que o valor da integral n ao depende da escolha da sequencia

de fun coes simples, e portanto esta denicao e coerente. Para estender a
deni cao de integral a quaisquer fun coes mensuraveis, observemos que dada
uma fun cao f : M R sempre podemos escrever f = f
+
f
onde f
+
(x) =
maxf(x), 0 e f
(x) = maxf(x), 0 sao n ao-negativas. Mostra-se tambem

que f
+
e f
sao mensuraveis se e so se, f e mensuravel.

Denicao 0.22. Seja f : M [0, ] uma fun cao mensuravel. Ent ao
_
f d =
_
f
+
d
_
f
d,
desde que alguma das integrais do lado direito seja nita.
Denicao 0.23. Dizemos que uma fun cao e integr avel se for mensur avel e tiver
integral nita. Denotamos o conjunto das fun coes integr aveis por L
1
(M, B, )
ou, mais simplesmente, por L
1
(M, ).
Dada uma fun cao mensuravel f : M R e um conjunto mensur avel E
denimos a integral de f sobre E por
_
E
fd =
_
fA
E
d,
onde A
E
e a fun cao caracterstica do conjunto E.
Exemplo 0.24. Sejam x
1
, . . . , x
m
M e p
1
, . . . , p
m
> 0 com p
1
+ +p
m
= 1.
Consideremos a medida de probabilidade : 2
M
[0, 1] dada por:
(A) =
xiA
p
i
.
Notemos que =
m
i=1
p
i
xi
, onde
xi
e a medida delta de Dirac em x
i
. Neste
caso temos que se f e uma fun cao integr avel entao
_
f d =
m
i=1
f(x
i
)p
i
.
0.3. INTEGRAC

AO EM ESPAC OS DE MEDIDA 9
0.3.1 Teorema de derivacao de Lebesgue
Comecemos por introduzir a no cao de quase em toda a parte em relacao a
uma medida. Dizemos que uma propriedade e valida em -quase todo ponto
se e valida em todo o M exceto, possivelmente, num conjunto de medida nula.
Por exemplo, dizemos que duas funcoes f, g sao iguais em -quase todo ponto
se existe um conjunto mensuravel N com (N) = 0 tal que f(x) = g(x) para
todo x M N.
Teorema 0.25 (Derivacao de Lebesgue). Seja M = R
d
, B a - algebra de
Borel e a medida de Lebesgue em R
d
. Seja f : M R uma fun cao localmente
integr avel, isto e, tal que fA
K
e integr avel para todo compacto K R
d
. Entao
lim
r0
1
(B(x, r))
_
B(x,r)
[f(y) f(x)[d = 0.
em -quase todo ponto x R
d
. Em particular, em -quase todo o ponto x R
d
tem-se
lim
r0
1
(B(x, r))
_
B(x,r)
f(y)d = f(x).
Dado um subconjunto mensuravel A de R
d
, dizemos que um ponto a A e
um ponto de densidade de A se este conjunto preenche a maior parte de qualquer
pequena vizinhan ca de a, i.e,
lim
0
(B(a, ) A)
(B(a, )
= 1. (2)
O pr oximo resultado e uma consequencia direta do teorema de derivacao de
Lebesgue. No Exerccio 0.13 sugerimos uma demonstra cao.
Teorema 0.26. Seja A um subconjunto mensur avel de R
d
com medida de
Lebesgue (A) maior que zero. Ent ao -quase todo ponto a A e ponto de
densidade de A.
Muitos dos resultados envolvendo fun coes vao se apoiar no chamado Teo-
rema da Convergencia Dominada, que garante que se uma sequencia de fun coes
convergente e menor que uma funcao integr avel, ent ao o limite das suas integrais
converge e podemos tomar o limite sob o sinal da integral. Mais precisamente:
Teorema 0.27 (Teorema da Convergencia Dominada). Consideremos
f
n
: M R uma sequencia de fun coes mensur aveis e g uma fun cao integravel
tal que [f
n
(x)[ [g(x)[ para -quase todo x em M. Se para -quase todo x M
a sequencia f
n
(x) converge para o valor f(x), entao a fun cao f e integr avel e
vale:
lim
n
_
f
n
d =
_
f d.
10 CAP

0.3.2 Teorema de Radon-Nikodym
Sejam e duas medidas num espa co mensuravel (M, B). Dizemos que e
absolutamente contnua em relacao a se (E) = 0 implica (E) = 0, qualquer
que seja o conjunto mensur avel. Nesse caso escrevemos . O Teorema
de RadonNikodym arma que nesse caso a medida pode ser vista como
o produto de por alguma fun cao mensuravel, que e chamada densidade ou
derivada de Radon-Nikodym de relativamente a .
Teorema 0.28 (Radon-Nikodym). Se e s ao medidas nitas tais que
entao existe uma fun cao mensur avel : M [0, +] tal que = ,
ou seja, tal que
(E) =
_
E
d para todo o conjunto mensuravel E M.
Alem disso, essa fun cao e essencialmente unica: duas quaisquer coincidem
quase em toda a parte.
0.4 Exerccios
0.1. Seja M um conjunto e, para cada i pertencente a um conjunto de ndices
1, seja B
i
uma -algebra de subconjuntos de M. Mostre que
B =
iI
B
i
e uma -algebra.
0.2. Seja M um conjunto e considere a famlia de conjuntos
B
0
= A M : A e nito ou A
c
e nito.
Mostre que B
0
e uma algebra. Alem disso, B
0
e uma -algebra se e somente se
o conjunto M e nito.
0.3. Seja M um conjunto e considere a seguinte famlia de conjuntos
B
1
= A M : A e nito ou enumer avel ou A
c
e nito ou enumer avel.
Mostre que B
1
e uma -algebra. De fato, B
1
e a -algebra gerada pela algebra
B
0
do Exerccio 0.2.
0.4. Seja c uma famlia de subconjuntos de um conjunto M. Mostre que existe
a menor algebra B
0
que contem c. Que rela cao existe entre B
0
e a -algebra B
gerada por c?
0.5. Seja (M, B, ) um espaco de medida. Mostre que se A
1
,A
2
, . . . est ao em B
ent ao
(
_
j=1
A
j
)
j=1
(A
j
).
0.4. EXERC
ICIOS 11
0.6. Seja B = 2
M
e considere : 2
M
[0, +] denido por:
(A) =
_
#A , se A e nito
se A e innito
.
Mostre que e uma medida. Esta medida e designada medida de contagem.
0.7. Demonstre o Teorema 0.10. Dica: Dados quaisquer conjuntos disjuntos
dois a dois B
1
, . . . , B
n
, . . . em B
0
tais B =
j=1
B
j
tambem esta em B
0
, dena
C
j
= B
1
B
j
para cada j 1. Verique que os conjuntos A
j
= B C
j
satisfazem a hipotese (1) no Teorema 0.10.
0.8. Seja (M, B) um espaco mensuravel.
1. Mostre que se : B [0, +] e uma medida entao
(
_
j=1
A
j
) = lim
j
(A
j
).
para qualquer sequencia crescente A
1
A
2
A
n
de elementos
de B.
2. Reciprocamente, mostre que se
0
: B [0, +] e uma fun cao nitamente
aditiva que satisfaz a condi cao do item anterior ent ao
0
e -aditiva.
0.9. Seja (M, B) um espaco mensuravel, onde o conjunto M e nao-enumeravel
e a -algebra B e denida como no Exerccio 0.3. Mostre que : B [0, +]
denida por:
(A) =
_
0 se A e nito ou enumer avel
1 se A
c
e nito ou enumer avel
e uma medida de probabilidade.
0.10. Sejam f e g fun coes mensuraveis. Mostre que f e integr avel se e somente
se [f[ e integr avel e, nesse caso,
_
f d
_
[f[ d.
Alem disso, se f e integr avel e [f[ [g[ ent ao g e integr avel.
0.11. Seja E um conjunto mensur avel com (E) = 0. Mostre que
_
E
f d = 0
para qualquer fun cao mensuravel f.
0.12. Mostre que a e um ponto de densidade do conjunto A se e so se
lim
0
inf
_
(B A)
(B)
: B bola contida em B(a, ) e contendo a
_
= 1
12 CAP

0.13. Demonstre o Teorema 0.26.
0.14. Seja x
1
, x
2
M e p
1
, p
2
, q
1
, q
2
> 0 com p
1
+p
2
= q
1
+q
2
= 1. Considere
as medidas de probabilidade e dadas por
(A) =
xiA
p
i
, (A) =
xiA
q
i
,
ou seja, = p
1
x1
+ p
2
x2
e = q
1
x1
+ q
2
x2
. Mostre que e e
calcule as respectivas derivadas de Radon-Nikodym.
0.15. Seja f : M R. Mostre que se f
1
((, c)) B para todo c R ent ao
f e mensuravel. Dica: Mostre que a famlia ( = A R : f
1
(A) B e uma
-algebra e contem todos os subconjuntos abertos.
0.16. Prove o Teorema 0.20. Dica: Trate primeiro o caso onde f e nao-negativa.
0.17. Mostre que o suporte de uma medida e sempre um conjunto fechado.
Conclua que se M e compacto, o suporte de qualquer medida tambem e com-
pacto.
0.18. Mostre que toda fun cao f : R
m
R
n
contnua e mensuravel. De exemplo
de uma fun cao mensuravel que n ao e contnua em nenhum ponto.
0.19. Seja T : M M uma fun cao mensuravel e uma medida. Dena
T
(A) = (T
1
(A)). Mostre que T
e uma medida.
Captulo 1
Teorema de Recorrencia de
Poincare
Um ponto x M diz-se recorrente se a sua trajetoria pelo sistema din amico
f : M M volta arbitrariamente perto de x quando o tempo vai para in-
nito. A din amica no conjunto dos pontos n ao-recorrentes e, em certo sentido,
sempre a mesma, independentemente do sistema dinamico. Por isso, e funda-
mental compreender o conjunto dos pontos recorrentes, ja que ele contem toda
a din amica interessante do sistema.
O resultado que estudaremos nesta captulo, enunciado por Poincare perto
do nal do seculo XIX, arma que quase todo ponto e recorrente, relativamente
a qualquer medida invariante nita do sistema din amico. Daremos duas vers oes
deste resultado, a primeira numa linguagem mensuravel e a segunda de natureza
mais topol ogica. Tambem comentaremos que a hip otese de nitude da medida
n ao pode ser omitida.
1.1 Versao mensuravel
Teorema 1.1. Seja f : M M uma transforma cao mensur avel e uma
medida invariante nita. Seja E M qualquer conjunto mensur avel com
(E) > 0. Entao, -quase todo ponto x E tem algum iterado f
n
(x), n 1,
que tambem esta em E.
Em outras palavras, o teorema arma que quase todo ponto de E regressa
a E no futuro. Antes mesmo de demonstrar este fato, podemos mostrar que ele
implica outro aparentemente mais forte: quase todo ponto de E regressa a E
innitas vezes:
Corolario 1.2. Nas condicoes do Teorema 1.1, para -quase todo ponto x E
existem innitos valores de n 1 tais que f
n
(x) esta em E.
Demonstra cao. Para cada k 1 vamos representar por E
k
o conjunto dos
pontos x E que regressam a E exatamente k vezes: existem exatamente k
13
14 CAP
ITULO 1. TEOREMA DE RECORR
ENCIA DE POINCAR
E
valores de n 1 tais que f
n
(x) E. Observe que o conjunto dos pontos que
regressam a E apenas um n umero nito de vezes e precisamente
_
k=1
E
k
.
Portanto, para provar o corol ario, basta mostrar que (E
k
) = 0 para todo k 1.
A demonstra cao ser a por contradi cao.
Suponhamos que (E
k
) > 0 para algum k 1. Ent ao, aplicando o Teo-
rema 1.1 com este E
k
no lugar de E, obtemos que quase todo ponto x E
k
tem
algum iterado f
n
(x) que esta em E
k
. Fixemos um tal x e denotemos y = f
n
(x).
Por deni cao, y tem exatamente k iterados futuros que est ao em E. Como y e
um iterado de x, isso implica que x tem k + 1 iterados futuros em E. Mas isso
contradiz o fato de que x E
k
. Esta contradi cao prova que E
k
tem medida
nula, relativamente a , e portanto o corol ario esta demonstrado.
Vamos agora dar a
Demonstra cao do Teorema 1.1. Representemos por E
0
o conjunto dos pontos
x E que nunca regressam a E. O nosso objetivo e provar que E
0
tem medida
nula. Para isso, comecamos por armar que as suas pre-imagens f
n
(E
0
) sao
disjuntas duas-a-duas. De fato, suponhamos que existem m > n 1 tais que
f
m
(E
0
) intersecta f
n
(E
0
). Seja x um ponto na interseccao e seja y = f
n
(x).
Ent ao y E
0
e f
mn
(y) = f
m
(x) E
0
, que esta contido em E. Isto quer
dizer que y volta pelo menos uma vez a E, o que contradiz a deni cao de E
0
.
Esta contradi cao, prova que as pre-imagens sao disjuntas duas-a-duas, como
armamos.
Isto implica que
_

_
n=0
f
n
(E
0
)
_
=
n=0
(f
n
(E
0
)) =
n=0
(E
0
).
Na ultima igualdade usamos a hip otese de que e invariante, que implica que
(f
n
(E
0
)) = (E
0
) para todo n 1. Como supomos que a medida e nita,
a expressao do lado esquerdo e nita. Por outro lado, ` a direita temos uma
soma de innitos termos, todos iguais. O unico jeito desta soma ser nita e
que as parcelas sejam nulas. Portanto, devemos ter (E
0
) = 0, tal como foi
armado.
1.2 Versao topol ogica
Dizemos que um ponto x M e recorrente para uma transformacao f : M M
se, para toda vizinhanca U de x, existe algum iterado f
n
(x) que esta em U. A
deni cao para uxos e analoga, apenas nesse caso o tempo n e um n umero real.
Na formulacao topol ogica do teorema de recorrencia supomos que o espa co
M admite uma base enumer avel de abertos, ou seja, um famlia enumer avel
1.3. RECORR
ENCIA PARA MEDIDAS INFINITAS 15

U
k
: k N de abertos tal que todo aberto de M pode ser escrito como
uni ao de elementos U
k
dessa famlia. Esta hip otese e satisfeita na maioria dos
exemplos interessantes.
Teorema 1.3. Suponhamos que M admite uma base enumer avel de abertos.
Seja f : M M uma transforma cao mensur avel e uma medida invariante
nita. Entao, -quase todo ponto x M e recorrente para f.
Demonstra cao. Para cada k representamos por U
0
k
o conjunto dos pontos x U
k
que nunca regressam a U
k
. De acordo com o Teorema 1.1, todo U
0
k
tem medida
nula. Consequentemente, a uni ao enumer avel
U =
_
kN
U
0
k
tem medida nula. Portanto, para demonstrar o teorema sera suciente que
mostremos que todo ponto x que n ao est a em

U e recorrente. Isso e f acil, como
vamos ver.
Seja x M

U e seja U uma vizinhan ca qualquer de x. A deni cao de
base de abertos implica que existe algum k N tal que x U
k
e U
k
U.
Como x n ao est a em

U, tambem x / U
0
k
. Em outras palavras, x tem algum
iterado f
n
(x), n 1 que esta em U
k
. Em particular, f
n
(x) tambem esta em
U. Como a vizinhan ca U e arbitr aria, isto prova que x e um ponto recorrente,
como havamos armado.
1.3 Recorrencia para medidas innitas
As conclusoes dos Teoremas 1.1 e 1.3 nao sao verdadeiras, em geral, se omitirmos
a hip otese de que a medida e nita. O exemplo mais simples e o seguinte:
Exemplo 1.4. Seja f : R R a transla cao de 1 unidade, isto e, f(x) = x + 1
para todo x R.

E f acil vericar que f deixa invariante a medida de Lebesgue
em R (que e innita). Por outro lado nenhum ponto e recorrente para f.
No entanto, e possvel estender estes enunciados para certos casos de medidas
innitas como, por exemplo, no exerccio que propomos a seguir.
Uma transforma cao f : M M diz-se invertvel se e uma bije cao e a sua
inversa e tambem uma transformacao mensuravel. Uma medida diz-se -nita
se existe uma sequencia crescente de subconjuntos M
k
cuja uniao e o espaco M
inteiro e tal que cada (M
k
) e nito. Neste caso, diremos que um ponto x vai
para innitose, para qualquer k, existe apenas um n umero nito de iterados
de x que est ao em M
k
.
1.4 Exerccios
1.1. Mostre que o seguinte enunciado e equivalente ao Teorema 1.1, isto e,
qualquer um dos dois pode ser deduzido a partir do outro: Seja f : M M
16 CAP
ITULO 1. TEOREMA DE RECORR
ENCIA DE POINCAR
E
uma transformacao mensuravel e uma medida invariante nita. Seja E M
qualquer conjunto mensur avel com (E) > 0. Ent ao existe N 1 e um conjunto
D E com medida positiva, tal que f
N
(x) E para todo ponto x D.
1.2. Suponha que f : M M e invertvel e que e uma medida -nita
invariante por f. Mostre que, dado qualquer conjunto mensuravel E M com
(E) > 0, quase todo ponto x E ou regressa a E ou vai para innito.
Dica: Considere o conjunto E
0,k
dos pontos x E que nunca regressam a E
e tem um n umero innito de iterados em M
k
. Comece por mostrar que os seus
iterados f
n
(E
0,k
) sao dois-a-dois disjuntos. Usando que (M
k
) e nito, deduza
que (E
k,0
) = 0 para todo k.
Captulo 2
Exemplos de Medidas
Invariantes
Nesta captulo vamos descrever alguns exemplos simples de medidas invariantes
por transforma coes ou por uxos. Antes porem, vamos mostrar uma proposicao
caracterizando quando uma medida e invariante:
Proposi cao 2.1. Seja f : M M uma transforma cao e uma medida. Ent ao
f preserva se, e somente se, para toda fun cao integr avel : M R vale:
_
d =
_
f d.
Demonstra cao. Assuma que f preserva a medida . Se e fun cao caracterstica
de algum conjunto, digamos =
A
, e imediato vericar que (f
1
(A)) =
_
f d, j a que
f
1
(A)
= f. Assim, ca provado que
_
d =
_
f d,
quando e uma fun cao caracterstica. Observe que segue diretamente da lin-
earidade da integral que se e uma fun cao simples, ent ao a igualdade ainda vale.
Finalmente, se e uma fun cao integr avel qualquer, pela deni cao de integral
_
d = lim
n
_

n
d,
onde
n
e uma sequencia de fun coes simples crescendo para . Por outro lado,
n
f e uma sequencia de fun coes simples crescendo para f. Logo,
_
f d = lim
n
_

n
f d.
Como
_

n
d =
_

n
f d, tomando o limite em ambos os lados, vem que
_
d =
_
f d.
17
18 CAP
ITULO 2. EXEMPLOS DE MEDIDAS INVARIANTES

A recproca e imediata, desde que dado um boreliano A, tomando =
A
, ent ao
(A) = (f
1
(A))
_
d =
_
f d.
2.1 Expansao decimal
O nosso primeiro exemplo e
f : [0, 1] [0, 1], f(x) = 10x [10x]
onde [10x] representa o maior inteiro menor ou igual a 10x. Em outras palavras,
f associa a cada x [0, 1] a parte fracion aria de 10x. O gr aco da transformacao
f esta descrito na Figura 2.1.
0 2/5 4/5 6/5 8/5
1
1
E
Figura 2.1: Transforma cao parte fracion aria de 10x
Armamos que a medida de Lebesgue no intervalo e invariante pela trans-
forma cao f, isto e, satisfaz a condi cao (2). Comecemos por supor que E e um
intervalo. Ent ao, como ilustrado na Figura 2.1, a pre-imagem f
1
(E) consiste
de dez intervalos, cada um deles dez vezes mais curto do que E. Logo, a medida
de Lebesgue de f
1
(E) e igual ` a medida de Lebesgue de E. Isto mostra que (2)
e satisfeita no caso de intervalos. Por outro lado, a famlia dos intervalos gera a
-algebra de Borel de [0, 1]. Portanto, para concluir a demonstra cao basta usar
o seguinte fato geral (veja o Exerccio 2.1):
Lema 2.2. Seja f : M M uma transforma cao mensur avel e uma medida
nita em M. Suponha que existe uma sub- algebra geradora 1 da - algebra de
M tal que (E) = (f
1
(E)) para todo E 1. Entao o mesmo vale para todo
conjunto mensur avel E, isto e, a medida e invariante por f.
2.2. SISTEMAS CONSERVATIVOS 19
Agora vamos explicar como, a partir do fato de que a medida de Lebesgue
e invariante pela transforma cao f, podemos obter conclusoes interessantes e
n ao-triviais usando o teorema de recorrencia de Poincare.
Comecemos por observar que f tem uma expressao muito simples em termos
de expansoes decimais: se x e dado por
x = 0, a
0
a
1
a
2
a
3

com a
i
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, ent ao a sua imagem e dada por
f(x) = 0, a
1
a
2
a
3
.
Com isso, ca muito facil escrever a expressao do iterado n-esimo, para qualquer
n 1:
f
n
(x) = 0, a
n
a
n+1
a
n+2
(2.1)
Agora, seja E o subconjunto dos x [0, 1] cuja expans ao decimal come ca
com o dgito 7, ou seja, tais que a
0
= 7. De acordo com o Corol ario 1.2, quase
todo elemento de E tem innitos iterados que tambem estao em E. Levando
em conta a expressao (2.1), isto quer dizer que existem innitos valores de n
tais que a
n
= 7. Portanto, provamos que quase todo n umero x cuja expans ao
decimal come ca por 7 tem innitos dgitos iguais a 7!
Claro que no lugar de 7 podemos considerar qualquer outro dgito. Alem
disso, podemos considerar blocos de dgitos mais complicados. Veja os Ex-
erccios 2.22.3.
Mais tarde iremos provar resultados mais fortes: para quase todo n umero
x [0, 1], todo dgito aparece com frequencia 1/10 na sua expans ao decimal.
O enunciado preciso aparecera na Proposi cao 5.2, que ser a provada a partir do
teorema ergodico de Birkho.
2.2 Sistemas conservativos
Seja U um aberto em algum espa co euclidiano R
d
, d 1 e seja f : U U
um difeomorsmo de classe C
1
. Isto quer dizer que f e uma bije cao e tanto ele
quanto a sua inversa sao deriv aveis com derivada contnua.
Representaremos por vol a medida de Lebesgue, ou volume, em R
k
. Em
outras palavras,
vol(B) =
_
B
dx
1
. . . dx
d
e
_
B
d vol =
_
B
(x
1
, . . . , x
d
) dx
1
. . . dx
d
para qualquer conjunto mensur avel B e qualquer fun cao integr avel .
A f ormula de mudan ca de variaveis arma que, para qualquer conjunto men-
sur avel B U,
vol(f(B)) =
_
B
[ det Df[ d vol (2.2)
Daqui se deduz facilmente
20 CAP

Lema 2.3. Um difeomorsmo f : M M de classe C
1
deixa invariante o
volume se e somente se o valor absoluto [ det Df[ do seu jacobiano e constante
igual a 1.
Demonstra c ao. Suponha primeiro que o valor absoluto do jacobiano e igual 1
em todo ponto. Considere um conjunto mensur avel E e seja B = f
1
(E). A
f ormula (2.2) d a que
vol(E) =
_
B
1 d vol = vol(B) = vol(f
1
(E)).
Isto signica que f deixa invariante o volume e, portanto, provamos a parte
sedo enunciado.
Para provar a parte somente se, suponha que [ det Df[ fosse maior que 1 em
algum ponto x. Ent ao, como o jacobiano e contnuo, existiria uma vizinhan ca
U de x e algum n umero > 1 tais que
[ det Df(y)[ para todo y U.
Ent ao a f ormula (2.2) aplicada a B = U daria
vol(f(U))
_
U
d vol vol(U).
Denotando E = f(U), isto implica que vol(E) > vol(f
1
(E)) e, portanto, f n ao
deixa invariante o volume. Do mesmo modo se mostra que se o valor absoluto
do jacobiano e menor que 1 em algum ponto ent ao f n ao deixa invariante o
volume.
Os Exerccios 2.42.5 estendem este lema para transformacoes nao necessari-
amente invertveis e tambem para uma classe mais ampla de medidas. As suas
conclus oes nos ser ao uteis mais tarde.
Agora vamos considerar o caso de uxos f
t
: U U, t R. Suporemos que
o uxo e de classe C
1
. Claro que o Lema 2.3 se aplica neste contexto: o uxo
deixa invariante o volume se e somente se
det Df
t
(x) = 1 para todo x U e todo t R. (2.3)
Fa camos duas observacoes simples antes de prosseguirmos. A primeira e que
segue da deni cao de uxo que todo f
t
e invertvel (um difeomorsmo, neste
caso): a sua inversa e f
t
. A segunda observacao e que o jacobiano de f
t
e
sempre positivo. Isso e claro quando t = 0 porque, outra vez por deni cao de
uxo, f
0
e a identidade. Segue que o mesmo e verdade para todo t R, porque
o jacobiano varia continuamente com t e, como acabamos de ver, nunca se anula.
Embora a resposta que acabamos de dar esteja inteiramente correta, ela nao
e muito util na pr atica porque em geral n ao temos uma expressao explcita para
f
t
, e portanto n ao e claro como vericar a condi cao (2.3). Felizmente, existe
uma expressao razoavelmente explcita para o jacobiano, de que iremos falar em
seguida, que pode ser usada em muitas situa coes interessantes.
2.3. DESLOCAMENTOS (SHIFTS) DE BERNOULLI 21
Suponhamos que o uxo f
t
corresponde às trajet orias de um campo de
vetores F : U U de classe C
1
, quer dizer f
t
(x) e o valor no tempo t da
solu cao da equacao diferencial
dx
dt
= F(x) (2.4)
(quando tratando de equacoes diferenciaveis sempre suporemos que as suas
solu coes estao denidas para todo tempo). A f ormula de Liouville exprime
o jacobiano de f
t
em termos do divergente div F do campo de vetores F:
det Df
t
(x) = exp
_
_
t
0
div F(f
s
(x)) ds
_
.
Lembre que o divergente de um campo de vetores F e o tra co da sua matriz
jacobiana, isto e
div F =
F
x
1
+ +
F
x
d
. (2.5)
Combinando esta formula com (2.3) obtemos
Lema 2.4. O uxo f
t
associado a um campo de vetores F de classe C
1
deixa
invariante o volume se e somente se o divergente de F e identicamente nulo.
O Exerccio 2.6 e uma aplica cao deste fato no caso, muito importante, de
uxos hamiltonianos.
2.3 Deslocamentos (shifts) de Bernoulli
Estes sistemas modelam sequencias de experimentos aleatorios em que o re-
sultado de cada experimento e independente dos demais. Supoe-se que em
cada experimento ha um n umero nito de resultados possveis, designados por
1, 2, . . . , d, com probabilidades p(1), p(2), . . . , p(d) de ocorrerem, sendo
p(1) +p(2) + +p(d) = 1 .
O conjunto M das sequencias = (
n
)
nZ
com cada
n
1, 2, . . . , d contem
os possveis resultados da sequencia de experimentos. Chamam-se cilindros os
subconjuntos da forma
[k, l; a
k
, . . . , a
l
] = M :
k
= a
k
, . . . ,
l
= a
l
onde k, l Z, com k l, e cada a

j
1, 2, . . . , d. Denimos
([k, l; a
k
, . . . , a
l
]) = p(a
k
) p(a
l
) (2.6)
Heuristicamente, isto signica que a probabilidade do evento composto
k
= a
k
e
k+1
= a
k+1
e e
l
= a
l
22 CAP

e o produto das probabilidades de cada um deles. Isto traduz, precisamente,
que os resultados sucessivos sao independentes entre si.
Consideramos em M a -algebra B gerada pelos cilindros. A famlia B
0
das
uni oes disjuntas nitas dos cilindros e uma algebra (por conven cao, M e um
cilindro e (M) = 1). Estendemos de modo a que seja nitamente aditiva: se
E B
0
e a uni ao disjunta de cilindros C
1
, . . . , C
N
, denimos
(E) = (C
1
) + +(C
N
).
Verica-se que esta fun cao e, de fato, -aditiva em B
0
; por exemplo, isso pode
ser feito usando o Teorema 0.10. Portanto existe uma unica probabilidade na
-algebra B gerada por B
0
que e uma extensao de , isto e, que coincide com
ela restrita a B
0
. Chamamos essa probabilidade medida de Bernoulli denida
por p(1), p(2), . . . , p(d) e, para n ao complicar desnecessariamente a nota cao, a
representamos tambem por .
No espaco M consideramos a transforma cao deslocamento (shift) à es-
querda
f : M M f
_
(
n
)
nZ
_
= (
n+1
)
nZ
que corresponde a fazer uma transla cao no tempo. Observe que a medida de
Bernoulli e invariante por essa transforma cao. De fato, se E = [k, l; a
k
, . . . , a
l
]
ent ao f
1
(E) = [k + 1, l + 1; a
k
, . . . , a
l
] e a deni cao (2.6) d a que
(E) = (f
1
(E))
neste caso. Como a famlia dos cilindros gera a -algebra B, isto juntamente
com o Lema 2.2, prova que a medida e invariante para f.
2.4 Transformacao de Gauss
A transforma cao de Gauss G : (0, 1] [0, 1] e denida por G(x) = parte
fracion aria de 1/x, ou seja,
G(x) =
1
x

_
1
x
_
.
O gr aco de G pode ser esbocado facilmente, a partir da seguinte observacao.
Se x (1/2, 1] ent ao 1/x [1, 2) e portanto a sua parte inteira [1/x] e
igual a 1. Isto quer dizer que neste intervalo a transforma cao e dada por
G(x) = (1/x) 1.
Mais geralmente, se x (1/(k + 1), 1/k) para algum k N ent ao a parte
inteira de 1/x e igual a k, e tem-se G(x) = 1/x k. Veja tambem a
Figura 2.2.
Note que G n ao est a denida no ponto x = 0. Alem disso, G(1/k) = 0 para
todo k N e portanto o segundo iterado G
2
(1/k) n ao est a denido nestes pontos
2.4. TRANSFORMAC

AO DE GAUSS 23
...
0 1
1
1/2 1/3 1/4
Figura 2.2: Transforma cao de Gauss
(e o terceiro iterado n ao est a denido nas suas pre-imagens, etc). Isto quer dizer,
a rigor, que G n ao e um sistema dinamico segundo a deni cao que demos antes.
No entanto, isto n ao coloca nenhum problema para o que pretendemos fazer. De
fato, todos os iterados est ao bem denidos no conjunto dos n umeros irracionais:
basta observar que a imagem de um irracional tambem e irracional. Isto e
suciente para os nossos objetivos porque sempre tratamos de propriedade que
valem para quase todo ponto, e o conjunto dos n umeros irracionais tem medida
de Lebesgue total no intervalo.
O que torna esta transforma cao interessante do ponto de vista ergodico e que
G admite uma probabilidade invariante que e equivalente ` a medida de Lebesgue
no intervalo. De fato, considere a medida denida por
(E) =
_
E
c
1 +x
dx para cada mensuravel E [0, 1]
onde c e uma constante positiva. Note que a integral est a bem denida, j a que
a fun cao integranda e contnua no intervalo [0, 1]. Note tambem que
c
2
m(E) (E) cm(E) para todo mensur avel E [0, 1].
Em particular, e de fato equivalente ` a medida de Lebesgue m: as duas medidas
tem os mesmos conjuntos com medida nula.
Proposi cao 2.5. A medida e invariante por G. Alem disso, se escolhermos
c = 1/log2 entao e uma probabilidade.
Demonstra cao. Vamos usar o criterio dado pelo exerccio 2.5: a medida e
invariante por G se tivermos
xf
1
(y)
(x)
[G
(x)[
= (y) onde (x) =
c
1 +x
(2.7)
24 CAP

para todo y. Comece por observar que cada y tem exatamente uma pre-imagem
x
k
em cada intervalo (1/(k + 1), 1/k], dada por
G(x
k
) =
1
x
k
k = y x
k
=
1
y +k
.
Note tambem que G
(x) = (1/x)
= 1/x
2
. Portanto, (2.7) se reescreve como
k=1
cx
2
k
1 +x
k
=
c
1 +y

k=1
1
(y +k)(y +k + 1)
=
c
1 +y
(2.8)
Para vericar que esta igualdade e realmente satisfeita, observe que
1
(y +k)(y +k + 1)
=
1
y +k

1
y +k + 1
.
Isto quer dizer que a ultima soma em (2.8) pode ser escrita na forma teles-
copica: todos os termos, exceto o primeiro, aparecem duas vezes, com sinais
contr arios, e portanto se cancelam. Logo a soma e igual ao primeiro termo, que
e precisamente o que se arma em (2.8). Isto prova a invariancia.
Finalmente, usando a primitiva c log(1 +x) da fun cao (x) vemos que
([0, 1]) =
_
1
0
c
1 +x
dx = c log 2.
Logo, escolhendo c = 1/ log 2 obtemos que e uma probabilidade.
A transforma cao de Gauss tem um papel muito importante em teoria dos
n umeros, devido ` a sua rela cao com o processo de expansao dos n umeros em
fra cao contnua. Recordemos do que se trata.
Dado um n umero x
0
(0, 1), seja
a
1
=
_
1
x
0
_
e x
1
=
1
x
0
a
1
= G(x
0
).
Note que a
1
e um n umero natural, x
1
[0, 1) e tem-se
x
0
=
1
a
1
+x
1
.
Agora, supondo que x
1
seja diferente de zero, podemos repetir o processo,
denindo
a
2
=
_
1
x
1
_
e x
2
=
1
x
1
a
2
= G(x
1
).
Ent ao
x
1
=
1
a
1
+x
2
portanto x
0
=
1
a
1
+
1
a
2
+x
2
.
2.4. TRANSFORMAC

AO DE GAUSS 25
Por recorrencia, para cada n 1 tal que x
n1
(0, 1) se dene
a
n
=
_
1
x
n1
_
e x
n
=
1
x
n1
a
n
= G(x
n1
)
e tem-se
x
0
=
1
a
1
+
1
a
2
+
1
+
1
a
n
+x
n
. (2.9)
Nao e difcil mostrar (verique!) que a sequencia
z
n
=
1
a
1
+
1
a
2
+
1
+
1
a
n
.
converge para x
0
quando n , e e usual traduzir este fato escrevendo
x
0
=
1
a
1
+
1
a
2
+
1
+
1
a
n
+
1

, (2.10)
que e chamada expansao em fra cao contnua de x
0
.
Note que a sequencia z
n
consiste de n umeros racionais. De fato se mostra que
estes sao os n umeros racionais que melhor aproximam o n umero x
0
, no sentido
de que z
n
esta mais pr oximo de x
0
do que qualquer outro n umero racional
com denominador menor ou igual que o denominador de z
n
(escrito em forma
irredutvel). Observe tambem que para obter (2.10) supusemos que x
n
(0, 1)
para todo n N. Se encontramos algum x
n
= 0, o processo para nesse momento
e consideramos (2.9) a expansao em fracao contnua de x
0
. Claro que este ultimo
caso ocorre somente se x
0
e um n umero racional.
Estas ideias de Teoria Ergodica podem ser usadas para obter conclus oes nao
triviais em Teoria dos N umeros. Por exemplo (veja o Exerccio 2.7), para quase
todo n umero x
0
(1/8, 1/7) o n umero 7 aparece innitas vezes na sua expans ao
em fra cao contnua, isto e, tem-se a
n
= 7 para innitos valores de n N.
De fato, mais tarde provaremos um fato muito mais preciso: para quase todo
x
0
(0, 1) o n umero 7 aparece com frequencia
1
log 2
log
64
63
na sua expans ao em fracao contnua. Tente intuir desde j a de onde vem este
n umero!
26 CAP

2.5 Exerccios
2.1. Demonstre o Lema 2.2. Dica: mostre que a famlia de todos os conjuntos
E tais que (E) = (f
1
(E)) e uma -algebra.
2.2. Prove que, para quase todo n umero x [0, 1] cuja expans ao decimal contem
o bloco 617 (por exemplo x = 0, 3375617264 ), esse bloco aparece innitas
vezes na expansao.
2.3. Prove que o dgito 7 aparece innitas vezes na expansao decimal de quase
todo n umero x [0, 1]. Dica: Comece por mostrar que o conjunto dos n umeros
cuja expans ao decimal nunca exibe o dgito 7 tem medida nula.
2.4. Suponha que f : U U e um difeomorsmo local (isto e: o seu jacobiano
e nao nulo em todo ponto) de classe C
1
. Mostre que f deixa invariante o volume
se e somente se
xf
1
(y)
1
[ det Df(x)[
= 1 para todo y U.
2.5. Dada uma fun cao : U [0, ), denotamos por = vol a medida
denida por (E) =
_
E
d vol. Suponha que f : U U e um difeomorsmo
local de classe C
1
e que e uma fun cao contnua. Mostre que f deixa invariante
a medida = vol se e somente se
xf
1
(y)
(x)
[ det Df(x)[
= (y) para todo y U.
Em particular, no caso em que f e invertvel, f deixa invariante a medida se
e somente se (x) = (f(x))[ det Df[(x) para todo x U.
2.6. Seja U um aberto de R
2d
e H : U R uma fun cao de classe C
2
. De-
notamos as variaveis em R
2d
por (p
1
, q
1
, . . . , . . . , p
d
, q
d
). O campo de vetores
hamiltoniano associado a H e denido por
F(p
1
, . . . , p
d
, q
1
, . . . , q
d
) =
_
H
q
1
, . . . ,
H
q
d
,
H
p
1
, . . . ,
H
p
d
_
.
Verique que o uxo denido por F preserva o volume.
2.7. Para (Lebesgue) quase todo n umero x
0
(1/8, 1/7) o n umero 7 aparece
innitas vezes na sua expans ao em fracao contnua, isto e, tem-se a
n
= 7 para
innitos valores de n N.
2.8. Considere a sequencia 1, 2, 4, 8, . . . , a
n
= 2
n
, . . . . Mostre que dado um
dgito i 0, . . . , 9, existe uma quantidade innita de valores n tal que a
n
comeca
com este dgito.
2.9. Mostre que se A e uma matriz n n com coecientes inteiros, entao a
transformacao induzida [A] :
n
Pi
n
denida por [A]( x) =

A(x) preserva a
medida de Lebesgue de
n
.
2.10. Mostre que o deslocamento denido na Sec cao 2.3 e transitivo e que o
conjunto de suas orbitas peri odicas e denso.
Captulo 3
Existencia de Medidas
Invariantes
Nesta captulo provaremos o seguinte resultado, que garante a existencia de
medidas invariantes em grande generalidade:
Teorema 3.1. Seja f : M M uma transforma cao contnua num espa co
metrico compacto. Entao existe pelo menos uma probabilidade invariante por
f. O mesmo resultado vale para uxos.
Antes de demonstrarmos este resultado, mencionemos alguns exemplos que
mostram que nenhuma das duas hipoteses, continuidade e compacidade, podem
ser omitidas.
3.1 Alguns exemplos simples
Considere f : (0, 1] (0, 1] dada por f(x) = x/2. Suponha que f admite
alguma probabilidade invariante (o objetivo e mostrar que isso nao acontece).
Pelo Teorema de Recorrencia 1.3, relativamente a essa probabilidade quase todo
ponto de (0, 1] e recorrente. Mas e imediato que nao existe nenhum ponto recor-
rente: a orbita de qualquer x (0, 1] converge para zero e, em particular, n ao
acumula no ponto inicial x. Isto mostra que f e um exemplo de transforma cao
contnua num espaco nao compacto que n ao admite nenhuma medida probabil-
idade invariante.
Modicando um pouco o exemplo, podemos mostrar que o mesmo fenome-
no pode ocorrer em espacos compactos, se a transformacao n ao e contnua.
Considere f : [0, 1] [0, 1] dada por f(x) = x/2 se x ,= 0 e f(0) = 1. Pela
mesma razao que antes, nenhum ponto x (0, 1] e recorrente. Portanto, se
existe alguma probabilidade invariante ela tem dar peso total ao unico ponto
recorrente que e x = 0. Em outras palavras, precisa ser a medida de Dirac
0
suportada em zero, que e denida por
0
(E) = 1 se 0 E e
0
(E) = 0 se 0 / E.
27
28 CAP
ITULO 3. EXIST
ENCIA DE MEDIDAS INVARIANTES

Mas a medida
0
nao e invariante por f: tomando E = 0 temos que E tem
medida 1 mas a sua pre-imagem f
1
(E) e o conjunto vazio, que tem medida
nula. Portanto, esta transforma cao tambem nao tem nenhuma probabilidade
invariante.
O nosso terceiro exemplo e de natureza um pouco diferente. Consideremos
f : [0, 1] [0, 1] dada por f(x) = x/2. Trata-se de uma transformacao contnua
num espaco compacto. Logo, pelo teorema que iremos demonstrar, admite
alguma probabilidade invariante. Pelos mesmos argumentos que usamos no
caso anterior, se conclui que de fato h a uma unica probabilidade invariante, que
e a medida de Dirac
0
suportada no ponto zero. Note que neste caso
0
e de
fato invariante.
Mencionamos este ultimo caso para enfatizar as limita coes do Teorema de
Existencia (que sao inerentes ` a sua grande generalidade): as medidas que ele
garante existirem podem ser bastante triviais; por exemplo, neste caso quando
falamos de quase todo pontoestamos nos referindo apenas ao ponto x = 0. Por
isso, um objetivo importante e obter resultados mais sosticados de existencia
de medidas com propriedades adicionais que as tornem mais interessantes, por
exemplo serem equivalentes à medida de Lebesgue.
3.2 A topologia fraca
no espa co das medidas

Nesta secao vamos introduzir uma topologia importante no conjunto /
1
(M)
das probabilidades borelianas do espa co M, chamada topologia fraca
, que
ser a muito util para provar o Teorema 3.1. A ideia da deni cao e a seguinte:
duas medidas est ao pr oximas se dao integrais pr oximas para muitas fun coes
contnuas. Procuremos exprimir esta ideia de modo preciso.
Dada uma medida /
1
(M), um conjunto nito F =
1
, . . . ,
N
de
fun coes contnuas
j
: M R, e um n umero > 0, denimos
V (, F, ) = /
1
(M) :
_

j
d
_

j
d
< para todo

j
F.
Ent ao a topologia fraca
e denida estipulando que estes conjuntos V (, F, ),

comF e vari avel, constituem uma base de vizinhancas da medida . O seguinte
lema deveria ajudar a compreender o signicado desta topologia:
Lema 3.2. Uma sequencia (
n
)
nN
em /
1
(M) converge para uma medida
/
1
(M) na topologia fraca
se e somente se
_
d
n

_
d para toda funcao contnua : M R.
Demonstra cao. Para provar a parte somente se, considere qualquer funcao
contnua e forme o conjunto F = . Como
n
, temos que dado
qualquer > 0 existe uma ordem a partir n da qual
n
esta na vizinhan ca
V (, F, ). Mas isto signica, precisamente, que
_
d
n

_
d
<
3.2. A TOPOLOGIA FRACA
NO ESPAC O DAS MEDIDAS 29

para todo n n. Em outras palavras, a sequencia
_
d
n
converge para
_
d.
A recproca arma que se
_
d
n
converge para
_
d, para toda fun cao
contnua, ent ao dado qualquer F e existe uma ordem a partir da qual
n

V (, F, ). Para ver isso, escrevemos F =
1
, . . . ,
N
. A hip otese garante que
para cada 1 j N existe n
j
tal que
_

j
d
n

_
d
< para todo n n

j
.
Tomando n = max n
1
, , . . . , n
N
, temos
n
V (, F, ) para n n.
Outra proposi cao muito util que caracteriza a convergencia de medidas e
dada na:
Proposi cao 3.3. Assuma que a sequencia
n
converge para na topologia
fraca
. Entao:
1. limsup
n
n
(K) (K) para cada conjunto compacto K M;
2. liminf
n
n
(U) (U) para cada conjunto aberto U M.
Em particular, se o bordo de A tem medida zero, temos que lim
n
n
(A) = (A).
Demonstra c ao. Seja U um aberto e vamos mostrar o item (b). Tome K um
compacto em U e escolha : [0, 1] uma fun cao contnua qualquer tal que
[
K
1 e [
U
c 0. Por exemplo, basta tomar (x) = d(x, U
c
)/(d(x, K) +
d(x, U
c
)). Ent ao:
(K)
_
d = lim
n
_
d
n
liminf
n
n
(U).
Como vale que (U) = sup
K
(K), onde o supremo e tomado sobre todos os
compactos K U provamos o item (b). O item (a) e inteiramente an alogo,
observando que (K) = inf (U), onde o nmo e tomado sobre todos os abertos
U contendo K.
As principais propriedades desta topologia de que necessitamos est ao dadas
no seguinte
Teorema 3.4. /
1
munido da topologia fraca
e metriz avel e compacto.

Vamos comecar por demonstrar a metrizabilidade, isto e, que existe uma
dist ancia d que gera a topologia fraca
em/
1
(M). Para isso usamos o resultado
seguinte, cuja prova pode ser encontrada em [Rud87]. Como e usual, denotamos
por C
0
(M) o espaco das fun coes contnuas : M R, munido da norma da
convergencia uniforme:
|
1

2
| = sup[
1
(x)
2
(x)[ : x M.
30 CAP
ITULO 3. EXIST

Proposi cao 3.5. Se M e um espa co metrico entao C
0
(M) tem subconjuntos
enumer aveis densos.
Logo, podemos escolher um subconjunto enumer avel T =
n
: n N
denso na bola unit aria do espaco C
0
(M). Feito isso, denimos
d(
1
,
2
) =
n=1
1
2
n
_

n
d
1

_

n
d
2
, (3.1)
para qualquer par de medidas
1
e
2
.
Proposi cao 3.6. A express ao d esta bem denida, e uma dist ancia, e gera a
topologia fraca
em /
1
(M).
Demonstra c ao. Como as fun coes estao na bola unit aria de C
0
(M), ou seja,
sup [[ 1, e as medidas
i
sao probabilidades, o termo geral da soma e limitado
por 2 2
n
. Isto garante que a serie em (3.1) converge.
O unico passo n ao trivial na prova de que d e uma dist ancia e mostrar que
d(
1
,
2
) = 0
1
=
2
.
A hip otese d(
1
,
2
) = 0 signica que
_

j
d
1
=
_

j
d
2
para toda
j

T. Agora, dada qualquer na bola unit aria de C
0
(M) podemos encontrar
uma sequencia de elementos de T convergindo uniformemente para . Como
consequencia, a igualdade continua valendo para :
_
d
1
=
_
d
2
(3.2)
para toda na bola unit aria de C
0
(M). Como todo elemento de C
0
(M) tem
algum m ultiplo na bola unit aria, isto implica que a igualdade (3.2) e verdadeira
para toda fun cao contnua . Isto quer dizer que
1
=
2
, como pretendamos
mostrar.
Para provar que d gera a topologia, devemos mostrar que toda bola B(, ) =
/
1
(M) : d(, ) < contem alguma vizinhanca V (, F, ) e reciproca-
mente. Dado > 0 xemos N 1 sucientemente grande para que
n=N
2
n
<

2
e consideremos F =
1
, . . . ,
N
formado pelos primeiros N elementos do
subconjunto enumer avel denso. Alem disso, consideremos = /2. Armamos
que V (, F, ) B(, ). De fato
V (, F, )
_

n
d
_

n
d
< para todo 1 n N
n=1
2
n
_

n
d
_

n
d
<
<
N
n=1
2
n
+
n=N+1
2 2
n
< ,
3.2. A TOPOLOGIA FRACA
NO ESPAC O DAS MEDIDAS 31

o que prova a nossa arma cao.
Reciprocamente, dado F =
1
, . . . ,
N
e > 0, selecionemos elementos
n1
, . . . ,
nN
distintos de T tais que
|
nj

j
| <

4
para todo 1 j N.
Fixemos > 0 sucientemente pequeno para que 2
nj
< /4 para todo 1 j N.
Armamos que B(, ) V (, F, ). De fato
B(, )
n=1
2
n
_

n
d
_

n
d
<
_

nj
d
_

nj
d
< 2
nj
para todo 1 j N
_

j
d
_

j
d
< 2
nj
+

2
< for all 1 n N,
e isto prova a nossa armacao.
Resta provar que (/
1
, fraca
) e um espaco compacto. Na demonstracao

vamos utilizar o seguinte resultado classico, que diz que as integrais sao os unicos
operadores lineares positivos no espa co das fun coes contnuas. Um operador
linear diz-se positivo se () > 0 para toda fun cao positiva em todo ponto.
Uma demonstracao deste resultado pode ser encontrada em [Rud87].
Teorema 3.7 (Riesz-Markov). Seja : C
0
(M) R qualquer operador linear
positivo. Entao existe uma unica medida boreliana em M tal que
() =
_
d para toda C
0
(M).
Observe que e uma probabilidade se e somente se (1) = 1, j a que (M) =
_
1 d = (1).
Vamos entao provar que o espa co /
1
e compacto para esta topologia. Como
j a sabemos que o espa co e metrizavel, basta provar
Proposi cao 3.8. Toda sequencia (
k
)
kN
em /
1
(M) admite alguma sub-
sequencia que e convergente na topologia fraca
.
Demonstra cao. Seja T =
n
: n N um subconjunto enumer avel denso
na bola unit aria de C
0
(M). Para cada n N, a sequencia de n umeros reais
_

n
d
k
, k N e limitada por 1. Portanto, para cada n N existe uma
sequencia (k
n
j
)
jN
tal que
_

n
d
k
n
j
converge para algum n umero
n
R quando j .
Alem disso, cada sequencia (k
n+1
j
)
jN
pode ser escolhida como subsequencia da
anterior (k
n
j
)
jN
. Denamos
j
= k
j
j
para cada j N. Por construcao, a menos
32 CAP
ITULO 3. EXIST

de um n umero nito de termos, (
j
)
jN
e uma subsequencia de cada uma das
(k
n
j
)
jN
. Logo
_

n
d
n
j

n
para todo n N.
Daqui se deduz facilmente que
() = lim
j
_
d
j
existe, para toda fun cao C
0
(M). (3.3)
De fato, suponha primeiro que esta na bola unit aria de C
0
(M). Dado qualquer
> 0 podemos encontrar
n
T tal que |
n
| . Ent ao
_
d
j

_

n
d
j

para todo j. Como
_

n
d
j
converge (para
n
), seque que
limsup
j
_
d
j
liminf
j
_
d
j
2.
Como e arbitr ario, conclumos que lim
j
_
d
j
existe. Isto prova (3.3) quando
a fun cao est a na bola unit aria. O caso geral reduz-se imediatamente a esse,
substituindo por /||. Assim, completamos a prova de (3.3).
Finalmente, e claro que o operador : C
0
(M) R denido por (3.3) e
linear e positivo: () min > 0 para todo fun cao C
0
(M) positiva em
todo ponto. Alem disso, (1) = 1. Logo, pelo Teorema 3.7, existe alguma prob-
abilidade boreliana em M tal que () =
_
d para toda fun cao contnua
. Agora a igualdade em (3.3) pode ser reescrita
_
= lim
j
_
d
j
para toda C
0
(M).
De acordo com o Lema 3.2, isto quer dizer que a subsequencia (
j
)
jN
converge
para na topologia fraca
. Isto completa a demonstracao do Teorema 3.4.

3.3 Demonstra cao do Teorema de Existencia
Comecemos por introduzir uma nota cao util. Dado f : M M e qualquer
medida em M denota-se por f
e chama-se imagem de por f a medida

denida por
f
_
E
_
=
_
f
1
(E)
_
para cada conjunto mensur avel E M.
Note que e invariante por f se e somente se f
= .
Lema 3.9. A aplicacao f
: /
1
(M) /
1
(M) e contnua relativamente à
topologia fraca
.
3.3. DEMONSTRAC

AO DO TEOREMA DE EXIST
ENCIA 33
Demonstra cao. Para mostrarmos o lema acima, basta mostrar que se
n
con-
verge para na topologia fraca
, ent ao para toda fun cao contnua temos

que
lim
n
df
n
=
_
df
.
De fato, se uma medida qualquer, armamos que
_
df
=
_
f d.
Com efeito, podemos aproximar por uma sequencia de fun coes simples
n
com
|
n
| ||. Observe que isso implica, em particular, que |
n
f| | f|.
Observe que se
A
e fun cao caracterstica, ent ao
_

A
df
= (f
1
(A)) =
_

A
f d.
Por linearidade, a igualdade acima se estende para as fun coes simples
n
. Para
nalizar, temos que pelo Teorema da Convergencia Dominada,
_
df
= lim
n
_

n
df
= lim
n
_

n
f d =
_
f d,
o que termina a prova da arma cao. Para completar a prova do Lema, basta
observar que a fun cao f tambem e contnua, uma vez que f e contnua.
Assim,
lim
n
_
df
n
= lim
n
_
f d
n
_
f d =
_
df
,
como queramos provar.
Voltando a prova do Teorema de Existencia, considere qualquer probabili-
dade em M: por exemplo, a medida de Dirac em um ponto qualquer. Forme
a sequencia de probabilidades
n
=
1
n
n1
j=0
f
j
(3.4)
onde f
j
e a imagem de pelo iterado f

j
. Pelo Teorema 3.4, esta sequencia
tem algum ponto de acumula cao: existe alguma subsequencia (n
j
)
jN
e alguma
probabilidade /
1
(M) tais que
= lim
k
n
k
= lim
k
1
n
k
n
k
1
j=0
f
j
. (3.5)
Agora e suciente provar o seguinte
34 CAP
ITULO 3. EXIST

Lema 3.10. Todo ponto de acumula cao de uma sequencia (
n
)
nN
e uma prob-
abilidade invariante por f.
Demonstra c ao. A partir de (3.5), e usando o Lema 3.9, obtemos que
f
= f
_
lim
k
1
n
k
n
k
1
j=0
f
j
_
= lim
k
f
_
1
n
k
n
k
1
j=0
f
j
_
= lim
k
1
n
k
n
k
j=1
f
j
.
A expressao do lado direito pode ser reescrita como
lim
k
_
1
n
k
n
k
1
j=0
f
j
+f
n
k

_
.
Armamos que lim
k
1
n
k
= 0 e lim
k
1
n
k
f
n
k
= 0. A primeira arma cao e obvia,

e para a segunda basta observar que
1
n
k
f
n
k
(E) =
1
n
k
(f
n
k
(E))
1
n
k
para todo conjunto mensur avel E F. Deste modo obtemos que
f
= lim
k
1
n
k
n
k
1
j=0
f
j
=
e portanto e invariante por f.
Isto completa a demonstracao do Teorema de Existencia 3.1.
Corolario 3.11 (Teorema de Recorrencia de Birkho). Se f : M M e
uma transforma cao contnua num espa co metrico compacto entao f tem algum
ponto recorrente.
Demonstra cao. Pelo Teorema 3.1, existe alguma probabilidade f-invariante .
Por outro lado, todo espa co metrico compacto admite uma base enumeravel de
abertos (verique!). Portanto, podemos aplicar o Teorema 1.3, para concluir
que -quase todo ponto e recorrente. Em particular, o conjunto dos pontos
recorrentes e nao vazio, conforme foi armado.
3.4 Exerccios
3.1. Prove a seguinte generaliza cao do Lema 3.10: Seja f : M M uma
transformacao contnua num espaco compacto, uma probabilidade em M e
(I
n
)
n
uma sequencia de intervalos de n umeros naturais tais que #I
n
converge
para innito quando n vai para innito. Ent ao qualquer ponto de acumula cao
da sequencia
n
=
1
#I
n
jIn
f
j
e uma probabilidade f-invariante.

3.4. EXERC
ICIOS 35
3.2. Dizemos que uma sequencia (
n
)
nN
de probabilidades converge pontual-
mente (ou fortemente) para /
1
(M)
n
(E) (E) para todo conjunto mensur avel E M.
1. Mostre que se (
n
)
nN
converge pontualmente para ent ao tambem con-
verge para na topologia fraca
. Mostre, atraves de um exemplo, que a

recproca e falsa.
2. Mostre que (
n
)
nN
converge para na topologia fraca
se e somente se
n
(E) (E) para todo conjunto mensur avel E M cujo bordo E
satisfaz (E) = 0.
Dica para (2): Dado o mensur avel E e > 0 encontre funcoes contnuas
1
e
2
tais que
1
A
E

2
e
_

1
d
_

2
d < .
3.3. Fixe um subconjunto enumer avel denso T =
n
: n N da bola unit aria
de C
0
(M). Mostre que uma sequencia (
k
)
kN
de probabilidades emM converge
na topologia fraca para alguma /
1
(M) se e somente se, para todo n N,
_

n
d
k
converge para
_

n
d.
3.4. Seja f
1
, f
2
, . . . , f
N
: M M uma famlia nita qualquer de transforma coes
contnuas num espaco metrico compacto que comutam entre si: f
i
f
j
= f
j
f
i
para todo i e todo j em 1, 2, . . . , N. Prove que existe alguma probabilidade
que e invariante por f
i
para todo i 1, 2, . . . , N.
Denicao 3.12. Dizemos que uma transformacao f : M M e unicamente
erg odica se admite exatamente uma probabilidade invariante.
Os exerccios a seguir tratam de transforma coes unicamente erg odicas. Esta
terminologia e justicada pelo Exerccio 3.7 abaixo, que arma que nesse caso a
probabilidade invariante e necessariamente ergodica. No que segue suporemos
que M e um espaco metrico compacto e f : M M e contnua.
3.5. Seja R
e uma rota cao irracional do crculo. Mostre que R
e unicamente
erg odica.
3.6. Seja f : M M uma transformacao unicamente erg odica. Mostre que se
: S
1
R e uma fun cao contnua qualquer, entao:
(x) = lim
n
1
n
n1
j=0
(R
j
(x))
existe em todo ponto e, de fato, o limite e uniforme. Justique que e constante
em todo ponto.
Dica: Verique que a sequencia do lado direito e equicontnua e use o teorema
de Ascoli-Arzela.
36 CAP
ITULO 3. EXIST

3.7. Mostre que f e uma transformacao unicamente erg odica se e somente se
lim
1
n
n1
j=0
(f
j
(x)) =
_
d
para toda fun cao contnua : M R e todo x M. Obtenha que, se uma
transformacao e unicamente erg odica ent ao a sua probabilidade invariante e
erg odica.
Captulo 4
Teorema Ergodico de
Birkho
O teorema fundamental da Teoria Erg odica arma que, para qualquer sub-
conjunto mensur avel e para quase todo ponto, existe um tempo medio de per-
manencia da orbita do ponto nesse conjunto. Este resultado e devido a von
Neumann, que provou um enunciado mais fraco, e sobretudo a Birkho, que o
provou na forma denitiva que iremos estudar.
Em muitos casos, esse tempo medio de permanencia e precisamente igual à
medida do subconjunto, ou seja, orbitas tpicas passam em cada subconjunto um
tempo que e exatamente igual à import anciaque a probabilidade invariante
atribui ao conjunto. Isto e o que se chama de ergodicidade, uma propriedade
que remonta a Boltzmann, e que estudaremos mais tarde.
4.1 Enunciados e comentarios
Comecemos por explicar o que entendemos por tempo medio de permanencia
de uma orbita num conjunto. Dado x M e um conjunto mensur avel E M,
vamos tomar um certo n umero (grande) de iterados iniciais da orbita de x e
vamos considerar a fra cao desses iterados que estao em E:
n
(E, x) =
1
n
#
_
j 0, 1, . . . , n 1 : f
j
(x) E
_
.
Observe que isto e o mesmo que
n
(E, x) =
1
n
n1
j=0
A
E
(f
j
(x)),
onde A
E
designa a fun cao caracterstica do conjunto E, isto e, A
E
(x) = 1 se
x E e A
E
(x) = 0 caso contr ario.
37
38 CAP
ITULO 4. TEOREMA ERG
ODICO DE BIRKHOFF
Em seguida, fazemos n ir para innito e chamamos tempo medio de per-
manencia da orbita de x em E o limite destas fracoes:
(E, x) = lim
n
n
(E, x).
Em geral, este limite pode nao existir. Iremos ver um exemplo desse fato daqui
a pouco. No entanto, o teorema ergodico arma que, relativamente a qualquer
probabilidade invariante, o limite realmente existe para quase todo ponto:
probabilidade invariante por f. Dado qualquer conjunto mensur avel E M,
o tempo medio de permanencia (E, x) existe em -quase todo ponto x M.
Alem disso,
_
(E, x) d(x) = (E).
Antes de passarmos ` a demonstracao deste resultado notavel, e a algumas
das suas aplicacoes, vamos fazer alguns comentarios relacionados. O primeiro
deles e que se (E, x) existe para um certo ponto x M ent ao
(E, f(x)) = (E, x). (4.1)
De fato, por denicao,
(E, f(x)) = lim
n
1
n
n
j=1
A
E
(f
j
(x))
= lim
n
1
n
n1
j=0
A
E
(f
j
(x))
1
n
_
A
E
(x) A
E
(f
n
(x))
= (E, x) + lim
n
1
n
_
A
E
(x) A
E
(f
n
(x))
Como a fun cao caracterstica e limitada, o ultimo limite e igual a zero. Isto
prova a igualdade (4.1).
O teorema ergodico pode ser enunciado de modo um pouco mais geral:
probabilidade invariante por f. Dada qualquer fun cao integr avel : M R o
limite
(x) = lim
n
1
n
n1
j=0
(f
j
(x))
existe em -quase todo ponto x M. Alem disso,
_
(x) d(x) =
_
(x) d(x).
Observe que o Teorema 4.1 e o caso particular = fun cao caracterstica A
E
do conjunto E. Este enunciado mais geral pode ser provado usando uma vers ao
um pouco mais elaborada do argumento da se cao 4.2, que n ao apresentaremos
aqui.
4.2. DEMONSTRAC

AO DO TEOREMA ERG
ODICO 39
4.2 Demonstra cao do teorema ergodico
A estrategia da prova e a seguinte. Seja E M um conjunto mensur avel
qualquer. Para cada x M, denimos
(E, x) = limsup
1
n
#
_
j 0, . . . , n 1 : f
j
(x) E
_
(E, x) = liminf
1
n
#
_
j 0, . . . , n 1 : f
j
(x) E
_
.
Note que, para todo x M,
(E, f(x)) = (E, x) e (E, f(x)) = (E, x) (4.2)
A justica cao e analoga ` a da rela cao (4.1).
O principal passo da demonstracao consiste em mostrar que
(E, x) = (E, x) para -quase todo ponto x. (4.3)
E claro que (E, x) e sempre maior ou igual que (E, x). Portanto, para mostrar
(4.3) sera suciente que provemos
_
(E, x) d(x) (E)
_
(E, x) d(x). (4.4)
Vamos provar a primeira desigualdade em (4.4). A segunda segue de um argu-
mento inteiramente an alogo
1
.
Fixemos qualquer > 0. Por deni cao de limsup, para cada x M existem
inteiros t 1 tais que
1
t
#
_
j 0, . . . , t 1 : f
j
(x) E
_
(E, x) . (4.5)
Representaremos por t(x) o menor inteiro com esta propriedade. Para tornar a
demonstracao mais transparente, consideraremos primeiro o caso particular em
que a fun cao x t(x) e limitada, isto e,
Caso particular: Existe T N tal que t(x) T para todo x M.
Dado qualquer x M, denimos uma sequencia x
0
, x
1
, . . . , x
s
de pontos em
M e uma sequencia t
0
, t
1
, . . . , t
s
de n umeros naturais, do seguinte modo:
1. Primeiramente, tomamos x
0
= x.
2. Supondo que x
i
j a foi denido, tomamos t
i
= t(x
i
) e x
i+1
= f
ti
(x
i
).
3. Terminamos quando encontramos x
s
tal que t
0
+t
1
+ +t
s1
+t
s
n.
1
Alternativamente, a segunda desigualdade pode ser deduzida da primeira, aplicada ao
complementar E
c
, observando que (E) = 1 (E
c
) e (E, x) = 1 (E
c
, x).
40 CAP
ODICO DE BIRKHOFF
Note que todo x
i
e iterado do ponto x: de fato x
i
= f
t0++ti1
(x). Apli-
cando (4.2) conclumos que (E, x
i
) = (E, x) para todo i. A deni cao de t(x
i
)
implica que, dos t
i
primeiros iterados de x
i
, pelo menos
t
i
_
(E, x
i
) ) = t
i
_
(E, x) ) (4.6)
estao em E. Isto vale para cada i = 0, 1, . . . , s 1. Portanto, pelo menos
(t
0
+t
1
+ +t
s1
)((E, x) )
dos n primeiros iterados de x, estao em E. Alem disso, a ultima regra na
deni cao das nossas sequencias implica que
t
0
+t
1
+ +t
s1
n t
s
n T.
Deste modo, mostramos que pelo menos (n T)((E, x) ) dos n primeiros
iterados de x estao em E. Em outras palavras,
n1
j=0
A
E
(f
j
(x)) (n T)((E, x) ) (4.7)
para todo x M e todo n 1. Integrando a relacao (4.7), obtemos que
n1
j=0
_
A
E
(f
j
(x)) d(x) (n T)
_
(E, x) d(x) (n T).
Todas as parcelas no membro da esquerda sao iguais a (E), uma vez que a
probabilidade e invariante por f. Portanto, esta desigualdade pode ser escrita
como
n(E) (n T)
_
(E, x) d(x) (n T).
Dividindo os dois termos por n e fazendo n ir para innito, conclumos que
(E)
_
(E, x) d(x)
Como > 0 e qualquer, isto implica a primeira desigualdade em (4.4). Isto
termina a demonstracao neste caso.
Caso geral: Vamos indicar as modicacoes que devem ser feitas relativamente
ao caso particular.
Dado > 0, comecamos por xar T 1 sucientemente grande, de modo
que a medida do
B = y M : t(y) > T
seja menor que . Em seguida, na deni cao das sequencias substitumos a regra
2 por
4.2. DEMONSTRAC

AO DO TEOREMA ERG
ODICO 41
2a. Se t(x
i
) T, tomamos t
i
= t(x
i
) e x
i+1
= f
ti
(x
i
).
2b. Se t(x
i
) > T, tomamos t
i
= 1 e x
i+1
= f(x
i
).
As regras 1 e 3 permanecem inalteradas. A estimativa referente a (4.6) continua
v alida, para os valores de i aos quais se aplica a regra 2a:
ti1
j=0
A
E
(f
j
(x
i
)) t
i
_
(E, x) ).
E claro que esta desigualdade implica a seguinte:

ti1
j=0
A
E
(f
j
(x
i
)) t
i
_
(E, x) )
ti1
j=0
A
B
(f
j
(x
i
)). (4.8)
A vantagem e que (4.8) e valida tambem para os valores de i aos quais se aplica
a regra 2b. De fato, nesse caso tem-se t
i
= 1, o membro da esquerda e maior ou
igual que zero e o membro da direita e menor que zero, uma vez que (E, x) e
sempre menor ou igual que 1. Isso signica que, no lugar de (4.7), tem-se
n1
j=0
A
E
(f
j
(x)) (n T)((E, x) )
n1
j=0
A
B
(f
j
(x)).
Integrando, como zemos anteriormente, obtemos
n(E) (n T)
_
(E, x) d(x) (n T) n(B).
Dividindo por n e fazendo n , deduzimos que (lembre que (B) < )
(E)
_
(E, x) d(x) (B)
_
(E, x) d(x) 2.
Como > 0 e arbitr ario, segue que
(E)
_
(E, x) d(x).
Isto completa a demonstracao do Teorema 4.1.
42 CAP
ODICO DE BIRKHOFF
4.3 Exerccios
4.1. Considere a transforma cao f : M M, f(x) = 10x [10x] introduzida
na secao 2.1. Considere
x = 0, 335533335555555533333333333333335 . . . .
Ou seja: a expansao decimal de x consiste de blocos de 3s e 5s, alternados, cada
bloco (exceto o segundo) com duas vezes mais dgitos que o anterior. Considere
tambem E = [0, 3, 0, 4). Mostre que
2
(E, x) = 1,
8
=
3
4
, . . .
2
2k1 (E, x)
2
3
,
enquanto que
4
(E, x) =
1
2
,
16
=
3
8
, . . .
2
2k (E, x)
1
3
,
e portanto o tempo medio de permanencia da orbita de x em E n ao existe.
4.2. Mostre que, para qualquer fun cao integr avel , a media temporal satisfaz
f = em -quase todo ponto.
Captulo 5
Ergodicidade
Uma transforma cao f : M M diz-se erg odica para uma probabilidade invari-
ante (tambem dizemos que a medida e ergodica para f, ou que o sistema
(f, ) e ergodico) se as medias temporais dadas pelo Teorema de Birkho 4.2
coincidem em quase todo ponto com as respectivas medias espaciais:
lim
n
1
n
n1
j=0
(f
j
(x)) =
_
d,
para toda fun cao -integr avel : M R e -quase todo x M.
Na pr oxima proposicao vamos reescrever esta condicao de v arias maneiras
equivalentes, para ajudar a entender o seu signicado. Um conjunto mensuravel
A M diz-se invariante se f
1
(A) = A. Uma fun cao mensuravel : M R
diz-se invariante se f = .
Proposi cao 5.1. Seja uma probabilidade invariante de uma transformacao
f : M M mensur avel. As seguintes condi coes sao equivalentes:
1. O sistema (f, ) e erg odico.
2. Para todo subconjunto invariante A tem-se (A) = 0 ou (A) = 1.
3. Toda fun cao invariante e constante num conjunto de medida total.
Demonstra cao. (1) implica (2): Considere = A
A
. Por um lado, a hip otese
(1) signica que
(x) =
_
d = (A)
para quase todo x M. Por outro lado, como A e invariante, temos que x A
se e somente se f(x) A. Isto implica que (f
j
(x)) = (x) para todo j 0 e
para todo x. Portanto,
(x) = (x) = A
A
(x)
para todo x M. Como a fun cao caracterstica s o toma os valores 0 e 1, estas
duas igualdades implicam que (A) = 0 ou (A) = 1, como e armado em (2).
43
44 CAP
ITULO 5. ERGODICIDADE
(2) implica (3): Seja uma fun cao invariante qualquer. Ent ao, a pre-
imagem
1
(I) de qualquer intervalo I R e um conjunto invariante. Portanto,
pela hip otese (2), essa pre-imagem tem medida zero ou um. Como o intervalo
I e qualquer, isto prova que e constante num conjunto com probabilidade
total.
(3) implica (1): Seja uma fun cao integr avel qualquer. Como vimos no
exerccio 4.2, a media temporal e uma fun cao invariante. Logo, pela hip otese
(3), e constante em quase todo ponto. Ent ao, usando o teorema erg odico,
(x) =
_
d =
_
d
em quase todo ponto. Isto e, o sistema e ergodico.
5.1 Exemplos e aplica coes
Nesta secao descrevemos diversos exemplos de sistemas ergodicos.
5.1.1 Expansao decimal
Considere a transforma cao f : [0, 1] [0, 1], f(x) = 10x [10x] da secao 2.1.
Armamos que f e ergodica para a medida de Lebesgue . Tendo em vista a
proposi cao 5.1, para mostrar isto s o temos que provar que se A e um conjunto
invariante com medida positiva ent ao A tem medida total.
Suponhamos ent ao que A e invariante e (A) > 0. O ingrediente principal
e o teorema de deriva cao 0.25. No nosso caso, como estamos tratando com
subconjuntos de R, a condi cao (2) torna-se
lim
0
inf
_
(I A)
(I)
: I (a , a +) intervalo contendo a
_
= 1 . (5.1)
Fixemos um ponto de densidade a A qualquer. Consideremos a sequencia de
intervalos
I
k
=
_
m
k
10
k
,
m
k
+ 1
10
k
_
, m
k
Z, k N,
que contem o ponto a. Como a e um ponto de densidade de A, a propriedade
(5.1) implica que
(I
k
A)
(I
k
)
1 quando k .
Observe tambem que cada f
k
e uma bije cao am de I
k
sobre o intervalo (0, 1).
Isso tem a seguinte consequencia, que e crucial para o nosso argumento:
(f
k
(E
1
))
(f
k
(E
2
))
=
(E
1
)
(E
2
)
(5.2)
5.1. EXEMPLOS E APLICAC

OES 45
para quaisquer subconjuntos mensuraveis E
1
e E
2
de I
k
. Aplicando este fato a
E
1
= I
k
A e E
2
= I
k
obtemos que
_
f
k
(I
k
A)
_
_
(0, 1)
_ =
(I
k
A)
(I
k
)
.
Claro que
_
(0, 1)
_
= 1. Alem disso, como estamos supondo que A e invariante,
f
k
(I
k
A) esta contido em A. Deste modo obtemos que
(A)
(I
k
A)
(I
k
)
.
Como a sequencia do lado direito converge para 1, segue que (A) = 1, como
queramos demonstrar. Ficou provado que a transforma cao f e ergodica para a
medida de Lebesgue .
Em seguida vamos dar uma aplica cao deste fato no contexto da Teoria dos
N umeros. Dizemos que um n umero x R e balanceado se todo dgito aparece
com a mesma frequencia, 1/10, na sua expans ao decimal.

E f acil dar exemplos de
n umeros balanceados. Mas em geral e muito difcil decidir se um dado n umero
irracional e balanceado ou n ao. Por exemplo, n ao e sabido ate hoje se o n umero
e balanceado.
No entanto, a conclus ao da se cao anterior nos permite deduzir que quase
todo n umero e balanceado:
Proposi cao 5.2. O conjunto dos n umeros x R nao balanceados tem medida
de Lebesgue nula.
Demonstra cao. Como o fato de ser balanceado e independente da parte inteira
do n umero, s o precisamos mostrar que quase todo x [0, 1] e balanceado.
Considere f : [0, 1] [0, 1] denida por f(x) = 10x [10x]. Para cada dgito
j 0, 1, . . . , 9 considere o intervalo E
j
= [j/10, (j + 1)/10). Recorde que
se x = 0, a
0
a
1
a
k
a
k+1
ent ao f
k
(x) = 0, a
k
a
k+1
. Portanto, f
k
(x)
E
j
se e somente se o k-esimo dgito da expans ao decimal de x e igual a j.
Consequentemente, o tempo medio de permanencia (E
j
, x) e exatamente a
frequencia do dgito j na expansao decimal de x. Usando o teorema ergodico e o
fato de que a transforma cao e ergodica para a medida de Lebesgue , conclumos
que para cada j 0, 1, . . . , 9 existe um subconjunto B
j
de M com (B
j
) = 1
tal que
(E
j
, x) = (E
j
) =
1
10
para todo x B
j
.
Ent ao B = B
0
B
1
B
9
tambem tem (B) = 1, e todo n umero x B e
balanceado.
5.1.2 Deslocamentos (shifts) de Bernoulli
Vamos agora voltar a discussao dos deslocamentos de Bernoulli, introduzidos
na Seccao 2.3 do Captulo 2. Mostraremos que as medidas de Bernoulli s ao
erg odicas. Para isso, a seguinte propriedade das medidas de Bernoulli vai ser
util :
46 CAP
Lema 5.3. Se A e B s ao elementos da algebra B
0
, isto e, uni oes nitas de
cilindros disjuntos, ent ao tem-se
(A f
m
(B)) = (A)(f
m
(B)) = (A)(B),
para todo m sucientemente grande.
Demonstra cao. Expliquemos porque esta propriedade e verdadeira quando A e
B sao cilindros, A = [k, l; a
k
, . . . , a
l
] e B = [u, v; b
u
, . . . , b
v
]. Para cada m tem-
se f
m
(B) = [u + m, v + m; b
u
, . . . , b
v
]. Escolhendo m sucientemente grande
garantimos que u +m > l e, entao,
A f
m
(B) = :
k
= a
k
, . . . ,
l
= a
l
,
u+m
= b
u
, . . . ,
v+m
= b
v
=
_
[k, v +m; a
k
, . . . , a
l
, c
l+1
, . . . , c
u+m1
, b
u
, . . . , b
v
],
onde a uni ao e sobre todos os valores possveis de c
l+1
, . . . , c
u+m1
. Usando
(2.6), conclumos que (A f
m
(B)) = (A)(B). Isto prova o lema quando
os conjuntos envolvidos s ao cilindros. O caso geral segue pelo fato de ser
nitamente aditiva.
Proposi cao 5.4. Seja f : M M um deslocamento e uma medida de
Bernoulli em M, como antes. Entao o sistema (f, ) e erg odico.
Demonstra cao. Seja A um conjunto mensur avel invariante qualquer. Queremos
mostrar que (A) = 0 ou (A) = 1. Para tornar a ideia da prova mais clara,
comecemos por um caso particular: suponhamos que A esta na algebra B
0
das
uni oes nitas de cilindros disjuntos dois-a-dois. Nesse caso podemos aplicar o
lema anterior, com B = A. Conclumos que (Af
m
(A)) = (A)
2
sempre que
tomemos m sucientemente grande. Mas, como A e invariante, f
m
(A) = A
para todo m. Ent ao a igualdade anterior quer dizer que (A) = (A)
2
, o que
so pode acontecer se (A) = 0 ou (A) = 1.
Agora vamos fazer a prova quando A B e um conjunto invariante qualquer.
A ideia e aproximar A por elementos da algebra B
0
, usando o Teorema de
Aproxima cao 0.11: dado qualquer > 0 existe A
0
B
0
tal que (AA
0
) < .
Escolha m como no caso anterior, de modo que
(A
0
f
m
(A
0
)) = (A
0
)(f
m
(A
0
)) = (A
0
)
2
. (5.3)
Observe que
(A f
m
(A))(A
0
f
m
(A
0
)) (AA
0
) (f
m
(A)f
m
(A
0
))
(AA
0
) f
m
(AA
0
).
Isto, junto com o fato de que e invariante por f, implica que
(A f
m
(A)) (A
0
f
m
(A
0
))
2(AA
0
) < 2. (5.4)
Alem disso,
(A)
2
(A
0
)
2
((A) +(A
0
))((A) (A
0
))
(A) (A
0
)
< 2.
(5.5)

OES 47
Juntando as rela coes (5.3), (5.4), (5.5), conclumos que [(A) (A)
2
[ < 4.
Como e arbitr ario, deduzimos que (A) = (A)
2
e entao, do mesmo modo que
antes, conclumos que (A) = 0 ou (A) = 1.
5.1.3 Rotacao irracional no crculo
Para n os o crculo S
1
ser a o conjunto dos n umeros complexos com m odulo igual
a 1. Dado R, a rotacao de angulo e a multiplica cao pelo n umero complexo
e
i
R
: S
1
S
1
, R
(z) = e
i
z .
E claro que R
preserva o comprimento dos intervalos (segmentos) de S

1
. Us-
ando o Lema 2.2 se deduz que a medida de Lebesgue (comprimento de arco) e
invariante por qualquer R
.
O comportamento din amico e erg odico de R
depende muito da natureza de

, como vamos ver. Dizemos que a rotacao e irracional se o n umero /(2) e
irracional, e dizemos que a rotacao e racional no caso contr ario.
A recproca e muito mais interessante:
Proposi cao 5.5. Se R
e rotacao irracional entao R
e erg odica para a medida

de Lebesgue.
Vamos mencionar duas demonstra coes diferentes deste fato. A primeira, que
detalharemos a seguir, usa fatos simples de analise de Fourier. A segunda, que
deixaremos como exerccio, e baseada num argumento de ponto de densidade
semelhante ao que usamos no caso da expansao decimal.
Seja a medida de Lebesgue no crculo. Chama-se L
2
() o espaco das
fun coes
1
mensuraveis : S
1
C cujo quadrado e integr avel:
_
[[
2
d < .
E claro que este espaco contem todas as fun coes mensuraveis limitadas e, em
particular, todas as fun coes caractersticas de conjuntos mensur aveis. Outro
fato de que necessitamos e que a famlia de fun coes
k
(z) = z
k
: k Z e
uma base (de Hilbert) desse espaco: dada qualquer L
2
() existe uma unica
sequencia (c
k
)
kZ
de n umeros complexos tais que
(z) =
kZ
c
k
z
k
para quase todo z S
1
.
Demonstra cao. Pela proposi cao 5.1, basta mostrar que toda fun cao integr avel
que e invariante e constante em -quase todo ponto. Observe que se e
integr avel, ent ao automaticamente L
2
() (verique! Utilize que e nita).
1
Quando lidamos com L
2
() sempre identicamos funcoes que diferem apenas num con-
junto de medida nula.
48 CAP
Usando a expans ao de Fourier (z) =

kZ
c
k
z
k
, a condi cao de ser invariante
R
= se escreve
kZ
c
k
e
ki
z
k
=
kZ
c
k
z
k
Por unicidade dos coecientes da expansao em serie de Fourier, obtemos que
c
k
(e
ki
1) = 0 para todo k Z.
A hip otese de que a rota cao e irracional signica que e
ki
1 ,= 0 para todo
k ,= 0, e portanto, c
k
= 0 para todo k ,= 0. Ou seja, (z) = c
0
para -quase
todo z S
1
, como queramos provar.
De fato as rota coes irracionais satisfazem uma propriedade muito mais forte
do que ergodicidade: elas s ao unicamente ergodicas, o que quer dizer que tem
uma unica probabilidade invariante (que e a medida de Lebesgue, claro).
Observa cao 5.6. A no cao de rota cao irracional se estende para dimensoes
maiores. Dado qualquer d 1 chamamos d-toro o produto T
d
= S
1
S
1
do crculo por si mesmo d vezes. A rotacao de angulo = (
1
, . . . ,
d
) e a
aplica cao R
: T
d
T
d
, R
(z
1
, . . . , z
d
) = (e
i1
z
1
, . . . , e
i
d
z
d
). A rota cao e
irracional se os n umeros
j
/(2) sao incomensur aveis:
m
0
+m
1
1
2
+ +m
d
d
2
= 0 m
0
= m
1
= = m
d
= 0,
quaisquer que sejam os inteiros m
0
, m
1
, . . . , m
d
. Usando uma vers ao multi-
dimensional das ideias anteriores, se prova que uma rota cao e ergodica se e
somente se ela e irracional.
5.1.4 Transformacao de Gauss
Como vimos na secao 2.4, a transforma cao de Gauss G(x) = 1/x [1/x] ad-
mite uma probabilidade invariante que e equivalente ` a medida de Lebesgue,
nomeadamente,
(E) =
1
log 2
_
E
dx
1 +x
Temos tambem que o sistema (G, ) e ergodico. Este fato pode ser demonstrado
pelo mesmo tipo de argumento que usamos na secao 5.1.1. Vamos esbocar o
argumento neste caso, explicando qual e a principal diculdade adicional.
Seja A um conjunto invariante com medida positiva. Em primeiro lugar, con-
tinua sendo verdade que para quase todo ponto a [0, 1] existe uma sequencia
de intervalos I
k
contendo a e tais que f
k
envia I
k
bijetivamente e diferenci-
avelmente sobre (0, 1). O di ametro desses intervalos converge para zero. Logo,
tomando para a um ponto de densidade qualquer de A, temos que
(I
k
A)
(I
k
)
1 quando k +. (5.6)

OES 49
Por outro lado embora f
k
seja uma bijecao restrita a cada I
k
, ela n ao e am.
Por essa razao n ao temos o analogo da rela cao (5.2) neste caso. Esta diculdade
e contornada atraves do seguinte resultado, que e um exemplo de controle de
distor c ao: e muito importante notar que a constante K e independente de k,
I
k
, E
1
, e E
2
.
Lema 5.7. Existe uma constante K > 1 tal que para todo k 1, todo intervalo
I
k
tal que G restrita a I
k
e uma bije cao diferenciavel, tem-se
(f
k
(E
1
))
(f
k
(E
2
))
K
(E
1
)
(E
2
)
para quaisquer subconjuntos mensur aveis E
1
e E
2
de I
k
.
Antes de demonstrarmos o Lema 5.7, explicamos como a ergodicidade de
(G, ) pode ser obtida a partir dele. Observe que f
k
(I
k
A
c
) = A
c
, porque o
conjunto A e invariante. Lembre tambem que f
k
(I
k
) = (0, 1), que tem medida
total. Tomando E
1
= I
k
A
c
e E
2
= I
k
no lema 5.7, conclumos que
(A
c
)
(f
k
(I
k
A
c
)
(A
c
)
K
(I
k
A
c
)
(I
k
.
De acordo com (5.6), a express ao do lado direito converge para zero quando
k . Logo (A
c
) = 0, como queramos demonstrar.
Daremos agora a prova do Lema 5.7. As linhas gerais da demonstracao,
servir ao para concluir um resultado mais geral,apresentado na secao 9.1.
Prova do Lema 5.7. Usaremos os seguintes fatos sobre a transformacao f que
podem ser facilmente vericados pelo leitor:
1. Para todo x (0, 1) vale que [f
(x)[ > 1 e [(f

2
)
(x)[ 4.
2. Existe C
1
> 0 tal que [
f
(x)
f
(x)
[ < C
1
.
Observe que a partir do item (1) acima, podemos mostrar que se x, y I
k
ent ao
[f
i
(x) f
i
(y)[
1
2
ki
[f
k
(x) f
k
(y)[ se i = 0, 1, 2, . . . k. (5.7)
Observe tambem que se x, y I
k
temos que
[ log
(f
k
)
(x)
(f
k
)
(y)
[
k1
i=0
[ log f
(f
i
(x)) log f
(f
i
(y))[.
O item (2) nos garante que a fun cao x log f
(x) tem derivada limitada por C,

logo pelo Teorema do Valor Medio temos que [ log f
(a) log f
(b)[ C
1
[a b[.
Aplicando este fato na desigualdade acima e observando a equacao 5.7:
[ log
(f
k
)
(x)
(f
k
)
(y)
[ C
1
k1
i=0
[f
i
(x) f
i
(y)[
k1
i=0
1
2
ki
C
1
[f
k
(x) f
k
(y)[ C
2
,
50 CAP
onde C
2
e uma constante propriamente escolhida. Logo, tomando K = exp C
2
,
vem que para todos x, y I
k
vale:
(f
k
)
(x)
(f
k
)
(y)
< C
3
.
Note que a constante C
3
escolhida n ao depende de k nem de I
k
. Observe ainda
que se A [0, 1] e um conjunto mensur avel, ent ao
1
2 log 2
m(A) (A)
1
log 2
m(A),
onde m representa a medida de Lebesgue de [0,1].
Assim, para concluir a prova do Lema 5.7, basta observar que se E
1
e E
2
sao subconjuntos mensur aveis de I
k
, ent ao:
(f
k
(E
1
))
(f
k
(E
2
))
= 2(log 2)
2
m(f
k
(E
1
))
m(f
k
(E
2
))

_
E1
(f
k
)
(x) dm
_
E2
(f
k
)
(y) dm

2(log 2)
2
(C
3
)
2
m(E
1
)
m(E
2
)
4(log 2)
4
C
3
(E
1
)
(E
2
)
.
Assim, basta tomar K = 4(log 2)
4
(C
3
)
2
e o lema esta provado.
5.1.5 Maquina de somar (adding machine)
A maquina de somar modela sistemas tais como o contador de quilometragem
de um carro ou o registro de consumo de gas (em algumas cidades): a dinamica
consiste em fazer avancar o contador de uma unidade. A principal diferen ca com
rela cao à realidade e que este contador idealizado comporta innitos dgitos.
Fixe d 2, que representa a base de numera cao (por exemplo, d = 10).
Consideramos o espa co M de todas as sequencias
= (
0
,
1
,
2
, . . . ,
k1
,
k
, . . .)
com
j
0, 1, . . . , d 1. Munimos este espa co da seguinte distancia
d(,
) = 2
N(,
)
onde N(,
) = minj 0 :
j
,=
j
.
Tambem consideramos a transforma cao f : M M soma uma unidade:
Para toda sequencia com
0
< d 1, denimos
f(
0
,
1
,
2
, . . . ,
k1
,
k
, . . .) = (
0
+ 1,
1
,
2
, . . . ,
k1
,
k
, . . .).
Se
0
= d 1 mas
1
< d 1, denimos
f(
0
,
1
,
2
, . . . ,
k1
,
k
, . . .) = (0,
1
+ 1,
2
, . . . ,
k1
,
k
, . . .).
5.2. EQUIVAL
ENCIA ESPECTRAL 51
Mais geralmente, se
0
= =
k1
= d 1 mas
k
< d 1, denimos
f(
0
,
1
,
2
, . . . ,
k1
,
k
, . . .) = (0, 0, 0, . . . , 0,
k
+ 1, . . .).
Se
j
= d 1 para todo j 0, denimos
f(
0
,
1
,
2
, . . . ,
k1
,
k
, . . .) = (0, 0, 0, . . . , 0, 0, . . .).
M munido da dist ancia denida em (3.1) e um espaco metrico compacto, e
a transforma cao f e contnua nesse espaco. O exerccio 5.7 pede para mostrar
que f e unicamente erg odica e para calcular a ( unica) probabilidade invariante.
5.2 Equivalencia Espectral
Esta subsecao trata da caracteriza cao das propriedades din amicas de uma me-
dida como propriedades de

Algebra Linear, relacionadas a um certo operador
U
f
que iremos denir. Iremos ver, por exemplo, que a invari ancia da medida
equivale ao fato do operador preservar dist ancias num espaco adequado de
fun coes. Veremos tambem a ergodicidade como uma propriedade espectral do
sistema (f, ), no sentido de que ela pode ser caracterizada pelos auto-valores
do operador U
f
.
5.2.1 O Espa co L
2
()
Para denir o operador U
f
, precisamos primeiro denir seu domnio, o espaco
de fun coes L
2
():
Denicao 5.8. O espaco vetorial L
2
() e denido como o conjunto
L
2
() = : M R;
_
[[
2
d < ,
onde duas fun coes sao identicadas se elas coincidem em quase todo ponto com
respeito à medida .
Podemos munir este espaco vetorial com um produto interno dado por:
< , >=
_
. d.
Segue da desigualdade de Holder e das propriedades da integral que a expressao
acima de fato dene um produto interno em L
2
(). Naturalmente, uma vez que
temos um produto interno em L
2
(), podemos denir uma norma por:
||
2
=

< , >.
Alem disso, podemos munir L
2
() com a metrica que provem do produto interno
<, > denida por:
d(, ) = | |
2
=
__
[ [
2
d
_1
2
. (5.8)
52 CAP
E cl assico da Analise Funcional que o espaco L

2
() com a metrica d e
um espaco metrico completo. Deixaremos tal verica cao para o leitor no ex-
erccio ??.
Deremos agora a transformacao linear que carrega algumas propriedades
metricas do sistema (f, ). Considere U
f
: L
2
() L
2
() denida simples-
mente como:
U
f
() = f.
E imediato vericar que U

f
e uma transformacao linear. A pr oxima proposicao
traz a primeira tradu cao entre propriedades de (f, ) e propriedades da trans-
forma cao U
f
.
Proposi cao 5.9. Seja f uma transforma cao e uma medida em M. f preserva
se, e s o se, para toda L
2
():
|U
f
|
2
= ||
2
. (5.9)
Demonstra cao. De fato, primeiramente observe que se f preserva a medida
ent ao para todo Boreliano A vale (A) = (f
1
(A)). Em particular, a
igualdade (5.9) vale se for uma fun cao caracterstica de um boreliano. Uti-
lizando a linearidade da integral, podemos estender nossa conclus ao para todas
fun coes simples. Para concluir a demonstracao da propriedade (5.9) observe
que L
2
() L
1
(). Com efeito, se L
2
(), aplicando a desigualdade de
Holder ` as fun coes || e 1, temos que
_
|| d
_
||
2
d < . Como toda
fun cao em L
1
() pode ser aproximada por uma sequencia monotona
n
de
fun coes simples, dada L
2
(), tomando uma sequencia de fun coes simples
s
n
convergindo monotonamente para e utilizando o Teorema da Convergencia
Mon otona para as sequencia s
n
e s
n
f, temos que:
_
f d = lim
n
_
s
n
f d = lim
n
_
s
n
d =
_
d.
Reciprocamente, provaremos este fato primeiramente para as fun coes contnuas
n ao-negativas. Se 0 e fun cao contnua, tomando =

temos que
L
2
(), pois e limitada e e uma probabilidade. Como estamos assu-
mindo que | f|
2
= ||
2
, temos que:
_
| f|
2
d =
_
f d =
_
d =
_
||
2
d.
Para provarmos que a igualdade acima vale quanto e uma fun cao contnua
qualquer, basta observarmos que toda fun cao contnua se escreve como diferenca
de duas fun coes positivas limitadas e aplicarmos a igualdade obtida a estas
fun coes. Assim, utilizando a Proposi cao 2.1, temos que f preserva .
Em palavras da

Algebra Linear, a igualdade (5.9) acima, signica que U
f
e uma isometria do espaco L
2
(). Em particular, esta propriedade implica
diretamente que U
f
e uma transformacao linear injetiva, pois se
||
2
> 0 |U
f
|
2
= ||
2
> 0.
5.2. EQUIVAL
ENCIA ESPECTRAL 53
Porem, U
f
so e sobrejetiva se f for invertvel (veja o Exerccio ??).
Observe que 1 e sempre um autovalor de U
f
e a esse autovalor temos associ-
ado um auto-espa co que sempre contem as fun coes constantes. A Proposicao 5.1
diz que a propriedade da medida ser ergodica equivale ao fato de que as unicas
fun coes invariantes por U
f
sao as fun coes constantes ou, em outros termos, a
dimensao do auto-espa co associado ao auto-valor 1 e igual a um. Isso justica
a arma cao de que a ergodicidade e uma propriedade espectral.
Vamos estabelecer quando duas tranformacoes f : M M e g : N N
preservando medidas e sao equivalentes do ponto de vista espectral. Isto
nos permitir a extrair informa coes sobre as propriedades espectrais do sistema
(f, ) a partir das propriedades espectrais do sistema (g, ) e vice-versa.
Denicao 5.10. Sejam f : M M preservando e g : N N preservando
. Dizemos que (f, ) e (g, ) sao espectralmente equivalentes se existir uma
transformacao linear invertvel A : L
2
() L
2
() tal que:
1. < A, A >=< , >;
2. AU
f
= U
g
A.
Deixaremos para o leitor no Exerccio ?? a verica cao de que a rela cao
denida acima e de fato uma rela cao de equivalencia.
Se (f, ) e (g, ) sao espectralmente equivalentes e A e uma equivalencia
espectral, se e auto-fun cao de U
f
associada ao auto-valor , ent ao A e auto-
fun cao de U
g
associada ao auto-valor . De fato, U
f
() = U
g
A() =
AU
f
() = A.
Assim, o auto-espaco F
1
associado ao auto-valor 1 para operador U
g
e sim-
plesmente a imagem por A do auto-espa co E
1
associado ao auto-valor 1 para
U
f
. Como A e um isomorsmo linear, a dimens ao de F
1
e igual dimens ao de
E
1
. Segundo a observa cao que (f, ) e ergodica se a dimensao do auto-espa co
associado ao auto-valor 1 e igual a 1, podemos armar que se (f, ) e (g, )
sao espectralmente equivalentes, entao (f, ) e um sistema ergodico se, e so se,
(g, ) e ergodico.
Exemplo 5.11. Considere f : [0, 1] [0, 1] a fun cao denida por f(x) = 2x
mod 1 preservando a medida de Lebesgue m e seja :
+
2

+
2
o deslocamento
no espaco
+
2
= 0, 1
Z
preservando a medida de Bernoulli associada ao vetor
(1/2, 1/2). Mostraremos que (f, m) e (, ) sao espectralmente equivalentes.
Realmente, para cada fun cao L
2
(m) associaremos uma fun cao = A
L
2
() denida por
(a
0
, a
1
, a
2
, . . . ) = (0, a
0
a
1
a
2
. . . )
Claramente Ae uma transformacao linear. A tambeme invertvel, pois podemos
denir A
1
por
A
1
(0, a
0
a
1
a
2
, . . . ) = (a
0
, a
1
, a
2
, . . . ).
Estritamente, para que A
1
esteja bem denida, devemos fazer uma escolha
do valor de A
1
nos pontos x que podem ser escritos de dois modos distintos
54 CAP
na base dois. Por exemplo, o ponto x = 0, 01111 . . . tambem pode se escrever
como x = 0, 1. Porem, como o conjunto dos pontos que podem ser escritos de
dois modos distintos e enumeravel, e portanto, com medida de Lebesgue igual
à zero, podemos denir A
1
de um modo arbitr ario nestes pontos, uma vez
que duas fun coes em L
2
(m) sao iguais se elas coincidem em quase todo ponto.
Assim, A
1
esta bem denida.
Para mostrar que Ae uma equivalencia espectral, note que segue da denicao
de que
_
AA d =
_
d =
_
dm.
Finalmente, a condi cao de que AU
f
= U
A e imediata, a partir da deni cao

de A. De fato, se L
2
(m), temos que U
f
(0, a
0
a
1
a
2
. . . ) = (0, a
1
a
2
a
3
. . . ).
Logo,
AU
f
(0, a
0
a
1
a
2
. . . ) = A(0, a
1
a
2
. . . ) = (a
1
, a
2
, . . . ) =
((a
0
, a
1
, . . . )) = U
(a
0
, a
1
, . . . ) = U
A(a
0
, a
1
, . . . ).
5.3 Propriedades de medidas erg odicas
Fixemos uma transformacao f : M M qualquer. Lembre que uma medida
diz-se absolutamente contnua com relacao a outra medida se (E) = 0
implica (E) = 0. O pr oximo lema arma que probabilidades erg odicas sao
minimais para a rela cao :
Lema 5.12. Se e s ao probabilidades invariantes tais que e erg odica e
e absolutamente contnua com relacao a entao = .
Demonstra c ao. Seja : M R uma fun cao mensuravel limitada qualquer, e
seja
(x) = lim
n
1
n
n1
j=0
(f
j
(x))
a sua media temporal. Como e invariante e erg odica, a media temporal e
constante
(x) =
_
d
para -quase todo ponto. Segue que isto e verdade para -quase todo ponto, j a
que . Em particular,
_
d =
_
d.
Por outro lado, pelo teorema erg odico,
_
d =
_
d .
5.3. PROPRIEDADES DE MEDIDAS ERG
ODICAS 55
Portanto, as integrais de com rela cao a e em relacao a coincidem, qual-
quer que seja a fun cao mensuravel limitada . Logo, considerando fun coes
caractersticas, = .
Naturalmente, se
1
e
2
sao probabilidades invariantes com respeito ` a f a
probabilidade
1
+t(
2
1
) ainda e invariante. Isso siginca que o conjunto das
probabilidades invariantes e um conjunto convexo. Veremos que dentro deste
conjunto, as medidas erg odicas desempenham um papel destacado:
Denicao 5.13. Seja X um conjunto convexo. Um ponto p X e dito ex-
tremal, se para quaisquer x, y X e t [0, 1], x+t(y x) = p implica que t = 0
ou 1.
O lema seguinte arma que uma probabilidade invariante e ergodica se e
somente se e ponto extremal no conjunto das probabilidades invariantes:
Lema 5.14. Uma probabilidade invariante e erg odica se e somente se n ao e
possvel escreve-la na forma
= c
1
1
+c
2
2
com c
1
, c
2
maiores que zero e
1
,
2
probabilidades invariantes distintas.
Demonstra c ao. Para provar a parte se, suponha que n ao seja erg odica.
Ent ao existe algum conjunto invariante A com 0 < (A) < 1. Dena
1
e
2
como sendo as restricoes normalizadas de a A e ao seu complementar,
respectivamente:
1
(E) =
(E A)
(A)

2
(E) =
(E A
c
)
(A
c
)
.
Como A e A
c
sao conjuntos invariantes e e medida invariante,
1
e
2
sao
tambem probabilidades invariantes. Alem disso, = (A)
1
+ (A
c
)
2
e por-
tanto n ao e extremal.
Para provar a recproca, suponha que e ergodica e temos = c
1
1
+c
2
2
com c
1
, c
2
> 0.

E claro que (E) = 0 implica
1
(E) =
2
(E) = 0, ou seja,
1
e
2
sao absolutamente contnuas com relacao a . Logo, pelo lema 5.12,
1
= =
2
. Isto prova que e extremal.
Em seguida vamos mostrar que medidas erg odicas distintas vivemem sub-
conjuntos disjuntos do espa co M:
Lema 5.15. Sejam
1
, . . . ,
N
probabilidades invariantes e erg odicas, todas
distintas. Ent ao existem subconjuntos mensur aveis P
1
, . . . , P
N
invariantes dis-
juntos tais que
j
(P
k
) =
_
1 se j = k
0 se j ,= k
56 CAP
Demonstra c ao. Fixe qualquer par j, k de n umeros distintos em1, . . . , N. Pelo
lema 5.12, a medida
j
n ao pode ser absolutamente contnua em rela cao a
k
.
Em outras palavras, existe algum subconjunto mensur avel E tal que
j
(E) > 0
mas
k
(E) = 0. Ent ao
j
_

_
j=0
f
j
(E)
_

j
(E) > 0. e
k
_

_
j=0
f
j
(E)
_
= 0
Dena P
j,k
=
m=0
j=m
f
j
(E). Como a sequencia de conjuntos na interse cao
e decrescente com m,
j
_
P
j,k
_
= lim
m
j
_

_
j=m
f
j
(E)
_
(5.10)
e, analogamente para
k
. Como as medidas
j
e
k
sao invariantes, e
_
j=m
f
j
(E) = f
m
_

_
j=0
f
j
(E)
_
,
a sequencia no lado direito de (5.10) e constante. Conclumos que
j
(P
j,k
) =
j
_

_
j=0
f
j
(E)
_
> 0 e
k
(P
j,k
) =
k
_

_
j=0
f
j
(E)
_
= 0.
Alem disso, P
j,k
e um conjunto invariante por f. Portanto
j
(P
j,k
) = 1, uma
vez que
j
e ergodica. Agora dena
P
j
=
k=j
P
j,k
e P
j
=

P
j

_
k=j
P
k
.
Primeiramente,
j
(

P
j
) = 1 e
k
(

P
j
) = 0 para todo k ,= j. Segue que
j
(P
j
) = 1
e
k
(P
j
) = 0 para todo k ,= j. Alem disso, os P
j
sao disjuntos dois-a-dois.
5.4 Teorema de decomposi cao ergodica
Na sequencia dos resultados da se cao anterior, e natural perguntar se toda
medida invariante e uma combinacao linear de medidas erg odicas. O teorema
que vamos enunciar nesta se cao arma que a resposta e armativa, exceto que
o n umero de parcelas nesta combinacao n ao e necessariamente nito, nem
mesmo enumeravel, em geral.
Teorema 5.16. Seja f : M M uma transforma cao contnua num espa co
compacto. Entao existe um conjunto mensur avel M
0
M, uma parti cao T de
M
0
e uma famlia de probabilidades
P
: P T satisfazendo

P
(P) = 1 para todo elemento P de T;
5.4. TEOREMA DE DECOMPOSIC

AO ERG
ODICA 57
a aplicacao P
P
e mensur avel;
toda
P
e invariante e erg odica para f;
tais que, dada qualquer probabilidade f-invariante , o conjunto M
0
satisfaz
(M
0
) = 1 e, alem disso,
(E) =
_

P
(E) d (P) para todo conjunto mensur avel E M (5.11)
onde e a medida proje cao de em T.
A rela cao (5.11) signica que e uma combina cao convexa das v arias prob-
abilidades erg odicas
P
, em que cada
P
entra com coecienteigual a (P).
Dada qualquer parti cao T de M ca denida a proje cao natural : M T
que associa a cada ponto x M o elemento P(x) da parti cao que o contem.
Isto permite denir o que e um subconjunto mensur avel da parti cao: Q T e
mensuravel se e somente
1
(Q) = uni ao dos P Q
e um subconjunto mensur avel de M.

E f acil ver que esta denicao est a correta:
a famlia dos subconjuntos mensur aveis e uma -algebra em T. A medida
proje cao de esta denida nesta -algebra, por
(Q) = (
1
(Q)).
Corolario 5.17. Uma transforma cao f e unicamente ergodica se e somente se
admite exatamente uma medida invariante erg odica.
Demonstra cao. De acordo com o Corolario ??, se f e unicamente erg odica ent ao
a sua probabilidade invariante e ergodica. Isto prova a parte somente sedo
enunciado. Por outro lado, o Teorema 5.16 mostra que a recproca tambem e
verdadeira: se f admite apenas uma probabilidade invariante erg odica, ent ao
essa e a unica probabilidade invariante.
5.4.1 Prova do teorema de decomposi cao erg odica
Nesta secao vamos deduzir o Teorema 5.16 de um resultado de Teoria da Proba-
bilidade, o teorema de desintegra cao de Rokhlin [Rok66], que tem muitas outras
aplica coes.
Seja Z um espaco metrico compacto, uma probabilidade em Z, e T uma
parti cao de Z em subconjuntos mensur aveis. Seja : Z T a aplica cao
que associa a cada z Z o atomo P T que o contem. Por deni cao, Q e
um subconjunto mensur avel de T se e somente se
1
(Q) e um subconjunto
mensuravel de Z. Seja o iterado de por , ou seja, e a probabilidade em
T denida por (Q) = (
1
(Q)) para cada conjunto mensur avel Q T.
Denicao 5.18. Uma famlia de medidas condicionais de relativamente a T
e uma famlia (
P
)
PP
de probabilidades em Z tais que
58 CAP
1.
P
(P) = 1 para -quase todo P T;
2. dada qualquer fun cao contnua : Z R, a fun cao T P
_
d
P
e
mensuravel e tem-se
_
d =
_ __
d
P
_
d (P).
Lema 5.19. Se (
P
)
PP
e uma famlia de medidas condicionais de relativa-
mente à parti cao T, entao T P
_
d
P
e mensur avel e
_
d =
_ __
d
P
_
d (P),
para toda funcao mensur avel limitada : Z R.
Demonstra cao. Denote por ( a classe de fun coes mensuraveis limitadas que
satisfazem a conclusao do lema. Pela denicao de sistema de medidas condi-
cionais, essa classe contem todas as fun coes contnuas. Alem disso, suponha que
n
: Z R, n N e uma sequencia de fun coes em ( convergindo pontualmente
para alguma fun cao : Z R. Suponha ainda que essa sequencia e uniforme-
mente limitada, isto e, existe K > 0 tal que [
n
(z)[ K para todo z Z e
todo n N. Armamos que a fun cao limite tambem esta em (. Admita, por
um instante, que esta arma cao e verdadeira. AQUI
Em particular, P
P
(E) e mensuravel, e (E) =
_

P
(E) d (P), para
qualquer conjunto mesur avel E Z.
Medidas condicionais, quando existem, s ao unicas em quase todo ponto:
Proposi cao 5.20. Se (
P
)
PP
e (
P
)
PP
s ao dois sistemas de medidas condi-
cionais de com respeito ` a T, entao
P
=
P
para -almost every P T.
Demonstra cao. Suponha o contr ario, isto e, existe um conjunto mensuravel
Q
0
T with (Q
0
) > 0 tal que
P
,=
P
for every P Q
0
. Seja
k
: k N
um conjunto enumer avel e denso de C
0
(Z, R), e dena
A
k
= P Q
0
:
_

k
d
P
,=
_

k
d
P
.
Notando que
k
A
k
= Q
0
, existe C
0
(Z, R) e um subconjunto Q de Q
0
tal
que (Q) > 0 e (trocando os papeis de
P
e
P
, se necessario)
_
d
P
>
_
d
P
para todo P Q. Ent ao
_
Q
__
d
P
_
d (P) >
_
Q
__
d
P
_
d (P). (5.12)
De outro modo, pelo Lema 5.19,
_
(A
1
(Q)
) d =
_ __
(A
1
(Q)
) d
P
_
d (P).
5.4. TEOREMA DE DECOMPOSIC

AO ERG
ODICA 59
Por hip otese
P
(P) = 1 para quase todo P T. Para cada um destes P,
temos que
_
(A
1
(Q)
) d
P
= A
Q
(P)
_
d
P
.
Assim,
_
(A
1
(Q)
) d =
_ _
A
Q
(P)
_
d
P
_
d (P) =
_
Q
__
d
P
_
d (P).
Analogamente, temos
_
(A
1
(Q)
) d =
_
Q
__
d
P
_
d (P).
Essas duas ultimas igualdadades contradizem (5.12). Logo,
P
=
P
para -
quase todo P, como armamos.
Denicao 5.21. T e uma parti cao mesur avel se existem conjuntos mensur aveis
E
1
, E
2
, . . . , E
n
, . . . de Z tais que
T = E
1
, Z E
1
E
2
, Z E
2
E
n
, Z E
n
mod 0.
Em outras palavras, existe um conjunto de medida total F
0
Z tal que, dado
qualquer atomo P de T podemos escrever
P F
0
= E
1
E
2
E
n
F
0
(5.13)
onde E
j
e E
j
ou seu complemento Z E
j
, para todo j 1.
Exemplo 5.22. Toda particao nita ou enumer avel e mesuravel. De fato, T e
mensuravel se e so se existe uma sequencia n ao-decrescente de particoes nitas
ou enumer aveis T
1
T
2
T
n
tais que T =
n=1
T
n
mod 0.
Exemplo 5.23. Seja Z = X Y , onde X e Y espacos metricos compactos, e
T e a parti cao de Z em linhas horizontais X y, y Y . Ent ao T e uma
parti cao mensuravel de Z.
Teorema 5.24 (desintegracao). Se T e parti cao mensur avel ent ao a proba-
bilidade admite alguma famlia de medidas condicionais relativamente a T.
Este resultado ser a provado na Se cao 5.5. De momento vamos usa-lo para
dar a
Demonstra cao do Teorema 5.16. Seja f : Z Z uma transformacao contnua
num espaco metrico compacto Z, e seja B
f
o subconjunto dos pontos z Z
tais que as medias temporais estao bem denidas na orbita de z: dada qualquer
fun cao contnua : Z R, a sequencia
1
n
n1
j=0
(f
j
(z))
converge para algum (z) R quando n . Seja T a parti cao de Z denida
por
60 CAP
1. Z B
f
e um elemento de T e
2. dois pontos z
1
e z
2
de B
f
estao no mesmo elemento de T se e somente
se tem as mesmas medias temporais: (z
1
) = (z
2
) para toda fun cao
continua .
Ent ao T e uma parti cao mensuravel, com respeito a qualquer probabilidade
em Z. Se e f-invariant ent ao (Z B
f
) = 0 e qualquer famlia de medidas
condicionais (
P
)
P
de relativamente a T e tal que
P
e f-invariante e erg odica
para -quase todo P T.
5.5 Teorema de desintegra cao
No intuito de provar o Teorema, podemos trocar o espa co Z por qualquer con-
junto de medida nula. Logo, n ao h a perda de generalidade supor que F
0
em
(5.13) coincide exatamente com Z, e iremos assumir isso no que se segue. Seja
qualquer fun cao mensuravel limitada em Z. Para cada n 1 seja
T
n
= E
1
, Z E
1
E
2
, Z E
2
E
n
, Z E
n
isto e, T
n
e a parti cao de Z cujo os atomos sao os conjuntos E
1
E
n
, with
E
j
= E
j
or E
j
= Z E
j
, para cada 1 j n. Dena

n
: Z R como se
segue. Se o atomo P
n
(z) de T
n
que contem z tem medida (P
n
(z)) positiva,
then
n
(z) =
1
(P
n
(z))
_
Pn(z)
d. (5.14)
Caso contrario,

n
(z) = 0. Claramente, o segundo caso na deni cao de

n
se
aplica somente num conjunto de pontos de medida igual a zero.
Lema 5.25. Dada qualquer fun cao mensur avel limitada : Z R, existe um
subconjunto de medida total F = F() de Z tal que

n
(z), n 1, converge
para algum n umero real

(z), para todo z F.
Demonstra cao. Observe que sempre podemos escrever =
+
, onde
sao measur aveis, limitadas e n ao-negativas: por exemplo,
= ([[ )/2.
Ent ao

n
=

+
n

n
para n 1, e entao a conclusao e verdadeira para se
ela vale para
+
e
. Isto mostra que nao h a restri cao em assumir que e

n ao-negativa. Iremos assumir isso de agora em diante.
Para todo < , seja S(, ) o conjunto dos pontos z Z tais que
liminf

n
(z) < < < limsup

n
(z).
E claro que dado z Z, a sequencia

n
(z) diverge se, e so se, z S(, ) para
algum para de n umeros racionais e . Logo, o lema segue-se se mostrarmos
que S = S(, ) tem medida igual a zero para todo e .
Para cada z S, xe uma sequencia de inteiros 1 a
z
1
< b
z
1
< < a
z
i
<
b
z
i
< tais que
a
z
i
(z) < and

b
z
i
(z) > for every i 1.
5.5. TEOREMA DE DESINTEGRAC

AO 61
Dena A
i
como sendo a uni ao dos elementos P
a
z
i
(z), e B
i
como a uni ao dos ele-
mentos P
b
z
i
(z) obtidos deste modo, para todos os pontos z S. Por constru cao,
S A
i+1
B
i
A
i
para todo i 1.
Em particular, S esta contido no conjunto
S =
i=1
B
i
=
i=1
A
i
.
Dados dois entre os conjuntos P
a
z
i
(z) que formam A
i
, ou eles sao disjuntos ou
coincidem. isto porque T
n
, n 1, e uma sequencia n ao-decrescente de particoes.
Consequentemente, A
i
pode ser escrito como uma uniao de conjuntos P
a
z
i
(z)
dois-a-dois disjuntos. Assim,
_
Ai
d =
P
a
z
i
(z)
_
P
a
z
i
d <
P
a
z
i
(z)
(P
a
z
i
) = (A
i
),
para qualquer i 1 (as somas sao sobre uni oes disjuntas). Analogamente,
_
Bi
d =
P
b
z
i
(z)
_
P
b
z
i
d >
P
b
z
i
(z)
(P
b
z
i
) = (B
i
).
Desde que A
i
B
i
e observando que estamos assumindo que 0, segue-se
que
(A
i
) >
_
Ai
d
_
Bi
d > (B
i
),
para todo i 1. Tomando o limite quando i , temos que
(
S) (
S).
Isto implica que (
S) = 0, e logo S

S tambem e um conjunto com medida
igual a zero.
Dada qualquer fun cao limitada mensur avel : Z R, iremos represen-
tar por e
n
(), e(), respectivamente, as funcoes

n
,

denidas por(5.14) e o
Lema 5.25.
Seja
k
: k N algum conjunto enumer avel e denso de C
0
(Z, R), e seja
F
k=1
F(
k
),
where F(
k
) como dado pelo Lema 5.25.
Lema 5.26. Dada qualquer fun cao contnua : Z R, a seuquencia e
n
()(z)
converge para e()(z) quando n , para todo z F
.
62 CAP
Demonstra c ao. Fixe z F
.

E claro que e
n
()(z) e um funcional linear
limitado em C
0
(Z, R), com norma 1, e o mesmo e verdade para e()(z).
Para todo > 0, escolha k tal que |
k
|
0
< /3. Ent ao, se n e grande o
suciente,
[e
n
()(z) e()(z)[
[e
n
()(z) e
n
(
k
)(z)[ +[e
n
(
k
)(z) e(
k
)(z)[ +[e(
k
)(z) e()(z)[
2|
k
|
0
+/3 < .
isto mostra a armacao.
Seja : Z R contnua. Por constru cao, e
n
() e constante em cada
P
n
T
n
, e logo e constante tambem em cada atomo P de T, para todo n 1.
Assim, e() e constante em P F
para cada P T. Seja e

n
()(P
n
) o valor
de e
n
() em cada P
n
T
n
. Similarmente, e()(P) representa o valor de e()
on P F
desde que o ultimo conjunto seja nao-vazio. Ent ao, desde que (5.14)
dene e
n
() em um subconjunto de medida total de Z,
_
d =
(Pn)>0
_
Pn
d =
(Pn)>0
(P
n
) e
n
()(P
n
) =
_
e
n
() d.
Observe tambem que [e
n
()[ sup [[ < para cada n 1. Assim, n os
podemos usar o Teorema da Convergencia Dominada para concluir que
_
d =
_
e() d. (5.15)
Agora, estamos em condicoes de construir um sistema de medidas condi-
cionais para . Seja P qualquer atomo de T tal que P F
e nao-vazio.

E f acil
de ver que
C
0
(Z, R) e()(P) R
e um funcional n ao-negativo de C
0
(Z, R). Do fato que e
n
(1)(P) = 1 e do
Teorema de Riez-Markov, existe uma unica medida de probabilidade
P
em Z
tal que
_
d
P
= e()(P). (5.16)
Devemos denir
P
mesmo quando P n ao intersecta F
. neste caso tomaremos
P
como qualquer probabilidade em Z: desde que o conjunto de todos esses
atomos P tem medida igual a zero em T (em outras palavras, sua uni ao tem
medida igual a zero em Z), a escolha nao e relevante. De acordo com essas
deni coes, (5.15) pode ser reescrito como
_
d =
_ __
d
P
_
d (P),
o fato que T P
_
d
P
e uma fun cao mensuravel e uma consequencia di-
reta de (5.16). Assim, para concluir que (
P
)
PP
forma um sistema de medidas
condicionais de com respeito a T resta-nos provar que
5.5. TEOREMA DE DESINTEGRAC

AO 63
Lema 5.27.
P
(P) = 1 para -quase todo P T.
Usaremos o seguinte resultado auxiliar:
Lema 5.28. dada uma fun cao mensur avel limitada : Z R existe um
conjunto de medida total T() T tal que o conjunto P F
e nao vazio
entao
_
d
P
= e()(P), para qualquer P T().
Demonstra c ao. A classe das funcoes que satisfazem o lema contem o conjunto
das fun coes contnuas e e fechado por convergencia pontual dominada.Assim,
contem todas as fun coes mensuraveis limitadas.
Podemos provar o Lema 5.27:
Demonstra cao. Dena T
=
k,P
k
T(A
P
k
), onde a interseccao e tomada sobre o
conjunto de todos os atomos P
k
T
k
, e todo k 1. Desde que esse conjunto e
enumer avel, T
tem medida total. Armamos que a conclusao do lema vale

para todo P T
. De fato, seja k 1 e P
k
elemento T
k
que contem P. Pela
deni cao de T
P
(P
k
) =
_
A
P
k
d
P
= e(A
P
k
)(P). (5.17)
Para cada n 1, seja P
n
o atomo de T
n
que contem P. Dado qualquer z
P F
,
e
n
(A
P
k
)(z) =
1
(P
n
)
_
Pn
A
P
k
d.
Agora, para cada n k temos que P
n
P
k
, e entao o ultimo termo e igual a 1.
Assim,
e(A
P
k
)(P) = e(A
P
k
)(z) = lim
n
e
n
(A
P
k
)(z) = 1.
Substituindo isso em (5.17) obtemos que
P
(P
k
) = 1 para todo k 1. Final-
mente,
P
(P) = lim
k
P
(P
k
) = 1
pois P
k
, k 1, e uma sequencia decrescente cuja interseccao e P.
A prova do Teorema 5.24 esta completa.
Exemplo 5.29. Seja Z o toro bi-dimensional, um n umero irracional, e T a
parti cao de Z em linhas retas de inclina cao . Ent ao T n ao e uma parti cao . Um
modo de ver isso e observar que a medida de Haar (Lebesgue) em Z n ao admite
sistema de medidas condicionais com respeito à T. De fato, pela unicidade
da desintegra cao, quase toda medida condicional teria que ser invariante por
transla coes ao longo das linhas retas, e e claro que estas translacoes nao tem
probabilidades invariantes.
64 CAP
5.6 Exerccios
5.1. Considere o espaco M = 1, 2, . . . , d
Z
das sequencias com valores num
conjunto 1, 2, . . . , d. Fixe qualquer n umero (0, 1). Para cada = (
n
)
nZ
e = (
n
)
nZ
em M, dena
N(, ) = max
_
N 0 :
n
=
n
para todo n Z com [n[ < N
_
e d(, ) =
N(, )
. Verique que d e uma metrica em M e gera a mesma
topologia que a famlia dos cilindros. Em particular, (M, d) e um espaco metrico
compacto. Tem-se um resultado analogo para M = 1, 2, . . . , d
N
.
5.2. Suponha que R
e uma rota cao irracional.

1. Mostre que a orbita R
n
(z) : n Z de todo z S
1
e densa em S
1
.
2. Seja A um conjunto invariante com medida positiva. Mostre que nenhum
ponto de S
1
e ponto de densidade de A
c
. Conclua que (A) = 1.
Dica: considere um ponto de densidade de A e use o item (1).
5.3. A rota cao R
e racional se e somente se e
i
e uma raiz da unidade, isto e,
se existe k ,= 0 tal que e
ki
= 1.
5.4. Se R
e rota cao racional entao R
n ao e ergodica para a medida de

Lebesgue.
No exerccio a seguir propomos outra demonstracao para a proposi cao 5.5:
5.5. Suponha que R

1. Mostre que a orbita R
n
(z) : n Z de todo z S
1
e densa em S
1
.
2. Seja A um conjunto invariante com medida positiva. Mostre que nenhum
ponto de S
1
e ponto de densidade de A
c
. Conclua que (A) = 1.
Dica: considere um ponto de densidade de A e use o item (1).
5.6. Suponha que R

1. Seja : S
1
R uma fun cao contnua qualquer. Mostre que
(x) = lim
n
1
n
n1
j=0
(R
j
(z))
existe em todo ponto e, de fato, o limite e uniforme. Justique que e
constante em todo ponto.
Dica: Verique que a sequencia do lado direito e equicontnua e use o
teorema de Ascoli-Arzela.
2. Deduza que R
tem uma unica probabilidade invariante.

5.6. EXERC
ICIOS 65
5.7. Seja f : M M uma maquina de somar, denida na sec cao 5.1.5.
1. Seja : M R uma fun cao contnua qualquer. Mostre que
(x) = lim
n
1
n
n1
j=0
(f
j
(z))
existe em todo ponto e o limite e uniforme.
2. Justique que e constante em todo ponto e deduza que f tem uma unica
probabilidade invariante.
3. Calcule essa probabilidade, encontrando uma express ao explcita para a
medida de qualquer subconjunto [b
0
, b
1
, . . . , b
k
] das sequencias com
0
=
b
0
,
1
= b
1
, . . . ,
k
= b
k
.
5.8 (Teorema de Kac). Seja uma medida erg odica para uma transforma cao
f : M M e A um conjunto com (A) > 0. Considere n
A
: A N +
como o menor n umero n
A
(x) > 0 tal que f
nA(x)
(x) A. Caso este n umero n ao
exista, denimos n
A
(x) = +.
1. Mostre que n
A
e integr avel com respeito a .
2. Mostre que se
A
(B) =
(AB)
(A)
ent ao:
_
A
n
A
(x) d
A
(x) =
1
(A)
.
5.9. Seja f : M M denida no espaco topologico M tal que existe alguma
medida erg odica tal que para todo A aberto, (A) > 0. Mostre que f e
transitiva e a orbita de -quase todo ponto e densa.
66 CAP
Captulo 6
Sistemas Misturadores
Neste captulo estudaremos mais uma propriedade das transforma coes que preser-
vam medida, a saber, a propriedade de misturar conjuntos. Introduziremos os
deslocamentos de Markov, que generalizam os deslocamentos de Bernoulli, in-
troduzidos no Captulo ??. Estudaremos sob que condicoes estas transformacoes
sao erg odicas ou misturadoras.
6.1 Deni coes e exemplos
Comecaremos este captulo, mostrando uma proposi cao que estabelece uma
condi cao equivalente ` a condi cao de ergodicidade de uma medida:
Proposi cao 6.1. Seja f : M M uma transforma cao que preserva uma
medida . S ao equivalentes:
1. e erg odica
2. Para quaisquer par de conjuntos mensur aveis A, B entao
lim
n
1
n
n1
i=0
(f
i
(A) B) = (A)(B). (6.1)
Demonstra cao. Primeiramente, se vale a igualdade como no item 2 acima, dado
um conjunto invariante A qualquer, temos que
(A) = lim
n
1
n
n1
i=0
(f
i
(A) A) = (A)
2
.
Logo, (A) = 0 ou 1, donde e ergodica.
Por outro lado, se e ergodica temos, pelo teorema de Birkho aplicado a
fun cao =
A
, que a sequencia de fun coes
n
(x) =
1
n
n1
i=0
(f
i
(x)
67
68 CAP
ITULO 6. SISTEMAS MISTURADORES

converge em quase todo x para o valor constante (A). Assim, tomando
=
B
pelo teorema da convergencia dominada:
lim
n
1
n
n1
i=0
(f
i
(A) B) = lim
n
_

n
d =
_
(A) d = (A)(B),
e isto encerra a prova da Proposi cao.
Observa cao 6.2. Podemos extrair um pouco mais da proposicao anterior.
Mesmo que seja somente invariante, podemos mostrar utilizando o Teorema de
Birkho e a prova da Proposi cao 6.1 que a sequencia lim
n
1
n
n1
i=0
(f
i
(A) B)
converge para quaisquer borelianos A e B. A adapta cao e canonica e ca a
cargo do leitor.
Denicao 6.3. Seja f uma transformacao f : M M preservando uma me-
dida . Dizemos que o sistema (f, ) e misturador, se dados quaisquer conjuntos
mensuraveis A, B M ent ao:
lim
n
(f
n
(A) B) = (A)(B). (6.2)
Em muitos casos, especialmente nos que consideramos f xada e onde n ao
houver perigo de confus ao, diremos simplesmente que a medida e misturadora,
sem mencionar a transformacao f.

E imediato a partir da Proposi cao 6.1 que
toda medida erg odica e misturadora. Em geral, o contr ario n ao vale como
veremos agora:
Exemplo 6.4. A rota cao R
de angulo irracional do crculo unit ario S

1
preservando a medida de Lebesgue m. Observe que como e irracional, a
propriedade de ergodicidade se verica para este sistema, como ja vimos no
exemplo ??. Porem a medida de Lebesgue nao e misturadora. Para provar
isto, observe que dados dois intervalos A, B S
1
sucientemente pequenos,
para innitos valores de n temos que f
n
(A) n ao interssecta B. Em particular,
m(f
n
(A) B) = 0 e o limite em (6.2) n ao se verica, j a que m(A)m(B) > 0.
Em geral, quando desejamos mostrar que uma medida e misturadora, pre-
cisamos vericar a condi cao 6.2 para todos pares de conjuntos mensur aveis A, B.
Para nosso auxlio nesta tarefa, na proposi cao a seguir mostraremos que basta
fazer tal vericacao para uma classe especial de subconjuntos gerando a -
algebra:
Proposi cao 6.5. Sejam (M, , /) um espa co de medida, f : M M uma
transforma cao preservando a medida e B uma semi- algebra que gera /. Se
para todos A, B B vale
lim
n
(f
n
(A) B) = (A)(B),
entao e misturadora.
6.2. DESLOCAMENTOS DE MARKOV 69
Exemplo 6.6. Todo deslocamento de Bernoulli e uma transformacao mistu-
radora. De fato, para provar isso considere o deslocamento denido no espaco
das sequencias de k smbolos 1, 2, . . . , k
N
e seja uma medida de Bernoulli
associada ao vetor de probabilidades p = (p
1
, . . . , p
k
). Precisamos mostrar que
a condi cao 6.2 vale para todo par A, B de conjuntos mensuraveis. Utilizando a
Proposi cao ??, basta mostrar que esta condicao vale no caso particular em que
A e B sao cilindros. De fato, se A = [m; a
m
, . . . , a
n
] e B = [r; b
r
, . . . , b
s
] sao
cilindros ent ao, para l sucientemente grande as restricoes nas coordenadas de
l
(A) sao independentes das restricoes nas coordenadas de B, de onde segue-se
que (
l
(A) B) = (A)(B). Deste modo, os deslocamentos de Bernoulli
sao transforma coes misturadoras.
Em termos de Teoria das Probabilidades, dizer que (
l
(A)B) = (A)(B),
signica dizer que os eventos
l
(A) e B sao independentes, ou seja, a ocorrencia
de B no presente nao inui na possibilidade de ocorrencia de A ap os l unidades
de tempo passadas.
6.2 Deslocamentos de Markov
Os deslocamentos de Markov sao uma classe de transformacoes preservando
medida que surgem naturalmente na Teoria das Probabilidades e em algumas
aplica coes dos Sistemas Dinamicos. Elas podem ser vistas como uma gener-
alizacao do conceito de deslocamento de Bernoulli com k smbolos, onde os
lan camentos n ao sao mais independentes. Alem da perda de independencia,
uma diferen ca entre os deslocamentos de Bernoulli e os de Markov e que, em
geral, o domnio dos deslocamentos de Markov serao subconjuntos pr oprios de
+
k
.
Para denirmos um deslocamento de Markov com k smbolos, antes de mais
nada, e necessario xar uma matriz A = (a
ij
) de tamanho k k e com entradas
iguais a 0 ou 1, chamada matriz de transi cao. A partir desta matriz, podemos
construir um subconjunto
+
A
de
+
k
das sequencias admissveis do seguinte
modo:
+
A
= (x
1
, x
2
, . . . )
+
k
; a
xixi+1
= 1.
Note que se x = (x
1
, x
2
. . . ) pertence à
+
A
ent ao (x) tambem pertence à
+
A
. Chamaremos de deslocamento de Markov associado à matriz de transi cao
A a restri cao de ao conjunto
+
A
.
Esta transforma cao admite uma classe especial de medidas, chamadas me-
didas de Markov. Para construir uma destas medidas, consideraremos uma
matriz P = (p
ij
) e um vetor p = (p
1
, . . . , p
k
) com todas as coordenadas p
i
> 0,
satisfazendo as seguintes propriedades:
0 p
ij
1
j=1
p
ij
= 1.
70 CAP

pP = p, ou seja:
k
i=1
p
i
p
ij
= p
j
, para todo j = 1, . . . , k.
Esta matriz e chamada matriz estoc astica e determina a probabilidade da transi cao
do sistema do estado i para o estado j. Analogamente, podemos interpretar a
entrada P
(n)
ij
da matriz P
n
, como sendo a chance de transicao do estado i para
o estado j em n passos. Com estes elementos em maos, denimos a medida de
Markov no cilindro [m; b
m
, . . . , b
n
] como:
([m; b
m
, . . . , b
n
]) = p
bm
p
bmbm+1
. . . p
bn1bn
(6.3)
e estendemos a denicao de para a algebra das uni oes disjuntas A = A
1

A
l
de cilindros por
(A) = (A
1
) + +(A
l
).
Pelo Teorema 0.9, segue-se que pode ser estendida para toda -algebra. Para
mostrar a invari ancia de com respeito à , basta provar que (
1
(C)) =
(C), onde C e um cilindro. Ora, isso segue diretamente da express ao de (C)
acima, uma vez que a medida ([m; b
m
, . . . , b
n
]) n ao depende do ndice m.
Observe que, ao contr ario dos deslocamentos de Bernoulli, se A e B sao
cilindros disjuntos entao (A B) n ao e necessariamente (A)(B). Para ver
isto, basta por exemplo considerar o cilindro A = [1; i] e o cilindro B = [2; j].
Claramente, (A B) = ([1; i, j]) = p
i
p
ij
que n ao e necessariamente igual ` a
(A)(B) = p
i
p
j
. Apesar disto, ainda podemos calcular, atraves de um fator
corretivo, a medida de A B:
Lema 6.7. Sejam A = [m;
m
, . . . ,
n
] e B = [r;
r
, . . . ,
s
] cilindros com
r > n. Entao:
(A B) = (A)(B)
P
(rn)
nr
p
r
.
Demonstra c ao. Podemos escrever A B como a uni ao disjunta
A B =
_
xF
[m;
m
. . . ,
n1
, x(n), . . . , x(r),
r+1
, . . . , b
s
],
onde x varia no conjunto T das fun coes w : n, . . . , r 1, . . . , k tais que
w(n) =
n
e w(r) =
r
. Deste modo, temos que:
(A B) = (A)(B)
xF
p
nx(n+1)
. . . p
xr1r
p
r
.
o que conclui a demonstracao do nosso lema, uma vez que
P
(rn)
nr
=
xF
p
nx(n+1)
. . . p
xr1r
.
Iremos agora estudar condicoes que a matriz estocastica P deve satisfazer
para que uma medida de Markov seja erg odica ou misturadora.
Denicao 6.8. Uma matriz estocastica P se diz irredutvel se dados i, j
1, . . . , k ent ao existe n N tal que P
(n)
ij
> 0.
Podemos interpretar a irredutibilidade de uma matriz estoc astica P do seguinte
modo: dizer que uma matriz P e irredutvel equivale a dizer que sempre e
possvel a partir de um estado i do sistema, chegar a um estado j com um
certo n umero n (que depende de i e j) de passos. Como veremos, a condicao de
irredutibilidade e necessaria e suciente para que uma medida de Markov seja
erg odica. Um primeiro passo nessa dire cao e o seguinte lema:
Lema 6.9. Seja P uma matriz estoc astica irredutvel. Ent ao, dados i e j temos
que:
1
n
n1
l=0
P
(l)
ij
= p
j
.
Demonstra cao. Primeiramente, provaremos que
1
n
n1
l=0
P
l
converge. De fato,
observe que se A = [1; j] e B = [0; i] ent ao, pelo Lema 6.7:
1
n
n1
l=0
(
l
(A) B) =
1
p
j
(A)(B)
1
n
n1
l=0
P
(l)
ij
.
Assim, para mostrar a convergencia de
1
n
n1
l=0
P
l
, e suciente observar que a
sequencia
1
n
n1
l=0
(
l
(A) B) converge, de acordo com a observa cao 6.2.
Se v e o vetor v = (1, 1, . . . , 1), as igualdades
k
j=1
p
ij
= 1, para i = 1, 2, . . . , k
na deni cao de matriz estocastica podem ser escritas como Pv = v. Deste
modo, e simples vericar que Qv = v, ou em outros termos, se Q = (q
ij
), ent ao
k
j=1
q
ij
= 1, para i = 1, 2, . . . , k. De modo an alogo, como pP = p, temos que
pQ = p, ou
k
i=1
p
i
q
ij
= p
j
, para todo j = 1, . . . , k.
Alem disso, uma facil verica cao a partir da deni cao de Q mostra que P
n
Q =
Q, para todo n N. Utilizaremos estas propriedades para concluir que q
ij
n ao
depende de i.
De fato, assuma por absurdo que existem r tal que q
rj
< q
sj
, onde s e
escolhido de modo que q
sj
= sup
i
q
ij
. Como P e irredutvel, temos que existe n
72 CAP

tal que P
(n)
sr
> 0. Assim,
q
sj
=
k
i=1
P
(n)
si
q
ij
< (
k
i=1
P
(n)
si
)q
sj
= q
sj
,
o que e uma contradi cao. Logo, q
ij
n ao depende de i. Seja q
j
= q
ij
este valor
comum. Como pQ = p, temos que:
p
j
=
k
i=1
p
i
q
ij
= (
k
i=1
p
i
)q
j
= q
j
,
terminando a prova do Lema.
Uma observa cao simples e que a condi cao do lema anterior e equivalente a
irredutibilidade de P. De fato, se caso contr ario existiriam i, j tais que P
(l)
ij
= 0
para todo l N, onde
1
n
n1
l=0
P
(l)
ij
= 0.
O teorema a seguir mostra que a irredutibilidade e uma condi cao necess aria
e suciente para que uma medida de Markov seja erg odica:
Teorema 6.10. Seja uma medida de Markov relativa a uma matriz estoc astica
P. Entao e erg odica se, e s o se, P e irredutvel.
Demonstra cao. Primeiramente, vamos assumir que e ergodica e mostraremos
que P e irredutvel. De fato, tendo em vista a Proposicao 6.1, como e ergodica,
se considerarmos os cilindros de comprimento 1, A = [1; j] e B = [0; i], temos
que:
lim
n
1
n
n1
l=0
(
l
(A) B) = (A)(B) = p
i
p
j
. (6.4)
Por outro lado, de acordo com o Lema 6.7 temos que
(
l
(A) B) = ([0; i] [l; j]) = p
i
P
(l)
ij
Substituindo na equa cao 6.4 e cancelando p
i
em ambos os lados,
1
n
n1
l=0
P
(l)
ij
= p
j
.
Em particular, existe n tal que P
(n)
ij
> 0.
Agora, mostraremos que se P e irredutvel, ent ao e ergodica. Apelando
para o Lema 6.9, podemos assumir que lim
n
1
n
n1
l=0
P
(l)
ij
= p
j
.
Utilizando a Proposi cao 6.1, para mostrar que e ergodica, basta mostrar
que para todos A, B mensuraveis vale:
1
n
n1
l=0
(
l
(A) B) = (A)(B).
Mostraremos isto em dois passos: inicialmente, veremos que basta mostrar no
caso em que A e B sao uni oes disjuntas de cilindros. A seguir, mostraremos
essa propriedade para uni oes disjuntas de cilindros. De fato, assumindo que
a equa cao 6.1 vale para uni oes disjuntas de cilindros, dados A e B borelianos
quaisquer e > 0, escolha A
0
e B
0
uni oes disjuntas de cilindros de modo que
(AA
0
) e (BB
0
) . Assim,
1
n
n1
l=0
|(
l
(A)B)(A)(B)|
1
n
n1
l=0
|(
l
(A)B)(
l
(A
0
)B
0
)|+
+
1
n
n1
l=0
|(
l
(A
0
) B
0
) (A
0
)(B
0
)| +
1
n
n1
l=0
|(A
0
)(B
0
) (A)(B)|.
Fazendo arbitrariamente pequeno e n arbitrariamente grande, temos que os
termos acima sao arbitrariamente pequenos, mostrando nossa armacao.
Resta-nos mostrar que a equacao 6.1 vale para uni oes de cilindros disjuntos.
Deixaremos para o leitor a vericacao de que basta mostrar que essa equacao
vale para cilindros. Vericaremos para o caso em que A = [m; a
m
, . . . , a
n
] e
B = [r; b
r
, . . . , b
s
] sao cilindros com m > r. Assim:
(
l
(A) B) =
1
p
am
(A)(B)P
(m+lr)
bram
.
Logo, segue diretamente que
1
n
n1
l=0
(
l
(A) B) =
1
p
am
(A)(B)
1
n
n1
l=0
P
(m+lr)
bram
.
Como
1
n
n1
l=0
P
(l)
ij
= p
j
,
acabamos a prova do teorema.
A seguir, mostraremos que uma condi cao necess aria e suciente para que
uma medida de Markov seja misturadora e que exista algum n umero n N tal
que P
n
ij
> 0 para todos i e j. Ou seja, mostraremos o seguinte teorema:
Teorema 6.11. Sao equivalentes:
1. e misturadora
2. lim
n
P
(n)
ij
= p
j
3. Existe n N tal que P
(n)
ij
> 0 para todos i e j.
74 CAP

Demonstra cao. 1 implica 2: Assim como no Teorema 6.10, se considerarmos
os cilindros de comprimento 1 A = [1; j] e B = [0; i], como e misturadora,
temos que:
lim
l
(
l
(A) B) = (A)(B) = p
i
p
j
.
Por outro lado,
lim
l
(
l
(A) B) = ([0; i] [l; j]) = p
i
P
(l)
ij
.
Cancelando o termo p
i
nas equacoes acima, obtemos o item 2.
2 implica 3: Trivial.
3 implica 1: Essa e a parte mais difcil de nosso teorema. Para mostrar que
e misturadora, utilizando o Proposi cao 6.5, basta mostrar que a equa cao ??
vale para cilindros. De fato, como j a vimos, se A = [m; a
m
, . . . , a
n
] e B =
[r; b
r
, . . . , b
s
] sao cilindros com m > r, ent ao:
(
l
(A) B) =
1
p
am
(A)(B)P
(m+lr)
bram
.
Logo, e suciente mostrar que
lim
n
P
(n)
ij
= p
j
.
De fato, assuma por um instante que a sequencia de matrizes P
(n)
converge
para uma matriz Q. Em particular,
lim
n
1
n
n1
i=0
P
(i)
= Q.
Assim, de acordo com o Lema 6.9, Q = (q
ij
) n ao depende de i e q
ij
= p
j
. Neste
ponto, recorreremos a o seguinte teorema (para uma prova do teorema, veja ??):
Teorema 6.12 (Perron-Fr obenius). Seja A uma matriz kk tal que alguma
de suas potencias tem todas as entradas maiores que zero. Ent ao:
1. Existe algum auto-valor de A tal que > ||, para todo auto-valor
de A
2. O auto-espa co associado a tem dimens ao 1.
A partir do Teorema de Perr on, vamos mostrar agora que P
(n)
de fato con-
verge, quando n . Primeiramente, mostraremos que o auto-valor dom-
inante de P obtido pelo Teorema de Perr on e, de fato, igual a um. Para
mostrar isso, utilizaremos a adjunta P
de P e o fato que os auto-valores de

P e de sua adjunta coincidem. Assim, podemos escolher v = (v
1
, . . . , v
k
) um
auto-vetor com v
i
> 0 associado ao auto-valor maximal para a adjunta P
,
tal que
k
i=1
v
i
= 1, obtido como no Teorema de Perr on. Logo:
P
v = v
k
i=1
P
ji
v
i
= v
j
,
6.3. EXERC
ICIOS 75
Somando com respeito à j e observando que
k
j=1
P
ji
= 1,
1 =
k
i=1
v
i
=
k
i=1
(
k
j=1
P
ji
)v
i
=
k
j=1
v
j
= .
Para concluir a demonstra cao, denote por V o subespaco de R
k
denido por
W
2
= (x
1
, . . . , x
k
);
k
i=1
= 0. Observe que P deixa invariante W
2
, ou seja,
PW
2
= W
2
e que o auto-espaco W
1
associado ao auto-valor 1 de P intersecta W
2
somente na origem, uma vez que pelo Teorema de Perron, W
1
e unidimensional
e tem algum vetor com todas as coordenadas positivas. Logo, pelo item 1 do
Teorema de Perr on, o m odulo de todos os auto-valores de P[W
2
sao menores
que um, de onde obtemos que lim
n
|P
(n)
[W
2
| = 0. Finalmente, dado um vetor
x R
k
, podemos escreve-lo como x = x
1
+ x
2
, com x
1
W
1
e x
2
W
2
. Isto
implica automaticamente que limP
(n)
x = x
1
, concluindo a prova da arma cao
de que a sequencia P
n
era convergente.
6.3 Exerccios
76 CAP

Captulo 7
Entropia Metrica
Este captulo e dedicado ao estudo da entropia de uma medida invariante,
um conceito que contem diversas informa coes ergodicas do sistema dinamico.
Por exemplo, podemos ve-lo como um n umero que mede qu ao desordenada a
din amica de uma transformacao que preserva uma medida pode ser. Outro as-
pecto interessante refere-se a distinguir duas transformacoes que preservam me-
dida do ponto de vista de sua estrutura erg odica: se as suas entropias diferem,
as transformacoes sao denitivamente diferentes do ponto de vista erg odico.
Finalmente, veremos a rela cao entre esse invariante metrico e um invariante
topol ogico para o sistema dinamico: a entropia topol ogica.
7.1 Entropia de uma parti cao
A deni cao intuitiva de entropia topol ogica, h
top
(f), e de entropia de uma me-
dida invariante, h
(f), e motivada pela necessidade de medir o crescimento

de possibilidades para um certo evento. Vamos tentar tornar isso mais claro,
considerando um exemplo muito familiar: o shift nito com 2 smbolos
+
.
Por exemplo, podemos pensar nessa transforma cao modelando o lan camento
de uma moeda viciada (0 para cara e 1 para coroa). Ao jogar uma moeda n
vezes, o n umero de sequencias diferentes de cara ou coroa que podemos obter
cresce exponencialmente, a uma taxa exponencial h
top
(f) = log 2. Por outro
lado, se nossa moeda viciada atribui probabilidade p para cara e probabilidade
(1 p) para coroa e razo avel, pelo teorema de Birkho, que a media de caras
que aparecem em n lan camentos seja pn. Ou seja, se n e grande, a medida das
sequencias tpicas com pn caras e muito proxima de 1. Adiantamos que neste
caso a entropia da medida de Bernoulli que atribui probabilidade p ao evento
cara e probabilidade (1 p) para coroa e h
(f) = (p log p +(1 p) log(1 p)).

Um motivo intuitivo para esta deni cao e o que se segue: a medida de uma
sequencia tpica e exatamente igual a
p
pn
(1 p)
(1p)n
= e
(p log p+(1p) log(1p))n
= e
h(f)n
.
77
78 CAP
ITULO 7. ENTROPIA M
ETRICA
Assim, o n umero de sequencias tpicas diferentes (que realmente s ao as que
importam no sentido de medida) e exponencial da ordem e
h(f)n
.
Vamos agora tornar um pouco mais rigorosos os conceitos intuitivos que
denimos anteriormente, comecando pela deni cao de entropia metrica. Exis-
tem varias deni coes possveis de entropia metrica e um consenso: sob hip oteses
razoaveis elas coincidem. Nos concentraremos na deni cao de Kolmogorov, via
entropia de parti coes:
Denicao 7.1. Seja f : X X uma transformacao que preserva a probabili-
dade . Dada uma parti cao Q enumer avel de X, a entropia da parti cao Q com
respeito à e o n umero,
H
(Q) =
QQ
(Q) log (Q),
onde se convenciona que 0 log 0 = 0.
Uma vez xado o n umero de elementos, para obtermos uma parti cao com
entropia maior possvel, temos que tentar escolher seus elementos de modo que
suas medida com respeito à seja o mais igualpossvel (veja o Exerccio 7.1.)
Em outros termos, se o n umero de elementos das parti coes e xado, ent ao a
parti cao que tem maior entropia possvel e aquela em que a medida de seus
elementos e melhor distribuida.
Isso nos motiva a ilustrar a deni cao de entropia com o seguinte exemplo:
foi acertado um classico entre os principais times de um estado (para dar nomes,
digamos CSA x CRB). O tecnico do CSA tem no seu plantel cerca de 22 jo-
gadores, podendo organizar seu time de 28.158.588.057.600 modos diferentes.
Denotaremos o conjunto dessas conguracoes por X e a cada congura cao x
do time do CSA associaremos um ndice tecnico t(x) e um ndice fsico f(x),
que sao obtidos de acordo com algum padr ao de medicao xado (por exemplo,
atribudo pelo comentarista do jogo, Gavi ao Boemio, tomando valores inteiros
de 0 a 10). Classicaremos uma conguracao x do time de acordo com sua
qualidade tecnica como otima, se t(x) 9, boa, se 7 t(x) < 9, regular, se
6 t(x) < 7 e ruim, se t(x) 6. Isso gera uma parti cao T do espaco das
congura coes X em quatro subconjuntos,
T = T
1
, T
2
, T
3
, T
4
.
Como o time referido e o CSA, a medida do conjunto das congura coes otimas
e quase igual a 1. Assim, a entropia e muito pequena, pois (T
i
) log (T
i
) e
muito pr oxima de 0 para cada i. Aqui n os estamos pensando em como sendo
a medida da contagem, denida por
(A) =
#A
#X
.
Por outro lado, se tivessemos considerado o CRB, as medidas dos conjuntos
T
1
, T
2
, T
3
e T
4
seriam quase iguais a
1
4
e a entropia seria bem proxima de log 4.
7.1. ENTROPIA DE UMA PARTIC

AO 79
Logo, se houvesse um aposta na loteria consistindo em adivinhar a condi cao
tecnica do time do CSA no dia do confronto (assuma que o treinador faltou e que
os times estao sendo escolhidos por meio de um sorteio, para tornar o processo
aleat orio) essa aposta devera pagar muito menos que a aposta consistindo em
adivinhar a condi cao tecnica do time do CRB. Assim, a entropia pode ser vista
como uma certa medida da diculdade em se ganhar essa aposta.
Vamos agora calcular a entropia de algumas particoes que ja estudamos:
Exemplo 7.2. Seja f dada por
f : [0, 1] [0, 1], f(x) = 10x [10x].
Se T e a parti cao por intervalos P
k
= (
k
10
,
k+1
10
] com k = 0, . . . , 9, ent ao a
entropia da parti cao T com respeito à medida de Lebesgue m de [0, 1] e dada
por H
m
(T) =
9
i=0
1
10
log
1
10
= log 10.
Exemplo 7.3. Consideremos o deslocamento unilateral comd smbolos 1, . . . , d
e a parti cao T
l
formada pelos cilindros de comprimento n, ou seja, T
l
e for-
mada pelos conjuntos C = [0, l; a
0
, . . . , a
l
] = (x
0
, . . . , x
n
, . . . )
+
; a
i
=
x
i
para i = 0, . . . , l 1. A entropia de T
l
com respeito à medida de Bernoulli
m relativa ao vetor de probabilidades p = (p
1
, . . . , p
d
) e dada por H
m
(T
l
) =
l
d
i=1
p
i
log p
i
(veja exerccio 7.3.)
Porem, nem sempre a entropia de uma parti cao e nita. Realmente, vamos
dar agora um exemplo de uma parti cao com entropia innita. Para tanto,
usaremos os fatos de que a serie

n1
1
n(log n)
2
e convergente com soma igual a
um certo n umero c > 0, enquanto que a serie

n1
c
nlog n
e divergente.
Exemplo 7.4. Considere a transforma cao f(x) = 10x [10x] acima. Clara-
mente a medida de Lebesgue e invariante para f. Para construir a parti cao, de-
componha o intervalo [0, 1] em subintervalos A
n
de modo que m(A
n
) =
1
cnlog n
2
.
Deste modo, se / = A
1
, . . . , A
n
, . . . segue que
H
m
(/) =
+
n=1
log c + log n + 2 log(log n)
cn(log n)
2

+
n=1
1
nlog n
=
Dadas duas parti coes T e Q podemos denir uma nova parti cao T Q de
X do seguinte modo:
T Q = A B; A T e B Q.
Dada a parti cao T, denotaremos por T
n
a parti cao
T
n
=
n1
i=0
f
i
(T).
Observe que se T = P
1
, . . . , P
d
, cada elemento de T
n
e dado por um itiner ario
(a
0
, . . . , a
n1
), a
i
1, . . . , p. Quer dizer, cada elemento de T
n
e formado pelos
pontos x M tais que f
i
(x) P
ai
.
80 CAP
ITULO 7. ENTROPIA M
ETRICA
7.2 Entropia de um sistema erg odico
Novamente, voltando ao exemplo CSA contra CRB, vamos agora considerar a
parti cao das congura coes do time do CSA de acordo com o nvel de prepara cao
fsica dos jogadores como
Ruim: F
1
= x X; f(x) 5
Regular: F
2
= x X; 6 f(x) 7
Boa: F
3
= x X; f(x) = 8

Otima: se F
4
= x X; f(x) 9.
Se denotamos T = F
1
, . . . , F
4
, ent ao
T = T T = T
i
F
j
X; i, j = 1, 2, 3, 4,
representa as possibilidades para o time do CSA, de acordo com a nossa classi-
cacao tecnica e fsica. Digamos agora que o time do CSA est a participando da
Super Copa Nordeste, consistindo de 200 jogos no sistema de pontos corridos.
Para otimizar os resultados e diminuir os custos com treinador, cada jogador
tem seu perl instalado num computador que, a partir da congura cao x da
ultima partida disputada, escolhe a congura cao f(x) para a partida seguinte.
Deste modo, se escolhemos ao acaso a conguracao do time para a primeira par-
tida do campeonato, as demais estarao determinadas pelo computador. Assim,
podemos considerar a particao
T
200
= T f
1
(T) . . . , f
199
(T),
que representa as possveis congura coes do time do CSA ao longo do campe-
onato, de acordo com a classicacao tecnica e fsica adotada. Claramente, essa
parti cao depende da programa cao feita no computador. Por exemplo, se o com-
putador a partir de uma congura cao qualquer, escolhe sempre um certo time,
por exemplo o time x
f
formado pelos lhos dos dirigentes, ent ao se P
f
denota
o elemento da parti cao T que contem x
f
, vem que
f
i
(T) = X,
logo
T
200
= T X X = T.
Assim, descobrir a conguracao do time ao longo do campeonato e tao difcil
quanto descobrir que time jogar a no dia da abertura; a partir da, o time que
entrara em campo sera sempre o mesmo, escolhido pelo computador. Vamos
agora introduzir o conceito de entropia de uma parti cao. A entropia da parti cao
T com respeito à transforma cao f e à medida e o n umero:
h
(f, T) = lim
n+
H(T
n
)
n
7.2. ENTROPIA DE UM SISTEMA ERG
ODICO 81
Devemos mostrar que a sequencia
H(P
n
)
n
e convergente para que o limite
acima fa ca sentido. Deixaremos esta demonstra cao a cargo do leitor (veja os
Exerccios 7.4 e 7.5.)
Assim, no nosso exemplo futebolstico, dada uma programa cao f do com-
putador, a entropia da parti cao T representa a diculdade em descobrir qual
ser a a congura cao, de acordo com a nossa classicacao do time do CSA, ao
longo da Super Copa Nordeste, dado que o time inicial e determinado por um
sorteio. Por exemplo, se para cada congura cao x o computador associa para o
pr oximo jogo uma certa congura cao xada que maximiza a qualidade do time
(por exemplo, a soma de t(x) com f(x)), ent ao n ao e difcil ver que a entropia da
parti cao T
200
e igual ` a entropia de T. Ou seja, n ao e nada difcil para um apos-
tador, descobrir a conguracao do time do CSA ao longo de todo campeonato:
basta descobrir a conguracao no primeiro dia. Observe que neste caso:
h
(f, T) = lim
n
1
n
H
(T
n
)

=
H
(T
200
)
200
=
H
(T)
200
= 0.
Ou seja, a aposta descobrir a conguracao do time do CSA ao longo da Super
Copa Nordeste e muito previsvel e devemos pagar pouco ao vencedor dela. Claro
que isso s o acontece se nossa programacao for, em certo sentido, previsvel. Se,
por exemplo, o time do CSA for escolhido a cada rodada por meio de um sorteio,
ent ao descobrir a sua conguracao ao longo do campeonato se torna muito mais
complicado. Neste caso, a entropia da parti cao T depender a da medida de seus
atomos, ou seja, da medida de cada elemento P
i
. Deniremos agora uma forma
global de medir a complexidade de uma transforma cao, no sentido metrico.
A palavra global aqui refere-se que ela n ao depender a de nenhuma parti cao
especca.
Denicao 7.5. A entropia de f com respeito à medida e:
h
(f) = sup
P
h
(f, T),
onde o supremo e tomado sobre todas as parti coes nitas de X.
Vamos agora ilustrar um pouco a deni cao com alguns exemplos:
Exemplo 7.6. Seja f : X uma transformacao e p X um ponto xo para
f, i.e., tal que f(p) = p. Deste modo, a medida
p
denida por:
p
(A) = 0 , se p / A
1 , se p A,
e uma medida invariante por f. Vamos calcular sua entropia: claramente, a
entropia de qualquer parti cao e zero, j a que a medida de um conjunto A e zero
ou um. Em ambos os casos,
p
(A) log
p
(A) = 0. Assim, segue-se diretamente
que a entropia h
p
(f) e zero.
Um fato interessante que podemos extrair diretamente do exemplo acima
e que a fun cao entropia h
(f) pode ser descontnua: de fato, a medida

82 CAP
ITULO 7. ENTROPIA M
ETRICA
SRB
absolutamente contnua com respeito à medida de Lebesgue para uma
transformacao expansora, construda no Captulo 9, pode ser obtida como limite
de medidas de Dirac concentradas nos pontos peri odicos. Porem, sua entropia
e igual a
_
log [ det Df[d
SRB
> 0, como mostra o Teorema 8.18.
Exemplo 7.7. Considere o shift completo com d smbolos
+
:
+
d

+
d
. Se
tomarmos a parti cao T de
+
d
dada pelos cilindros de comprimento 1 podemos
vericar que T
n
e simplesmente a particao por cilindros de comprimento n. No
exemplo 7.3 calculamos a entropia de T
n
com respeito à medida de Bernoulli
p
com vetor de probabilidades p = (p
1
, . . . , p
d
), obtendo n
d
i=1
p
i
log p
i
. Assim,
h
p
(
+
, T) =
d
i=1
p
i
log p
i
.
De fato, este n umero e a entropia da transforma cao
+
com respeito à medida
p
: isso e consequencia do fato de que T e uma parti cao geradora e do Teorema
de Kolmogorov-Sinai. Veja a Secao 7.3
Exemplo 7.8. Vamos calcular a entropia da medida de Lebesgue de [0, 1] para
a transforma cao dada por f(x) = 10x [10x]. Se considerarmos a parti cao T
como no exemplo 7.2, note que existem exatamente 10
n
elementos em T
n
e cada
um deles e um intervalo de comprimento 10
n
. Assim, m(C) = 10
n
para todo
C T
n
. Donde
h
m
(f, T) = lim
1
n
CP
n
m(C) log m(C) = lim
log 10
n
n
= log 10.
Alem disso, a entropia desta particao e a entropia da medida de Lebesgue.
Isso e consequencia novamente do Teorema de Kolmogorov-Sinai.
Exemplo 7.9. Esse exemplo e dedicado a calcular a entropia de uma rota cao
R
de angulo do crculo S
1
com respeito à medida de Lebesgue m. Na
verdade, o argumento que usaremos abaixo se aplica a qualquer bije cao men-
sur avel f : S
1
S
1
(ou f : [0, 1] [0, 1]) que preserve uma dada medida
. Primeiramente, observe que uma particao do crculo T com k elemen-
tos e determinada por uma sequencia p
1
, . . . , p
k
de pontos de S
1
. Observe
tambem que se denotamos por p
j
i
= f
j
(p
i
) ent ao T
n
e determinada pelo con-
junto de pontos C
n
= (p
j
i
) S
1
; i = 1, . . . , k e j = 0, . . . , n 1. Note que
#C
n
#C
n1
+k, pois C
n
C
n1
= p
n
1
, . . . , p
n
k
. Assim, e facil deduzir por
indu cao que #T
n
kn. Deste modo:
h
(f, T) = lim
H
(T
n
)
n

#T
n
n
= lim
log kn
n
= 0.
Como a escolha de T foi arbitr aria, temos que h
(f) = 0.
7.3. TEOREMA DE KOLMOGOROV-SINAI 83
7.3 Teorema de Kolmogorov-Sinai
Denicao 7.10. Seja f : X X uma transformacao invertvel preservando
uma probabilidade no espaco de probabilidade (X, /, ). Uma parti cao T e
dita geradora se
+
_
n=
f
n
T gera a -algebra /. No caso que f e nao-invertvel,
ent ao T e geradora se
+
_
n=0
f
n
T gera a -algebra.
Teorema 7.11. Seja T uma parti cao geradora para f : X X preservando
uma probabilidade no espaco de probabilidade (X, /, ). Entao:
h
(f) = h
(f, T).
7.4 Equivalencia ergodica
Vamos agora denir uma rela cao de equivalencia do ponto de vista ergodico
entre as transformacoes que preservam medida. Duas transforma coes serao
equivalentes se, apos retirarmos conjuntos de medida zero, suas din amicas sao
conjugadas. Mais precisamente:
Denicao 7.12. Sejam f
1
: X
1
X
1
preservando a medida
1
e f
2
: X
2
X
2
preservando a medida
2
. Diremos que o sistema (f
1
,
1
) e equivalente ` a (f
2
,
2
)
se podemos escolher conjuntos Y
1
e Y
2
com
1
(X
1
Y
1
) = 0 e
2
(X
2
Y
2
) = 0,
e uma bije cao mensuravel : Y
1
Y
2
com inversa mensur avel tal que:
1.
1
(
1
(A)) =
2
(A) para todo A Y
2
mensuravel;
2. f
1
= f
2
.
Muitas vezes a rela cao de equivalencia acima e chamada de conjuga cao
erg odica entre (f
1
,
1
) e (f
2
,
2
) e e dita a conjuga cao.
Observa cao 7.13. Observe que os conjuntos Y
1
e Y
2
acima podem ser tomados
de modo que f
1
(Y
1
) Y
1
e f
2
(Y
2
) Y
2
. De fato, se B
1
= X
1
Y
1
n ao
e invariante por f
1
, tome

B
1
=
+
i=0
f
i
(B
1
). Como
1
(B
1
) = 0, temos que
1
(f
i
(B
1
)) =
1
(B
1
) = 0, donde segue-se que
1
(

B
1
). Analogamente para
B
2
= X
2
Y
2
.
Claramente a relacao acima e de equivalencia (prove isto!). Vamos agora ver
alguns exemplos de transforma coes equivalentes do ponto de vista ergodico:
Exemplo 7.14. Considere a transforma cao do intervalo f : [0, 1] [0, 1] tal
que f(x) = 2x [2x] preservando a medida de Lebesgue m, onde [x] e o menor
inteiro menor ou igual a x. Observe que, escrevendo um n umero x [0, 1]
em sua expans ao bin aria x = 0, a
1
a
2
a
3
. . .
2
, a transformacao f e simplesmente
84 CAP
ITULO 7. ENTROPIA M
ETRICA
deslocarumdgito de x para esquerda. Isso nos motiva a considerar a aplica cao
: [0, 1]
+
2
= 0, 1
N
denida por
x = (0, a
1
a
2
a
3
. . . )
2
(x) = (a
1
, a
2
, a
3
, . . . ).
Observe que em alguns pontos n ao est a bem denida. Por exemplo, podemos
escrever (0, 1)
2
de outro modo, a saber, como (0, 1)
2
= (0, 01111 . . . )
2
. Porem,
isso nao gera maiores problemas: o conjunto B dos pontos que se escrevem
de dois modos diferentes e enumeravel (prove isso!) e, logo, tem medida de
Lebesgue nula. Eventualmente, um ponto de [0, 1] pode ser mapeado por f em
um ponto de B. Observe que como cada f
i
(B) e enumeravel, conjunto
B
_
i=0
f
i
(B)
e enumeravel. Em particular o conjunto B
tem medida de Lebesgue zero.

Assim, considerando o conjunto Y
1
= [0, 1] B
e Y
2

+
2
denido como
sendo o conjunto enumer avel dos itiner arios obtidos a partir dos elementos de
B
podemos denir a tranformacao , que faz com que (f

1
, m) seja ergodica-
mente equivalente ao shift completo com 2 smbolos, equipado com a medida de
Bernoulli associada ao vetor (1/2, 1/2).
Facilmente, podemos generalizar esse exemplo para uma transformacao do
intervalo [0, 1] dada por f(x) = nxmod1. Neste caso, f ser a conjugada a um
shift completo com n smbolos munido da medida de Bernoulli associada ao
vetor (1/n, . . . , 1/n).
7.5 Equivalencia Espectral
Uma deni cao mais fraca de equivalencia, levando em conta somente as pro-
priedades espectrais da transformacao e pode ser formulada como se segue:
Denicao 7.15. Seja f : M M transformacao preservando uma medida
e g : N N uma transformacao preservando uma medida . Dizemos
que (f, ) e espectralmente equivalente ` a (g, ) se existe uma bijecao linear
T : L
2
(M, ) L
2
(N, ) contnua tal que:
U
g
T = TcircU
f
.
Esta denicao garante se (f, ) e espectralmente equivalente à (g, ) ent ao
todas as propriedades espectrais de (f, ) tambem valem para (g, ). Em
particular, se (f, ) e ergodica, entao (g, ) tambem e ergodica. Veremos no
Captulo 10.28 uma no cao mais geral de equivalencia entre duas transformacoes
preservando medida, que negligencia conjuntos que tem medida zero.
Proposi cao 7.16. Sejam d
1
e d
2
n umeros naturais e
1
e
2
deslocamentos de
Bernoulli com d
1
e d
2
smbolos, respectivamente. Entao,
1
e
2
s ao espectral-
mente equivalentes.
7.6. A ENTROPIA COMO INVARIANTE 85
7.6 A entropia como invariante
Como veremos na proposicao abaixo, a entropia e um invariante com respeito a
essa relacao de equivalencia. Isso torna a entropia bastante util em identicar
quando duas transformacoes preservando medida nao sao equivalentes.
Proposi cao 7.17. Se (f
1
,
1
) e ergodicamente equivalente a (f
2
,
2
), entao
h
1
(f
1
) = h
2
(f
2
).
Demonstra cao. Seja T
1
uma parti cao de X
1
. Desprezando um conjunto de
medida
1
nula podemos supor, sem perda de generalidade, que T
1
e uma
parti cao em Y
1
. Dena
T
2
= (T
1
) = (P) X
2
; P T
1
.
Observe que como e uma bije cao mensuravel, temos que T
2
e de fato uma
parti cao de X
2
. Alem disso, utilizando que f
1
= f
2
vem que (T
n
1
) =
(T
1
)
n
= T
n
2
. Assim, existe uma bijecao entre os elementos de T
n
1
e os elementos
de T
n
2
de modo que cada elemento P T
n
1
e levado por num elemento (P)
de T
n
2
. Como
1
(P) =
2
((P)) para cada P T
n
1
temos que
H
1
(T
n
1
) =

PP
n
1
1
(P) log
1
(P) =

PP
n
1
2
((P)) log
2
((P))
=

QP
n
2
2
(Q) log
2
(Q) = H
2
(T
n
2
).
Assim, vem diretamente que
h
1
(f
1
, T
1
) = h
2
(f
2
, T
2
).
Como a parti cao T
1
de X
1
foi escolhida de modo arbitrario, tomando o supremo
no lado esquerdo da igualdade acima, vem que h
1
(f
1
) h
2
(f
2
). Aplicando o
mesmo argumento com f
2
no lugar de f
1
, vem que h
2
(f
2
) h
1
(f
1
), o que
encerra a prova.
Apesar da utilidade clara do teorema acima em determinar quando duas
transformacoes preservando medida nao sao equivalentes, a entropia metrica
tem a limita cao de n ao ser um invariante completo para a rela cao de equivalencia
que denimos acima. Por exemplo, j a vimos que a entropia da medida de
Lebesgue de uma rota cao e sempre igual a zero. Porem, rotacoes irracionais
n ao podem ser equivalentes a rota coes racionais. De fato, todas as orbitas de
uma rota cao racional sao peri odicas, enquanto todas as orbitas de uma rotacao
irracional sao densas. Porem, nem tudo esta perdido: se nos restringirmos a
classe dos shifts de Bernoulli a entropia e de fato um invariante completo. Esse
resultado e o famoso:
Teorema 7.18 (Orstein[Orn70]). Dois shifts de Bernoulli com a mesma en-
tropia s ao necessariamente equivalentes.
86 CAP
ITULO 7. ENTROPIA M
ETRICA
Vamos agora introduzir uma nova forma de calcular a entropia de uma me-
dida invariante, devida a Brin e Katok [BK83], com um certo sabor topol ogico.
Primeiramente, vamos denir o conceito de bola din amica:
Denicao 7.19. A bola din amica de tamanho n e raio em torno do ponto x
e o conjunto:
B
(n, x) = y M; d(f
i
(x), f
i
(y)) < , i = 0, 1, . . . , n 1,
ou equivalentemente,
B
(n, x) =
n1
k=0
f
k
(B
(f
k
(x))).
A entropia de e a media da taxa exponencial de decrescimento da medida
das bolas din amicas. Tornando a frase anterior mais clara, dena as fun coes:
h(x, ) = limsup
n
1
n
log (B
(n, x))
e
h(x) = lim
0
h(x, ).
O Teorema de Brin-Katok arma que:
Teorema 7.20 (Brin-Katok [BK83]). A fun cao h(x) denida acima e -
integr avel e, alem disso, vale:
h
(f) =
_
h(x)d.
7.7 Exerccios
7.1. Mostre que se Q = Q
1
, . . . , Q
d
, ent ao H
(Q) log d. (dica: Use calculo

e mostre que se x
1
, . . . , x
d
0 sao n umeros reais positivos tais que
n
i=1
x
i
= 1,
ent ao
d
i=1
x
i
log x
i
e maximo quando x
1
= x
2
= = x
d
= 1/d.)
7.2. Mostre que a fun cao h(x) e f-invariante. Conclua da que se e ergodica,
ent ao h
(f) = h(x) para quase todo ponto x.

7.3. Mostre que se T e a parti cao por cilindros de comprimento 1, ent ao a
entropia de T
n
com respeito à medida de Bernoulli m relativa ao vetor de
probabilidades p = (p
1
, . . . , p
d
) e dada por H
m
(T
n
) = n
d
i=1
p
i
log p
i
.
7.4. Uma sequencia de n umeros reais a
n
e dita subaditiva se a
n+m
a
n
+a
m
.
Mostre que se a
n
0 e subaditiva ent ao o limite lim
n
an
n
existe.
7.5. Mostre que dada uma parti cao nita T de X ent ao a sequencia H
(T
n
) e
subaditiva.
7.7. EXERC
ICIOS 87
7.6. Mostre que se = (
1
, . . . ,
n
)
n
e R
:
n

n
e a rota cao de angulo
denida por R
(x
1
, . . . , x
n
) = (x
1
+
n
, . . . , x
n
+
n
), ent ao h
m
(R
) = 0, onde
m e a medida de Lebesgue.
7.7. Dena A :
2

2
por A(x, y) = (2x,
1
2
y). Mostre que a entropia de A
com respeito à medida de Lebesgue m e h
m
(A) = log 2.
7.8. Mostre as seguintes propriedades da entropia:
1. Para n N, h
(f
n
) = nh
(f);
2. Se t [0, 1] e
1
,
2
sao medidas f-invariantes, ent ao
h
t1+(1t)2
(f) = th
1
(f) + (1 t)h
2
(f)
3. Se p e um ponto peri odico de perodo n e =
1
n
n1
i=0
f
i
(p)
, ent ao h
(f) = 0
88 CAP
ITULO 7. ENTROPIA M
ETRICA
Captulo 8
Entropia Topol ogica
Introduziremos agora um importante conceito topologico com conexao com a
deni cao de entropia metrica, estudada anteriormente. Este invariante ser a um
n umero que, como veremos, coincide com o supremo das entropias metricas
quando percorremos o conjunto de todas as medidas invariantes. Estudaremos
tambem sua rela cao com a taxa de crescimento do n umero de pontos peri odicos
e sua versao para uxos.
8.1 Deni cao via coberturas
Daremos primeiramente uma denicao de entropia topol ogica com o sabor da
deni cao de entropia via parti coes. Neste caso, o ingrediente que utilizaremos
e a no cao de entropia de uma cobertura (note que aqui n ao iremos nos reportar
a nenhuma medida invariante.)
Denicao 8.1. Seja X um espaco metrico e uma cobertura de X. Deniremos
N() o n umero da cobertura como a menor cardinalidade possvel de uma
subcobertura de , ou seja,
N() = inf#; e subcobertura de X.
A entropia de e simplesmente o n umero H() = log N().
Se | e 1 sao coberturas tais que dado qualquer U | existe algum V 1
isso por tal que U V , ent ao dizemos que | rena 1 e denotamos isso por
1 |.
Do mesmo modo como foi feito para particoes, dadas duas coberturas e
podemos denir uma nova cobertura de X do seguinte modo:
= A B; A e B .
Dada uma parti cao , denimos
n
por
n
= f
n+1
().
89
90 CAP
ITULO 8. ENTROPIA TOPOL
OGICA
Deixaremos para o leitor a tarefa de mostrar que H(
n
) e uma sequencia sub-
aditiva (Exerccio 8.2.)
Assim, dada uma funcao contnua f : X X, denimos a entropia de f
com respeito a cobertura , como sendo o n umero
h(f, ) = lim
n
1
n
H(
n
).
Finalmente, a entropia topol ogica de f e
h
top
(f) = suph(f, ); e cobertura aberta nita de X.
Exemplo 8.2. Vamos agora calcular a entropia topologica de uma bije cao
mensuravel f : S
1
S
1
(ou f : [0, 1] [0, 1]). Primeiramente, dada uma
cobertura do crculo podemos supor, sem perda de generalidade, que e for-
mada por intervalos abertos. Sejam p
1
, p
2
, . . . , p
k
os extremos desses intervalos.
Observe que se denotamos por p
j
i
= f
j
(p
i
) ent ao
n
e determinada pelo con-
junto de pontos C
n
= (p
j
i
) S
1
; i = 1, . . . , k e j = 0, . . . , n 1. Note que
#C
n
#C
n1
+k, pois C
n
C
n1
= p
n
1
, . . . , p
n
k
. Assim, e facil deduzir por
indu cao que #
n
kn. Deste modo:
h
(f, ) = lim
H
(
n
)
n

#
n
n
= lim
log kn
n
= 0.
Como a escolha de foi arbitr aria, temos que h
(f) = 0.
Exemplo 8.3. Como consequencia do exemplo anterior, a entropia de uma
rota cao R
de angulo do crculo S
1
e sempre igual a zero.
Vamos agora mostrar a seguinte proposicao, util para calcular a entropia
topol ogica de uma transformacao.
Proposi cao 8.4. Seja
n
uma sequencia de coberturas nitas tais que os seus
di ametros diam
n
vao para zero quando n vai para innito. Entao,
h
top
(f) = sup
nN
h(f,
n
) = lim
n
h(f,
n
).
Demonstra cao. Observe primeiramente que dada uma cobertura nita 1, pode-
mos escolher N sucientemente grande de modo que se n > N ent ao diam
n
e
menor que o n umero de Lebesgue da cobertura 1. Relembrando a deni cao,
e um n umero de Lebesgue de 1 se, dado qualquer conjunto C com diamC ,
ent ao existe V 1 tal que C V . Logo, como diam
n
, temos que todo
elemento B de
n
esta contido em algum V 1. Logo, 1
n
, o que implica
diretamente que h(f, 1) h(f,
n
), pois 1
k

k
n
, para todo N. Em particu-
lar, h(f, 1) sup
nN
h(f,
n
). Logo, tomando o supremo sobre todas as coberturas
nitas no lado esquerdo da igualdade anterior:
h
top
(f) = sup h(f, 1) sup
nN
h(f,
n
) h
top
(f).
8.2. DEFINIC

AO VIA CONJUNTOS GERADORES 91
Para mostrar que a sequencia h(f,
n
) e convergente, suponha que uma sub-
sequencia
ni
satisfazendo lim
i
h(f,
ni
) = h. Vamos mostrar que h = h
top
(f).
De fato, dado > 0, podemos escolher N grande de modo que se i > N, ent ao
h h(f,
ni
h + . Deste modo, aplicando a parte que j a mostramos à
sequencia
i
=
ni+N
, temos que
h
top
(f) = sup
iN
h(f,
i
) (h , h +).
Como e arbitr ario, vem que h
top
(f) = h, provando que a sequencia h(f,
n
) e
convergente.
Corolario 8.5. Se e uma cobertura tal que lim
n
diam
n
= 0, entao
h
top
(f) = h(f, ).
8.2 Deni cao via conjuntos geradores
Vamos agora denir de uma outra forma o conceito de entropia topol ogica,
utilizando a deni cao de conjunto gerador.
Denicao 8.6. Seja f : X X uma aplica cao contnua do espaco metrico
(X, d) e E X. Dado > 0 e n N, dizemos que E e um (n, )-gerador de X,,
se X =

xE
B
(n, x).
Consideraremos daqui por diante X compacto para que sempre exista um
conjunto (n, )-gerador nito. Isso decorre diretamente da denicao de conjuntos
compactos, pois sempre podemos cobrir X por bolas din amicas de raio e
tamanho n. Para cada par (n, ), associaremos um n umero S
n
() denido por
S
n
() = inf#E; E X e (n, )-gerador .
Deixaremos para o leitor a tarefa de vericar que a sequencia log S
n
() e suba-
ditiva (Exerccio 8.3.)
Assim, podemos considerar o limite
h(f, ) = lim
n
1
n
log S
n
().
Observando que a fun cao h() e monotona decrescente, temos que o
limite h(f) = lim
0
h(f, ) existe. De fato, temos que
Proposi cao 8.7. Com as deni coes anteriores vale
h(f) = h
top
(f).
92 CAP
OGICA
8.3 Entropia de uxos
Com as ferramentas introduzidas vamos facilmente denir o conceito de entropia
topol ogica para um uxo de uma variedade compacta
t
: M M. Primeira-
mente, vamos denir o an alogo da bola din amica B
(n, x). Para isso, para cada

T > 0 dena a dist ancia:
d
T
(x, y) = max
t[0,T]
d(
t
(x),
t
(y))
Denimos B
(T, x) = y M; d
T
(x, y) a bola de raio na dist ancia d
T
.
Um conjunto E Xser a chamado de (T, )-gerador de X , se =

xE
B
(n, x).
Assim, de forma analoga ao que zemos no caso de aplica coes, denimos
S
T
() = inf#E; E X e (T, ) gerador e
h(, ) = lim
T
1
T
log S
T
().
Finalmente, a entropia topol ogica do uxo e denida como sendo o n umero:
h
top
() = lim
0
h(, ).
Uma primeira conex ao entre a entropia topol ogica de uxos e aplica coes e:
Teorema 8.8. A entropia topologica h
top
() do uxo
t
coincide com a entropia
topologica h
top
(
1
) da aplicacao
1
.
Um importante resultado (cuja prova foge ao ambito deste texto) e:
Teorema 8.9 (Princpio Variacional). Seja f : X X uma fun cao cont-
nua do espaco metrico compacto X. Denote por 1 o conjunto das medidas (de
probabilidade) invariantes por f. Entao vale a igualdade:
h
top
(f) = sup
I
h
(f).
Podemos tirar algumas conclus oes uteis do teorema acima. A primeira delas
e que se para alguma medida invariante a entropia metrica e positiva ent ao, a
entropia topol ogica tambem o e. Em contrapartida, se a entropia de toda as
medida invariantes e igual a zero, ent ao a entropia topol ogica tambem e igual
a zero. Como consequencia disso e do exemplo 7.9, reobtemos que a entropia
topol ogica de qualquer bije cao do intervalo ou de S
1
e zero, j a que a entropia
metrica de qualquer medida invariante e igual a zero.
Uma das boas propriedades da entropia topol ogica e que ela e um invari-
ante topol ogico: se duas transformacoes sao equivalentes do ponto de vista
topol ogico, ent ao sua entropia topol ogica e a mesma. Como zemos no captulo
anterior, vamos tornar preciso o que entendemos por transforma coes equiva-
lentes (agora no sentido topologico):
8.4. PRESS
AO TOPOL
OGICA 93
Denicao 8.10. Sejam f
1
: X
1
X
1
e f
2
: X
2
X
2
fun coes contnuas dos
espacos metricos X
1
e X
2
. Diremos que f
1
e topologicamente equivalente à f
2
se existe um homeomorsmo h : X
1
X
2
tal que:
h f
1
= f
2
h.
Neste caso dizemos que f
1
e topologicamente conjugado a f
2
e h e dita uma
conjuga cao entre f
1
e f
2
.
Observa cao 8.11. Observe que se o ponto p X
1
e tal que f
n
1
(p) = p, ent ao
f
n
2
((p)) = (f
n
1
(p)) = (p). Em palavras, leva pontos peri odicos de f
1
em
pontos peri odicos de f
2
. De modo an alogo, n ao e difcil ver que leva pontos
de X
1
com orbita por f
1
densa, em pontos de X
2
com orbita por f
2
densa.
Deixamos a prova da proposi cao abaixo para o leitor:
Proposi cao 8.12. Se f
1
e topologicamente equivalente a f
2
, entao h
top
(f
1
) =
h
top
(f
2
).
Como no caso da entropia metrica, a entropia topologica tem a limita cao de
n ao ser um invariante completo. Por exemplo, duas rota coes quaisquer do circulo
tem sempre a mesma entropia topologica, igual a zero. Porem, uma rotacao
irracional tem todos os pontos com orbita densa, enquanto uma rota cao racional
n ao possui nenhum com esta propriedade, j a que todos s ao peri odicos. De acordo
com a observa cao acima, isso torna impossvel que haja uma conjugacao entre
elas.
8.4 Pressao topol ogica
Vamos agora denir uma generaliza cao do conceito de entropia topologica, in-
troduzindo o conceito de press ao topologica de uma fun cao : X R com
respeito a transformacao f : X X. Esse conceito (oriundo da Fsica, como
o pr oprio nome indica) ser a tambem um invariante topol ogico de f, no sentido
de que duas transformacoes topologicamente equivalentes atribuem a mesma
pressao a uma fun cao . Suporemos que o espaco X e compacto para que as
quantidades tratadas sejam sempre nitas, mas os conceitos expostos sao de
car ater geral e nao dependem desta condicao.
Denicao 8.13. Dado n N vamos denotar
n
(x) =

n1
i=0
(f
i
(x)). Dado
um conjunto C X ent ao
n
(C) = max
xC

n
(x).
Dada uma cobertura de X denimos a pressao de com respeito a cober-
tura como:
P(, ) = lim
n+
1
n
log inf
U
n
UU
e
n(U)
,
onde o nmo e tomado sobre todas subcoberturas | de
n
.
Fica como exerccio para o leitor diligente mostrar que o limite acima existe
(a essa altura o caminho a ser percorrido e standard: mostre que a sequencia e
subaditiva).
94 CAP
OGICA
Denicao 8.14. A press ao P(, f) de com respeito a f e o supremo dos
valores de P(, ) sobre todas as coberturas abertas de X.
Proposi cao 8.15. Sejam , C
0
(X) e C R. Entao:
1. P(0, f) = h
top
(f)
2. P( + C, f) = P(, f) +C
3. Se existir fun cao limitada u : X R tal que se escreve como =
+u f u ( e neste caso diremos que a fun cao e cohomologa a ),
entao P(, f) = P(, f).
Demonstra c ao. Para o item 1, xada uma cobertura observe que como =
0, ent ao dada uma subcobertura | de
n
vale

UU
e
n(U)
= #|. Logo,
P(0, ) = h(f, ) para cada cobertura de X.
No item 2, observe que se denotamos = + C ent ao
n
(x) =
n
(x) +
Cn. Logo, xada uma cobertura , para qualquer subcobertura | de
n
vale
UU
e
n(U)
= e
Cn
UU
e
n(U)
. Assim, segue diretamente que P(, ) =
P(, ) +C e, por conseguinte, que P(, f) = P(, f) +C
Para o ultimo item, inicialmente como = + u f u vale que
n
(x) =
n
(x) + u(f
n
(x)) u(x). Assim,

UU
e
n(U)
= e
u(f
n
(x))u(x)
UU
e
n(U)
.
Logo, como u e limitada, digamos [u(x)[ K, ent ao vale que
UU
e
n(U)
= e
2K
UU
e
n(U)
.
Segue diretamente que P(, ) = P(, ) e, consequentemente, P(, f) =
P(, f).
8.5 Princpio variacional
Denotaremos tambem a pressao da medida com respeito a como sendo o
n umero P
() = h
(f) +
_
d. Para simplicar nossa nota cao, sempre que f
estiver xada e nao houver perigo de confus ao, utilizaremos P() para indicar
P(, f).
E simples ver que se t [0, 1] e

1
,
2
1 ent ao (veja exerccio 7.8):
P
t1+(1t)2
() = tP
1
() + (1 t)P
2
().
Como ja observamos, se tomarmos = 0 ent ao a pressao de e exatamente
a entropia topol ogica. Podemos nos perguntar se a press ao topol ogica de um
potencial contnuo qualquer admite uma caracteriza cao via supremo no conjunto
de medidas, como obtivemos para = 0. A resposta para esta pergunta e sim
e forma o importante teorema conhecido como Princpio Variacional para a
pressao:
8.5. PRINC
IPIO VARIACIONAL 95
Teorema 8.16 (Princpio Variacional). Se 1 e o conjunto das probabilidades
invariantes para uma transforma c ao contnua f : X X do espaco compacto
X e : X R e contnua, ent ao
P(, f) = sup
I
P
() = sup
I
h
(f) +
_
d (8.1)
Outra boa propriedade da press ao e que ela e uma fun cao contnua com o
potencial. Mostraremos, sem muito esfor co, que
Proposi cao 8.17. P : C
0
(X) R e Lipschitz com constante de Lipschitz igual
a 1.
Demonstra cao. De fato, dados os potenciais e C
0
(X) vale que:
| | +| |
De onde , para cada 1:
h
(f) +
_
d | | h
(f) +
_
d h
(f) +
_
d +| |
Tomando o supremo em nas desigualdades acima:
P() | | P() P() +| |
Ou equivalentemente, |P() P()| | |.
Agora vamos estudar a press ao de um potencial particular, a saber, (x) =
log [ det Df(x)[ e tirar conclus oes quando f e uma transformacao expansora
de classe C
2
, estudada no Captulo 9 anterior. Na prova da proposi cao a seguir,
vamos utilizar alguns resultados classicos de teoria ergodica. O leitor que os
desconhece pode recorrer à Secao 12.2.
Proposi cao 8.18. Seja M
d
uma variedade compacta de dimensao d. Se f e
uma transforma cao expansora de classe C
2
, entao P(log [ det Df(x)[) = 0.
Demonstra cao. Observe primeiramente que se e uma probabilidade invariante
para f, pela desigualdade de Ruelle (veja o Teorema 12.3) se (x) e a soma dos
expoentes de Lyapunov positivos de x, ent ao a entropia de satisfaz:
h
(f)
_

i
(x) d(x).
Por outro lado, como a transforma cao f e expansora, todos os expoentes de
Lyapunov de f sao positivos e, pelo teorema de Oseledets, a soma de todos os
expoentes de Lyapunov
i
(x) e
d
i=1
i
(x) =
i
(x) = log [ det Df(x)[.
96 CAP
OGICA
Consequentemente, a pressao P() satisfaz:
P(log [ det Df[) = sup
I
h
(f)
_
log [ det Df(x)[ d(x) 0.
De fato, P(log [ det Df[) = 0. Para ver isso, basta calcularmos a entropia da
medida
SRB
construda no captulo 9. Note que essa medida tem a propriedade
de ser absolutamente contnua com respeito a medida de Lebesgue de M. Isso
nos coloca em condicoes de aplicar a f ormula de Pesin, que nos garante que:
h
SRB
(f) =
_

i
(x) d
SRB
(x) =
_
log [ det Df(x)[ d
SRB
.
8.6 Exerccios
8.1. Se | e 1 sao coberturas tais que | 1, ent ao H(1) H(|).
8.2. Mostre que H(
n
) e uma sequencia subaditiva.
8.3. Mostre que xado , ent ao a sequencia log S
n
() e subaditiva.
8.4. Mostre que o maximo da fun cao h : R
d
R dada por h(x
1
, . . . , x
d
) =
d
i=1
x
i
log x
i
restrita ao simplexo x
i
0; x
1
+ +x
d
= 1 e igual a log d
e e obtido exatamente quando x
1
= x
2
= = x
d
=
1
d
. Conclua que entre as
medidas de Bernoulli do Shift completo com d smbolos, a de maior entropia e
dada pelo vetor de probabilidade (
1
d
, . . . ,
1
d
).
8.5. Este exerccio e uma generaliza cao do anterior: sejam a
1
, . . . , a
d
n umeros
reais. Mostre que o m aximo da fun cao F : R
d
R dada por
F(x
1
, . . . , x
d
) =
d
i=1
x
i
log x
i
+x
i
a
i
restrita ao simplexo x
i
0; x
1
+ +x
d
= 1 e obtido exatamente quando
x
j
=
e
aj
d
i=1
e
ai
.
Captulo 9
Transforma c oes Expansoras
Nesta secao provamos que para qualquer transforma cao expansora cujo jaco-
biano det Df e Holder
1
existe uma unica probabilidade invariante absoluta-
mente contnua com relacao à medida de Lebesgue. Essa probabilidade e posi-
tiva em todos os subconjuntos abertos de M, e ergodica, e a sua bacia de atra cao
tem medida de Lebesgue total em M.
Denicao 9.1. Seja M uma variedade compacta e f : M M uma trans-
forma cao de classe C
1
. Dizemos que f e expansora se existe > 1 e alguma
metrica riemanniana | | em M tais que
|Df(x)v| |v| para todo x M e v T
x
M. (9.1)
Exemplo 9.2. Seja F : R
d
R
d
, d 1 um isomorsmo linear satisfazendo
F(Z
d
) Z
d
. Ent ao existe uma unica transformacao f : T
d
T
d
no toro
d-dimensional M = T
d
tal que f = F, onde
: R
d
T
d
, (x
1
, . . . , x
d
) =
_
e
2ix1
, . . . , e
2ix
d
_
e a proje cao can onica. Se todos os autovalores
1
, . . . ,
d
de F tem norma
maior que 1 ent ao a transforma cao f e expansora: podemos tomar qualquer
1 < < inf
i
[
i
[ em (9.1).
Chamamos suporte de uma probabilidade o conjunto dos pontos tais que
toda vizinhanca tem medida positiva para . Note que o suporte de e o espaco
M inteiro se e somente se e positiva em todo aberto de M.
Quando e invariante para f, chamamos bacia de o conjunto B() dos
pontos x M tais que
lim
n
1
n
n1
j=0
(f
j
(x)) =
_
d
1
Dado > 0, dizemos que : M R e -Holder se existe alguma constante C > 0 tal que
|(x
1
) (x
2
)| Cd(x
1
, x
2
)
para todo x
1
, x
2
em M.
97
98 CAP
ITULO 9. TRANSFORMAC

OES EXPANSORAS
para toda fun cao contnua : M R. Note que a bacia sempre e um conjunto
invariante. Se e ergodica ent ao B() tem -medida total.
Teorema 9.3. Seja f : M M uma transforma cao expansora numa variedade
compacta conexa M. Assuma que o logaritmo
M x log [ det Df(x)[
do jacobiano de f e -Holder, para algum > 0. Entao f admite uma unica
probabilidade invariante absolutamente contnua com relacao à medida de
Lebesgue m. Alem disso, e erg odica, o seu suporte coincide com M e a sua
bacia tem medida de Lebesgue total na variedade.
A estrategia da demonstracao do Teorema 9.3 e a seguinte.

E f acil ver
que a pre-imagem por f de um conjunto com medida de Lebesgue m nula
tambem tem medida de Lebesgue nula. Isto signica que a imagem f
por
f de qualquer medida absolutamente contnua com relacao a m tambem e
absolutamente contnua com relacao a m. Em particular, a nesima imagem
f
n
m e absolutamente contnua com relacao à medida de Lebesgue m para todo

n 1.
Provaremos na Proposicao 9.6 que a derivada de Radon-Nikodym de cada
f
n
m com rela cao a m (tambem chamada densidade) e limitada por alguma

constante independente de n 1. Deduziremos que todo ponto de acumula cao,
na topologia fraca
, da sequencia
1
n
n1
j=0
f
j
m
e uma probabilidade invariante absolutamente contnua com relacao à medida
de Lebesgue, com densidade limitada pela mesma constante.
Um argumento adicional provar a que tal ponto de acumula cao e unico e
satisfaz todas as propriedades no enunciado do teorema.
9.1 Lema de distor cao
A hip otese de que a transformacao f : M M e expansora serve para obter a
seguinte proposi cao:
Lema 9.4. Existe k 1 tal que todo ponto y M tem exatamente k pre-
imagens por f. Alem disso, existe
0
> 0 tal que, para qualquer pre-imagem x
de um ponto y M, existe uma aplica cao h : B(y,
0
) M de classe C
1
tal
que f h = id , h(y) = x e
d(h(y
1
), h(y
2
))
1
d(y
1
, y
2
) para todo y
1
, y
2
B(y,
0
).
Demonstra cao. A condi cao (9.1) implica que a derivada Df e um isomorsmo
em todo ponto. Logo, dado qualquer x M existe
0
> 0 tal que f envia
9.1. LEMA DE DISTORC

AO 99
alguma vizinhanca V (x) de x difeomorcamente sobre a bola de raio
0
em
torno de y = f(x). Por compacidade, podemos tomar
0
independente de x.
Ent ao o n umero de pre-imagens de qualquer y M deve ser limitado. Alem
disso, o conjunto dos pontos que tem exatamente n pre-imagens e aberto, para
todo n 0. Portanto, por conexidade, o n umero de pre-imagens deve ser o
mesmo para todo y M. Finalmente, seja h = (f [ V (x))
1
. Pela condi cao
(9.1),
|Dh(z)| = |Df(h(z))
1
|
1
para todo z no domnio de h, e portanto h contrai distancias à taxa
1
como
enunciamos.
Transformacoes h como neste enunciado sao chamadas ramos inversos de f.
Mais geralmente, podemos denir ramos inversos h
n
de f
n
, n 1, da seguinte
maneira. Dado y M e x f
n
(y), sejam h
1
, . . . , h
n
ramos inversos de f com
h
j
(f
nj+1
(x)) = f
nj
(x)
para todo 1 j n. Como cada h
j
e uma contracao, a sua imagem esta contida
numa bola de raio menor que
0
em torno de f
nj
(x). Ent ao h
n
= h
n
h
1
esta bem denida na bola de raio
0
em torno de y.

E claro que f
n
h
n
= id e
h
n
(y) = x.
O pr oximo resultado fornece um bom controle da distorcao de iterados de f
e seus ramos inversos, que e crucial para a demonstra cao do teorema. Este e o
unico lugar onde se usa a hip otese de que o jacobiano e Holder.
Proposi cao 9.5 (lema de distorcao). Existe C
1
> 0 tal que, dado qualquer
n 1, qualquer y M, e qualquer ramo inverso h
n
: B(y,
0
) M de f
n
,
tem-se
[ det Dh
n
(y
1
)[
[ det Dh
n
(y
2
)[
exp(C
1
d(y
1
, y
2
)
) exp(C
1
(2
0
)
)
para todo y
1
, y
2
B(y,
0
).
Demonstra c ao. Escrevamos h
n
como composicao h
n
= h
n
h
1
de ramos
inversos de f. Tambem escrevemos h
i
= h
i
h
1
para 1 i < n, bem como
h
0
= id . Ent ao
log
[ det Dh
n
(y
1
)[
[ det Dh
n
(y
2
)[
=
n
i=1
log [ det Dh
i
(h
i1
(y
1
))[ log [ det Dh
i
(h
i1
(y
2
))[ .
Note que log [ det Dh
i
[ = log [ det Df[ h
i
e, por hip otese, log [ det Df[ is
(C
0
, )-Holder for some C
0
> 0. Alem disso, pelo Lema 9.4, cada h
j
e uma
1
-contra cao. Logo,
log
[ det Dh
n
(y
1
)[
[ det Dh
n
(y
2
)[

n
i=1
C
0
d(h
i
(y
1
), h
i
(y
2
))
i=1
C
0

i
d(y
1
, y
2
)
.
Portanto, para provar o lema basta tomar C
1
= C
0
i=1
i
.
100 CAP

OES EXPANSORAS
9.2 Medidas absolutamente contnuas
O pr oximo resultado, que e uma consequencia do lema de distor cao, mostra que
as imagens f
n
m tem densidades uniformemente limitadas:

Proposi cao 9.6. Existe C
2
> 0 tal que (f
n
m)(B) C
2
m(B) para todo con-
junto mensur avel B M e todo n 1.
Demonstra cao. Podemos, sem restricao, supor que B esta contido em alguma
bola B
0
= B(z,
0
) de raio
0
centrada em algum ponto z M. Usando a
Proposi cao 9.5 vemos que
m(h
n
(B))
m(h
n
(B
0
))
=
_
B
[ det Dh
n
[ dm
_
B0
[ det Dh
n
[ dm
exp(C
1
(2
0
)
)
m(B)
m(B
0
)
,
para todo ramo inverso h
n
de f
n
no ponto z. Alem disso, tambem temos que
(f
n
m)(B) = m(f
n
(B)) e a soma de m(h
n
(B)) sobre todos os ramos inversos,
e analogamente para B
0
. Deste modo, obtemos que
(f
n
m)(B)
(f
n
m)(B
0
)
exp(C
1
(2
0
)
)
m(B)
m(B
0
)
.
Claro que (f
n
m)(B
0
) (f
n
m)(M) = 1. Alem disso, a medida de Lebesgue das

bolas com um raio xado
0
esta limitada de zero por alguma constante
0
> 0
que so depende de
0
. Ent ao, para obter a conclus ao da proposi cao basta tomar
C
2
= exp(C
1
(2
0
)
)/
0
.
Tambem precisamos do seguinte resultado auxiliar:
Lema 9.7. Seja uma probabilidade num espa co metrico compacto X, e seja
: X [0, +) uma fun cao integr avel com respeito a . Seja
i
, i 1,
uma sequencia de probabilidades em X convergindo para uma probabilidade
na topologia fraca
. Se
i
para todo i 1 entao .
Demonstra c ao. Seja B um conjunto mensur avel qualquer. Para cada > 0,
seja K
um subconjunto compacto de B tal que (B K
) e ()(B K
)
sao ambos menores que . Ent ao seja A
uma vizinhan ca aberta de K
da
forma A
= z : d(z, K
) < r, com r > 0 sucientemente pequeno para que a

medida de A
seja menor que , tanto para como para . Mudando r

ligeiramente, caso necessario, podemos supor que o bordo de A
tem -medida
zero: ha no m aximo uma quantidade enumer avel de valores de r para os quais
isso nao acontece. Ent ao, = lim
i
implica (A
) = lim
i
(A
) ()(A
).
Fazendo 0 obtemos que (B) ()(B).
Aplicando este lema na nossa situacao, obtemos
Corolario 9.8. Todo ponto de acumula cao da sequencia n
1
n1
j=0
f
j
m e
uma probabilidade invariante para f absolutamente contnua com relacao à me-
dida de Lebesgue.
9.3. EXIST
ENCIA DE MEDIDAS ERG
ODICAS 101
Demonstra cao. Tomemos constante igual a C
2
e = m. Tomemos tambem
i
= n
1
i
ni1
j=0
f
j
m, para qualquer subsequencia (n

i
)
i
tal que (
i
)
i
converge
para uma medida . A Proposi cao 9.6 garante que
i
. Ent ao tambem
temos = C
2
m, pelo Lema 9.7. Isto implica que m, com densidade
limitada por C
2
.
9.3 Existencia de medidas ergodicas
Agora vamos mostrar que a medida que acabamos de construir e a unica prob-
abilidade invariante absolutamente contnua com relacao à medida de Lebesgue
e, alem disso, e ergodica para f.
Comecamos por xar uma parti cao T
0
= U
1
, . . . , U
s
de M em regioes com
interior n ao vazio e di ametro menor que
0
. Ent ao, para cada n 1, denimos
T
n
como sendo a particao de M que consiste das imagens de cada um dos U
i
,
1 i s, pelos respectivos ramos inversos de f
n
. O di ametro da parti cao T
n
,
ou seja, o supremo dos diametros dos seus elementos, e menor que
0
n
.
Lema 9.9. Seja T
n
, n 1, uma sequencia de parti coes num espa co metrico
compacto com diametros convergindo para zero quando n . Seja uma
probabilidade nesse espaco, e seja B qualquer conjunto mensur avel com (B) >
0. Entao existem V
n
T
n
, para n 1, tais que
(V
n
) > 0 e
(B V
n
)
(V
n
)
1 quando n .
Demonstra cao. Dado qualquer 0 < < (B), seja K
um subconjunto com-
pacto de B com (B K
) < . Como o di ametro das particoes converge para

zero, a medida da uni ao A
,n
de todos os elementos de T
n
que intersectam K
satisfaz (A
,n
K
) < para todo n sucientemente grande. Se tivessemos

(K
V
n
)
(B)
(B) +
(V
n
)
para todo V
n
T
n
que intersecta K
, deduziramos que
(K
)
(B)
(B) +
(A
,n
)
(B)
(B) +
((K
) +) (B) ,
o que e uma contradi cao. Portanto, deve existir algum V
n
T
n
tal que
(B V
n
) (K
V
n
) >
(B)
(B) +
(V
n
)
e isto implica (V
n
) > 0. Fazendo 0 obtemos a conclusao do lema.
Lembre que A M e um conjunto invariante para f : M M se f
1
(A) =
A. Mais geralmente, dizemos que A e positivamente invariante se f(A) = A.
Note que conjuntos invariantes sempre s ao positivamente invariantes, porque f
e sobrejetiva.
102 CAP

OES EXPANSORAS
Lema 9.10. Se A M um conjunto positivamente invariante para f com
medida de Lebesgue m(A) > 0, entao A tem medida de Lebesgue total em algum
U
i
T
0
, ou seja, existe 1 i s tal que m(U
i
A) = 0.
Demonstra cao. Pelo Lema 9.9, existe V
n
T
n
tal que
m(V
n
A)
m(V
n
)
converge para zero quando n . Seja U
i(n)
= f
n
(V
n
). Pela Proposi cao 9.5
aplicada ao ramo inverso de f
n
que envia U
i(n)
em V
n
, conclumos que
m(U
i(n)
A)
m(U
i(n)
)

m(f
n
(V
n
A))
m(f
n
(V
n
))
exp
_
C
1
(2
0
)
_
m(V
n
A)
m(V
n
)
tambem converge para zero. Como T
0
e nito, deve existir 1 i s tal que
i(n) = i para innitos valores de n. Logo, m(U
i
A) = 0.
Corolario 9.11. A transforma cao f : M M admite alguma probabilidade
invariante ergodica e absolutamente contnua com relacao à medida de Lebesgue.
Demonstra cao. Como consequencia do lema anterior, existem no m aximo #T
0
conjuntos invariantes com medida de Lebesgue positiva disjuntos dois-a-dois.
Portanto, M pode ser particionado num n umero nito de conjuntos invariantes
A
1
, . . . , A
s
, s #T
0
com medida de Lebesgue positiva e que sao minimais
no seguinte sentido de que nao existem subconjuntos invariantes B
i
A
i
com
0 < m(B
i
) < m(A
i
). Dada qualquer medida invariante absolutamente contnua
, existe algum i tal que (A
i
) > 0. Ent ao a restri cao normalizada
i
de a
A
i
,
i
(B) =
(B A
i
)
(A
i
)
e invariante e absolutamente contnua. Alem disso,
i
e ergodica, porque A
i
e
minimal.
9.4 Unicidade e conclusao da prova
O argumento anterior tambem mostra que existe apenas um n umero nito de
probabilidades erg odicas e absolutamente contnuas. O ultimo passo da demon-
stracao e mostrar que, de fato, tal probabilidade e unica. Para isso usamos o
fato de que f e topologicamente misturadora:
Lema 9.12. Dado qualquer aberto n ao vazio U M, existe N 1 tal que
f
N
(U) = M.
Demonstra cao. Seja x U e r > 0 tais que a bola de raio r centrada em
x esta contida em U. Dado qualquer n 1, suponha que f
n
(U) n ao cobre
toda a variedade. Entao existe alguma curva ligando f
n
(x) a um ponto
9.5. EXERC
ICIOS 103
y M f
n
(U), e essa curva pode ser tomada com comprimento menor que
diamM +1. Levantando pelo difeomorsmo local f
n
, obtemos uma curva
n
ligando x a um ponto y
n
M U. Ent ao r comp(
n
)
n
(diamM + 1).
Isto da uma cota superior para o valor possvel de n. Logo, f
n
(U) = M para
todo n sucientemente grande, como armamos.
Corolario 9.13. Se A M e um conjunto positivamente invariante com me-
dida de Lebesgue positiva, entao A tem medida de Lebesgue total na variedade
M.
Demonstra cao. Seja U o interior de um conjunto U
i
como no Lema 9.10, e
seja N 1 tal que f
N
(U) = M. Ent ao m(U A) = 0, e portanto M A =
f
N
(U) f
N
(A) f
N
(U A) tambem tem medida de Lebesgue zero.
O pr oximo enunciado completa a demonstra cao do Teorema 9.3:
Corolario 9.14. Seja qualquer probabilidade invariante absolutamente con-
tnua. Ent ao e erg odica e a sua bacia B() tem medida de Lebesgue total em
M. Alem disso, o suporte de e toda a variedade M.
Demonstra c ao. Se A e um subconjunto invariante qualquer ent ao, pelo corol ario
anterior, A tem medida de Lebesgue zero ou A
c
tem medida de Lebesgue zero.
Uma vez que e absolutamente contnua, segue que (A) = 0 ou (A
c
) = 0.
Isto prova que e ergodica. Ent ao B() e um conjunto invariante com medida
de Lebesgue positiva e, consequentemente, deve ter medida de Lebesgue to-
tal.Analogamente, como o suporte de e um conjunto compacto positivamente
invariante, ele tem que coincidir com M.
Observa cao 9.15.

E possvel mostrar que a derivada d/dm e Holder e lim-
itada de zero. Em particular, a probabilidade e equivalente ` a medida de
Lebesgue m, no sentido de que elas tem os mesmos conjuntos com medida nula.
A conclusao do Teorema 9.3 e falsa, em geral, se omitirmos a hip otese de que o
jacobiano e Holder.
9.5 Exerccios
104 CAP

OES EXPANSORAS
Captulo 10
Estados de Equilbrio
Estudaremos neste captulo uma classe especialmente importante de medidas
invariantes, a saber, os estados de equilbrio. A deni cao destas medidas, atraves
de um princpio variacional, tem uma forte motiva cao fsica e encontra aplica coes
em varias areas tais como teoria da dimensao de conjuntos invariantes, estudo de
recorrencias do sistema din amico, crescimento do n umero de pontos peri odicos,
uxos geodesicos, medidas fsicas, etc. Estaremos interessados em estudar que
hip oteses sao relevantes para que perguntas tais como a existencia, unicidade,
ergodicidade destas medidas, possam ter respostas positivas. Como veremos,
este estudo pode ser feito para uma ampla classe de difeomorsmos locais em
variedades compactas.
10.1 Deni cao de Estado de Equilbrio
Neste captulo consideraremos uma funcao f : X X denida em um espaco
metrico X e : X R uma fun cao contnua (que daqui por diante chamaremos
de potencial, invocando o termo fsico). O conjunto das medidas (de probabili-
dade) invariantes por f designaremos pela letra 1.
Denicao 10.1. Uma medida invariante
e dita um estado de equilbrio para

o potencial se
h
(f) +
_
d
= P(, f).
Ou seja:
e um maximo para a fun cao P = P() : 1 R denida por

P
() = h
(f) +
_
d.
Exemplo 10.2. Observe que os estados de equilbrio para o potencial = 0
sao aquelas medidas que maximizam a entropia. Como vimos no exemplo 7.7,
no caso do deslocamento completo com d smbolos 1, . . . , d, a unica medida que
maximiza a entropia e bem conhecida: e a medida de Bernoulli associada ao
vetor de probabilidade (
1
d
, . . . ,
1
d
).
105
106 CAP
ITULO 10. ESTADOS DE EQUIL
IBRIO
Exemplo 10.3. Ainda para a transforma cao deslocamentocom d smbolos,
xados n umeros a
1
, . . . , a
d
podemos considerar o potencial (x) = a
x0
que e
constante nos cilindros [0; i] de comprimento 1. Observe neste caso que a integral
_
d se escreve como
_
d =
d
i=1
([0; i])a
i
Assim, a funcao P numa medida de Bernoulli dada pelo vetor de probabilidades
(p
1
, . . . , p
d
) nada mais e que
d
i=1
p
i
log p
i
+p
i
a
i
. Logo, utilizando o exerccio
8.5 temos que entre todas as medidas de Bernoulli a que maximiza a P e a que
tem vetor de probabilidades p
j
=
e
a
j
d
i=1
e
a
i
.
Exemplo 10.4. Se f e uma transformacao expansora de classe C
2
em uma
variedade compacta M, como ja vimos no Teorema 8.18, a pressao da fun cao
(x) = log [ det Df(x)[ e P(, f) = 0. Alem disso, foi mostrado que se e a
medida SRB de f construda no captulo 9, ent ao e um estado de equilbrio
para j a que P
() = 0. Nao por acaso, essa medida e de certa forma a

medida invariante com maior dimensao possvel. N ao explicaremos o conceito
de dimensao, mas sugerimos que o leitor interessado consulte [Fal90].
Nosso pr oximo passo sera introduzir uma classe ampla de transformacoes
com a propriedade de que todo potencial contnuo admite algum estado de
equilbrio.
10.2 Transforma coes expansivas
Em linhas gerais, as transforma coes expansivas sao aquelas tais que duas orbitas
diferentes s ao distinguidas, em algum momento, de forma macrosc opica. Em
outras palavras, duas condi coes iniciais diferentes do sistema, mesmo aquelas
muito pr oximas, produzem efeitos a longo prazo que diferem por uma constante
xa. Veremos que essa propriedade das orbitas implica uma certa regularidade
da fun cao P e nos permitir a mostrar a existencia de estados de equilbrio para
potenciais contnuos. Denamos de modo preciso:
Denicao 10.5. Uma transforma cao f : M M e dita expansiva se existir
uma constante
0
(chamada constante de expansividade) tal que: dados x, y M
com x ,= y, ent ao existe n N tal que d(f
n
(x), f
n
(y))
0
.
Exemplo 10.6. Um primeiro exemplo de transforma cao expansiva e a trans-
forma cao
f : [0, 1] [0, 1], f(x) = 10x [10x]
onde [10x] representa o maior inteiro menor ou igual a 10x, vista na Secao 2.1.
Note que se dois pontos x, y [0, 1] sao distintos, ent ao em algum momento n,
10.2. TRANSFORMAC

OES EXPANSIVAS 107
o n-esimo dgito a
n
da expansao decimal de x difere do n-esimo dgito b
n
da
expansao decimal de y. Deste modo,
[f
n
(x) f
n
(y)[ >
[a
n
b
n
[
10
>
1
10
,
provando que f e expansiva com constante de expansividade
1
10
.
Exemplo 10.7. Inspirados no exemplo anterior, n ao e difcil concluir que o
deslocamento introduzido em 5.1.2 e uma transformacao expansiva no espaco
das sequencias. De fato, o mesmo argumento do exemplo anterior se aplica neste
caso: se a = (a
n
) e b = (b
n
) sao sequencias distintas, ent ao a
n
,= b
n
para algum
ndice n. Assim, d(
n
(a),
n
(b)) > 2
0
= 1 (lembre-se que a dist ancia no espa co
das sequencias e denida como em 5.1.2), onde podemos tomar a constante de
expansividade igual a 1.
Mais geralmente, os dois exemplos acima fazem parte da classe de trans-
forma coes que expandem distancias a uma taxa uniforme, estudadas no captulo
9. De fato, podemos mostrar o seguinte lema
Lema 10.8. Se f e expansora, ou seja, existe > 1 tal que
|Df(x)v| |v|
para todo x M e v T
x
M, entao f e expansiva.
Demonstra cao. Pelo lema 9.4, existe
0
> 0 tal que, para qualquer pre-imagem
x de um ponto y M, existe uma aplica cao h : B(y,
0
) M de classe C
1
tal
que f h = id , h(y) = x e
d(h(y
1
), h(y
2
))
1
d(y
1
, y
2
) para todo y
1
, y
2
B(y,
0
).
Assim, se d(f
n
(x), f
n
(y)) para todo n 0, conclumos que d(x, y)
n
d(f
n
(x), f
n
(y))
n
, o que implica imediatamente que x = y.
Para ilustrar a propriedade de expansividade, vamos provar uma proposi cao
conectando o crescimento do n umero de pontos peri odicos de f com a sua en-
tropia topol ogica. Denotaremos o conjunto Per(n) = x M; f
n
(x) = x.
Ent ao:
Proposi cao 10.9. Se f e expansiva entao
limsup
1
n
log #Per(n) h
top
(f).
Demonstra cao. Seja uma cobertura de M de di ametro menor que constante
de expansividade de f. Observe que em um elemento de
n
so pode existir
no maximo um ponto de Per(n): de fato, se x, y Per(n) estao no mesmo
elemento de
n
, ent ao d(f
i
(x), f
i
(y) < para i = 0, . . . , n1. Como f
n
(x) = x
108 CAP
IBRIO
e f
n
(y) = y, a desigualdade d(f
i
(x), f
i
(y) < vale para todo i N. Logo, pela
expansividade de f, x = y. Assim,
limsup
1
n
log #Per(n) limsup
1
n
log #N(
n
) = h
top
(f, ).
Tomando o limite quando o di ametro de vai a zero, temos a desigualdade
requerida.
Nao e difcil obter transformacoes que nao satisfazem a propriedade de ex-
pansividade. Por exemplo, uma isometria da variedade nunca satisfaz a condicao
de expansividade. Se a transformacao admitir um ponto xo do tipo sela, ent ao
(pelo Teorema da Variedade Estavel) a transformacao tambem nao e expansiva.
Iremos agora tratar as transformacoes expansivas do ponto de vista ergodico.
Mais precisamente, mostraremos o seguinte teorema:
Teorema 10.10. Seja f : M M uma transforma cao expansiva denida
na variedade compacta M e seja C
0
(M) o conjunto das fun coes : M R
contnuas. Dado qualquer C
0
(M) existe algum estado de equilbrio para .
Para o conforto do leitor iremos dividir a demonstra cao do teorema anterior
em um conjunto de lemas. O primeiro deles diz que se T e uma parti cao com
di ametro menor que a constante de expansividade e e uma medida, entao T
e necessariamente uma particao geradora.
Lema 10.11. Seja T = P
1
, . . . , P
k
uma parti cao tal que para todo i = 1, . . . , k
vale diamP
i
. Entao, T e geradora com respeito a qualquer medida invariante
.
Demonstra cao. Dena
T
(n)
= C
(n)
= P
i0
f
n+1
(P
in1
), para cada n 1.
Nos precisamos mostrar que dado um conjunto mensur avel A e > 0, existem
borelianos C
(n)
1
, . . . , C
(n)
m
of T
(n)
tal que
(
_
C
(n)
i
A) .
Primeiramente, observe que se P
n
(x) denota o elemento da parti cao T
n
que
contem x, ent ao lim
n
diamP
n
(x) = 0. De fato, se existe uma sequencia de
pontos y
n
P
n
(x) tais que d(y
n
, x) > > 0, por compacidade de M, existe o
limite y = lim
n+
y
n
(passando a uma subsequencia se necessario). Assim,
temos por um lado que d(y, x) > > 0 e por outro que y P
n
(x) para todo
n, o que implica que d(f
n
(y), f
n
(x)) < , o que contradiz a hip otese de f ser
expansiva.
Considere ent ao K
1
A e K
2
A
c
compactos tais que (K
1
A) e
(K
2
A
c
) . Seja r = d(K
1
, K
2
) > 0. Temos que se n e sucientemente
10.2. TRANSFORMAC

OES EXPANSIVAS 109
grande diamT
(n)
(x)
r
2
, para todo x M. Considere C
(n)
1
, . . . , C
(n)
m
T
(n)
aqueles que intersectam K
1
. Ent ao
(
_
C
(n)
i
A) = (
_
C
(n)
i
A) +(A
_
C
(n)
i
)
(A K
1
) +(A
c
K
2
) 2.
O que prova o lema.
Observa cao 10.12. Relembrando a deni cao de entropia com respeito a uma
parti cao Q,
H
(Q) =
QQ
(Q) log (Q),
temos que se Qe tal que
0
(Q) = 0, para cada Q Q e uma medida
0
xada,
ent ao a fun cao H
(Q) e contnua em
0
. Isso implica diretamente que
h
(f, T) = inf
n
1
n
H
(T
(n)
).
e semi-contnua superiormente em
0
.
Como consequencia do lema 10.11 e da observa cao 10.12 podemos obter o
seguinte lema:
Lema 10.13. Dado C
0
(M), a fun cao P = P
() = h
(f) +
_
d e
semicontnua superiormente.
Demonstra cao. Como a fun cao
_
d e contnua (logo semicontnua su-
periormente), basta mostrar que a transformacao H denida por H() =
h
(f) e semicontnua superiormente. Para tanto, xe uma medida

0
e escolha
uma parti cao T = P
1
, . . . , P
k
tal que
0
(P
i
) = 0 para todo i = 1, . . . , k e
diamP
i
< , para todo i = 1, . . . , k. Por um lado, o Lema 10.11 nos garante que
T e uma parti cao geradora para toda medida e como consequencia do teorema
de Kolmogorov-Sinai, vale h
(f) = h
(f, T). Por outro lado, a observa cao 10.12

garante que a fun cao h
(f, T) e semicontnua superiormente em

0
. Logo,
H e semicontnua superiormente em
0
.
Para provar o Teorema 10.10, basta unirmos os resultados que obtivemos:
Prova do Teorema 10.10. Pelo lema anterior, dada contnua, a fun cao P e
semicontnua superiormente. Como vimos no Captulo 3, /
1
(M) e compacto,
logo P admite um maximo, o qual e por deni cao um estado de equilbrio para
.
Observa cao 10.14. Podemos selecionar um conjunto residual (interseccao enu-
meravel de conjuntos abertos e densos) C
0
(M) tal que se entao o
estado de equilbrio para e unico.
110 CAP
IBRIO
Uma pergunta que surge naturalmente e se existe estado de equilbrio espe-
cial, ou ate mesmo sob que condicoes para garantem que admite um unico
estado de equilbrio. Claramente precisamos supor que o sistema f : M M
seja indecomponvel no sentido ergodico pois, caso contr ario, poderamos sim-
plesmente construir contra-exemplos da seguinte forma: tomando duas c opias
da variedade M, digamos M
1
e M
2
, disjuntas e consideraramos

f :

M

M
atuando na uni ao

M = M
1
M
2
como sendo f em cada componente M
i
. Neste
caso, um estado de equilbrio para f : M M produz uma innidade de esta-
dos de equilbrio para

f, via combina cao convexa dos estados de equilbrio em
M
1
e M
2
. O que falta a f e a condi cao de transitividade. O grande teorema do
pr oximo captulo dir a que se f e expansora e M e uma variedade compacta e
conexa (neste caso f e transitiva), ent ao todo potencial H older contnuo admite
um unico estado de equilbrio.
10.3 Transforma coes expansoras
Nesta subsecao, generalizaremos a construcao feita no Captulo 9 num contexto
mais abstrato e com alguns novos ingredientes. Porem, a essencia das ideias e
a mesma e tentaremos tracar um parelelo entre os conceitos e teoremas demon-
strados aqui com os do Captulo 9, ressaltando suas semelhan cas.
10.3.1 O operador de transferencia
Fixados f e phi, deniremos agora um operador que desempenhar a um impor-
tante papel na nossa construcao.
Denicao 10.15. O operador de Ruelle-Perron-Frobenius ou operador de trans-
ferencia e o operador L
: C
0
(M) C
0
(M) denido no espaco C
0
(M) das
fun coes contnuas g : M R por
L
g(x) =
f(y)=x
e
(y)
g(y).
O seu dual L
e o operador L
: / /denido no espaco /das medidas

nitas de M, do seguinte modo: para toda fun cao contnua g : M R
_
gd L
=
_
L
g d.
Algumas propriedades importantes de L
e do seu dual s ao dadas na proposi cao

abaixo:
Proposi cao 10.16. Valem as seguintes propriedades:
1. L
e um operador linear contnuo |L
| Ce
, onde C nao depende de

.
10.3. TRANSFORMAC

OES EXPANSORAS 111
2. L
e positivo: se g(x) 0 para todo x M, entao L
g(x) 0 para todo

x M;
3. L
admite alguma auto-medida com (M) = 1

Demonstra cao. Os items 1 e 2 sao imediatos a partir da deni cao de L
e deix-
amos as vericacoes para o leitor. Para mostrar o item 3 usaremos o Teorema
de Tychono-Schauder para pontos xos que arma o seguinte: uma fun cao
contnua denida num espa co compacto e convexo admite necessariamente um
ponto xo. Claramente /
1
o espaco das medidas de probabilidade em M e
convexo, pois a combina cao de duas medidas de probabilidade tambem e uma
medida de probabilidade. Como foi provado na Se cao 3.2, temos que /
1
e
compacto. Logo, se denimos a fun cao contnua G : /
1
/
1
por:
G() =
L
()
_
L
1 d
,
existe /
1
tal que G() = , o que implica que L
= , onde =
_
L
1 d.
As auto-medidas para o dual do operador de transferencia sao chamadas
medidas conformes. Por exemplo, a medida de Lebesgue e uma medida conforme
para o potencial = log [ det Df|, como o leitor pode vericar empregando
diretamente a formula de mudan ca de variaveis. Em geral, as medidas nao sao
invariantes pela transforma cao f.
Denicao 10.17. O jacobiano de uma medida com respeito a f (quando
existe) e uma fun cao J
f tal que se A e um boreliano tal que f[

A
e injetiva,
ent ao:
(f(A)) =
_
A
J
f d.
Nem sempre o jacobiano de uma medida invariante existe. Quando cada
ponto de M admite somente um n umero nito de pre-imagens por f, ent ao
J
f existe para toda medida invariante. Neste caso, o jacobiano e unicamente

denido, exceto talvez por um conjunto de medida zero. Podemos mostrar,
aplicando sucessivas vezes a denicao do jacobiano, que se f
n
[
A
e injetiva, ent ao
J
f
n
(x) =
n1
i=0
J
f(f
i
(x)).
Deixaremos isso como exerccio para o leitor (veja 10.4
Uma das importantes propriedades das medidas conformes e o fato de que
seu jacobiano e bem determinado pela fun cao e que vale a f ormula de mudan ca
de vari aveis:
Lema 10.18. Se L
= , entao
1. O jacobiano de com respeito a f e dado por J
f(x) = e
(x)
.
112 CAP
IBRIO
2. Se u C
0
(M) entao
_
u f d =
_

f(y)=x
(J
f(y))
1
u(x) d(x).
Demonstra cao. Comecaremos mostrado a f ormula de mudan ca de variaveis do
item 2. Ora,
_
u f d =
1
_
u f dL
() =
1
_
L
(u f) d.
Por outro lado, L
(u f) =

f(y)=x
(e
(y)
u(x), de onde:
_
u f d =
_

f(y)=x
1
e
(y)
u(x) d(x) =
_

f(y)=x
(J
f(y))
1
u(x)d(x)).
Para mostrar o item 1, considere um conjunto mensur avel A tal que f[
A
e
injetiva. Tome uma sequencia g
n
C
0
(M) tal que g
n

A
em -q.t.p. e
sup [g
n
[ 2 para todo n. Ent ao,
L
(e
g
n
)(x) =
f(y)=x
e
(y)
e
(y)
g
n
(y) =
f(y)=x
g
n
(y).
Observe que a ultima expressao converge para
f(A)
(x) em -quase todo ponto.
Assim, pelo Teorema da Convergencia Dominada,
_
e
g
n
d =
_
e
g
n
d(L
) =
_
L
(e
g
n
) d (f(A)).
Como o lado esquedo tambem converge para
_
A
e
d, concluimos que
(f(A)) =
_
A
e
d,
terminando a prova do lema.
Lembre-se que B
(n, x) denota a bola din amica de raio e tamanho n cen-

trada em x, como denida em 7.19 e S
n
(x) = (x) + +(f
n1
(x)).
Enunciaremos agora o principal teorema deste captulo, devido a Ruelle ([]),
generalizando o teorema 9.3 do Captulo 9:
Teorema 10.19. Seja f : M M uma transforma cao expansora numa var-
iedade compacta conexa M e : M R um potencial -Holder, para algum
> 0. Entao, se denota uma medida conforme para , entao
1. Existe uma unica probabilidade invariante
absolutamente contnua com

respeito ` a ;
10.3. TRANSFORMAC

OES EXPANSORAS 113
2.
e o unico estado de equilbrio para (f, );

3. Alem disso, e erg odica, o seu suporte coincide com M e vale a condi cao
de Gibbs: Existe K > 0 tal que para todo x M
K
1
(B
(n, x))
e
Sn(x)nP()
K. (10.1)
Antes de iniciarmos a prova do Teorema 10.19 vamos fazer alguns comentarios
a respeito de sua relacao com Teorema 9.3.
A primeira observa cao e que o Teorema 9.3 e uma caso particular do Teo-
rema 10.19, tomando-se = log [ det Df|. Neste caso, a pressao de e igual
a zero. Uma segunda observa cao e que a medida conforme , obtida como na
proposi cao 10.16,desempenha aqui o mesmo papel que a medida de Lebesgue
desempenha no Teorema 9.3.
Apesar disso, nosso conhecimento à priori da medida e mnimo, se re-
sumindo ao seu jacobiano e a f ormula de mudan ca de variaveis, obtidos no
Lema 10.18. Observe tambem que a conexidade do domnio M e um ingre-
diente indispens avel para mostrar a unicidade de
. Alem disso, seguir a da

prova do Teorema que a medida conforme e unica, m odulo multiplica cao por
uma fun cao.
O trabalho para mostrar o Teorema 10.19 seguir a o seguinte roteiro:
Fixada uma medida conforme associada a um auto-valor de L
,
mostraremos que existe uma funcao contnua h tal que L
h = h e alem
disso, h(x) > 0, para todo x M;
Mostraremos que satisfaz a equa cao 10.1 com a constante P = log ;
Construiremos
= h e mostraremos que
e invariante, satisfaz a
equa cao 10.1 e que
e o unico estado de equilbrio para absolutamente

contnu com respeito à .
Finalmente, mostraremos que qualquer estado de equilbrio para e ab-
solutamente contnuo com respeito à .
Uma vez explicada a nossa linha geral de a cao, vamos comecar a construir os
alicerces para a prova do Teorema. A pr oxima proposicao e fundamental para
nossa construcao e e o analogo do Lema de distor cao ( prop. 9.5), substituindo-
se o jacobiano com respeito ` a medida de Lebesgue pelo jacobiano da medida
.
Proposi cao 10.20. Existe uma constante A tal que para todos x, y M tais
que d(f
n
(x), f
n
(y)) < , entao
Ad(f
n
(x), f
n
(y))
|S
n
(x) S
n
(y)| Ad(f
n
(x), f
n
(y))
.
Demonstra c ao. Observe que como d(f
n
(x), f
n
(y)) < , segue-se pelo Lema 9.4
que
114 CAP
IBRIO
d(f
ni
(x), f
ni
(y)) <
i
d(f
n
(x), f
n
(y)). (10.2)
Logo,
|S
n
(y) S
n
(x)|
n1
i=0
|(f
i
(x)) (f
i
(y))|
n1
i=0
i
d(f
n
(x), f
n
(y))
Ad(f
n
(x), f
n
(y))
onde A e escolhido sucientemente grande.

Como uma consequencia direta da proposi cao acima, podemos mostrar que:
Corolario 10.21. Existe uma constante K tal que para todos x, y M tais que
d(f
n
(x), f
n
(y)) < , entao
K
1
2

J
f
n
(x)
J
f
n
(y)
K
2
.
Demonstra c ao. Como J
f(x) =
1
e
(x)
, segue-se diretamente da denicao que
J
f
n
(x) =
n
e
Sn(x)
.
Como d(f
n
(x), f
n
(y)) < , segue-se pelo Proposicao 10.20 que
J
f
n
(x)
J
f
n
(y)
= e
Sn(y)Sn(x)
e
Ad(f
n
(x),f
n
(y))
,
Assim, nos so precisamos escolher K = e
AD
, onde D =
.
Tendo em maos esses resultados, mostraremos agora a propriedade de Gibbs
para a medida conforme.
Lema 10.22. Se e uma medida satisfazendo a equa cao L
= e e
pequeno, entao tomando P = log e x pertence ao suporte de existe algum
n umero K > 0, dependendo somente de , tal que vale:
K
1
(B
(n, x))
e
Sn(x)nP
K.
Demonstra cao. De fato, como f
n
[
cB(n,x)
e injetiva e J
f(x) =
1
e
(x)
, temos
que J
f
n
=
n
e
Sn(x)
, onde
(f
n
(B
(n, x)) =
_
B(n,x)
J
f
n
(y)d(y).
10.3. TRANSFORMAC

OES EXPANSORAS 115
De acordo com a Proposi cao 2.3, o valor de J
f
n
num ponto qualquer y
B
(n, x) difere do valor de J
f
n
em x pela multiplica cao por uma constante K,
que n ao depende de x ou n. Logo:
K
1
2
(f
n
(B
(n, x)) J
f
n
(x)(B
(n, x)) K
2
(f
n
(B
(n, x)).
Para concluir, como qualquer ramo inverso de f e uma contracao, de acordo
com o que foi provado no lema 9.4, temos que f
n
(B
(n, x)) = f(B
(f
n1
(x)).
Assim, como f e um difeomorsmo local, podemos escolher independente de
n ou x sucientemente pequeno de modo que B
(f
n
(x)) f
n
(B
(n, x)). Deix-

amos para o leitor a prova do seguinte fato (exerccio 10.6): Dado > 0, existe
a > 0 tal que (B
(x)) > a > 0 para todo x no suporte de . Assim, tomando

K = supK
2
a, K
2
, P = log e observando que (J
f
n
(x))
1
= e
Sn(x)nP
temos que
K
1
(B
(n, x))
e
Sn(x)nP
K,
como queriamos provar.
Lema 10.23. Existe uma constante K > 0 such
L
n
(x
1
)
L
n
(x
2
)
1
Kd(x
1
, x
2
)
para todos x
1
e x
2
com d(x
1
, x
2
) < . Em particular, existe A tal que para todos
x, y M :
L
n
(x)
L
n
(y)
A.
Demonstra c ao. Fixada uma pre-imagem y
1
de x
1
por f
n
, como d(x
1
, x
2
) <
ent ao temos que x
2
tem uma unica pre-imagem por f
n
na mesma bola din amica
de comprimento n+1 e raio , que iremos denotar por y
2
. Pela proposi cao 10.20,
existe uma constante uniforme K tal que
Ae
d(x1,x2)
[e
Sn(y1)Sn(y2)
[ Ae
d(x1,x2)
Ent ao,
e
Ad(x1,x2)
L
n
(x
1
)
L
n
(x
2
)
=
f
n
(y1)=x1
e
Sn(y1)
f
n
(y2)=x2
e
Sn(y2)
e
Ad(x1,x2)
Agora e suciente observar que para todo x

1
e x
2
,
[e
Ad(x1,x2)
1[ Kd(x
1
, x
2
)
se K e escolhido sucientemente grande com respeito à A. O resto do lema e

imediato, cobrindo M por um n umero k de bolas de raio .
116 CAP
IBRIO
Para mostrar que L
admite alguma auto-fun cao, mostraremos que a sequencia

de fun coes
i
L
i
1 forma uma sequencia limitada e equicontnua. Isso sera o

trabalho dos dois pr oximos lemas:
Lema 10.24. A sequencia de fun coes
n
L
n
1 e limitada. Alem disso, existe

c > 0 tal que
n
L
n
1(x) > c > 0, para todo x M.

Demonstra cao. Observe que
_

n
L
n
1 d = 1. Logo, existem pontos z

n
e y
n
tais que
n
L
n
1(z
n
) 1 e
n
L
n
1(y
n
) 1. De acordo com o Lema 10.23,
temos que para todo x M vale:
n
L
n
(x) AL
n
(z
n
) A
e
1
A

1
A
n
L
n
(y
n
) L
n
(x),
o que termina a prova do Lema.
Lema 10.25. A sequencia
n
L
n
1 e equicontnua.
Demonstra cao. Para mostrar que sequencia de fun coes
n
L
n
1 e equicontnua,
observe que para todos x, y com d(x, y) < , pelo Lema 10.23:
|
n
L
n
1(x)
n
L
n
1(y)|
|
n
L
n
1(x)|
Kd(x, y)
ou seja,
|
n
L
n
1(x)
n
L
n
1(y)| K|
n
L
n
1(x)|d(x, y)
.
Pelo lema 10.24, a sequencia de fun coes
n
L
n
1 e limitada uniformemente em
M. Utilizando esse fato na equacao acima, acabamos a prova do Lema 10.25
Baseado nas informa coes obtidas sobre a sequencia de fun coes
n
L
n
1,
vamos agora mostrar que existe alguma auto-funcao h para o operador L.
Primeiramente, observe que pelos lemas 10.24 e 10.25 a sequencia
n
L
n
1 e
limitada e equicontnua. Naturalmente, isso implica que a media dessas fun coes
h
n
=
1
n
n1
i=0
i
L
i
1,
ainda e uma sequencia limitada e equicontnua. Como M e compacto, pelo
Teorema de Ascoli-Arzela, segue-se que a sequencia h
n
possui uma subsequencia
h
ni
convergindo uniformemente para uma certa fun cao contnua h. Mostraremos
que esta funcao h e que h e de fato uma auto-fun cao de L
.
10.3. TRANSFORMAC

OES EXPANSORAS 117
Ora, se h
ni
h para uma certa subsequencia n
i
ent ao, como L
e
contnua
L
h = lim
ni
L
h
ni
= lim
ni
1
n
i
ni1
k=0
k
L
k+1
1 =
= lim
ni
n
i
n
k
1
k=0
(k+1)
L
k+1
1 = lim
ni
n
n1
k=0
(k)
L
k
1
1
ni
L
ni
1
n
i
.
Como
ni
L
ni
1 e uma sequencia limitada, de acordo com o Lema 10.24, o
segundo termo da ultima igualdade acima vai para zero e o primeiro converge
para h, provando que L
h = h.
Observe ainda que, utilizando o fato que e uma medida conforme, que
_

ni
L
ni
1 d = 1, para todo n N. Deste modo, segue-se diretamente que
_
h
n
d = 1 e como hlimh
ni
, tomando o limite mostramos que
_
hd = 1.
Resumindo, mostramos que:
Proposi cao 10.26. Existe alguma fun cao contnua h : M R tal que:
1. L
h = h;
2. h > 0;
3.
_
hd = 1.
Como a fun cao h e contnua e n ao-negativa, podemos denir uma medida
por
(A) =
_
A
hd.
Da Proposi cao 10.26 vem que e uma medida de probabilidade, uma vez que
(M) =
_
hd = 1. Observe tambem que como existe c > 0 tal que 1/c h c,
temos que para todo boreliano A M, vale
c
1
(A) (A) (A)c. (10.3)
Alem disso, a medida e invariante, como veremos no:
Lema 10.27. Sejam tal que L
= e h uma fun cao nao-negativa sat-

isfazendo L
h = h. Denindo por = h, entao temos que e uma

probabilidade f-invariante. Alem disso, existe K tal que para todo x M e
n N vale:
K
1
(B
(n, x))
e
Sn(x)nP
K, (10.4)
Demonstra cao. Para mostrar que e f invariante, de acordo com a Proposi cao ??
basta mostramos que para toda fun cao contnua g : M R vale:
_
g f d =
_
g d.
118 CAP
IBRIO
Primeiro, observe que L
(g fh)(x) = g(x)L
h. Assim,
_
g f d =
_
g fhd =
1
_
g fhdL
() =
1
_
L
(g fh) d =
1
_
gL
hd =
_
ghd =
_
g d.
A equa cao 10.4 vem diretamente da equacao 10.3.
Vamos agora utilizar a equa cao 10.4 para calcular o valor de h
(f) +
_
d.
Corolario 10.28. Se = h construida anteriormente, ent ao
h
(f) +
_
d = P.
Demonstra cao. O Teorema de Brin-Katok arma que a fun cao h dada por
H(x) = lim
0
lim
n
1
n
log (B
(n, x)),
esta bem denida para quase todo x M, e -integr avel e vale:
h
(f) =
_
H d.
Observe que a equa cao 10.4 fornece que H(x) = lim
n
1
n
S
n
(x) +P. Sub-
stituindo acima, vem que:
h
(f) =
_
lim
n
1
n
S
n
d +P.
Logo, usando o Teorema de Birkho
h
(f) =
_
lim
n
1
n
S
n
d +P =
_
d +P,
como era nosso intuito inicial.
Para completar a prova do Teorema 10.19 resta-nos duas tarefas. A primeira
delas e mostrar que de fato o n umero P na equacao 10.4 e igual ` a P(),
mostrando que e um estado de equilbrio e de Gibbs. Outra tarefa refere-
se à mostrar que e unico. Faremos isso no seguinte lema :
Lema 10.29. Seja tal que existe e h com L
= e L
h = h. Entao
= e
P()
.
Na proposi cao a seguir utilizaremos o seguinte lema de c alculo:
Lema 10.30. Sejam p
i
, x
i
(i = 1, 2, . . . , n) n umeros reais tais que p
i
> 0, x
i
> 0,
e

n
i=1
p
i
= 1. Entao

n
i=1
p
i
log x
i
log(
n
i=1
p
i
x
i
) e a igualdade acontece
se, e s o se, os n umeros x
i
s ao iguais.
10.3. TRANSFORMAC

OES EXPANSORAS 119
Deixaremos como exerccio para o leitor (exerccio ??) a prova deste fato.
Proposi cao 10.31. Vale o seguinte:
1. P = P(f, );
2. Se e um estado de equilbrio para , entao L
(h
1
) = h
1
.
Demonstra c ao. Dena g : M (0, ) por
g(x) =
1
e
(x)
h(x)
h(f(x))
,
e seja g
= (J
f)
1
. Observe que:
f(y)=x
g(y) =
f(y)=x
e
(y)
h(y)
h(x)
=
L
h(x)
h(x)
= 1 (10.5)
Vamos mostrar que g = g
para -quase todo ponto. Primeiramente, usando

a deni cao de g segue que h
(f) +
_
g d 0, pois:
h
(f) +
_
log gd = h
(f) log +
_
( + log h log h f) d 0.
Usaremos agora o fato que h
(f) =
_
log J
f d. O roteiro para a prova

desse fato esta no exerccio ??. Combinando a f ormula anterior para a entropia
de com a desigualdade acima:
0
_
log
g
g
d =
_

f(y)=x
g
(y) log
g(y)
g
(y)
d,
onde a segunda igualdade segue do fato que g
= 1/J
f. De acordo com a
equa cao (10.5), a primeira arma cao do Lema 10.30 nos d a:
0
f(y)=x
g
(y) log
g(y)
g
(y)
log
_

f(y)=x
g
(y)
g(y)
g
(y)
_
= log
_

f(y)=x
g(y)
_
= 0
em -quase todo ponto. Uma vez em que a expressao na esquerda e nao-negativa,
segue-se a igualdade. Assim, temos que h
(f) +
_
d log = 0, o que implica
log = P(f, )
Para mostrar que g = g
, observe que pela segunda arma cao no Lema 10.30

os valores de log g(y)/g
(y) sao os mesmos para todos y f

1
(x). Em outras
palavras, para -quase todo x M existe um n umero c(x) tal que
g(y)
g
(y)
= c(x) para todo y f
1
(x).
A hip otese de ser invariante implica que
f(y)=x
g
(x) = 1
120 CAP
IBRIO
para -quase todo x M. Combinando isso com (10.5), conclumos que
c(x) =
f(y)=x
g(y)
f(y)=x
g
(y)
= 1.
Finalmente, vamos mostrar que L
(h
1
) = h
1
. Dada uma fun cao
contnua
_
d(L
h
1
) =
_
(L
)(x)h(x)
1
d(x) =
_

f(y)=x
e
(y)
h(f(y))
1
(y) d(x).
usando a deni cao de g e , temos que
e
(y)
h(f(y))
1
= g(y)h(y)
1
= g
(y)h(y)
1
.
Substituindo na f ormula anterior,
_
d(L
(h
1
)) =
_
_
log
f(y)=x
g
(y)(y)h(y)
1
_
d(x) =
_
h
1
d.
Uma vez que e arbitr ario, temos que L
(h
1
) = (h
1
), como armamos.
O lema a seguir mostra que duas medidas conformes sao necessariamente
equivalentes:
Lema 10.32. Sejam
1
e
2
tais que L
i
=
i
, para i = 1, 2. Entao
1
e
2
s ao equivalentes.
Demonstra cao. Pela equa cao 10.1, dado x M e n N, temos que
A
1
2
(B
(n, x))
1
(B
(n, x)) A
2
(B
(n, x)).
Como a sequencia de coberturas
U
n
= U; U e bola din amica de raio e comprimento n

tem di ametro decrescendo ` a zero, U
n
e geradora. Deste modo, aproximando

por bolas din amicas, podemos estender a equa cao anterior para todo boreliano
A de M. Isso mostra que
1
e
2
sao equivalentes.
Observando o que ja mostramos no Lema 10.27, o Corol ario 10.28 e a
Proposi cao 10.31, para nalizar a prova do Teorema 10.19, basta mostrar que
se e um estado de equilbrio, ent ao = , construido como no Lema 10.27.
Prova do Teorema 10.19. Suponha que e um estado de equilbrio erg odico
de e seja a medida construda como no Lema 10.27. De acordo com
a Proposi cao 10.31, denotando
= h
1
, temos que L
. Pelo
10.4. EXERC
ICIOS 121
Lema 10.32
e sao equivalentes, o que implica que e tambem sao

equivalentes: = , para alguma fun cao -integrable . Desde que e
sao invariantes,
= f
= ( f)f
= ( f).
Como a derivada de Radon-Nikodym essencialmente unica, temos que = f
em -quase todo ponto. Observando que e ergodica, segue-se que e constante.
Usando que 1 = (M) =
_
d = c
_
d = c, n os temos que = . Observe que
isso termina a prova, desde que qualquer componente erg odica de um estado de
equilbrio tambem e um estado de equilbrio.
10.4 Exerccios
10.1. Seja uma medida em M. Dado > 0, mostre que existe a > 0 tal que
(B
(x)) > a > 0 para todo x no suporte de .

10.2. Seja f : M M uma transformacao expansora e M uma variedade
conexa. Mostre que se uma
10.3. Seja f : M M uma transformacao tal que cada ponto admite somente
um n umero nito de pre-imagens. Mostre que J
f existe para toda medida

invariante .
10.4. Seja uma medida e J
f seu jacobiano. Mostre que se f

n
[
A
e injetiva,
ent ao
J
f
n
(x) =
n1
i=0
J
f(f
i
(x)).
10.5. Seja f uma transformacao expansora e uma medida invariante. Mostre
que para -quase todo x existe n
0
= n
0
(x) e K = K(x) tais que se n > n
0
ent ao
K
1
< J
f
n
(x)(B
(n, x)) < K.

10.6. (F ormula de Rokhlin) Seja f uma transformacao expansora e uma
medida invariante. Mostre que:
h
(f) =
_
log J
f d.
Dica: Use o exerccio 10.5 e o Teorema de Brin-Katok.
122 CAP
IBRIO
Captulo 11
Aplica c oes em Teoria dos
N umeros
Neste captulo apresentamos duas aplicacoes da Teoria Erg odica no domnio
da Teoria dos N umeros: o Teorema de S. Szemeredi [Sze75] sobre existencia
de progressoes aritmeticas dentro de subconjuntos sucientemente densos do
conjunto Z dos n umeros inteiros, e o teorema de H. Weyl [Wey16] sobre equidis-
tribui cao da parte fracion aria dos valores de fun coes polinomiais restritas a Z.
11.1 Teorema de Szemeredi
A nossa apresenta cao e inspirada por Furstenberg [Fur81], onde o leitor pode
encontrar muita informa cao adicional sobre este tema.
11.1.1 Densidade superior
Chamamos intervalo do conjunto Z dos n umeros inteiros qualquer subconjunto
I da forma n Z : a n < b, para quaisquer a b em Z. O seu cardinal e
#I = b a.
Denicao 11.1. A densidade superior D
s
(S) de um subconjunto S de Z e
D
s
(S) = limsup
#I
#(S I)
#I
onde I representa qualquer intervalo em Z. Do mesmo modo se dene a densi-
dade inferior D
i
(S), trocando limite superior por limite inferior.
Em outras palavras, D
s
(I) e o maior n umero D tal que existe uma sequencia
de intervalos I
j
Z tais que
#I
j
e
#(S I
j
)
#I
j
D
123
124 CAP
ITULO 11. APLICAC

OES EM TEORIA DOS N
UMEROS
e D
i
(S) e o menor n umero nessas condi coes. Note que 0 D
i
(S) D
s
(S) 1.
No Exerccio 11.1 tambem veremos que D
i
(S) = D
s
(Z S) para todo S Z.
Exemplo 11.2. Seja S o conjunto dos n umeros pares. Dado qualquer intervalo
I Z, temos que #(S I) = #I/2 se o cardinal de I e par e #(S I) =
#(I 1)/2 se o cardinal de I e mpar, onde o sinal e positivo se o menor
elemento de I e um n umero par, e e negativo caso contr ario. Desta observa cao
segue, imediatamente, que D
s
(S) = D
i
(S) = 1/2.
Exemplo 11.3. Seja S o seguinte subconjunto de Z:
1, 3, 4, 7, 8, 9, 13, 14, 15, 16, 21, 22, 23, 24, 25, 31, 32, 33, 34, 35, 36, 42, . . ..
Isto e, para cada k 1 inclumos em S um bloco de k inteiros consecutivos e
omitimos os k inteiros seguintes. Este conjunto contem intervalos com compri-
mento arbitrariamente grande. Portanto D
s
(S) = 1. Por outro lado, o com-
plementar de S tambem contem intervalos com comprimento arbitrariamente
grande. Portanto, D
i
(S) = 1 D
s
(Z S) = 0.
Exemplo 11.4. Seja S o seguinte subconjunto de Z:
1, 3, 4, 5, 6,9, 10, 11, 12, 14, 15, 16, 17, 18,
22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 42, . . ..
Ou seja, para cada k 1 inclumos em S um bloco de k
2
inteiros consecutivos
e depois exclumos os k inteiros seguintes. Neste caso temos
lim
n
#(S [1, 2, . . . , n])
n
= 1.
Isto implica D
s
(S) = 1. Mas, tal como no caso anterior, D
i
(S) = 0.
11.1.2 Enunciados
Nos anos 30, Erd os e Turan [ET36] conjecturaram que todo subconjunto de
Z com densidade superior positiva contem sequencias aritmeticas nitas com
comprimento arbitrariamente grande. Esta conjectura foi demonstrada por Sze-
meredi [Sze75], quase quatro decadas mais tarde:
Teorema 11.5 (Szemeredi). Se S e um subconjunto de Z com densidade
superior positiva, ent ao para todo k N existem m Z e n N tais que m,
m+n, m + 2n, . . . , m+kn pertencem a S.
Em geral, n ao podemos esperar que S contenha progressoes aritmeticas com
comprimento innito, como mostram os Exemplos 11.3 e 11.4.
A demonstra cao original do Teorema 11.5 usa argumentos combinat orios
bastante intrincados. No entanto, poucos anos depois Furstenberg [Fur77] deu
uma nova demonstra cao, utilizando ideias de Teoria Ergodica. Na verdade, ele
deduziu o Teorema 11.5 de uma generalizacao do Teorema 1.1 para famlias de
transformacoes que comutam entre si:
11.1. TEOREMA DE SZEMER
EDI 125
Teorema 11.6 (Recorrencia Simultanea de Poincare). Sejam f
i
: M
M, i = 1, 2, . . . , k transforma coes que preservam uma probabilidade em M
e tais que f
i
f
j
= f
j
f
i
para todo i, j = 1, 2, . . . , k. Entao, para qualquer
conjunto E M tal que (E) > 0, existe algum n 1 tal que
_
E f
n
1
(E) f
n
2
(E) f
n
k
(E)
_
> 0.
Em outras palavras, este teorema arma que existe algum tempo n tal que
os iterados de um subconjunto com medida positiva de pontos de E, por todas
as transformacoes f
i
, regressam a E simultaneamente nesse momento n.
A demonstra cao do Teorema 11.6 escapa ao ambito deste texto. Mas, na
Secao 11.1.6, explicaremos porque ele implica o Teorema 11.5. Alem disso,
vamos discutir vers oes um pouco mais fracas destes resultados, que chamamos
teorema de van der Waerden e teorema de Recorrencia Simultanea de Birkho,
respectivamente.
O teorema de van der Waerden [vdW27] arma que dada qualquer parti cao
do conjunto Z num n umero nito de subconjuntos, algum desses subconjuntos
deve conter progressoes aritmeticas com comprimento arbitrariamente grande:
Teorema 11.7 (van der Waerden). Sejam S
1
, S
2
, . . . , S
q
subconjuntos dois-
a-dois disjuntos de Z tais que S
1
S
2
S
q
= Z. Dado qualquer k 1 existe
algum S
i
que contem alguma progress ao aritmetica com comprimento k+1. Em
particular, algum elemento S
j
da particao contem progress oes aritmeticas com
comprimento arbitrariamente grande.
Na Secao 11.1.3 veremos que este resultado e uma consequencia simples do
Teorema 11.5. Tambem veremos, na Secao 11.1.4, que ele pode ser deduzido da
seguinte extensao do Teorema 3.11:
Teorema 11.8 (Recorrencia Simultanea de Birkho). Seja M um espa co
metrico compacto e f
i
: M M, i = 1, 2, . . . , k transforma coes contnuas tais
que f
i
f
j
= f
j
f
i
para todo i, j = 1, 2, . . . , k. Entao existe algum x M e
alguma sequencia n
j
tal que
f
nj
i
(x) x quando j , para todo i = 1, 2, . . . , k.
Em outras palavras, as trajet orias de x por todas as transforma coes recorrem
para x simultaneamente nos momentos n
j
.
Na Secao 11.1.5 veremos que o Teorema 11.8 e uma consequencia simples
do Teorema 11.6. Alias, como veremos na Secao 11.1.6, este ultimo teorema
tambem implica o Teorema 11.5. Portanto, o diagrama a seguir resume as
rela coes logicas entre os quatro enunciados, que ser ao discutidas nas pr oximas
secoes:
T. Szemeredi 11.5 T. R. S. Poincare 11.6

T. van der Waerden 11.7 T. R. S. Birkho 11.8.
126 CAP
ITULO 11. APLICAC

OES EM TEORIA DOS N
UMEROS
11.1.3 T. de Szemeredi implica T. van der Waerden
Seja S
1
, S
2
, . . . , S
N
uma parti cao nita de Z qualquer. De acordo com o
Exerccio 11.1, pelo menos um dos elementos S
i
da parti cao deve ter densidade
superior positiva. Aplicando o Teorema 11.5 a S = S
i
conclumos que ele contem
progressoes aritmeticas com comprimento arbitrariamente grande. Isto prova o
Teorema 11.7.
11.1.4 T. de Birkho implica T. de van der Waerden
Vamos comecar por traduzir o Teorema 11.7 num enunciado sobre o desloca-
mento (shift) f : M M no espaco M = 1, 2, . . . , q
Z
das sequencias bila-
terais com valores em 1, 2, . . . , q. Observe que cada sequencia = (
n
)
nZ
em M dene uma parti cao de Z em subconjuntos
S
i
= n Z :
n
= i, i = 1, 2, . . . , q
e, reciprocamente, toda parti cao de Z em q subconjuntos determine uma se-
quencia M. Portanto, o teorema pode ser reformulado do seguinte modo:
para todo M e todo k 1, existem m Z e n 1 tais que
m
=
m+n
= =
m+nk
. (11.1)
Para provarmos este fato, vamos munir M da metrica d(, ) =
N(, )
,
N(, ) = max
_
N 0 :
n
=
n
para todo n Z com [n[ < N
_
,
que foi denida no Exerccio 5.1, sendo um n umero qualquer em (0, 1). Note
que
d(, ) < 1 se e somente se
0
=
0
. (11.2)
Como o espaco metrico (M, d) e compacto, o fecho A =
_
f
n
() : n Z
_
da
trajetoria de e tambem um compacto, para a metrica induzida. Lembre que
o deslocamento f : M M e denido por
f ((
n
)
nZ
) = (
n+1
)
nZ
. (11.3)
Consideremos as transformacoes f
1
= f, f
2
= f
2
, . . . , f
k
= f
k
denidas de
A em A.

E claro que as f
i
comutam entre si. Portanto, podemos aplicar
o Teorema 11.8 e concluir desta maneira que existe A e uma sequencia
n
j
tal que
f
nj
i
() para todo i = 1, 2, . . . , k.
Observe que f
nj
i
= f
i nj
. Em particular, podemos xar n = n
j
tal que os
iterados f
n
(), f
2n
(), . . . , f
kn
() estao todos a distancia menor que 1/3 do
ponto . Logo, os pontos
, f
n
(), f
2n
(), . . . , f
kn
()
11.1. TEOREMA DE SZEMER
EDI 127
estao todos a distancia menor que 2/3 uns dos outros. Ent ao, como esta
no fecho A da orbita de , podemos encontrar m Z tal que f
m
() esta t ao
pr oximo de que os pontos
f
m
(), f
m+n
(), f
m+2n
(), . . . , f
m+kn
()
estao a dist ancia menor que 1 uns dos outros. Tendo em conta a observa cao
(11.2) e a deni cao (11.3) da transforma cao f, isto quer dizer que
m
=
m+n
= =
m+kn
,
como pretendamos provar. Isto completa a demonstracao do teorema de van
der Waerden a partir do teorema de Recorrencia Simultanea de Birkho.
De fato, a conclusao do Teorema 11.7 ainda vale para parti coes de subcon-
juntos nitos de Z, desde que sejam sucientemente grandes:
Teorema 11.9 (van der Waerden). Dados k 1 e q 2 existe N 1 tal
que, dada qualquer parti cao do intervalo 1, 2, . . . , N em q subconjuntos, algum
desses subconjuntos contem progress oes aritmeticas com comprimento k + 1.
E f acil ver que o Teorema 11.9 implica o Teorema 11.7. No Exerccio 11.2
veremos que a recproca tambem e verdadeira.
11.1.5 T. de Poincare implica T. de Birkho
Comecemos por lembrar (Exerccio 3.4) que se f
i
: M M, i = 1, 2, . . . , k
sao transforma coes contnuas num espaco metrico compacto que comutam en-
tre si, entao existe alguma probabilidade invariante comum a todas essas
transformacoes.
Em seguida, observemos que o Teorema 11.6 tem a seguinte consequencia:
Corolario 11.10. Sejam f
i
: M M, i = 1, 2, . . . , k transforma coes que
preservam uma probabilidade em M e tais que f
i
f
j
= f
j
f
i
para todo
i, j = 1, 2, . . . , k. Entao, para qualquer conjunto E M tal que (E) > 0, e
para quase todo x E existe uma sequencia n
j
tal que f
nj
i
(x) E para
todo i = 1, . . . , k e todo j 1.
Deixaremos a prova desta proposicao como exerccio para o leitor (Ex-
erccio 11.6). Compare tambem com o Exerccio 1.1. Este corolario ser a util
na:
Prova do Teorema de Recorrencia M ultipla de Birkho. Considere uma base enu-
meravel de abertos U
j
de M com o diametro de U
j
indo a zero quando j .
Seja alguma medida invariante simultaneamente para todos os f
i
(note que o
Exerccio 3.4 nos garante a existencia de alguma destas medidas).
Para cada j representamos por D
j
o conjunto dos pontos x U
j
tais que
existe n > j tal que f
n
i
(x) U
j
para todo i = 1, 2, . . . , k. Observe que de
acordo com o Corolario 11.10, o conjunto U
j
D
j
tem medida igual a zero,
128 CAP
ITULO 11. APLICAC

OES EM TEORIA DOS N
UMEROS
uma vez que quase todo ponto retorna simutaneamente a U
j
em algum momento.
Consequentemente, como U
j
jN
e uma cobertura de M, temos que o conjunto:
D =
n=1
_
mn
D
m
,
tem medida (D) = 1. Em particular, D ,= .
Mostraremos que todo ponto x D e simultaneamente recorrente para as
transformacoes f
1
, f
2
, . . . , f
k
. Ora, se x D x
mn
D
m
para todo n N.
Logo, existe m n tal que x D
m
. De acordo com a deni cao de D
m
,
existe algum n
m
> m tal que f
nm
i
(x) U
m
para todo i = 1, 2, . . . , k. Logo,
d(x, f
nm
i
(x)) 0, uma vez que os pontos x e f
mn
i
(x) pertencem a U
m
e o
di ametro de U
m
vai a zero quando m . Isto encerra a prova do Teorema de
Recorrencia M ultipla de Birkho.
11.1.6 Prova do Teorema de Szemeredi
Mostraremos nesta seccao como deduzir o Teorema de Szemeredi (Teorema 11.5)
a partir do Teorema de Recorrencia Simultanea (Teorema 11.6). Novamente,
utilizaremos o dicionario entre particoes de Z e sequencias de inteiros, como ja
zemos na prova do Teorema de Van der Waerden (Teorema 11.7).
Prova do Teorema de Szemeredi. Considere S um conjunto com densidade su-
perior positiva qualquer. Vamos associar a S uma sequencia = (
n
)
nZ

M = 0, 1
Z
denida por:
n
= 1 n S.
Como S possui densidade superior positiva, existe c > 0 e uma sequencia de
intervalos I
n
= [a
n
, b
n
) de Z com lim#I
n
= e tais que
D
s
(S) = lim
#In
#(S I
n
)
#I
n
> c > 0.
Considere o deslocamento f : M M e dena o subconjunto A M por
A = y M; y
0
= 1.
Note que o fato de f
j
() A equivale a dizer que
j
= 1, ou seja, j S.
Resumindo,
f
j
() A j S (11.4)
O conjunto A e um aberto e ao mesmo tempo um fechado de M, considerando
a topologia dada onde os cilindros s ao abertos, pois A e um cilindro de compri-
mento 1 em M e seu complementar e uma uni ao de cilindros. Deste modo, tendo
em vista (11.4), mostrar que m+in S equivale a mostrar que f
m+in
() A.
Logo, para mostrar o Teorema de Szemeredi, basta provar que para todo k N
existem m Z e n N tais que
f
m
(), f
m+n
(), f
m+2n
(), . . . , f
m+kn
() A.
11.2. TEOREMA DE WEYL 129
Para mostrar este fato, vamos denir a sequencia
n
de probabilidades em
M por:
n
=
1
#I
n
bn1
i=an
f
i
()
(11.5)
Como ja vimos no Teorema 3.4, o conjunto das probabilidades /
1
(M) mu-
nido com a topologia fraca
e compacto. Assim, podemos garantir que alguma

subsequencia
ni
converge para uma probabilidade de M. Para n ao carregar a
nota cao, vamos supor que a pr opria sequencia
n
converge para na topologia
fraca
. Observe que e uma probabilidade f-invariante, pois para toda fun cao
contnua : M R, vale
_
f d = lim
n
_
f d
n
= lim
n
1
#I
n
bn1
i=an
(f
i
())
+ lim
n
(f
bn
()) (f
an
())
#I
n
= lim
n
_
d
n
=
_
d.
Para utilizar o Teorema de Recorrencia Simultanea de Poincare para o con-
junto A, precisamos mostrar inicialmente que (A) > 0. De fato, observe que
A e um conjunto fechado e aberto de M. Logo, pela Proposi cao 3.3 temos que
(A)
n
(A) = lim
#In
#(S I
n
)
#I
n
> c > 0.
Dado k N, considerando as fun coes f, f
2
, f
3
, . . . , f
k
(que claramente comutam
entre si) o Teorema de Recorrencia Simultanea de Poincare nos garante que
existe algum n 1 tal que
_
A f
n
(A) f
2n
(A) f
kn
k
(A)
_
> 0.
Em particular, como A e aberto, existe algum l tal que
l
_
A f
n
(A) f
2n
(A) f
kn
(A)
_
> 0.
Como
l
= (1/#I
l
)
b
l
1
i=a
l
f
i
()
, podemos garantir que pelo menos para algum
a
n
m b
l
1, o ponto f
m
() pertence a Af
n
(A) f
kn
(A). Assim,
f
m+in
() A, para i = 0, 1, . . . , k, como queramos provar.
11.2 Teorema de Weyl
Vamos descrever outra bela aplica cao da Teoria Erg odica ` a Teoria dos N umeros,
devida a H. Weyl [Wey16]. Consideramos fun coes polinomiais
P(x) = a
0
+a
1
x +a
2
x
2
+ +a
d
x
d
,
130 CAP
ITULO 11. APLICAC

OES EM TEORIA DOS N
UMEROS
com coecientes reais e grau d 1. Para cada inteiro positivo n, calculamos o
valor da fun cao P em n e chamamos z
n
a parte fracion aria do valor P(n) obtido.
De maneira mais formal,
z
n
= P(n) = P(n) [P(n)]
onde x = parte fracion aria e [x] = parte inteira de x. Observe que z
n
[0, 1)
para cada n. Mas podemos, igualmente, considerar que a sequencia toma valores
no crculo S
1
= R/Z, e faremos isso no que segue. Estamos interessados em
entender como se distribui a sequencia z
n
no crculo.
Denicao 11.11. Dizemos que uma sequencia x
n
S
1
e equidistribuda se
para qualquer fun cao contnua : S
1
R tem-se
lim
n
1
n
n
j=1
(x
j
) =
_
(x) dx.
Veremos no Exerccio 11.4 que isto equivale a dizer que, para todo intervalo
I S
1
, a fra cao dos termos da sequencia que estao em I e igual ao comprimento
m(I) desse intervalo.
Teorema 11.12 (Weyl). Se algum dos coecientes a
1
, a
2
, . . . , a
d
e irracional
entao a sequencia z
n
= P(n) e equidistribuda.
Podemos, sem restricao, supor que o coeciente a
d
e irracional. De fato, a
sequencia z
n
sempre pode ser decomposta numa soma
z
n
= x
n
+y
n
, x
n
= a
d
n
d
, y
n
= Q(n)
onde Q(x) = a
0
+a
1
x + +a
d1
x
d1
. Suponha que a
d
e racional, isto e, que
existem inteiros p e q tais que a
d
= p/q. Ent ao a primeira parcela x
n
toma no
maximo q valores distintos. De fato esta sequencia e peri odica com perodo q:
x
n+p
=
_
p
q
(n +q)
d
_
=
_
p
q
n
d
_
= x
n
para todo n Z.
Por outro lado, a segunda parcela y
n
e do mesmo tipo que z
n
, exceto que o
polin omio Q que lhe esta associado tem grau d 1. Portanto, por indu cao no
grau, podemos supor que y
n
e equidistribuda. Mais que isso, podemos supor
que as subsequencias
y
qn+r
= Q(qn +r), n Z
sao equidistribudas para todo r 0, 1, . . . , q1. Na verdade, estas sequencias
podem ser escritas como y
nq+r
= Q
r
(n) para algum polin omio Q
r
com o
mesmo grau que Q (verique), e portanto a hip otese de inducao se aplica a
elas tambem. Destas duas observacoes segue que a soma z
n
tambem e equidis-
tribuda, porque cada uma das subsequencias z
qn+r
, n Z e equidistribuda.
11.2.1 O caso am
Para desenvolvermos alguma intui cao sobre o problema, comecemos por con-
siderar o caso especial d = 1. Neste caso a funcao polinomial resume-se a
P(x) = a
0
+a
1
x. Estamos supondo que o coeciente a
1
e irracional. Consider-
emos a transformacao
f : S
1
S
1
, f() = +a
1
mod Z.
Foi visto na Proposi cao 3.6 que esta transforma cao f admite uma unica prob-
abilidade invariante, que e a medida de Lebesgue m. Consequentemente, dada
qualquer fun cao contnua : S
1
R, e dado qualquer ponto S
1
,
lim
n
1
n
n
j=1
(f
j
()) =
_
dm.
Considere = a
0
mod Z. Ent ao, f
j
() = a
0
+ a
1
j mod Z = P(j) mod Z e
isto signica que podemos identicar z
j
= P(j) com a sequencia dos iterados
f
j
(a
0
). Ent ao a relacao anterior d a
lim
n
1
n
n
j=1
(z
j
) =
_
dm.
Isto e precisamente o que signica dizer que z
j
e equidistribuda.
11.2.2 Ergodicidade
Vamos estender os argumentos acima para provar o caso geral do Teorema 11.8.
Seja T
d
o toro d-dimensional, isto e,
T
d
= R
d
/Z
d
= S
1
S
1
(d vezes).
Introduzimos a transformacao f : T
d
T
d
f(
1
,
2
, . . . ,
d
) = (
1
+,
2
+
1
, . . . ,
d
+
d1
), (11.6)
onde e um n umero irracional que ser a escolhido mais tarde. Observe que f
preserva a medida de Lebesgue m em T
d
. Isto pode ser visto usando as ideias
da Secao 2.2: a derivada de f em cada ponto vem dada pela matriz
_
_
_
_
_
_
1 0 0 0 0
1 1 0 0 0
0 1 1 0 0

0 0 0 1 1
_
_
_
_
_
_
cujo determinante e 1. Observe que a transformacao f e invertvel.
132 CAP
ITULO 11. APLICAC

OES EM TEORIA DOS N
UMEROS
Proposi cao 11.13. A transforma cao f e erg odica relativamente ` a medida de
Lebesgue no toro T
d
.
Demonstra c ao. O metodo e analogo ao da Proposi cao 5.5, baseado em an alise
de Fourier. Seja : T
d
R uma fun cao em L
2
(m). Escrevemos
() =
nZ
d
a
n
e
2in
onde = (
1
, . . . ,
d
), n = (n
1
, . . . , n
d
), n = n
1
1
+ +n
d
d
, e
nZ
d
[a
n
[
2
=
_
[()[
2
d
1
d
d
< . (11.7)
Suponhamos que a fun cao e invariante, isto e, f = em quase todo ponto.
Observe que
(f()) =
nZ
d
a
n
e
2i(n1(1+)+n2(2+1)+n
d
(
d
+
d1
))
=
nZ
d
a
n
e
2in1
e
2iL(n)
onde L(n) = (n
1
+ n
2
, n
2
+ n
3
, . . . , n
d1
+ n
d
, n
d
). Portanto, a rela cao de
invari ancia f = se traduz por
a
n
e
2in1
= a
L(n)
para todo n Z
d
. (11.8)
Isto implica que a
n
e a
L(n)
tem o mesmo valor absoluto. Por outro lado, a
rela cao de integrabilidade (11.7) implica que existe no maximo um n umero nito
de termos com um dado valor absoluto n ao-nulo. Conclumos que a
n
= 0 para
todo n Z
d
cuja orbita L
j
(n), j Z seja innita. Observando a expressao de
L deduzimos que a
n
= 0 exceto, possivelmente, se n
2
= = n
d
= 0. Alem
disso, para os valores de n restantes, ou seja, para n = (n
1
, 0, . . . , 0), tem-se que
L(n) = n e portanto a rela cao (11.8) torna-se
a
n
= a
n
e
2in1
.
Como e irracional, o ultimo fator e diferente de 1 sempre que n
1
e nao-nulo.
Portanto esta rela cao d a que a
n
= 0 tambem para n = (n
1
, 0, . . . , 0) com n
1
,= 0.
Deste modo, mostramos que se e uma fun cao invariante ent ao todos os termos
da sua expans ao de Fourier se anulam exceto, possivelmente, o termo constante.
Isto mostra que e constante, e isso prova que f e ergodica.
11.2.3 Unicidade erg odica
O pr oximo passo da demonstracao do Teorema 11.12 e a seguinte
Proposi cao 11.14. A transforma cao f e unicamente ergodica, isto e, a medida
de Lebesgue no toro e a sua unica medida invariante.
Demonstra cao. A demonstra cao ser a por indu cao no grau d do polin omio P. O
caso de grau 1 j a foi tratado na Se cao 11.2.1, portanto s o precisamos explicar
como o caso de grau d pode ser deduzido do caso de grau d 1. Para isso,
escrevemos T
d
= T
d1
S
1
e
f : T
d1
S
1
T
d1
S
1
f(
0
, ) = (f
0
(
0
), +
d1
) (11.9)
onde
0
= (
1
, . . . ,
d1
) e f
0
(
0
) = (
1
+ ,
2
+
1
, . . . ,
d1
+
d2
). Vamos
representar por : T
d
T
d1
a proje cao () =
0
. Por indu cao, a trans-
forma cao
f
0
: T
d1
T
d1
e unicamente erg odica. Para mostrar que f e unicamente erg odica so precisamos
mostrar que a medida de Lebesgue m e a sua unica probabilidade invariante
erg odica.
Lema 11.15. Se e uma probabilidade invariante por f entao a proje cao
coincide com a medida de Lebesgue m

0
em T
d1
.
Demonstra cao. Dado qualquer conjunto mensur avel E T
d1
,
(
)(f
1
0
(E)) = (
1
f
1
0
(E)).
Usando f = f
0
e o fato de que e f-invariante, se verica que a expressao
do lado direito e igual a
(f
1
1
(E)) = (
1
(E)) = (
)(E).
Portanto (
)(f
1
0
(E)) = (
)(E) para todo subconjunto mensur avel E, ou

seja,
e probabilidade f
0
-invariante. Como supomos que f
0
e unicamente
erg odico, segue que
coincide com a medida de Lebesgue m

0
em T
d1
.
Agora suponhamos que e ergodica. Pelo Teorema de Birkho 4.2, o con-
junto G
dos pontos T
d
tais que
lim
1
n
n1
j=0
(f
j
()) =
_
d para toda fun cao contnua : T
d
R (11.10)
tem medida total. Seja G
0
() o conjunto dos
0
T
d1
tais que G() intersecta
0
S
1
. Em outras palavras, G
0
() = (G
).

E claro que
1
(G
0
()) contem
G
e portanto tem medida igual a 1. Logo, usando o Lema 11.15,

m
0
(G
0
()) = (
1
(G
0
())) = 1.
Em particular, isto vale para a medida de Lebesgue:
m
0
(G
0
(m)) = m(
1
(G
0
(m))) = 1.
Uma consequencia direta destas rela coes e que a interseccao de G
0
() e G
0
(m)
tem medida m
0
total e, portanto, estes conjuntos n ao podem ser disjuntos. Seja
0
um ponto qualquer na intersec cao. Por deni cao, G() intersecta
0
S
1
.
Mas o pr oximo resultado arma que G(m) contem
0
S
1
:
134 CAP
ITULO 11. APLICAC

OES EM TEORIA DOS N
UMEROS
Lema 11.16. Se
0
G
0
(m) entao
0
S
1
esta contido em G(m).
Demonstra cao. A observacao crucial e que a medida m e invariante por toda a
transformacao da forma
R
: T
d1
S
1
T
d1
S
1
, (, ) (, +).
A hip otese
0
G
0
(m) signica que existe algum S
1
tal que (
0
, ) G(m),
ou seja,
lim
1
n
n1
j=0
(f
j
(
0
, )) =
_
dm
para toda fun cao contnua : T
d
R. Qualquer outro ponto de
0
S
1
pode ser escrito como (
0
, + ) = R
(
0
, ) para algum S
1
. Recordando
(11.6), vemos que
f
_
R
(
0
, )
_
= (
1
+,
2
+
1
, . . . ,
d1
+
d2
, + +
d1
) = R
_
f(
0
, )
_
para todo (
0
, ) T
d1
S
1
. Logo, por indu cao,
f
j
(
0
, +) = f
j
_
R
(
0
, )
_
= R
_
f
j
(
0
, )
_
para todo j 1. Portanto, dada qualquer fun cao contnua : T
d
R,
lim
1
n
n1
j=0
(f
j
(
0
, +)) = lim
1
n
n1
j=0
( R
)(f
j
(
0
, ))
=
_
( R
) dm =
_
dm.
Isto prova que (
0
, +) esta em G
m
para todo S
1
, conforme armado.
Segue do que dissemos ate agora que G() e G(m) se intersectam em algum
ponto de
0
S
1
. Tendo em vista a deni cao (11.10), isto implica que as
duas medidas tem a mesma integral para cada fun cao contnua. De acordo
com o Teorema de Riesz-Markov 3.7, isto implica que = m, como queramos
demonstrar.
Corolario 11.17. A orbita de todo ponto T
d
e equidistribuda no toro: para
toda fun c ao contnua : T
d
R tem-se
lim
1
n
n1
j=0
(f
j
()) =
_
dm.
Demonstra cao. Isto e uma consequencia imediata da Proposi cao 11.14 e da
Proposi cao 3.7.
11.2.4 Demonstra cao do Teorema de Weyl
Para completarmos a demonstracao do Teorema 11.12, introduzimos os polin o-
mios denidos por p
d
(x) = P(x) e
p
j1
(x) = p
j
(x + 1) p
j
(x) for j = 2, . . . , d. (11.11)
Lema 11.18. 1. O polinomio p
j
(x) tem grau j, para todo 1 j d.
2. p
1
(x) = x + onde = a
d
d! e irracional.
Deixamos a demonstracao deste lema para o Exerccio 11.5.
Lema 11.19. Para todo n 0,
f
n
_
p
1
(0), p
2
(0), . . . , p
d
(0)
_
=
_
p
1
(n), p
2
(n), . . . , p
d
(n)
_
.
Demonstra c ao. A demonstra cao ser a por indu cao em n. Como o caso n = 0 e
obvio, s o precisamos tratar do passo indutivo. Lembre que f foi denida em
(11.6). Se
f
n1
(p
1
(0), p
2
(0), . . . , p
d
(0)) = (p
1
(n 1), p
2
(n 1), . . . , p
d
(n 1))
ent ao f
n
(p
1
(0), p
2
(0), . . . , p
d
(0)) e igual a
(p
1
(n 1) +, p
2
(n 1) +p
1
(n 1), . . . , p
d
(n 1) +p
d1
(n 1)).
Usando a deni cao (11.11) e o Lema 11.18, obtemos que esta express ao e igual
a
(p
1
(n), p
2
(n), . . . , p
d
(n)),
e isto prova o lema.
Finalmente, estamos prontos para provar que a sequencia z
n
= P(n) e
equidistribuda, conforme arma o Teorema 11.12. Seja : S
1
R uma fun cao
contnua qualquer. Considere : T
d
R denida por
(
1
,
2
, . . . ,
d
) = (
d
).
Fixemos = (p
1
(0), p
2
(0), . . . , p
d
(0)). Usando o Lema 11.19 e o Corolario 11.17,
lim
1
n
n1
j=0
(z
n
) = lim
1
n
n1
j=0
(f
n
()) =
_
dm =
_
dx.
Isto termina a demonstracao do Teorema 11.12.
136 CAP
ITULO 11. APLICAC

OES EM TEORIA DOS N
UMEROS
11.3 Exerccios
11.1. Prove que
1. D
i
(S) = D
s
(Z S) para qualquer subconjunto S de Z.
2. Se S
1
, S 2, . . . , S
N
e uma parti cao de Z ent ao
D
s
(S
1
) +D
s
(S
2
) + +D
s
(S
N
) 1.
11.2. Deduza o Teorema 11.9 a partir do Teorema 11.7.
11.3. Mostre que dadas quaisquer transforma coes contnuas f
i
: M M,
i = 1, 2, . . . , k num espaco metrico compacto M, tais que f
i
f
j
= f
j
f
i
para
todo i, j = 1, 2, . . . , k, existe alguma medida de probabilidade que e invariante
por todas essas transforma coes.
11.4. Mostre que uma sequencia x
n
e equidistribuda se e somente se, dado
qualquer intervalo I [0, 1], tem-se
lim
n
1
n
#j = 1, 2, . . . , n : x
j
I = m(I)
onde m representa a medida de Lebesgue em [0, 1].
11.5. Demonstre o Lema 11.18.
11.6. Sejam f
i
: M M, i = 1, 2, . . . , k transformacoes que preservam uma
probabilidade em M e tais que f
i
f
j
= f
j
f
i
para todo i, j = 1, 2, . . . , k.
Ent ao, para qualquer conjunto E M tal que (E) > 0, e para quase todo
x E existe uma sequencia n
j
tal que f
nj
i
(x) E para todo i = 1, . . . , k
e todo j 1.
Captulo 12
Resultados em Teoria
Ergodica Diferenciavel
12.1 Fluxos geodesicos
12.2 Hiperbolicidade nao-uniforme
Nesta secao enunciar sem provas alguns resultados centrais da Teoria Erg odica
diferenci avel. Para os interessados em suas provas, recomendamos a leitura de
[Ma n87].
Denicao 12.1. Seja f : M
d
M
d
um difeomorsmo da variedade M. Um
ponto x M e dito regular se existe n umeros
1
<
2
<
l
(x) e uma
decomposicao E
1
(x) E
l
(x) = T
x
M tal que em cada subespaco E
i
vale:
lim
n
1
n
log |Df
n
(x)v| =
i
(x),
para todo v E
i
(x).
Denotaremos por o conjunto dos pontos regulares. O n umeros
i
(x) sao
chamados os expoentes de Lyapunov de x e dimE
i
(x) e a multiplicidade de
i
(x).
Observe que se x e regular, ent ao f
n
(x) e regular e seus expoentes coincidem
com os expoentes de x. Para ver isso, basta denir E
i
(f
n
(x)) = Df
n
(x)E
i
(x).
Vale o seguinte teorema:
Teorema 12.2 (Oseledets). Seja f um difeomorsmo C
1
de uma variedade
compacta M. Entao () = 1 para toda medida invariante . Ou seja, o
conjunto dos pontos regulares e um conjunto com medida total. Alem disso:
1. Se e erg odica, entao l(x) e
1
(x), . . . ,
l
(x) s ao constantes para -quase
todo ponto x M.
137
138CAP
ITULO12. RESULTADOS EM TEORIAERG
ODICADIFERENCI
AVEL
2.
_
log [ det Df(x)[d(x) =
l
i=0
(x)
i
(x)d(x).
Deniremos a fun cao : R por
(x) =
lim
i(x)>0
i
(x)dimE
i
(x).
Ent ao,
Teorema 12.3 (desigualdade de Ruelle). Se e uma medida invariante
para um difeomorsmo (ou endomorsmo) C
1
de uma variedade compacta M,
entao:
h
(f)
_
(x)d(x).
Teorema 12.4 (formula de Pesin). Se e uma medida invariante absoluta-
mente contnua com respeito ` a medida de Lebesgue para um difeomorsmo (ou
endomorsmo) C
1+
de uma variedade compacta M, entao:
h
(f) =
_
(x)d(x).
12.3 Exerccios
Bibliograa
[BK83] M. Brin and A. Katok. On local entropy. In Geometric dynamics
(Rio de Janeiro, 1981), volume 1007 of Lecture Notes in Math., pages
3038. Springer, 1983.
[Cas04] A. A. Castro. Teoria da medida. Projeto Euclides. IMPA, 2004.
[ET36] P. Erd os and P. Tur an. On some sequences of integers. J. London.
Math. Soc., 11:261264, 1936.
[Fal90] K. Falconer. Fractal geometry. John Wiley & Sons Ltd., 1990. Math-
ematical foundations and applications.
[Fer02] R. Fernandez. Introdu c ao à teoria da medida. Projeto Euclides. IMPA,
2002.
[Fur77] H. Furstenberg. Ergodic behavior and a theorem of Szemeredi on
arithmetic progressions. J. dAnalyse Math., 31:204256, 1977.
[Fur81] H. Furstenberg. Recurrence in ergodic theory and combinatorial num-
ber theory. Princeton Univertsity Press, 1981.
[Ma n87] R. Ma ne. Ergodic theory and dierentiable dynamics. Springer Verlag,
1987.
[Orn70] D. Ornstein. Bernoulli shifts with the same entropy are isomorphic.
Advances in Math., 4:337352 (1970), 1970.
[Rok66] V.A. Rokhlin. Selected topics from the metric theory of dynamical
systems. A. M. S. Transl., 49:171240, 1966. Transl. from Uspekhi
Mat. Nauk. 4 - 2 (1949), 57128.
[Rud87] W. Rudin. Real and complex analysis. McGraw-Hill, 3 edition, 1987.
[Sze75] S. Szemeredi. On sets of integers containing no k elements in arith-
metic progression. Acta Arith., 27:199245, 1975.
[vdW27] B. van der Waerden. Beweis eibe Baudetschen Vermutung. Nieuw
Arch. Wisk., 15:212216, 1927.
139
140 BIBLIOGRAFIA
[Wey16] H. Weyl. Uber die Gleichverteilungen von Zahlen mod Eins. Math.
Ann., 77:313352, 1916.

Introducao A Teoria Ergodica

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Introducao A Teoria Ergodica

Caricato da

Copyright:

Formati disponibili

Introdu cao ` a Teoria Erg odica

Krerley Oliveira e Marcelo Viana

no espaco das medidas . . . . . . . . . . . . . 28

ITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

ITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

num intervalo [a, b] por:

e aditiva e com o auxlio dos Teoremas 0.10 e 0.9 podemos

para toda -algebra dos Borelianos de [0, 1]. A medida

(A) = 0. Essa propriedade nos diz que

ITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

ITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

E f acil vericar que o valor da integral n ao depende da escolha da sequencia

(x) = maxf(x), 0 sao n ao-negativas. Mostra-se tambem

sao mensuraveis se e so se, f e mensuravel.

ITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

ITULO 0. ELEMENTOS DE TEORIA DA MEDIDA

ITULO 1. TEOREMA DE RECORR

ENCIA PARA MEDIDAS INFINITAS 15

ITULO 1. TEOREMA DE RECORR

ITULO 2. EXEMPLOS DE MEDIDAS INVARIANTES

ITULO 2. EXEMPLOS DE MEDIDAS INVARIANTES

onde k, l Z, com k l, e cada a

ITULO 2. EXEMPLOS DE MEDIDAS INVARIANTES

ITULO 2. EXEMPLOS DE MEDIDAS INVARIANTES

ITULO 2. EXEMPLOS DE MEDIDAS INVARIANTES

ENCIA DE MEDIDAS INVARIANTES

no espa co das medidas

< para todo

e denida estipulando que estes conjuntos V (, F, ),

NO ESPAC O DAS MEDIDAS 29

< para todo n n

e metriz avel e compacto.

ENCIA DE MEDIDAS INVARIANTES

< para todo 1 n N

NO ESPAC O DAS MEDIDAS 31

) e um espaco compacto. Na demonstracao

ENCIA DE MEDIDAS INVARIANTES

. Isto completa a demonstracao do Teorema 3.4.

e chama-se imagem de por f a medida

, ent ao para toda fun cao contnua temos

e a imagem de pelo iterado f

ENCIA DE MEDIDAS INVARIANTES

= 0. A primeira arma cao e obvia,

e uma probabilidade f-invariante.

. Mostre, atraves de um exemplo, que a

e uma rota cao irracional do crculo. Mostre que R

ENCIA DE MEDIDAS INVARIANTES

ITULO 4. TEOREMA ERG

ITULO 4. TEOREMA ERG

E claro que esta desigualdade implica a seguinte:

ITULO 4. TEOREMA ERG

preserva o comprimento dos intervalos (segmentos) de S

depende muito da natureza de

e rotacao irracional entao R

e erg odica para a medida

(x)[ > 1 e [(f

(x) tem derivada limitada por C,

E cl assico da Analise Funcional que o espaco L

E imediato vericar que U

A e imediata, a partir da deni cao

sao measur aveis, limitadas e n ao-negativas: por exemplo,

. Isto mostra que nao h a restri cao em assumir que e

E claro que dado z Z, a sequencia