Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
UDO
5.4 Teorema de decomposicao erg odica . . . . . . . . . . . . . . . . . 56
5.5 Teorema de desintegracao . . . . . . . . . . . . . . . . . . . . . . 60
5.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
6 Sistemas Misturadores 67
6.1 Deni coes e exemplos . . . . . . . . . . . . . . . . . . . . . . . . 67
6.2 Deslocamentos de Markov . . . . . . . . . . . . . . . . . . . . . . 69
6.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
7 Entropia Metrica 77
7.1 Entropia de uma parti cao . . . . . . . . . . . . . . . . . . . . . . 77
7.2 Entropia de um sistema erg odico . . . . . . . . . . . . . . . . . . 80
7.3 Teorema de Kolmogorov-Sinai . . . . . . . . . . . . . . . . . . . . 83
7.4 Equivalencia ergodica . . . . . . . . . . . . . . . . . . . . . . . . 83
7.5 Equivalencia Espectral . . . . . . . . . . . . . . . . . . . . . . . . 84
7.6 A entropia como invariante . . . . . . . . . . . . . . . . . . . . . 85
7.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
8 Entropia Topol ogica 89
8.1 Deni cao via coberturas . . . . . . . . . . . . . . . . . . . . . . . 89
8.2 Deni cao via conjuntos geradores . . . . . . . . . . . . . . . . . . 91
8.3 Entropia de uxos . . . . . . . . . . . . . . . . . . . . . . . . . . 92
8.4 Pressao topol ogica . . . . . . . . . . . . . . . . . . . . . . . . . . 93
8.5 Princpio variacional . . . . . . . . . . . . . . . . . . . . . . . . . 94
8.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
9 Transforma coes Expansoras 97
9.1 Lema de distor cao . . . . . . . . . . . . . . . . . . . . . . . . . . 98
9.2 Medidas absolutamente contnuas . . . . . . . . . . . . . . . . . . 100
9.3 Existencia de medidas erg odicas . . . . . . . . . . . . . . . . . . . 101
9.4 Unicidade e conclusao da prova . . . . . . . . . . . . . . . . . . . 102
9.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
10 Estados de Equilbrio 105
10.1 Deni cao de Estado de Equilbrio . . . . . . . . . . . . . . . . . . 105
10.2 Transforma coes expansivas . . . . . . . . . . . . . . . . . . . . . . 106
10.3 Transforma coes expansoras . . . . . . . . . . . . . . . . . . . . . 110
10.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
11 Aplicacoes em Teoria dos N umeros 123
11.1 Teorema de Szemeredi . . . . . . . . . . . . . . . . . . . . . . . . 123
11.2 Teorema de Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
11.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
CONTE
UDO ix
12 Resultados em Teoria Erg odica Diferenciavel 137
12.1 Fluxos geodesicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
12.2 Hiperbolicidade n ao-uniforme . . . . . . . . . . . . . . . . . . . . 137
12.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
x CONTE
UDO
Captulo 0
Elementos de Teoria da
Medida
Neste captulo inicial recordamos algumas no coes e resultados b asicos da Teo-
ria da Medida que s ao uteis para o que segue. As demonstracoes podem ser
encontradas nos livros de Castro [Cas04], Fernandez [Fer02] ou Rudin [Rud87].
0.1 Espacos mensuraveis
Comecamos por introduzir as no coes de algebra e -algebra de subconjuntos.
Em seguida denimos espa cos mensur aveis e apresentamos uma tecnica de
construcao de -algebras. Seja M um conjunto.
Denicao 0.1. Uma algebra de subconjuntos de M e uma famlia B de subcon-
juntos que contem M e e fechada para as opera coes elementares de conjuntos:
A B implica A
c
= M A B
A B e B B implica A B B.
Ent ao AB = (A
c
B
c
)
c
e A B = AB
c
tambem estao em B, quaisquer
que sejam A, B B. Alem disso, por associatividade, a uni ao e a interseccao
de qualquer n umero nito de elementos de B tambem estao em B.
Denicao 0.2. Uma algebra diz-se uma - algebra de subconjuntos de M se
tambem for fechada para uni oes enumer aveis:
A
j
B para j = 1, 2, . . . , n, . . . implica
_
j=1
A
j
B.
Observa cao. B tambeme fechada para intersec coes enumer aveis: se A
j
B
para j = 1, 2, . . . , n, . . . ent ao
j=1
A
j
=
_
_
j=1
A
c
j
_
c
B.
1
2 CAP
iI
B
i
e tambem uma -algebra (veja o Exerccio 0.1). Agora, dado um conjunto
qualquer c de subconjuntos de M, podemos aplicar esta ideia `a famlia de todas
as -algebras que contem c. Note que esta famlia e nao vazia, uma vez que
contem a -algebra 2
M
, pelo menos. De acordo com a observa cao anterior, a
interseccao de todas estas -algebras e tambem uma -algebra, e e claro que
contem c. Alem disso, do modo que e construda, ela esta contida em todas as
-algebras que contem c. Portanto e a menor -algebra que contem c.
Denicao 0.5. A - algebra gerada por uma famlia c de subconjuntos de M e
a menor -algebra que contem a famlia c.
No caso em que M vem munido da estrutura de espaco topologico, h a uma
escolha natural para c, nomeadamente, o conjunto dos subconjuntos abertos.
Isto nos conduz `a no cao de - algebra de Borel.
Denicao 0.6. Seja (M, ) um espaco topologico, isto e, M um conjunto e
a famlia dos subconjuntos abertos de M. Ent ao a - algebra de Borel de M
e a -algebra gerada por , ou seja, a menor -algebra que contem todos os
subconjuntos abertos.
0.2 Espacos de medida
Agora introduzimos o conceito de medida e analisamos algumas das suas pro-
priedades fundamentais. Em seguida apresentamos alguns resultados sobre
construcao de medidas. Finalmente, analisamos duas importantes classes de
medidas: medidas de Lebesgue em espacos euclideanos e medidas produto em
espaco de sequencias.
0.2. ESPAC OS DE MEDIDA 3
Denicao 0.7. Uma medida num espaco mensuravel (M, B) e uma fun cao
: B [0, +] que satisfaz:
1. () = 0;
2. (
j=1
A
j
) =
j=1
(A
j
) para quaisquer A
j
B disjuntos dois-a-dois.
A tripla (M, B, ) e chamada espaco de medida. Quando (M) = 1 dizemos que
e uma medida de probabilidade e (M, B, ) e um espaco de probabilidade.
A segunda propriedade na deni cao de medida e chamada a -aditividade.
Dizemos que uma fun cao : B [0, +] e nitamente aditiva se:
(
N
_
j=1
A
j
) =
N
j=1
(A
j
)
para qualquer famlia nita A
1
, . . . , A
N
B de subconjuntos disjuntos dois-a-
dois. Note que toda medida e, automaticamente, nitamente aditiva.
Exemplo 0.8. Seja M um conjunto e consideremos a -algebra B = 2
M
. Dado
qualquer p M, consideremos a funcao
p
: 2
M
[0, +] denida por:
p
(A) =
_
1 , se p A
0 , se p / A
.
Temos que
p
e uma medida, que e usualmente designada por delta de Dirac no
ponto p.
Em seguida apresentamos um resultado muito util na constru cao de medidas.
Teorema 0.9 (Extensao). Seja B
0
uma algebra de subconjuntos de M e seja
0
: B
0
[0, +] uma fun c ao nita, nitamente aditiva. Entao existe uma
unica fun cao nita, nitamente aditiva : B [0, +] que e uma extens ao de
0
(isto e, restrita a B
0
coincide com
0
) ` a - algebra B gerada por B
0
. Se
0
e -aditiva ent ao tambem o e.
Em geral, ao aplicar este resultado o mais difcil e vericar a -aditividade.
O criterio mais usado para esse efeito e expresso no seguinte resultado. A sua
demonstracao e proposta como Exerccio 0.7.
Teorema 0.10 (-aditividade). Seja B
0
uma algebra e seja
0
: B
0
[0, +]
uma fun c ao nitamente aditiva com
0
(M) = 1. Suponha que
lim
n
0
(
n
j=1
A
j
) = 0 (1)
para toda a sequencia A
1
A
j
de conjuntos mensur aveis tal que
j=1
A
j
= . Entao
0
e -aditiva.
4 CAP
0
: B
0
[0, 1] denida nesta algebra por
0
_
I
1
I
N
_
= [I
1
[ + +[I
N
[ ,
onde [I
j
[ representa o comprimento de I
j
. Note que
0
(M) = 1. Alem
disso, a -algebra gerada por B
0
coincide com a -algebra de Borel de M, j a
que todo aberto pode ser escrito como uni ao enumer avel de intervalos disjuntos
dois-a-dois. Pelo Teorema 0.9, existe uma unica probabilidade denida na
-algebra de [0, 1] que e uma extensao de
0
`a -algebra B gerada por B
0
.
Chamamos de medida de Lebesgue em [0, 1]. Mais geralmente, denimos
medida de Lebesgue no cubo M = [0, 1]
d
de qualquer dimens ao d 1 da
seguinte maneira: chamamos ret angulo em M qualquer subconjunto da forma
R = I
1
I
d
onde os I
j
sao intervalos, e denimos
0
(R) = [I
1
[ [I
d
[ .
Em seguida, consideramos a algebra B
0
dos subconjuntos de [0, 1]
d
da forma
B = R
1
R
N
, onde R
1
, . . . , R
N
sao ret angulos disjuntos dois-a-dois, e
denimos
0
(B) =
0
(R
1
) +
0
(R
N
)
para todo B nessa algebra. A medida de Lebesgue em M = [0, 1]
d
e a extensao
de
0
`a -algebra gerada por B
0
, que coincide com a -algebra de Borel de
M. Finalmente, denimos a medida de Lebesgue num espa co euclidiano R
d
decompondo o espa co em cubos de lado unit ario
R
d
=
_
m1Z
_
m
d
Z
[m
1
, m
1
+ 1) [m
d
, m
d
+ 1)
e denindo, para cada subconjunto mensur avel E,
(E) =
m1Z
m
d
Z
_
E [m
1
, m
1
+ 1) [m
d
, m
d
+ 1)
_
.
0.2. ESPAC OS DE MEDIDA 5
Exemplo 0.12 (Medida de Volume em S
1
). Considere a aplica cao sobre-
jetora : [0, 1] S
1
denida por:
(t) = e
2it
.
A medida de Lebesgue em S
1
e a medida denida por (A) = m(
1
(A)).
Observe que com esta denicao, a medida de A e igual a medida de R
(A), onde
R
: S
1
S
1
denota a rota cao de angulo . Na verdade, m odulo multiplica cao
por um n umero positivo, e a unica medida que satisfaz essa condicao para
todo .
Exemplo 0.13. Seja : [0, 1] R uma fun cao contnua e positiva. Dena a
medida
([a, b]) =
_
b
a
(x) dx.
Observe que
tem
a seguinte propriedade especial: se um conjunto A [0, 1] tem medida de
Lebesgue 0 entao
e absolutamente
contnua com respeito `a medida de Lebesgue. A densidade de
em relacao a
m e igual a . Estudaremos tais medidas com mais detalhes na Seccao 0.3.2.
Exemplo 0.14. Vamos agora exibir uma medida que, apesar de ser positiva
em qualquer aberto, n ao e absolutamente contnua com respeito a medida de
Lebesgue. Para isso, considere uma enumeracao r
1
, r
2
, . . . do conjunto Q dos
racionais. Dena por:
(A) =
riA
1
2
i
.
Observe que a medida de qualquer aberto da reta e positiva, pois necessaria-
mente A contem algum i, e, apesar disso, (Q) = 1. Em particular, n ao e
absolutamente contnua com respeito a medida de Lebesgue.
O exemplo anterior nos motiva a denir o suporte de uma medida:
Denicao 0.15. Seja (M, B, ) um espaco de medida e M um espaco topologico.
O suporte da medida e o fecho do conjunto de pontos x M tais que para
qualquer vizinhan ca aberta V
x
contendo x, temos que (V
x
) > 0.
Fica como exerccio para o leitor mostrar que o suporte de uma medida e
sempre um conjunto fechado (10.6).
0.2.2 Medida produto no espa co das sequencias
Consideremos os espa cos de probabilidade (M
i
, B
i
,
i
), com i Z. Vamos con-
struir uma probabilidade no conjunto
M =
i=
M
i
6 CAP
i=
com x
i
M
i
para cada i. Mais precisa-
mente, a medida ser a denida na - algebra produto B das -algebras B
i
, que
e caracterizada do seguinte modo: dados inteiros m n e conjuntos A
j
B
j
para m j n, consideremos
[m; A
m
, . . . , A
n
] = (x
i
)
iZ
: x
j
A
j
para m j n.
Estes subconjuntos de M sao chamados cilindros. A famlia B
0
das uni oes ni-
tas de cilindros disjuntos dois-a-dois e uma algebra. Por deni cao, a -algebra
produto B e a -algebra gerada por B
0
. Para construir a medida procede-
mos do seguinte modo: primeiramente, consideramos a aplica cao denida na
famlia dos cilindros por
([m; A
m
, . . . , A
n
]) =
n
j=m
j
(A
j
).
Em seguida estendemos `a algebra B
0
, estipulando que a imagem de qualquer
uni ao nita de cilindros disjuntos dois-a-dois e igual ` a soma das imagens dos
cilindros. Esta extens ao est a bem denida e e nitamente aditiva. Ent ao,
recorrendo aos Teoremas 0.10 e 0.9, obtemos uma medida de probabilidade
em (M, B) que estende .
Denicao 0.16. O espaco de probabilidade (M, B, ) construdo acima e de-
signado produto direto dos espacos (M
i
, B
i
,
i
).
Existe um caso particular importante, que corresponde ` a situa cao onde os
espacos (M
i
, B
i
,
i
) sao todos iguais a um dado (X, (, ), em que X = 1, . . . , d
e um conjunto nito e ( = 2
X
e a -algebra de todos os subconjuntos de X.
Neste caso basta considerar apenas cilindros elementares, isto tais que cada A
j
consiste de um unico ponto de X. De fato, todo cilindro e uma uni ao nita
disjunta de tais cilindros elementares. Obtemos entao subconjuntos de M da
forma
[m; a
m
, . . . , a
n
] = (x
i
)
i=
M : x
m
= a
m
, . . . , x
n
= a
n
onde a
j
1, . . . , d. A medida e designada medida de Bernoulli denida por
e e caracterizada por ([m; a
m
, . . . , a
n
]) = (a
m
) (a
n
).
0.3 Integra cao em espacos de medida
Nesta secao denimos a nocao de integral de uma fun cao em relacao a uma me-
dida e apresentamos teoremas fundamentais da Teoria da Medida. Para tanto,
introduziremos algumas classes de fun coes. Ao longo desta secao (M, B, ) sera
sempre um espaco de medida.
Denicao 0.17. Seja B(R) a -algebra de Borel de R. Uma fun cao f : M R
diz-se mensur avel se f
1
(D) B para todo D B(R).
0.3. INTEGRAC
AO EM ESPAC OS DE MEDIDA 7
O espaco das fun coes mensuraveis possui diversas propriedades muito uteis.
Vamos enuncia-las como proposicao:
Proposi cao 0.18. Sejam f
1
, f
2
fun coes mensur aveis e c
1
, c
2
R. Entao
tambem s ao mensur aveis as seguintes fun coes:
1. entao (c
1
f
1
+c
2
f
2
)(x) = c
1
f
1
(x) +c
2
f
2
(x)
2. (f
1
f
2
)(x) = f
1
(x) f
2
(x)
3. maxf
1
, f
2
(x) = maxf
1
(x), f
2
(x)
Dizemos que uma fun cao s : M R e simples se existem constantes
1
, . . . ,
k
R e conjuntos A
1
, . . . , A
k
B disjuntos dois-a-dois tais que
s =
k
j=1
k
A
A
k
,
onde A
A
e a fun cao caracterstica do conjunto A, isto e, A
A
(x) e igual a 1 se
x A e zero caso contr ario. Introduzimos agora a no cao de integral. Para tal
comecamos por denir integral de uma fun cao simples.
Denicao 0.19. Seja s uma fun cao simples da forma acima. Ent ao a integral
de s em relacao a e dado por:
_
s d =
k
j=1
k
(A
k
).
E f acil vericar que esta deni cao e coerente: se duas combina coes lineares
de fun coes caractersticas denem uma mesma funcao simples, os valores das
integrais obtidos a partir das duas combina coes coincidem. O pr oximo passo
e denir integral de uma fun cao mensuravel qualquer. Para isso, trataremos
primeiro do caso da fun cao ser n ao-negativa. Necessitamos do seguinte resul-
tado, que nos diz que qualquer funcao mensuravel e o limite de uma sequencia
de fun coes simples mensuraveis:
Teorema 0.20. Seja f : M [, ] uma fun cao mensur avel. Entao existe
uma sequencia s
1
, s
2
, . . . de fun coes simples mensur aveis tal que
lim
k
s
k
(x) = f(x) para todo o x M.
Se f 0 entao a sequencia pode ser escolhida de modo que 0 s
1
s
2
.
A demonstra cao deste teorema e proposta como Exerccio 0.16. Ele torna
possvel a seguinte
8 CAP
onde f
+
(x) =
maxf(x), 0 e f
d,
desde que alguma das integrais do lado direito seja nita.
Denicao 0.23. Dizemos que uma fun cao e integr avel se for mensur avel e tiver
integral nita. Denotamos o conjunto das fun coes integr aveis por L
1
(M, B, )
ou, mais simplesmente, por L
1
(M, ).
Dada uma fun cao mensuravel f : M R e um conjunto mensur avel E
denimos a integral de f sobre E por
_
E
fd =
_
fA
E
d,
onde A
E
e a fun cao caracterstica do conjunto E.
Exemplo 0.24. Sejam x
1
, . . . , x
m
M e p
1
, . . . , p
m
> 0 com p
1
+ +p
m
= 1.
Consideremos a medida de probabilidade : 2
M
[0, 1] dada por:
(A) =
xiA
p
i
.
Notemos que =
m
i=1
p
i
xi
, onde
xi
e a medida delta de Dirac em x
i
. Neste
caso temos que se f e uma fun cao integr avel entao
_
f d =
m
i=1
f(x
i
)p
i
.
0.3. INTEGRAC
AO EM ESPAC OS DE MEDIDA 9
0.3.1 Teorema de derivacao de Lebesgue
Comecemos por introduzir a no cao de quase em toda a parte em relacao a
uma medida. Dizemos que uma propriedade e valida em -quase todo ponto
se e valida em todo o M exceto, possivelmente, num conjunto de medida nula.
Por exemplo, dizemos que duas funcoes f, g sao iguais em -quase todo ponto
se existe um conjunto mensuravel N com (N) = 0 tal que f(x) = g(x) para
todo x M N.
Teorema 0.25 (Derivacao de Lebesgue). Seja M = R
d
, B a - algebra de
Borel e a medida de Lebesgue em R
d
. Seja f : M R uma fun cao localmente
integr avel, isto e, tal que fA
K
e integr avel para todo compacto K R
d
. Entao
lim
r0
1
(B(x, r))
_
B(x,r)
[f(y) f(x)[d = 0.
em -quase todo ponto x R
d
. Em particular, em -quase todo o ponto x R
d
tem-se
lim
r0
1
(B(x, r))
_
B(x,r)
f(y)d = f(x).
Dado um subconjunto mensuravel A de R
d
, dizemos que um ponto a A e
um ponto de densidade de A se este conjunto preenche a maior parte de qualquer
pequena vizinhan ca de a, i.e,
lim
0
(B(a, ) A)
(B(a, )
= 1. (2)
O pr oximo resultado e uma consequencia direta do teorema de derivacao de
Lebesgue. No Exerccio 0.13 sugerimos uma demonstra cao.
Teorema 0.26. Seja A um subconjunto mensur avel de R
d
com medida de
Lebesgue (A) maior que zero. Ent ao -quase todo ponto a A e ponto de
densidade de A.
Muitos dos resultados envolvendo fun coes vao se apoiar no chamado Teo-
rema da Convergencia Dominada, que garante que se uma sequencia de fun coes
convergente e menor que uma funcao integr avel, ent ao o limite das suas integrais
converge e podemos tomar o limite sob o sinal da integral. Mais precisamente:
Teorema 0.27 (Teorema da Convergencia Dominada). Consideremos
f
n
: M R uma sequencia de fun coes mensur aveis e g uma fun cao integravel
tal que [f
n
(x)[ [g(x)[ para -quase todo x em M. Se para -quase todo x M
a sequencia f
n
(x) converge para o valor f(x), entao a fun cao f e integr avel e
vale:
lim
n
_
f
n
d =
_
f d.
10 CAP
iI
B
i
e uma -algebra.
0.2. Seja M um conjunto e considere a famlia de conjuntos
B
0
= A M : A e nito ou A
c
e nito.
Mostre que B
0
e uma algebra. Alem disso, B
0
e uma -algebra se e somente se
o conjunto M e nito.
0.3. Seja M um conjunto e considere a seguinte famlia de conjuntos
B
1
= A M : A e nito ou enumer avel ou A
c
e nito ou enumer avel.
Mostre que B
1
e uma -algebra. De fato, B
1
e a -algebra gerada pela algebra
B
0
do Exerccio 0.2.
0.4. Seja c uma famlia de subconjuntos de um conjunto M. Mostre que existe
a menor algebra B
0
que contem c. Que rela cao existe entre B
0
e a -algebra B
gerada por c?
0.5. Seja (M, B, ) um espaco de medida. Mostre que se A
1
,A
2
, . . . est ao em B
ent ao
(
_
j=1
A
j
)
j=1
(A
j
).
0.4. EXERC
ICIOS 11
0.6. Seja B = 2
M
e considere : 2
M
[0, +] denido por:
(A) =
_
#A , se A e nito
se A e innito
.
Mostre que e uma medida. Esta medida e designada medida de contagem.
0.7. Demonstre o Teorema 0.10. Dica: Dados quaisquer conjuntos disjuntos
dois a dois B
1
, . . . , B
n
, . . . em B
0
tais B =
j=1
B
j
tambem esta em B
0
, dena
C
j
= B
1
B
j
para cada j 1. Verique que os conjuntos A
j
= B C
j
satisfazem a hipotese (1) no Teorema 0.10.
0.8. Seja (M, B) um espaco mensuravel.
1. Mostre que se : B [0, +] e uma medida entao
(
_
j=1
A
j
) = lim
j
(A
j
).
para qualquer sequencia crescente A
1
A
2
A
n
de elementos
de B.
2. Reciprocamente, mostre que se
0
: B [0, +] e uma fun cao nitamente
aditiva que satisfaz a condi cao do item anterior ent ao
0
e -aditiva.
0.9. Seja (M, B) um espaco mensuravel, onde o conjunto M e nao-enumeravel
e a -algebra B e denida como no Exerccio 0.3. Mostre que : B [0, +]
denida por:
(A) =
_
0 se A e nito ou enumer avel
1 se A
c
e nito ou enumer avel
e uma medida de probabilidade.
0.10. Sejam f e g fun coes mensuraveis. Mostre que f e integr avel se e somente
se [f[ e integr avel e, nesse caso,
_
f d
_
[f[ d.
Alem disso, se f e integr avel e [f[ [g[ ent ao g e integr avel.
0.11. Seja E um conjunto mensur avel com (E) = 0. Mostre que
_
E
f d = 0
para qualquer fun cao mensuravel f.
0.12. Mostre que a e um ponto de densidade do conjunto A se e so se
lim
0
inf
_
(B A)
(B)
: B bola contida em B(a, ) e contendo a
_
= 1
12 CAP
xiA
p
i
, (A) =
xiA
q
i
,
ou seja, = p
1
x1
+ p
2
x2
e = q
1
x1
+ q
2
x2
. Mostre que e e
calcule as respectivas derivadas de Radon-Nikodym.
0.15. Seja f : M R. Mostre que se f
1
((, c)) B para todo c R ent ao
f e mensuravel. Dica: Mostre que a famlia ( = A R : f
1
(A) B e uma
-algebra e contem todos os subconjuntos abertos.
0.16. Prove o Teorema 0.20. Dica: Trate primeiro o caso onde f e nao-negativa.
0.17. Mostre que o suporte de uma medida e sempre um conjunto fechado.
Conclua que se M e compacto, o suporte de qualquer medida tambem e com-
pacto.
0.18. Mostre que toda fun cao f : R
m
R
n
contnua e mensuravel. De exemplo
de uma fun cao mensuravel que n ao e contnua em nenhum ponto.
0.19. Seja T : M M uma fun cao mensuravel e uma medida. Dena
T
(A) = (T
1
(A)). Mostre que T
e uma medida.
Captulo 1
Teorema de Recorrencia de
Poincare
Um ponto x M diz-se recorrente se a sua trajetoria pelo sistema din amico
f : M M volta arbitrariamente perto de x quando o tempo vai para in-
nito. A din amica no conjunto dos pontos n ao-recorrentes e, em certo sentido,
sempre a mesma, independentemente do sistema dinamico. Por isso, e funda-
mental compreender o conjunto dos pontos recorrentes, ja que ele contem toda
a din amica interessante do sistema.
O resultado que estudaremos nesta captulo, enunciado por Poincare perto
do nal do seculo XIX, arma que quase todo ponto e recorrente, relativamente
a qualquer medida invariante nita do sistema din amico. Daremos duas vers oes
deste resultado, a primeira numa linguagem mensuravel e a segunda de natureza
mais topol ogica. Tambem comentaremos que a hip otese de nitude da medida
n ao pode ser omitida.
1.1 Versao mensuravel
Teorema 1.1. Seja f : M M uma transforma cao mensur avel e uma
medida invariante nita. Seja E M qualquer conjunto mensur avel com
(E) > 0. Entao, -quase todo ponto x E tem algum iterado f
n
(x), n 1,
que tambem esta em E.
Em outras palavras, o teorema arma que quase todo ponto de E regressa
a E no futuro. Antes mesmo de demonstrar este fato, podemos mostrar que ele
implica outro aparentemente mais forte: quase todo ponto de E regressa a E
innitas vezes:
Corolario 1.2. Nas condicoes do Teorema 1.1, para -quase todo ponto x E
existem innitos valores de n 1 tais que f
n
(x) esta em E.
Demonstra cao. Para cada k 1 vamos representar por E
k
o conjunto dos
pontos x E que regressam a E exatamente k vezes: existem exatamente k
13
14 CAP
ENCIA DE POINCAR
E
valores de n 1 tais que f
n
(x) E. Observe que o conjunto dos pontos que
regressam a E apenas um n umero nito de vezes e precisamente
_
k=1
E
k
.
Portanto, para provar o corol ario, basta mostrar que (E
k
) = 0 para todo k 1.
A demonstra cao ser a por contradi cao.
Suponhamos que (E
k
) > 0 para algum k 1. Ent ao, aplicando o Teo-
rema 1.1 com este E
k
no lugar de E, obtemos que quase todo ponto x E
k
tem
algum iterado f
n
(x) que esta em E
k
. Fixemos um tal x e denotemos y = f
n
(x).
Por deni cao, y tem exatamente k iterados futuros que est ao em E. Como y e
um iterado de x, isso implica que x tem k + 1 iterados futuros em E. Mas isso
contradiz o fato de que x E
k
. Esta contradi cao prova que E
k
tem medida
nula, relativamente a , e portanto o corol ario esta demonstrado.
Vamos agora dar a
Demonstra cao do Teorema 1.1. Representemos por E
0
o conjunto dos pontos
x E que nunca regressam a E. O nosso objetivo e provar que E
0
tem medida
nula. Para isso, comecamos por armar que as suas pre-imagens f
n
(E
0
) sao
disjuntas duas-a-duas. De fato, suponhamos que existem m > n 1 tais que
f
m
(E
0
) intersecta f
n
(E
0
). Seja x um ponto na interseccao e seja y = f
n
(x).
Ent ao y E
0
e f
mn
(y) = f
m
(x) E
0
, que esta contido em E. Isto quer
dizer que y volta pelo menos uma vez a E, o que contradiz a deni cao de E
0
.
Esta contradi cao, prova que as pre-imagens sao disjuntas duas-a-duas, como
armamos.
Isto implica que
_
_
n=0
f
n
(E
0
)
_
=
n=0
(f
n
(E
0
)) =
n=0
(E
0
).
Na ultima igualdade usamos a hip otese de que e invariante, que implica que
(f
n
(E
0
)) = (E
0
) para todo n 1. Como supomos que a medida e nita,
a expressao do lado esquerdo e nita. Por outro lado, ` a direita temos uma
soma de innitos termos, todos iguais. O unico jeito desta soma ser nita e
que as parcelas sejam nulas. Portanto, devemos ter (E
0
) = 0, tal como foi
armado.
1.2 Versao topol ogica
Dizemos que um ponto x M e recorrente para uma transformacao f : M M
se, para toda vizinhanca U de x, existe algum iterado f
n
(x) que esta em U. A
deni cao para uxos e analoga, apenas nesse caso o tempo n e um n umero real.
Na formulacao topol ogica do teorema de recorrencia supomos que o espa co
M admite uma base enumer avel de abertos, ou seja, um famlia enumer avel
1.3. RECORR
U =
_
kN
U
0
k
tem medida nula. Portanto, para demonstrar o teorema sera suciente que
mostremos que todo ponto x que n ao est a em
U e recorrente. Isso e f acil, como
vamos ver.
Seja x M
U e seja U uma vizinhan ca qualquer de x. A deni cao de
base de abertos implica que existe algum k N tal que x U
k
e U
k
U.
Como x n ao est a em
U, tambem x / U
0
k
. Em outras palavras, x tem algum
iterado f
n
(x), n 1 que esta em U
k
. Em particular, f
n
(x) tambem esta em
U. Como a vizinhan ca U e arbitr aria, isto prova que x e um ponto recorrente,
como havamos armado.
1.3 Recorrencia para medidas innitas
As conclusoes dos Teoremas 1.1 e 1.3 nao sao verdadeiras, em geral, se omitirmos
a hip otese de que a medida e nita. O exemplo mais simples e o seguinte:
Exemplo 1.4. Seja f : R R a transla cao de 1 unidade, isto e, f(x) = x + 1
para todo x R.
E f acil vericar que f deixa invariante a medida de Lebesgue
em R (que e innita). Por outro lado nenhum ponto e recorrente para f.
No entanto, e possvel estender estes enunciados para certos casos de medidas
innitas como, por exemplo, no exerccio que propomos a seguir.
Uma transforma cao f : M M diz-se invertvel se e uma bije cao e a sua
inversa e tambem uma transformacao mensuravel. Uma medida diz-se -nita
se existe uma sequencia crescente de subconjuntos M
k
cuja uniao e o espaco M
inteiro e tal que cada (M
k
) e nito. Neste caso, diremos que um ponto x vai
para innitose, para qualquer k, existe apenas um n umero nito de iterados
de x que est ao em M
k
.
1.4 Exerccios
1.1. Mostre que o seguinte enunciado e equivalente ao Teorema 1.1, isto e,
qualquer um dos dois pode ser deduzido a partir do outro: Seja f : M M
16 CAP
ENCIA DE POINCAR
E
uma transformacao mensuravel e uma medida invariante nita. Seja E M
qualquer conjunto mensur avel com (E) > 0. Ent ao existe N 1 e um conjunto
D E com medida positiva, tal que f
N
(x) E para todo ponto x D.
1.2. Suponha que f : M M e invertvel e que e uma medida -nita
invariante por f. Mostre que, dado qualquer conjunto mensuravel E M com
(E) > 0, quase todo ponto x E ou regressa a E ou vai para innito.
Dica: Considere o conjunto E
0,k
dos pontos x E que nunca regressam a E
e tem um n umero innito de iterados em M
k
. Comece por mostrar que os seus
iterados f
n
(E
0,k
) sao dois-a-dois disjuntos. Usando que (M
k
) e nito, deduza
que (E
k,0
) = 0 para todo k.
Captulo 2
Exemplos de Medidas
Invariantes
Nesta captulo vamos descrever alguns exemplos simples de medidas invariantes
por transforma coes ou por uxos. Antes porem, vamos mostrar uma proposicao
caracterizando quando uma medida e invariante:
Proposi cao 2.1. Seja f : M M uma transforma cao e uma medida. Ent ao
f preserva se, e somente se, para toda fun cao integr avel : M R vale:
_
d =
_
f d.
Demonstra cao. Assuma que f preserva a medida . Se e fun cao caracterstica
de algum conjunto, digamos =
A
, e imediato vericar que (f
1
(A)) =
_
f d, j a que
f
1
(A)
= f. Assim, ca provado que
_
d =
_
f d,
quando e uma fun cao caracterstica. Observe que segue diretamente da lin-
earidade da integral que se e uma fun cao simples, ent ao a igualdade ainda vale.
Finalmente, se e uma fun cao integr avel qualquer, pela deni cao de integral
_
d = lim
n
_
n
d,
onde
n
e uma sequencia de fun coes simples crescendo para . Por outro lado,
n
f e uma sequencia de fun coes simples crescendo para f. Logo,
_
f d = lim
n
_
n
f d.
Como
_
n
d =
_
n
f d, tomando o limite em ambos os lados, vem que
_
d =
_
f d.
17
18 CAP
k
= a
k
e
k+1
= a
k+1
e e
l
= a
l
22 CAP
xf
1
(y)
(x)
[G
(x)[
= (y) onde (x) =
c
1 +x
(2.7)
24 CAP
(x) = (1/x)
= 1/x
2
. Portanto, (2.7) se reescreve como
k=1
cx
2
k
1 +x
k
=
c
1 +y
k=1
1
(y +k)(y +k + 1)
=
c
1 +y
(2.8)
Para vericar que esta igualdade e realmente satisfeita, observe que
1
(y +k)(y +k + 1)
=
1
y +k
1
y +k + 1
.
Isto quer dizer que a ultima soma em (2.8) pode ser escrita na forma teles-
copica: todos os termos, exceto o primeiro, aparecem duas vezes, com sinais
contr arios, e portanto se cancelam. Logo a soma e igual ao primeiro termo, que
e precisamente o que se arma em (2.8). Isto prova a invariancia.
Finalmente, usando a primitiva c log(1 +x) da fun cao (x) vemos que
([0, 1]) =
_
1
0
c
1 +x
dx = c log 2.
Logo, escolhendo c = 1/ log 2 obtemos que e uma probabilidade.
A transforma cao de Gauss tem um papel muito importante em teoria dos
n umeros, devido ` a sua rela cao com o processo de expansao dos n umeros em
fra cao contnua. Recordemos do que se trata.
Dado um n umero x
0
(0, 1), seja
a
1
=
_
1
x
0
_
e x
1
=
1
x
0
a
1
= G(x
0
).
Note que a
1
e um n umero natural, x
1
[0, 1) e tem-se
x
0
=
1
a
1
+x
1
.
Agora, supondo que x
1
seja diferente de zero, podemos repetir o processo,
denindo
a
2
=
_
1
x
1
_
e x
2
=
1
x
1
a
2
= G(x
1
).
Ent ao
x
1
=
1
a
1
+x
2
portanto x
0
=
1
a
1
+
1
a
2
+x
2
.
2.4. TRANSFORMAC
AO DE GAUSS 25
Por recorrencia, para cada n 1 tal que x
n1
(0, 1) se dene
a
n
=
_
1
x
n1
_
e x
n
=
1
x
n1
a
n
= G(x
n1
)
e tem-se
x
0
=
1
a
1
+
1
a
2
+
1
+
1
a
n
+x
n
. (2.9)
Nao e difcil mostrar (verique!) que a sequencia
z
n
=
1
a
1
+
1
a
2
+
1
+
1
a
n
.
converge para x
0
quando n , e e usual traduzir este fato escrevendo
x
0
=
1
a
1
+
1
a
2
+
1
+
1
a
n
+
1
, (2.10)
que e chamada expansao em fra cao contnua de x
0
.
Note que a sequencia z
n
consiste de n umeros racionais. De fato se mostra que
estes sao os n umeros racionais que melhor aproximam o n umero x
0
, no sentido
de que z
n
esta mais pr oximo de x
0
do que qualquer outro n umero racional
com denominador menor ou igual que o denominador de z
n
(escrito em forma
irredutvel). Observe tambem que para obter (2.10) supusemos que x
n
(0, 1)
para todo n N. Se encontramos algum x
n
= 0, o processo para nesse momento
e consideramos (2.9) a expansao em fracao contnua de x
0
. Claro que este ultimo
caso ocorre somente se x
0
e um n umero racional.
Estas ideias de Teoria Ergodica podem ser usadas para obter conclus oes nao
triviais em Teoria dos N umeros. Por exemplo (veja o Exerccio 2.7), para quase
todo n umero x
0
(1/8, 1/7) o n umero 7 aparece innitas vezes na sua expans ao
em fra cao contnua, isto e, tem-se a
n
= 7 para innitos valores de n N.
De fato, mais tarde provaremos um fato muito mais preciso: para quase todo
x
0
(0, 1) o n umero 7 aparece com frequencia
1
log 2
log
64
63
na sua expans ao em fracao contnua. Tente intuir desde j a de onde vem este
n umero!
26 CAP
xf
1
(y)
1
[ det Df(x)[
= 1 para todo y U.
2.5. Dada uma fun cao : U [0, ), denotamos por = vol a medida
denida por (E) =
_
E
d vol. Suponha que f : U U e um difeomorsmo
local de classe C
1
e que e uma fun cao contnua. Mostre que f deixa invariante
a medida = vol se e somente se
xf
1
(y)
(x)
[ det Df(x)[
= (y) para todo y U.
Em particular, no caso em que f e invertvel, f deixa invariante a medida se
e somente se (x) = (f(x))[ det Df[(x) para todo x U.
2.6. Seja U um aberto de R
2d
e H : U R uma fun cao de classe C
2
. De-
notamos as variaveis em R
2d
por (p
1
, q
1
, . . . , . . . , p
d
, q
d
). O campo de vetores
hamiltoniano associado a H e denido por
F(p
1
, . . . , p
d
, q
1
, . . . , q
d
) =
_
H
q
1
, . . . ,
H
q
d
,
H
p
1
, . . . ,
H
p
d
_
.
Verique que o uxo denido por F preserva o volume.
2.7. Para (Lebesgue) quase todo n umero x
0
(1/8, 1/7) o n umero 7 aparece
innitas vezes na sua expans ao em fracao contnua, isto e, tem-se a
n
= 7 para
innitos valores de n N.
2.8. Considere a sequencia 1, 2, 4, 8, . . . , a
n
= 2
n
, . . . . Mostre que dado um
dgito i 0, . . . , 9, existe uma quantidade innita de valores n tal que a
n
comeca
com este dgito.
2.9. Mostre que se A e uma matriz n n com coecientes inteiros, entao a
transformacao induzida [A] :
n
Pi
n
denida por [A]( x) =
A(x) preserva a
medida de Lebesgue de
n
.
2.10. Mostre que o deslocamento denido na Sec cao 2.3 e transitivo e que o
conjunto de suas orbitas peri odicas e denso.
Captulo 3
Existencia de Medidas
Invariantes
Nesta captulo provaremos o seguinte resultado, que garante a existencia de
medidas invariantes em grande generalidade:
Teorema 3.1. Seja f : M M uma transforma cao contnua num espa co
metrico compacto. Entao existe pelo menos uma probabilidade invariante por
f. O mesmo resultado vale para uxos.
Antes de demonstrarmos este resultado, mencionemos alguns exemplos que
mostram que nenhuma das duas hipoteses, continuidade e compacidade, podem
ser omitidas.
3.1 Alguns exemplos simples
Considere f : (0, 1] (0, 1] dada por f(x) = x/2. Suponha que f admite
alguma probabilidade invariante (o objetivo e mostrar que isso nao acontece).
Pelo Teorema de Recorrencia 1.3, relativamente a essa probabilidade quase todo
ponto de (0, 1] e recorrente. Mas e imediato que nao existe nenhum ponto recor-
rente: a orbita de qualquer x (0, 1] converge para zero e, em particular, n ao
acumula no ponto inicial x. Isto mostra que f e um exemplo de transforma cao
contnua num espaco nao compacto que n ao admite nenhuma medida probabil-
idade invariante.
Modicando um pouco o exemplo, podemos mostrar que o mesmo fenome-
no pode ocorrer em espacos compactos, se a transformacao n ao e contnua.
Considere f : [0, 1] [0, 1] dada por f(x) = x/2 se x ,= 0 e f(0) = 1. Pela
mesma razao que antes, nenhum ponto x (0, 1] e recorrente. Portanto, se
existe alguma probabilidade invariante ela tem dar peso total ao unico ponto
recorrente que e x = 0. Em outras palavras, precisa ser a medida de Dirac
0
suportada em zero, que e denida por
0
(E) = 1 se 0 E e
0
(E) = 0 se 0 / E.
27
28 CAP
ITULO 3. EXIST
, que
ser a muito util para provar o Teorema 3.1. A ideia da deni cao e a seguinte:
duas medidas est ao pr oximas se dao integrais pr oximas para muitas fun coes
contnuas. Procuremos exprimir esta ideia de modo preciso.
Dada uma medida /
1
(M), um conjunto nito F =
1
, . . . ,
N
de
fun coes contnuas
j
: M R, e um n umero > 0, denimos
V (, F, ) = /
1
(M) :
_
j
d
_
j
d
se e somente se
_
d
n
_
d para toda funcao contnua : M R.
Demonstra cao. Para provar a parte somente se, considere qualquer funcao
contnua e forme o conjunto F = . Como
n
, temos que dado
qualquer > 0 existe uma ordem a partir n da qual
n
esta na vizinhan ca
V (, F, ). Mas isto signica, precisamente, que
_
d
n
_
d
<
3.2. A TOPOLOGIA FRACA
_
j
d
n
_
d
. Entao:
1. limsup
n
n
(K) (K) para cada conjunto compacto K M;
2. liminf
n
n
(U) (U) para cada conjunto aberto U M.
Em particular, se o bordo de A tem medida zero, temos que lim
n
n
(A) = (A).
Demonstra c ao. Seja U um aberto e vamos mostrar o item (b). Tome K um
compacto em U e escolha : [0, 1] uma fun cao contnua qualquer tal que
[
K
1 e [
U
c 0. Por exemplo, basta tomar (x) = d(x, U
c
)/(d(x, K) +
d(x, U
c
)). Ent ao:
(K)
_
d = lim
n
_
d
n
liminf
n
n
(U).
Como vale que (U) = sup
K
(K), onde o supremo e tomado sobre todos os
compactos K U provamos o item (b). O item (a) e inteiramente an alogo,
observando que (K) = inf (U), onde o nmo e tomado sobre todos os abertos
U contendo K.
As principais propriedades desta topologia de que necessitamos est ao dadas
no seguinte
Teorema 3.4. /
1
munido da topologia fraca
em/
1
(M). Para isso usamos o resultado
seguinte, cuja prova pode ser encontrada em [Rud87]. Como e usual, denotamos
por C
0
(M) o espaco das fun coes contnuas : M R, munido da norma da
convergencia uniforme:
|
1
2
| = sup[
1
(x)
2
(x)[ : x M.
30 CAP
ITULO 3. EXIST
n=1
1
2
n
_
n
d
1
_
n
d
2
, (3.1)
para qualquer par de medidas
1
e
2
.
Proposi cao 3.6. A express ao d esta bem denida, e uma dist ancia, e gera a
topologia fraca
em /
1
(M).
Demonstra c ao. Como as fun coes estao na bola unit aria de C
0
(M), ou seja,
sup [[ 1, e as medidas
i
sao probabilidades, o termo geral da soma e limitado
por 2 2
n
. Isto garante que a serie em (3.1) converge.
O unico passo n ao trivial na prova de que d e uma dist ancia e mostrar que
d(
1
,
2
) = 0
1
=
2
.
A hip otese d(
1
,
2
) = 0 signica que
_
j
d
1
=
_
j
d
2
para toda
j
T. Agora, dada qualquer na bola unit aria de C
0
(M) podemos encontrar
uma sequencia de elementos de T convergindo uniformemente para . Como
consequencia, a igualdade continua valendo para :
_
d
1
=
_
d
2
(3.2)
para toda na bola unit aria de C
0
(M). Como todo elemento de C
0
(M) tem
algum m ultiplo na bola unit aria, isto implica que a igualdade (3.2) e verdadeira
para toda fun cao contnua . Isto quer dizer que
1
=
2
, como pretendamos
mostrar.
Para provar que d gera a topologia, devemos mostrar que toda bola B(, ) =
/
1
(M) : d(, ) < contem alguma vizinhanca V (, F, ) e reciproca-
mente. Dado > 0 xemos N 1 sucientemente grande para que
n=N
2
n
<
2
e consideremos F =
1
, . . . ,
N
formado pelos primeiros N elementos do
subconjunto enumer avel denso. Alem disso, consideremos = /2. Armamos
que V (, F, ) B(, ). De fato
V (, F, )
_
n
d
_
n
d
n=1
2
n
_
n
d
_
n
d
<
<
N
n=1
2
n
+
n=N+1
2 2
n
< ,
3.2. A TOPOLOGIA FRACA
n1
, . . . ,
nN
distintos de T tais que
|
nj
j
| <
4
para todo 1 j N.
Fixemos > 0 sucientemente pequeno para que 2
nj
< /4 para todo 1 j N.
Armamos que B(, ) V (, F, ). De fato
B(, )
n=1
2
n
_
n
d
_
n
d
<
_
nj
d
_
nj
d
< 2
nj
para todo 1 j N
_
j
d
_
j
d
< 2
nj
+
2
< for all 1 n N,
e isto prova a nossa armacao.
Resta provar que (/
1
, fraca
.
Demonstra cao. Seja T =
n
: n N um subconjunto enumer avel denso
na bola unit aria de C
0
(M). Para cada n N, a sequencia de n umeros reais
_
n
d
k
, k N e limitada por 1. Portanto, para cada n N existe uma
sequencia (k
n
j
)
jN
tal que
_
n
d
k
n
j
converge para algum n umero
n
R quando j .
Alem disso, cada sequencia (k
n+1
j
)
jN
pode ser escolhida como subsequencia da
anterior (k
n
j
)
jN
. Denamos
j
= k
j
j
para cada j N. Por construcao, a menos
32 CAP
ITULO 3. EXIST
_
d
j
_
n
d
j
para todo j. Como
_
n
d
j
converge (para
n
), seque que
limsup
j
_
d
j
liminf
j
_
d
j
2.
Como e arbitr ario, conclumos que lim
j
_
d
j
existe. Isto prova (3.3) quando
a fun cao est a na bola unit aria. O caso geral reduz-se imediatamente a esse,
substituindo por /||. Assim, completamos a prova de (3.3).
Finalmente, e claro que o operador : C
0
(M) R denido por (3.3) e
linear e positivo: () min > 0 para todo fun cao C
0
(M) positiva em
todo ponto. Alem disso, (1) = 1. Logo, pelo Teorema 3.7, existe alguma prob-
abilidade boreliana em M tal que () =
_
d para toda fun cao contnua
. Agora a igualdade em (3.3) pode ser reescrita
_
= lim
j
_
d
j
para toda C
0
(M).
De acordo com o Lema 3.2, isto quer dizer que a subsequencia (
j
)
jN
converge
para na topologia fraca
_
E
_
=
_
f
1
(E)
_
para cada conjunto mensur avel E M.
Note que e invariante por f se e somente se f
= .
Lema 3.9. A aplicacao f
: /
1
(M) /
1
(M) e contnua relativamente `a
topologia fraca
.
3.3. DEMONSTRAC
AO DO TEOREMA DE EXIST
ENCIA 33
Demonstra cao. Para mostrarmos o lema acima, basta mostrar que se
n
con-
verge para na topologia fraca
n
=
_
df
.
De fato, se uma medida qualquer, armamos que
_
df
=
_
f d.
Com efeito, podemos aproximar por uma sequencia de fun coes simples
n
com
|
n
| ||. Observe que isso implica, em particular, que |
n
f| | f|.
Observe que se
A
e fun cao caracterstica, ent ao
_
A
df
= (f
1
(A)) =
_
A
f d.
Por linearidade, a igualdade acima se estende para as fun coes simples
n
. Para
nalizar, temos que pelo Teorema da Convergencia Dominada,
_
df
= lim
n
_
n
df
= lim
n
_
n
f d =
_
f d,
o que termina a prova da arma cao. Para completar a prova do Lema, basta
observar que a fun cao f tambem e contnua, uma vez que f e contnua.
Assim,
lim
n
_
df
n
= lim
n
_
f d
n
_
f d =
_
df
,
como queramos provar.
Voltando a prova do Teorema de Existencia, considere qualquer probabili-
dade em M: por exemplo, a medida de Dirac em um ponto qualquer. Forme
a sequencia de probabilidades
n
=
1
n
n1
j=0
f
j
(3.4)
onde f
j
n
k
= lim
k
1
n
k
n
k
1
j=0
f
j
. (3.5)
Agora e suciente provar o seguinte
34 CAP
ITULO 3. EXIST
= f
_
lim
k
1
n
k
n
k
1
j=0
f
j
_
= lim
k
f
_
1
n
k
n
k
1
j=0
f
j
_
= lim
k
1
n
k
n
k
j=1
f
j
.
A expressao do lado direito pode ser reescrita como
lim
k
_
1
n
k
n
k
1
j=0
f
j
+f
n
k
_
.
Armamos que lim
k
1
n
k
= 0 e lim
k
1
n
k
f
n
k
(E) =
1
n
k
(f
n
k
(E))
1
n
k
para todo conjunto mensur avel E F. Deste modo obtemos que
f
= lim
k
1
n
k
n
k
1
j=0
f
j
=
e portanto e invariante por f.
Isto completa a demonstracao do Teorema de Existencia 3.1.
Corolario 3.11 (Teorema de Recorrencia de Birkho). Se f : M M e
uma transforma cao contnua num espa co metrico compacto entao f tem algum
ponto recorrente.
Demonstra cao. Pelo Teorema 3.1, existe alguma probabilidade f-invariante .
Por outro lado, todo espa co metrico compacto admite uma base enumeravel de
abertos (verique!). Portanto, podemos aplicar o Teorema 1.3, para concluir
que -quase todo ponto e recorrente. Em particular, o conjunto dos pontos
recorrentes e nao vazio, conforme foi armado.
3.4 Exerccios
3.1. Prove a seguinte generaliza cao do Lema 3.10: Seja f : M M uma
transformacao contnua num espaco compacto, uma probabilidade em M e
(I
n
)
n
uma sequencia de intervalos de n umeros naturais tais que #I
n
converge
para innito quando n vai para innito. Ent ao qualquer ponto de acumula cao
da sequencia
n
=
1
#I
n
jIn
f
j
ICIOS 35
3.2. Dizemos que uma sequencia (
n
)
nN
de probabilidades converge pontual-
mente (ou fortemente) para /
1
(M)
n
(E) (E) para todo conjunto mensur avel E M.
1. Mostre que se (
n
)
nN
converge pontualmente para ent ao tambem con-
verge para na topologia fraca
se e somente se
n
(E) (E) para todo conjunto mensur avel E M cujo bordo E
satisfaz (E) = 0.
Dica para (2): Dado o mensur avel E e > 0 encontre funcoes contnuas
1
e
2
tais que
1
A
E
2
e
_
1
d
_
2
d < .
3.3. Fixe um subconjunto enumer avel denso T =
n
: n N da bola unit aria
de C
0
(M). Mostre que uma sequencia (
k
)
kN
de probabilidades emM converge
na topologia fraca para alguma /
1
(M) se e somente se, para todo n N,
_
n
d
k
converge para
_
n
d.
3.4. Seja f
1
, f
2
, . . . , f
N
: M M uma famlia nita qualquer de transforma coes
contnuas num espaco metrico compacto que comutam entre si: f
i
f
j
= f
j
f
i
para todo i e todo j em 1, 2, . . . , N. Prove que existe alguma probabilidade
que e invariante por f
i
para todo i 1, 2, . . . , N.
Denicao 3.12. Dizemos que uma transformacao f : M M e unicamente
erg odica se admite exatamente uma probabilidade invariante.
Os exerccios a seguir tratam de transforma coes unicamente erg odicas. Esta
terminologia e justicada pelo Exerccio 3.7 abaixo, que arma que nesse caso a
probabilidade invariante e necessariamente ergodica. No que segue suporemos
que M e um espaco metrico compacto e f : M M e contnua.
3.5. Seja R
e unicamente
erg odica.
3.6. Seja f : M M uma transformacao unicamente erg odica. Mostre que se
: S
1
R e uma fun cao contnua qualquer, entao:
(x) = lim
n
1
n
n1
j=0
(R
j
(x))
existe em todo ponto e, de fato, o limite e uniforme. Justique que e constante
em todo ponto.
Dica: Verique que a sequencia do lado direito e equicontnua e use o teorema
de Ascoli-Arzela.
36 CAP
ITULO 3. EXIST
j=0
(f
j
(x)) =
_
d
para toda fun cao contnua : M R e todo x M. Obtenha que, se uma
transformacao e unicamente erg odica ent ao a sua probabilidade invariante e
erg odica.
Captulo 4
Teorema Ergodico de
Birkho
O teorema fundamental da Teoria Erg odica arma que, para qualquer sub-
conjunto mensur avel e para quase todo ponto, existe um tempo medio de per-
manencia da orbita do ponto nesse conjunto. Este resultado e devido a von
Neumann, que provou um enunciado mais fraco, e sobretudo a Birkho, que o
provou na forma denitiva que iremos estudar.
Em muitos casos, esse tempo medio de permanencia e precisamente igual `a
medida do subconjunto, ou seja, orbitas tpicas passam em cada subconjunto um
tempo que e exatamente igual `a import anciaque a probabilidade invariante
atribui ao conjunto. Isto e o que se chama de ergodicidade, uma propriedade
que remonta a Boltzmann, e que estudaremos mais tarde.
4.1 Enunciados e comentarios
Comecemos por explicar o que entendemos por tempo medio de permanencia
de uma orbita num conjunto. Dado x M e um conjunto mensur avel E M,
vamos tomar um certo n umero (grande) de iterados iniciais da orbita de x e
vamos considerar a fra cao desses iterados que estao em E:
n
(E, x) =
1
n
#
_
j 0, 1, . . . , n 1 : f
j
(x) E
_
.
Observe que isto e o mesmo que
n
(E, x) =
1
n
n1
j=0
A
E
(f
j
(x)),
onde A
E
designa a fun cao caracterstica do conjunto E, isto e, A
E
(x) = 1 se
x E e A
E
(x) = 0 caso contr ario.
37
38 CAP
ODICO DE BIRKHOFF
Em seguida, fazemos n ir para innito e chamamos tempo medio de per-
manencia da orbita de x em E o limite destas fracoes:
(E, x) = lim
n
n
(E, x).
Em geral, este limite pode nao existir. Iremos ver um exemplo desse fato daqui
a pouco. No entanto, o teorema ergodico arma que, relativamente a qualquer
probabilidade invariante, o limite realmente existe para quase todo ponto:
Teorema 4.1. Seja f : M M uma transforma cao mensur avel e uma
probabilidade invariante por f. Dado qualquer conjunto mensur avel E M,
o tempo medio de permanencia (E, x) existe em -quase todo ponto x M.
Alem disso,
_
(E, x) d(x) = (E).
Antes de passarmos ` a demonstracao deste resultado notavel, e a algumas
das suas aplicacoes, vamos fazer alguns comentarios relacionados. O primeiro
deles e que se (E, x) existe para um certo ponto x M ent ao
(E, f(x)) = (E, x). (4.1)
De fato, por denicao,
(E, f(x)) = lim
n
1
n
n
j=1
A
E
(f
j
(x))
= lim
n
1
n
n1
j=0
A
E
(f
j
(x))
1
n
_
A
E
(x) A
E
(f
n
(x))
= (E, x) + lim
n
1
n
_
A
E
(x) A
E
(f
n
(x))
Como a fun cao caracterstica e limitada, o ultimo limite e igual a zero. Isto
prova a igualdade (4.1).
O teorema ergodico pode ser enunciado de modo um pouco mais geral:
Teorema 4.2. Seja f : M M uma transforma cao mensur avel e uma
probabilidade invariante por f. Dada qualquer fun cao integr avel : M R o
limite
(x) = lim
n
1
n
n1
j=0
(f
j
(x))
existe em -quase todo ponto x M. Alem disso,
_
(x) d(x) =
_
(x) d(x).
Observe que o Teorema 4.1 e o caso particular = fun cao caracterstica A
E
do conjunto E. Este enunciado mais geral pode ser provado usando uma vers ao
um pouco mais elaborada do argumento da se cao 4.2, que n ao apresentaremos
aqui.
4.2. DEMONSTRAC
AO DO TEOREMA ERG
ODICO 39
4.2 Demonstra cao do teorema ergodico
A estrategia da prova e a seguinte. Seja E M um conjunto mensur avel
qualquer. Para cada x M, denimos
(E, x) = limsup
1
n
#
_
j 0, . . . , n 1 : f
j
(x) E
_
(E, x) = liminf
1
n
#
_
j 0, . . . , n 1 : f
j
(x) E
_
.
Note que, para todo x M,
(E, f(x)) = (E, x) e (E, f(x)) = (E, x) (4.2)
A justica cao e analoga ` a da rela cao (4.1).
O principal passo da demonstracao consiste em mostrar que
(E, x) = (E, x) para -quase todo ponto x. (4.3)
E claro que (E, x) e sempre maior ou igual que (E, x). Portanto, para mostrar
(4.3) sera suciente que provemos
_
(E, x) d(x) (E)
_
(E, x) d(x). (4.4)
Vamos provar a primeira desigualdade em (4.4). A segunda segue de um argu-
mento inteiramente an alogo
1
.
Fixemos qualquer > 0. Por deni cao de limsup, para cada x M existem
inteiros t 1 tais que
1
t
#
_
j 0, . . . , t 1 : f
j
(x) E
_
(E, x) . (4.5)
Representaremos por t(x) o menor inteiro com esta propriedade. Para tornar a
demonstracao mais transparente, consideraremos primeiro o caso particular em
que a fun cao x t(x) e limitada, isto e,
Caso particular: Existe T N tal que t(x) T para todo x M.
Dado qualquer x M, denimos uma sequencia x
0
, x
1
, . . . , x
s
de pontos em
M e uma sequencia t
0
, t
1
, . . . , t
s
de n umeros naturais, do seguinte modo:
1. Primeiramente, tomamos x
0
= x.
2. Supondo que x
i
j a foi denido, tomamos t
i
= t(x
i
) e x
i+1
= f
ti
(x
i
).
3. Terminamos quando encontramos x
s
tal que t
0
+t
1
+ +t
s1
+t
s
n.
1
Alternativamente, a segunda desigualdade pode ser deduzida da primeira, aplicada ao
complementar E
c
, observando que (E) = 1 (E
c
) e (E, x) = 1 (E
c
, x).
40 CAP
ODICO DE BIRKHOFF
Note que todo x
i
e iterado do ponto x: de fato x
i
= f
t0++ti1
(x). Apli-
cando (4.2) conclumos que (E, x
i
) = (E, x) para todo i. A deni cao de t(x
i
)
implica que, dos t
i
primeiros iterados de x
i
, pelo menos
t
i
_
(E, x
i
) ) = t
i
_
(E, x) ) (4.6)
estao em E. Isto vale para cada i = 0, 1, . . . , s 1. Portanto, pelo menos
(t
0
+t
1
+ +t
s1
)((E, x) )
dos n primeiros iterados de x, estao em E. Alem disso, a ultima regra na
deni cao das nossas sequencias implica que
t
0
+t
1
+ +t
s1
n t
s
n T.
Deste modo, mostramos que pelo menos (n T)((E, x) ) dos n primeiros
iterados de x estao em E. Em outras palavras,
n1
j=0
A
E
(f
j
(x)) (n T)((E, x) ) (4.7)
para todo x M e todo n 1. Integrando a relacao (4.7), obtemos que
n1
j=0
_
A
E
(f
j
(x)) d(x) (n T)
_
(E, x) d(x) (n T).
Todas as parcelas no membro da esquerda sao iguais a (E), uma vez que a
probabilidade e invariante por f. Portanto, esta desigualdade pode ser escrita
como
n(E) (n T)
_
(E, x) d(x) (n T).
Dividindo os dois termos por n e fazendo n ir para innito, conclumos que
(E)
_
(E, x) d(x)
Como > 0 e qualquer, isto implica a primeira desigualdade em (4.4). Isto
termina a demonstracao neste caso.
Caso geral: Vamos indicar as modicacoes que devem ser feitas relativamente
ao caso particular.
Dado > 0, comecamos por xar T 1 sucientemente grande, de modo
que a medida do
B = y M : t(y) > T
seja menor que . Em seguida, na deni cao das sequencias substitumos a regra
2 por
4.2. DEMONSTRAC
AO DO TEOREMA ERG
ODICO 41
2a. Se t(x
i
) T, tomamos t
i
= t(x
i
) e x
i+1
= f
ti
(x
i
).
2b. Se t(x
i
) > T, tomamos t
i
= 1 e x
i+1
= f(x
i
).
As regras 1 e 3 permanecem inalteradas. A estimativa referente a (4.6) continua
v alida, para os valores de i aos quais se aplica a regra 2a:
ti1
j=0
A
E
(f
j
(x
i
)) t
i
_
(E, x) ).
j=0
A
E
(f
j
(x
i
)) t
i
_
(E, x) )
ti1
j=0
A
B
(f
j
(x
i
)). (4.8)
A vantagem e que (4.8) e valida tambem para os valores de i aos quais se aplica
a regra 2b. De fato, nesse caso tem-se t
i
= 1, o membro da esquerda e maior ou
igual que zero e o membro da direita e menor que zero, uma vez que (E, x) e
sempre menor ou igual que 1. Isso signica que, no lugar de (4.7), tem-se
n1
j=0
A
E
(f
j
(x)) (n T)((E, x) )
n1
j=0
A
B
(f
j
(x)).
Integrando, como zemos anteriormente, obtemos
n(E) (n T)
_
(E, x) d(x) (n T) n(B).
Dividindo por n e fazendo n , deduzimos que (lembre que (B) < )
(E)
_
(E, x) d(x) (B)
_
(E, x) d(x) 2.
Como > 0 e arbitr ario, segue que
(E)
_
(E, x) d(x).
Isto completa a demonstracao do Teorema 4.1.
42 CAP
ODICO DE BIRKHOFF
4.3 Exerccios
4.1. Considere a transforma cao f : M M, f(x) = 10x [10x] introduzida
na secao 2.1. Considere
x = 0, 335533335555555533333333333333335 . . . .
Ou seja: a expansao decimal de x consiste de blocos de 3s e 5s, alternados, cada
bloco (exceto o segundo) com duas vezes mais dgitos que o anterior. Considere
tambem E = [0, 3, 0, 4). Mostre que
2
(E, x) = 1,
8
=
3
4
, . . .
2
2k1 (E, x)
2
3
,
enquanto que
4
(E, x) =
1
2
,
16
=
3
8
, . . .
2
2k (E, x)
1
3
,
e portanto o tempo medio de permanencia da orbita de x em E n ao existe.
4.2. Mostre que, para qualquer fun cao integr avel , a media temporal satisfaz
f = em -quase todo ponto.
Captulo 5
Ergodicidade
Uma transforma cao f : M M diz-se erg odica para uma probabilidade invari-
ante (tambem dizemos que a medida e ergodica para f, ou que o sistema
(f, ) e ergodico) se as medias temporais dadas pelo Teorema de Birkho 4.2
coincidem em quase todo ponto com as respectivas medias espaciais:
lim
n
1
n
n1
j=0
(f
j
(x)) =
_
d,
para toda fun cao -integr avel : M R e -quase todo x M.
Na pr oxima proposicao vamos reescrever esta condicao de v arias maneiras
equivalentes, para ajudar a entender o seu signicado. Um conjunto mensuravel
A M diz-se invariante se f
1
(A) = A. Uma fun cao mensuravel : M R
diz-se invariante se f = .
Proposi cao 5.1. Seja uma probabilidade invariante de uma transformacao
f : M M mensur avel. As seguintes condi coes sao equivalentes:
1. O sistema (f, ) e erg odico.
2. Para todo subconjunto invariante A tem-se (A) = 0 ou (A) = 1.
3. Toda fun cao invariante e constante num conjunto de medida total.
Demonstra cao. (1) implica (2): Considere = A
A
. Por um lado, a hip otese
(1) signica que
(x) =
_
d = (A)
para quase todo x M. Por outro lado, como A e invariante, temos que x A
se e somente se f(x) A. Isto implica que (f
j
(x)) = (x) para todo j 0 e
para todo x. Portanto,
(x) = (x) = A
A
(x)
para todo x M. Como a fun cao caracterstica s o toma os valores 0 e 1, estas
duas igualdades implicam que (A) = 0 ou (A) = 1, como e armado em (2).
43
44 CAP
ITULO 5. ERGODICIDADE
(2) implica (3): Seja uma fun cao invariante qualquer. Ent ao, a pre-
imagem
1
(I) de qualquer intervalo I R e um conjunto invariante. Portanto,
pela hip otese (2), essa pre-imagem tem medida zero ou um. Como o intervalo
I e qualquer, isto prova que e constante num conjunto com probabilidade
total.
(3) implica (1): Seja uma fun cao integr avel qualquer. Como vimos no
exerccio 4.2, a media temporal e uma fun cao invariante. Logo, pela hip otese
(3), e constante em quase todo ponto. Ent ao, usando o teorema erg odico,
(x) =
_
d =
_
d
em quase todo ponto. Isto e, o sistema e ergodico.
5.1 Exemplos e aplica coes
Nesta secao descrevemos diversos exemplos de sistemas ergodicos.
5.1.1 Expansao decimal
Considere a transforma cao f : [0, 1] [0, 1], f(x) = 10x [10x] da secao 2.1.
Armamos que f e ergodica para a medida de Lebesgue . Tendo em vista a
proposi cao 5.1, para mostrar isto s o temos que provar que se A e um conjunto
invariante com medida positiva ent ao A tem medida total.
Suponhamos ent ao que A e invariante e (A) > 0. O ingrediente principal
e o teorema de deriva cao 0.25. No nosso caso, como estamos tratando com
subconjuntos de R, a condi cao (2) torna-se
lim
0
inf
_
(I A)
(I)
: I (a , a +) intervalo contendo a
_
= 1 . (5.1)
Fixemos um ponto de densidade a A qualquer. Consideremos a sequencia de
intervalos
I
k
=
_
m
k
10
k
,
m
k
+ 1
10
k
_
, m
k
Z, k N,
que contem o ponto a. Como a e um ponto de densidade de A, a propriedade
(5.1) implica que
(I
k
A)
(I
k
)
1 quando k .
Observe tambem que cada f
k
e uma bije cao am de I
k
sobre o intervalo (0, 1).
Isso tem a seguinte consequencia, que e crucial para o nosso argumento:
(f
k
(E
1
))
(f
k
(E
2
))
=
(E
1
)
(E
2
)
(5.2)
5.1. EXEMPLOS E APLICAC
OES 45
para quaisquer subconjuntos mensuraveis E
1
e E
2
de I
k
. Aplicando este fato a
E
1
= I
k
A e E
2
= I
k
obtemos que
_
f
k
(I
k
A)
_
_
(0, 1)
_ =
(I
k
A)
(I
k
)
.
Claro que
_
(0, 1)
_
= 1. Alem disso, como estamos supondo que A e invariante,
f
k
(I
k
A) esta contido em A. Deste modo obtemos que
(A)
(I
k
A)
(I
k
)
.
Como a sequencia do lado direito converge para 1, segue que (A) = 1, como
queramos demonstrar. Ficou provado que a transforma cao f e ergodica para a
medida de Lebesgue .
Em seguida vamos dar uma aplica cao deste fato no contexto da Teoria dos
N umeros. Dizemos que um n umero x R e balanceado se todo dgito aparece
com a mesma frequencia, 1/10, na sua expans ao decimal.
E f acil dar exemplos de
n umeros balanceados. Mas em geral e muito difcil decidir se um dado n umero
irracional e balanceado ou n ao. Por exemplo, n ao e sabido ate hoje se o n umero
e balanceado.
No entanto, a conclus ao da se cao anterior nos permite deduzir que quase
todo n umero e balanceado:
Proposi cao 5.2. O conjunto dos n umeros x R nao balanceados tem medida
de Lebesgue nula.
Demonstra cao. Como o fato de ser balanceado e independente da parte inteira
do n umero, s o precisamos mostrar que quase todo x [0, 1] e balanceado.
Considere f : [0, 1] [0, 1] denida por f(x) = 10x [10x]. Para cada dgito
j 0, 1, . . . , 9 considere o intervalo E
j
= [j/10, (j + 1)/10). Recorde que
se x = 0, a
0
a
1
a
k
a
k+1
ent ao f
k
(x) = 0, a
k
a
k+1
. Portanto, f
k
(x)
E
j
se e somente se o k-esimo dgito da expans ao decimal de x e igual a j.
Consequentemente, o tempo medio de permanencia (E
j
, x) e exatamente a
frequencia do dgito j na expansao decimal de x. Usando o teorema ergodico e o
fato de que a transforma cao e ergodica para a medida de Lebesgue , conclumos
que para cada j 0, 1, . . . , 9 existe um subconjunto B
j
de M com (B
j
) = 1
tal que
(E
j
, x) = (E
j
) =
1
10
para todo x B
j
.
Ent ao B = B
0
B
1
B
9
tambem tem (B) = 1, e todo n umero x B e
balanceado.
5.1.2 Deslocamentos (shifts) de Bernoulli
Vamos agora voltar a discussao dos deslocamentos de Bernoulli, introduzidos
na Seccao 2.3 do Captulo 2. Mostraremos que as medidas de Bernoulli s ao
erg odicas. Para isso, a seguinte propriedade das medidas de Bernoulli vai ser
util :
46 CAP
ITULO 5. ERGODICIDADE
Lema 5.3. Se A e B s ao elementos da algebra B
0
, isto e, uni oes nitas de
cilindros disjuntos, ent ao tem-se
(A f
m
(B)) = (A)(f
m
(B)) = (A)(B),
para todo m sucientemente grande.
Demonstra cao. Expliquemos porque esta propriedade e verdadeira quando A e
B sao cilindros, A = [k, l; a
k
, . . . , a
l
] e B = [u, v; b
u
, . . . , b
v
]. Para cada m tem-
se f
m
(B) = [u + m, v + m; b
u
, . . . , b
v
]. Escolhendo m sucientemente grande
garantimos que u +m > l e, entao,
A f
m
(B) = :
k
= a
k
, . . . ,
l
= a
l
,
u+m
= b
u
, . . . ,
v+m
= b
v
=
_
[k, v +m; a
k
, . . . , a
l
, c
l+1
, . . . , c
u+m1
, b
u
, . . . , b
v
],
onde a uni ao e sobre todos os valores possveis de c
l+1
, . . . , c
u+m1
. Usando
(2.6), conclumos que (A f
m
(B)) = (A)(B). Isto prova o lema quando
os conjuntos envolvidos s ao cilindros. O caso geral segue pelo fato de ser
nitamente aditiva.
Proposi cao 5.4. Seja f : M M um deslocamento e uma medida de
Bernoulli em M, como antes. Entao o sistema (f, ) e erg odico.
Demonstra cao. Seja A um conjunto mensur avel invariante qualquer. Queremos
mostrar que (A) = 0 ou (A) = 1. Para tornar a ideia da prova mais clara,
comecemos por um caso particular: suponhamos que A esta na algebra B
0
das
uni oes nitas de cilindros disjuntos dois-a-dois. Nesse caso podemos aplicar o
lema anterior, com B = A. Conclumos que (Af
m
(A)) = (A)
2
sempre que
tomemos m sucientemente grande. Mas, como A e invariante, f
m
(A) = A
para todo m. Ent ao a igualdade anterior quer dizer que (A) = (A)
2
, o que
so pode acontecer se (A) = 0 ou (A) = 1.
Agora vamos fazer a prova quando A B e um conjunto invariante qualquer.
A ideia e aproximar A por elementos da algebra B
0
, usando o Teorema de
Aproxima cao 0.11: dado qualquer > 0 existe A
0
B
0
tal que (AA
0
) < .
Escolha m como no caso anterior, de modo que
(A
0
f
m
(A
0
)) = (A
0
)(f
m
(A
0
)) = (A
0
)
2
. (5.3)
Observe que
(A f
m
(A))(A
0
f
m
(A
0
)) (AA
0
) (f
m
(A)f
m
(A
0
))
(AA
0
) f
m
(AA
0
).
Isto, junto com o fato de que e invariante por f, implica que
(A f
m
(A)) (A
0
f
m
(A
0
))
2(AA
0
) < 2. (5.4)
Alem disso,
(A)
2
(A
0
)
2
((A) +(A
0
))((A) (A
0
))
(A) (A
0
)
< 2.
(5.5)
5.1. EXEMPLOS E APLICAC
OES 47
Juntando as rela coes (5.3), (5.4), (5.5), conclumos que [(A) (A)
2
[ < 4.
Como e arbitr ario, deduzimos que (A) = (A)
2
e entao, do mesmo modo que
antes, conclumos que (A) = 0 ou (A) = 1.
5.1.3 Rotacao irracional no crculo
Para n os o crculo S
1
ser a o conjunto dos n umeros complexos com m odulo igual
a 1. Dado R, a rotacao de angulo e a multiplica cao pelo n umero complexo
e
i
R
: S
1
S
1
, R
(z) = e
i
z .
E claro que R
.
O comportamento din amico e erg odico de R
E claro que este espaco contem todas as fun coes mensuraveis limitadas e, em
particular, todas as fun coes caractersticas de conjuntos mensur aveis. Outro
fato de que necessitamos e que a famlia de fun coes
k
(z) = z
k
: k Z e
uma base (de Hilbert) desse espaco: dada qualquer L
2
() existe uma unica
sequencia (c
k
)
kZ
de n umeros complexos tais que
(z) =
kZ
c
k
z
k
para quase todo z S
1
.
Demonstra cao. Pela proposi cao 5.1, basta mostrar que toda fun cao integr avel
que e invariante e constante em -quase todo ponto. Observe que se e
integr avel, ent ao automaticamente L
2
() (verique! Utilize que e nita).
1
Quando lidamos com L
2
() sempre identicamos funcoes que diferem apenas num con-
junto de medida nula.
48 CAP
ITULO 5. ERGODICIDADE
Usando a expans ao de Fourier (z) =
kZ
c
k
z
k
, a condi cao de ser invariante
R
= se escreve
kZ
c
k
e
ki
z
k
=
kZ
c
k
z
k
Por unicidade dos coecientes da expansao em serie de Fourier, obtemos que
c
k
(e
ki
1) = 0 para todo k Z.
A hip otese de que a rota cao e irracional signica que e
ki
1 ,= 0 para todo
k ,= 0, e portanto, c
k
= 0 para todo k ,= 0. Ou seja, (z) = c
0
para -quase
todo z S
1
, como queramos provar.
De fato as rota coes irracionais satisfazem uma propriedade muito mais forte
do que ergodicidade: elas s ao unicamente ergodicas, o que quer dizer que tem
uma unica probabilidade invariante (que e a medida de Lebesgue, claro).
Observa cao 5.6. A no cao de rota cao irracional se estende para dimensoes
maiores. Dado qualquer d 1 chamamos d-toro o produto T
d
= S
1
S
1
do crculo por si mesmo d vezes. A rotacao de angulo = (
1
, . . . ,
d
) e a
aplica cao R
: T
d
T
d
, R
(z
1
, . . . , z
d
) = (e
i1
z
1
, . . . , e
i
d
z
d
). A rota cao e
irracional se os n umeros
j
/(2) sao incomensur aveis:
m
0
+m
1
1
2
+ +m
d
d
2
= 0 m
0
= m
1
= = m
d
= 0,
quaisquer que sejam os inteiros m
0
, m
1
, . . . , m
d
. Usando uma vers ao multi-
dimensional das ideias anteriores, se prova que uma rota cao e ergodica se e
somente se ela e irracional.
5.1.4 Transformacao de Gauss
Como vimos na secao 2.4, a transforma cao de Gauss G(x) = 1/x [1/x] ad-
mite uma probabilidade invariante que e equivalente ` a medida de Lebesgue,
nomeadamente,
(E) =
1
log 2
_
E
dx
1 +x
Temos tambem que o sistema (G, ) e ergodico. Este fato pode ser demonstrado
pelo mesmo tipo de argumento que usamos na secao 5.1.1. Vamos esbocar o
argumento neste caso, explicando qual e a principal diculdade adicional.
Seja A um conjunto invariante com medida positiva. Em primeiro lugar, con-
tinua sendo verdade que para quase todo ponto a [0, 1] existe uma sequencia
de intervalos I
k
contendo a e tais que f
k
envia I
k
bijetivamente e diferenci-
avelmente sobre (0, 1). O di ametro desses intervalos converge para zero. Logo,
tomando para a um ponto de densidade qualquer de A, temos que
(I
k
A)
(I
k
)
1 quando k +. (5.6)
5.1. EXEMPLOS E APLICAC
OES 49
Por outro lado embora f
k
seja uma bijecao restrita a cada I
k
, ela n ao e am.
Por essa razao n ao temos o analogo da rela cao (5.2) neste caso. Esta diculdade
e contornada atraves do seguinte resultado, que e um exemplo de controle de
distor c ao: e muito importante notar que a constante K e independente de k,
I
k
, E
1
, e E
2
.
Lema 5.7. Existe uma constante K > 1 tal que para todo k 1, todo intervalo
I
k
tal que G restrita a I
k
e uma bije cao diferenciavel, tem-se
(f
k
(E
1
))
(f
k
(E
2
))
K
(E
1
)
(E
2
)
para quaisquer subconjuntos mensur aveis E
1
e E
2
de I
k
.
Antes de demonstrarmos o Lema 5.7, explicamos como a ergodicidade de
(G, ) pode ser obtida a partir dele. Observe que f
k
(I
k
A
c
) = A
c
, porque o
conjunto A e invariante. Lembre tambem que f
k
(I
k
) = (0, 1), que tem medida
total. Tomando E
1
= I
k
A
c
e E
2
= I
k
no lema 5.7, conclumos que
(A
c
)
(f
k
(I
k
A
c
)
(A
c
)
K
(I
k
A
c
)
(I
k
.
De acordo com (5.6), a express ao do lado direito converge para zero quando
k . Logo (A
c
) = 0, como queramos demonstrar.
Daremos agora a prova do Lema 5.7. As linhas gerais da demonstracao,
servir ao para concluir um resultado mais geral,apresentado na secao 9.1.
Prova do Lema 5.7. Usaremos os seguintes fatos sobre a transformacao f que
podem ser facilmente vericados pelo leitor:
1. Para todo x (0, 1) vale que [f
(x)[ 4.
2. Existe C
1
> 0 tal que [
f
(x)
f
(x)
[ < C
1
.
Observe que a partir do item (1) acima, podemos mostrar que se x, y I
k
ent ao
[f
i
(x) f
i
(y)[
1
2
ki
[f
k
(x) f
k
(y)[ se i = 0, 1, 2, . . . k. (5.7)
Observe tambem que se x, y I
k
temos que
[ log
(f
k
)
(x)
(f
k
)
(y)
[
k1
i=0
[ log f
(f
i
(x)) log f
(f
i
(y))[.
O item (2) nos garante que a fun cao x log f
(a) log f
(b)[ C
1
[a b[.
Aplicando este fato na desigualdade acima e observando a equacao 5.7:
[ log
(f
k
)
(x)
(f
k
)
(y)
[ C
1
k1
i=0
[f
i
(x) f
i
(y)[
k1
i=0
1
2
ki
C
1
[f
k
(x) f
k
(y)[ C
2
,
50 CAP
ITULO 5. ERGODICIDADE
onde C
2
e uma constante propriamente escolhida. Logo, tomando K = exp C
2
,
vem que para todos x, y I
k
vale:
(f
k
)
(x)
(f
k
)
(y)
< C
3
.
Note que a constante C
3
escolhida n ao depende de k nem de I
k
. Observe ainda
que se A [0, 1] e um conjunto mensur avel, ent ao
1
2 log 2
m(A) (A)
1
log 2
m(A),
onde m representa a medida de Lebesgue de [0,1].
Assim, para concluir a prova do Lema 5.7, basta observar que se E
1
e E
2
sao subconjuntos mensur aveis de I
k
, ent ao:
(f
k
(E
1
))
(f
k
(E
2
))
= 2(log 2)
2
m(f
k
(E
1
))
m(f
k
(E
2
))
_
E1
(f
k
)
(x) dm
_
E2
(f
k
)
(y) dm
2(log 2)
2
(C
3
)
2
m(E
1
)
m(E
2
)
4(log 2)
4
C
3
(E
1
)
(E
2
)
.
Assim, basta tomar K = 4(log 2)
4
(C
3
)
2
e o lema esta provado.
5.1.5 Maquina de somar (adding machine)
A maquina de somar modela sistemas tais como o contador de quilometragem
de um carro ou o registro de consumo de gas (em algumas cidades): a dinamica
consiste em fazer avancar o contador de uma unidade. A principal diferen ca com
rela cao `a realidade e que este contador idealizado comporta innitos dgitos.
Fixe d 2, que representa a base de numera cao (por exemplo, d = 10).
Consideramos o espa co M de todas as sequencias
= (
0
,
1
,
2
, . . . ,
k1
,
k
, . . .)
com
j
0, 1, . . . , d 1. Munimos este espa co da seguinte distancia
d(,
) = 2
N(,
)
onde N(,
) = minj 0 :
j
,=
j
.
Tambem consideramos a transforma cao f : M M soma uma unidade:
Para toda sequencia com
0
< d 1, denimos
f(
0
,
1
,
2
, . . . ,
k1
,
k
, . . .) = (
0
+ 1,
1
,
2
, . . . ,
k1
,
k
, . . .).
Se
0
= d 1 mas
1
< d 1, denimos
f(
0
,
1
,
2
, . . . ,
k1
,
k
, . . .) = (0,
1
+ 1,
2
, . . . ,
k1
,
k
, . . .).
5.2. EQUIVAL
ENCIA ESPECTRAL 51
Mais geralmente, se
0
= =
k1
= d 1 mas
k
< d 1, denimos
f(
0
,
1
,
2
, . . . ,
k1
,
k
, . . .) = (0, 0, 0, . . . , 0,
k
+ 1, . . .).
Se
j
= d 1 para todo j 0, denimos
f(
0
,
1
,
2
, . . . ,
k1
,
k
, . . .) = (0, 0, 0, . . . , 0, 0, . . .).
M munido da dist ancia denida em (3.1) e um espaco metrico compacto, e
a transforma cao f e contnua nesse espaco. O exerccio 5.7 pede para mostrar
que f e unicamente erg odica e para calcular a ( unica) probabilidade invariante.
5.2 Equivalencia Espectral
Esta subsecao trata da caracteriza cao das propriedades din amicas de uma me-
dida como propriedades de
Algebra Linear, relacionadas a um certo operador
U
f
que iremos denir. Iremos ver, por exemplo, que a invari ancia da medida
equivale ao fato do operador preservar dist ancias num espaco adequado de
fun coes. Veremos tambem a ergodicidade como uma propriedade espectral do
sistema (f, ), no sentido de que ela pode ser caracterizada pelos auto-valores
do operador U
f
.
5.2.1 O Espa co L
2
()
Para denir o operador U
f
, precisamos primeiro denir seu domnio, o espaco
de fun coes L
2
():
Denicao 5.8. O espaco vetorial L
2
() e denido como o conjunto
L
2
() = : M R;
_
[[
2
d < ,
onde duas fun coes sao identicadas se elas coincidem em quase todo ponto com
respeito `a medida .
Podemos munir este espaco vetorial com um produto interno dado por:
< , >=
_
. d.
Segue da desigualdade de Holder e das propriedades da integral que a expressao
acima de fato dene um produto interno em L
2
(). Naturalmente, uma vez que
temos um produto interno em L
2
(), podemos denir uma norma por:
||
2
=
< , >.
Alem disso, podemos munir L
2
() com a metrica que provem do produto interno
<, > denida por:
d(, ) = | |
2
=
__
[ [
2
d
_1
2
. (5.8)
52 CAP
ITULO 5. ERGODICIDADE
ENCIA ESPECTRAL 53
Porem, U
f
so e sobrejetiva se f for invertvel (veja o Exerccio ??).
Observe que 1 e sempre um autovalor de U
f
e a esse autovalor temos associ-
ado um auto-espa co que sempre contem as fun coes constantes. A Proposicao 5.1
diz que a propriedade da medida ser ergodica equivale ao fato de que as unicas
fun coes invariantes por U
f
sao as fun coes constantes ou, em outros termos, a
dimensao do auto-espa co associado ao auto-valor 1 e igual a um. Isso justica
a arma cao de que a ergodicidade e uma propriedade espectral.
Vamos estabelecer quando duas tranformacoes f : M M e g : N N
preservando medidas e sao equivalentes do ponto de vista espectral. Isto
nos permitir a extrair informa coes sobre as propriedades espectrais do sistema
(f, ) a partir das propriedades espectrais do sistema (g, ) e vice-versa.
Denicao 5.10. Sejam f : M M preservando e g : N N preservando
. Dizemos que (f, ) e (g, ) sao espectralmente equivalentes se existir uma
transformacao linear invertvel A : L
2
() L
2
() tal que:
1. < A, A >=< , >;
2. AU
f
= U
g
A.
Deixaremos para o leitor no Exerccio ?? a verica cao de que a rela cao
denida acima e de fato uma rela cao de equivalencia.
Se (f, ) e (g, ) sao espectralmente equivalentes e A e uma equivalencia
espectral, se e auto-fun cao de U
f
associada ao auto-valor , ent ao A e auto-
fun cao de U
g
associada ao auto-valor . De fato, U
f
() = U
g
A() =
AU
f
() = A.
Assim, o auto-espaco F
1
associado ao auto-valor 1 para operador U
g
e sim-
plesmente a imagem por A do auto-espa co E
1
associado ao auto-valor 1 para
U
f
. Como A e um isomorsmo linear, a dimens ao de F
1
e igual dimens ao de
E
1
. Segundo a observa cao que (f, ) e ergodica se a dimensao do auto-espa co
associado ao auto-valor 1 e igual a 1, podemos armar que se (f, ) e (g, )
sao espectralmente equivalentes, entao (f, ) e um sistema ergodico se, e so se,
(g, ) e ergodico.
Exemplo 5.11. Considere f : [0, 1] [0, 1] a fun cao denida por f(x) = 2x
mod 1 preservando a medida de Lebesgue m e seja :
+
2
+
2
o deslocamento
no espaco
+
2
= 0, 1
Z
preservando a medida de Bernoulli associada ao vetor
(1/2, 1/2). Mostraremos que (f, m) e (, ) sao espectralmente equivalentes.
Realmente, para cada fun cao L
2
(m) associaremos uma fun cao = A
L
2
() denida por
(a
0
, a
1
, a
2
, . . . ) = (0, a
0
a
1
a
2
. . . )
Claramente Ae uma transformacao linear. A tambeme invertvel, pois podemos
denir A
1
por
A
1
(0, a
0
a
1
a
2
, . . . ) = (a
0
, a
1
, a
2
, . . . ).
Estritamente, para que A
1
esteja bem denida, devemos fazer uma escolha
do valor de A
1
nos pontos x que podem ser escritos de dois modos distintos
54 CAP
ITULO 5. ERGODICIDADE
na base dois. Por exemplo, o ponto x = 0, 01111 . . . tambem pode se escrever
como x = 0, 1. Porem, como o conjunto dos pontos que podem ser escritos de
dois modos distintos e enumeravel, e portanto, com medida de Lebesgue igual
`a zero, podemos denir A
1
de um modo arbitr ario nestes pontos, uma vez
que duas fun coes em L
2
(m) sao iguais se elas coincidem em quase todo ponto.
Assim, A
1
esta bem denida.
Para mostrar que Ae uma equivalencia espectral, note que segue da denicao
de que
_
AA d =
_
d =
_
dm.
Finalmente, a condi cao de que AU
f
= U
(a
0
, a
1
, . . . ) = U
A(a
0
, a
1
, . . . ).
5.3 Propriedades de medidas erg odicas
Fixemos uma transformacao f : M M qualquer. Lembre que uma medida
diz-se absolutamente contnua com relacao a outra medida se (E) = 0
implica (E) = 0. O pr oximo lema arma que probabilidades erg odicas sao
minimais para a rela cao :
Lema 5.12. Se e s ao probabilidades invariantes tais que e erg odica e
e absolutamente contnua com relacao a entao = .
Demonstra c ao. Seja : M R uma fun cao mensuravel limitada qualquer, e
seja
(x) = lim
n
1
n
n1
j=0
(f
j
(x))
a sua media temporal. Como e invariante e erg odica, a media temporal e
constante
(x) =
_
d
para -quase todo ponto. Segue que isto e verdade para -quase todo ponto, j a
que . Em particular,
_
d =
_
d.
Por outro lado, pelo teorema erg odico,
_
d =
_
d .
5.3. PROPRIEDADES DE MEDIDAS ERG
ODICAS 55
Portanto, as integrais de com rela cao a e em relacao a coincidem, qual-
quer que seja a fun cao mensuravel limitada . Logo, considerando fun coes
caractersticas, = .
Naturalmente, se
1
e
2
sao probabilidades invariantes com respeito ` a f a
probabilidade
1
+t(
2
1
) ainda e invariante. Isso siginca que o conjunto das
probabilidades invariantes e um conjunto convexo. Veremos que dentro deste
conjunto, as medidas erg odicas desempenham um papel destacado:
Denicao 5.13. Seja X um conjunto convexo. Um ponto p X e dito ex-
tremal, se para quaisquer x, y X e t [0, 1], x+t(y x) = p implica que t = 0
ou 1.
O lema seguinte arma que uma probabilidade invariante e ergodica se e
somente se e ponto extremal no conjunto das probabilidades invariantes:
Lema 5.14. Uma probabilidade invariante e erg odica se e somente se n ao e
possvel escreve-la na forma
= c
1
1
+c
2
2
com c
1
, c
2
maiores que zero e
1
,
2
probabilidades invariantes distintas.
Demonstra c ao. Para provar a parte se, suponha que n ao seja erg odica.
Ent ao existe algum conjunto invariante A com 0 < (A) < 1. Dena
1
e
2
como sendo as restricoes normalizadas de a A e ao seu complementar,
respectivamente:
1
(E) =
(E A)
(A)
2
(E) =
(E A
c
)
(A
c
)
.
Como A e A
c
sao conjuntos invariantes e e medida invariante,
1
e
2
sao
tambem probabilidades invariantes. Alem disso, = (A)
1
+ (A
c
)
2
e por-
tanto n ao e extremal.
Para provar a recproca, suponha que e ergodica e temos = c
1
1
+c
2
2
com c
1
, c
2
> 0.
E claro que (E) = 0 implica
1
(E) =
2
(E) = 0, ou seja,
1
e
2
sao absolutamente contnuas com relacao a . Logo, pelo lema 5.12,
1
= =
2
. Isto prova que e extremal.
Em seguida vamos mostrar que medidas erg odicas distintas vivemem sub-
conjuntos disjuntos do espa co M:
Lema 5.15. Sejam
1
, . . . ,
N
probabilidades invariantes e erg odicas, todas
distintas. Ent ao existem subconjuntos mensur aveis P
1
, . . . , P
N
invariantes dis-
juntos tais que
j
(P
k
) =
_
1 se j = k
0 se j ,= k
56 CAP
ITULO 5. ERGODICIDADE
Demonstra c ao. Fixe qualquer par j, k de n umeros distintos em1, . . . , N. Pelo
lema 5.12, a medida
j
n ao pode ser absolutamente contnua em rela cao a
k
.
Em outras palavras, existe algum subconjunto mensur avel E tal que
j
(E) > 0
mas
k
(E) = 0. Ent ao
j
_
_
j=0
f
j
(E)
_
j
(E) > 0. e
k
_
_
j=0
f
j
(E)
_
= 0
Dena P
j,k
=
m=0
j=m
f
j
(E). Como a sequencia de conjuntos na interse cao
e decrescente com m,
j
_
P
j,k
_
= lim
m
j
_
_
j=m
f
j
(E)
_
(5.10)
e, analogamente para
k
. Como as medidas
j
e
k
sao invariantes, e
_
j=m
f
j
(E) = f
m
_
_
j=0
f
j
(E)
_
,
a sequencia no lado direito de (5.10) e constante. Conclumos que
j
(P
j,k
) =
j
_
_
j=0
f
j
(E)
_
> 0 e
k
(P
j,k
) =
k
_
_
j=0
f
j
(E)
_
= 0.
Alem disso, P
j,k
e um conjunto invariante por f. Portanto
j
(P
j,k
) = 1, uma
vez que
j
e ergodica. Agora dena
P
j
=
k=j
P
j,k
e P
j
=
P
j
_
k=j
P
k
.
Primeiramente,
j
(
P
j
) = 1 e
k
(
P
j
) = 0 para todo k ,= j. Segue que
j
(P
j
) = 1
e
k
(P
j
) = 0 para todo k ,= j. Alem disso, os P
j
sao disjuntos dois-a-dois.
5.4 Teorema de decomposi cao ergodica
Na sequencia dos resultados da se cao anterior, e natural perguntar se toda
medida invariante e uma combinacao linear de medidas erg odicas. O teorema
que vamos enunciar nesta se cao arma que a resposta e armativa, exceto que
o n umero de parcelas nesta combinacao n ao e necessariamente nito, nem
mesmo enumeravel, em geral.
Teorema 5.16. Seja f : M M uma transforma cao contnua num espa co
compacto. Entao existe um conjunto mensur avel M
0
M, uma parti cao T de
M
0
e uma famlia de probabilidades
P
: P T satisfazendo
P
(P) = 1 para todo elemento P de T;
5.4. TEOREMA DE DECOMPOSIC
AO ERG
ODICA 57
a aplicacao P
P
e mensur avel;
toda
P
e invariante e erg odica para f;
tais que, dada qualquer probabilidade f-invariante , o conjunto M
0
satisfaz
(M
0
) = 1 e, alem disso,
(E) =
_
P
(E) d (P) para todo conjunto mensur avel E M (5.11)
onde e a medida proje cao de em T.
A rela cao (5.11) signica que e uma combina cao convexa das v arias prob-
abilidades erg odicas
P
, em que cada
P
entra com coecienteigual a (P).
Dada qualquer parti cao T de M ca denida a proje cao natural : M T
que associa a cada ponto x M o elemento P(x) da parti cao que o contem.
Isto permite denir o que e um subconjunto mensur avel da parti cao: Q T e
mensuravel se e somente
1
(Q) = uni ao dos P Q
e um subconjunto mensur avel de M.
E f acil ver que esta denicao est a correta:
a famlia dos subconjuntos mensur aveis e uma -algebra em T. A medida
proje cao de esta denida nesta -algebra, por
(Q) = (
1
(Q)).
Corolario 5.17. Uma transforma cao f e unicamente ergodica se e somente se
admite exatamente uma medida invariante erg odica.
Demonstra cao. De acordo com o Corolario ??, se f e unicamente erg odica ent ao
a sua probabilidade invariante e ergodica. Isto prova a parte somente sedo
enunciado. Por outro lado, o Teorema 5.16 mostra que a recproca tambem e
verdadeira: se f admite apenas uma probabilidade invariante erg odica, ent ao
essa e a unica probabilidade invariante.
5.4.1 Prova do teorema de decomposi cao erg odica
Nesta secao vamos deduzir o Teorema 5.16 de um resultado de Teoria da Proba-
bilidade, o teorema de desintegra cao de Rokhlin [Rok66], que tem muitas outras
aplica coes.
Seja Z um espaco metrico compacto, uma probabilidade em Z, e T uma
parti cao de Z em subconjuntos mensur aveis. Seja : Z T a aplica cao
que associa a cada z Z o atomo P T que o contem. Por deni cao, Q e
um subconjunto mensur avel de T se e somente se
1
(Q) e um subconjunto
mensuravel de Z. Seja o iterado de por , ou seja, e a probabilidade em
T denida por (Q) = (
1
(Q)) para cada conjunto mensur avel Q T.
Denicao 5.18. Uma famlia de medidas condicionais de relativamente a T
e uma famlia (
P
)
PP
de probabilidades em Z tais que
58 CAP
ITULO 5. ERGODICIDADE
1.
P
(P) = 1 para -quase todo P T;
2. dada qualquer fun cao contnua : Z R, a fun cao T P
_
d
P
e
mensuravel e tem-se
_
d =
_ __
d
P
_
d (P).
Lema 5.19. Se (
P
)
PP
e uma famlia de medidas condicionais de relativa-
mente `a parti cao T, entao T P
_
d
P
e mensur avel e
_
d =
_ __
d
P
_
d (P),
para toda funcao mensur avel limitada : Z R.
Demonstra cao. Denote por ( a classe de fun coes mensuraveis limitadas que
satisfazem a conclusao do lema. Pela denicao de sistema de medidas condi-
cionais, essa classe contem todas as fun coes contnuas. Alem disso, suponha que
n
: Z R, n N e uma sequencia de fun coes em ( convergindo pontualmente
para alguma fun cao : Z R. Suponha ainda que essa sequencia e uniforme-
mente limitada, isto e, existe K > 0 tal que [
n
(z)[ K para todo z Z e
todo n N. Armamos que a fun cao limite tambem esta em (. Admita, por
um instante, que esta arma cao e verdadeira. AQUI
Em particular, P
P
(E) e mensuravel, e (E) =
_
P
(E) d (P), para
qualquer conjunto mesur avel E Z.
Medidas condicionais, quando existem, s ao unicas em quase todo ponto:
Proposi cao 5.20. Se (
P
)
PP
e (
P
)
PP
s ao dois sistemas de medidas condi-
cionais de com respeito ` a T, entao
P
=
P
para -almost every P T.
Demonstra cao. Suponha o contr ario, isto e, existe um conjunto mensuravel
Q
0
T with (Q
0
) > 0 tal que
P
,=
P
for every P Q
0
. Seja
k
: k N
um conjunto enumer avel e denso de C
0
(Z, R), e dena
A
k
= P Q
0
:
_
k
d
P
,=
_
k
d
P
.
Notando que
k
A
k
= Q
0
, existe C
0
(Z, R) e um subconjunto Q de Q
0
tal
que (Q) > 0 e (trocando os papeis de
P
e
P
, se necessario)
_
d
P
>
_
d
P
para todo P Q. Ent ao
_
Q
__
d
P
_
d (P) >
_
Q
__
d
P
_
d (P). (5.12)
De outro modo, pelo Lema 5.19,
_
(A
1
(Q)
) d =
_ __
(A
1
(Q)
) d
P
_
d (P).
5.4. TEOREMA DE DECOMPOSIC
AO ERG
ODICA 59
Por hip otese
P
(P) = 1 para quase todo P T. Para cada um destes P,
temos que
_
(A
1
(Q)
) d
P
= A
Q
(P)
_
d
P
.
Assim,
_
(A
1
(Q)
) d =
_ _
A
Q
(P)
_
d
P
_
d (P) =
_
Q
__
d
P
_
d (P).
Analogamente, temos
_
(A
1
(Q)
) d =
_
Q
__
d
P
_
d (P).
Essas duas ultimas igualdadades contradizem (5.12). Logo,
P
=
P
para -
quase todo P, como armamos.
Denicao 5.21. T e uma parti cao mesur avel se existem conjuntos mensur aveis
E
1
, E
2
, . . . , E
n
, . . . de Z tais que
T = E
1
, Z E
1
E
2
, Z E
2
E
n
, Z E
n
mod 0.
Em outras palavras, existe um conjunto de medida total F
0
Z tal que, dado
qualquer atomo P de T podemos escrever
P F
0
= E
1
E
2
E
n
F
0
(5.13)
onde E
j
e E
j
ou seu complemento Z E
j
, para todo j 1.
Exemplo 5.22. Toda particao nita ou enumer avel e mesuravel. De fato, T e
mensuravel se e so se existe uma sequencia n ao-decrescente de particoes nitas
ou enumer aveis T
1
T
2
T
n
tais que T =
n=1
T
n
mod 0.
Exemplo 5.23. Seja Z = X Y , onde X e Y espacos metricos compactos, e
T e a parti cao de Z em linhas horizontais X y, y Y . Ent ao T e uma
parti cao mensuravel de Z.
Teorema 5.24 (desintegracao). Se T e parti cao mensur avel ent ao a proba-
bilidade admite alguma famlia de medidas condicionais relativamente a T.
Este resultado ser a provado na Se cao 5.5. De momento vamos usa-lo para
dar a
Demonstra cao do Teorema 5.16. Seja f : Z Z uma transformacao contnua
num espaco metrico compacto Z, e seja B
f
o subconjunto dos pontos z Z
tais que as medias temporais estao bem denidas na orbita de z: dada qualquer
fun cao contnua : Z R, a sequencia
1
n
n1
j=0
(f
j
(z))
converge para algum (z) R quando n . Seja T a parti cao de Z denida
por
60 CAP
ITULO 5. ERGODICIDADE
1. Z B
f
e um elemento de T e
2. dois pontos z
1
e z
2
de B
f
estao no mesmo elemento de T se e somente
se tem as mesmas medias temporais: (z
1
) = (z
2
) para toda fun cao
continua .
Ent ao T e uma parti cao mensuravel, com respeito a qualquer probabilidade
em Z. Se e f-invariant ent ao (Z B
f
) = 0 e qualquer famlia de medidas
condicionais (
P
)
P
de relativamente a T e tal que
P
e f-invariante e erg odica
para -quase todo P T.
5.5 Teorema de desintegra cao
No intuito de provar o Teorema, podemos trocar o espa co Z por qualquer con-
junto de medida nula. Logo, n ao h a perda de generalidade supor que F
0
em
(5.13) coincide exatamente com Z, e iremos assumir isso no que se segue. Seja
qualquer fun cao mensuravel limitada em Z. Para cada n 1 seja
T
n
= E
1
, Z E
1
E
2
, Z E
2
E
n
, Z E
n
isto e, T
n
e a parti cao de Z cujo os atomos sao os conjuntos E
1
E
n
, with
E
j
= E
j
or E
j
= Z E
j
, para cada 1 j n. Dena
n
: Z R como se
segue. Se o atomo P
n
(z) de T
n
que contem z tem medida (P
n
(z)) positiva,
then
n
(z) =
1
(P
n
(z))
_
Pn(z)
d. (5.14)
Caso contrario,
n
(z) = 0. Claramente, o segundo caso na deni cao de
n
se
aplica somente num conjunto de pontos de medida igual a zero.
Lema 5.25. Dada qualquer fun cao mensur avel limitada : Z R, existe um
subconjunto de medida total F = F() de Z tal que
n
(z), n 1, converge
para algum n umero real
(z), para todo z F.
Demonstra cao. Observe que sempre podemos escrever =
+
, onde
= ([[ )/2.
Ent ao
n
=
+
n
n
para n 1, e entao a conclusao e verdadeira para se
ela vale para
+
e
n
(z) < < < limsup
n
(z).
n
(z) diverge se, e so se, z S(, ) para
algum para de n umeros racionais e . Logo, o lema segue-se se mostrarmos
que S = S(, ) tem medida igual a zero para todo e .
Para cada z S, xe uma sequencia de inteiros 1 a
z
1
< b
z
1
< < a
z
i
<
b
z
i
< tais que
a
z
i
(z) < and
b
z
i
(z) > for every i 1.
5.5. TEOREMA DE DESINTEGRAC
AO 61
Dena A
i
como sendo a uni ao dos elementos P
a
z
i
(z), e B
i
como a uni ao dos ele-
mentos P
b
z
i
(z) obtidos deste modo, para todos os pontos z S. Por constru cao,
S A
i+1
B
i
A
i
para todo i 1.
Em particular, S esta contido no conjunto
S =
i=1
B
i
=
i=1
A
i
.
Dados dois entre os conjuntos P
a
z
i
(z) que formam A
i
, ou eles sao disjuntos ou
coincidem. isto porque T
n
, n 1, e uma sequencia n ao-decrescente de particoes.
Consequentemente, A
i
pode ser escrito como uma uniao de conjuntos P
a
z
i
(z)
dois-a-dois disjuntos. Assim,
_
Ai
d =
P
a
z
i
(z)
_
P
a
z
i
d <
P
a
z
i
(z)
(P
a
z
i
) = (A
i
),
para qualquer i 1 (as somas sao sobre uni oes disjuntas). Analogamente,
_
Bi
d =
P
b
z
i
(z)
_
P
b
z
i
d >
P
b
z
i
(z)
(P
b
z
i
) = (B
i
).
Desde que A
i
B
i
e observando que estamos assumindo que 0, segue-se
que
(A
i
) >
_
Ai
d
_
Bi
d > (B
i
),
para todo i 1. Tomando o limite quando i , temos que
(
S) (
S).
Isto implica que (
S) = 0, e logo S
S tambem e um conjunto com medida
igual a zero.
Dada qualquer fun cao limitada mensur avel : Z R, iremos represen-
tar por e
n
(), e(), respectivamente, as funcoes
n
,
denidas por(5.14) e o
Lema 5.25.
Seja
k
: k N algum conjunto enumer avel e denso de C
0
(Z, R), e seja
F
k=1
F(
k
),
where F(
k
) como dado pelo Lema 5.25.
Lema 5.26. Dada qualquer fun cao contnua : Z R, a seuquencia e
n
()(z)
converge para e()(z) quando n , para todo z F
.
62 CAP
ITULO 5. ERGODICIDADE
Demonstra c ao. Fixe z F
.
E claro que e
n
()(z) e um funcional linear
limitado em C
0
(Z, R), com norma 1, e o mesmo e verdade para e()(z).
Para todo > 0, escolha k tal que |
k
|
0
< /3. Ent ao, se n e grande o
suciente,
[e
n
()(z) e()(z)[
[e
n
()(z) e
n
(
k
)(z)[ +[e
n
(
k
)(z) e(
k
)(z)[ +[e(
k
)(z) e()(z)[
2|
k
|
0
+/3 < .
isto mostra a armacao.
Seja : Z R contnua. Por constru cao, e
n
() e constante em cada
P
n
T
n
, e logo e constante tambem em cada atomo P de T, para todo n 1.
Assim, e() e constante em P F
desde que o ultimo conjunto seja nao-vazio. Ent ao, desde que (5.14)
dene e
n
() em um subconjunto de medida total de Z,
_
d =
(Pn)>0
_
Pn
d =
(Pn)>0
(P
n
) e
n
()(P
n
) =
_
e
n
() d.
Observe tambem que [e
n
()[ sup [[ < para cada n 1. Assim, n os
podemos usar o Teorema da Convergencia Dominada para concluir que
_
d =
_
e() d. (5.15)
Agora, estamos em condicoes de construir um sistema de medidas condi-
cionais para . Seja P qualquer atomo de T tal que P F
e nao-vazio.
E f acil
de ver que
C
0
(Z, R) e()(P) R
e um funcional n ao-negativo de C
0
(Z, R). Do fato que e
n
(1)(P) = 1 e do
Teorema de Riez-Markov, existe uma unica medida de probabilidade
P
em Z
tal que
_
d
P
= e()(P). (5.16)
Devemos denir
P
mesmo quando P n ao intersecta F
P
como qualquer probabilidade em Z: desde que o conjunto de todos esses
atomos P tem medida igual a zero em T (em outras palavras, sua uni ao tem
medida igual a zero em Z), a escolha nao e relevante. De acordo com essas
deni coes, (5.15) pode ser reescrito como
_
d =
_ __
d
P
_
d (P),
o fato que T P
_
d
P
e uma fun cao mensuravel e uma consequencia di-
reta de (5.16). Assim, para concluir que (
P
)
PP
forma um sistema de medidas
condicionais de com respeito a T resta-nos provar que
5.5. TEOREMA DE DESINTEGRAC
AO 63
Lema 5.27.
P
(P) = 1 para -quase todo P T.
Usaremos o seguinte resultado auxiliar:
Lema 5.28. dada uma fun cao mensur avel limitada : Z R existe um
conjunto de medida total T() T tal que o conjunto P F
e nao vazio
entao
_
d
P
= e()(P), para qualquer P T().
Demonstra c ao. A classe das funcoes que satisfazem o lema contem o conjunto
das fun coes contnuas e e fechado por convergencia pontual dominada.Assim,
contem todas as fun coes mensuraveis limitadas.
Podemos provar o Lema 5.27:
Demonstra cao. Dena T
=
k,P
k
T(A
P
k
), onde a interseccao e tomada sobre o
conjunto de todos os atomos P
k
T
k
, e todo k 1. Desde que esse conjunto e
enumer avel, T
. De fato, seja k 1 e P
k
elemento T
k
que contem P. Pela
deni cao de T
P
(P
k
) =
_
A
P
k
d
P
= e(A
P
k
)(P). (5.17)
Para cada n 1, seja P
n
o atomo de T
n
que contem P. Dado qualquer z
P F
,
e
n
(A
P
k
)(z) =
1
(P
n
)
_
Pn
A
P
k
d.
Agora, para cada n k temos que P
n
P
k
, e entao o ultimo termo e igual a 1.
Assim,
e(A
P
k
)(P) = e(A
P
k
)(z) = lim
n
e
n
(A
P
k
)(z) = 1.
Substituindo isso em (5.17) obtemos que
P
(P
k
) = 1 para todo k 1. Final-
mente,
P
(P) = lim
k
P
(P
k
) = 1
pois P
k
, k 1, e uma sequencia decrescente cuja interseccao e P.
A prova do Teorema 5.24 esta completa.
Exemplo 5.29. Seja Z o toro bi-dimensional, um n umero irracional, e T a
parti cao de Z em linhas retas de inclina cao . Ent ao T n ao e uma parti cao . Um
modo de ver isso e observar que a medida de Haar (Lebesgue) em Z n ao admite
sistema de medidas condicionais com respeito `a T. De fato, pela unicidade
da desintegra cao, quase toda medida condicional teria que ser invariante por
transla coes ao longo das linhas retas, e e claro que estas translacoes nao tem
probabilidades invariantes.
64 CAP
ITULO 5. ERGODICIDADE
5.6 Exerccios
5.1. Considere o espaco M = 1, 2, . . . , d
Z
das sequencias com valores num
conjunto 1, 2, . . . , d. Fixe qualquer n umero (0, 1). Para cada = (
n
)
nZ
e = (
n
)
nZ
em M, dena
N(, ) = max
_
N 0 :
n
=
n
para todo n Z com [n[ < N
_
e d(, ) =
N(, )
. Verique que d e uma metrica em M e gera a mesma
topologia que a famlia dos cilindros. Em particular, (M, d) e um espaco metrico
compacto. Tem-se um resultado analogo para M = 1, 2, . . . , d
N
.
5.2. Suponha que R
(z) : n Z de todo z S
1
e densa em S
1
.
2. Seja A um conjunto invariante com medida positiva. Mostre que nenhum
ponto de S
1
e ponto de densidade de A
c
. Conclua que (A) = 1.
Dica: considere um ponto de densidade de A e use o item (1).
5.3. A rota cao R
e racional se e somente se e
i
e uma raiz da unidade, isto e,
se existe k ,= 0 tal que e
ki
= 1.
5.4. Se R
(z) : n Z de todo z S
1
e densa em S
1
.
2. Seja A um conjunto invariante com medida positiva. Mostre que nenhum
ponto de S
1
e ponto de densidade de A
c
. Conclua que (A) = 1.
Dica: considere um ponto de densidade de A e use o item (1).
5.6. Suponha que R
j=0
(R
j
(z))
existe em todo ponto e, de fato, o limite e uniforme. Justique que e
constante em todo ponto.
Dica: Verique que a sequencia do lado direito e equicontnua e use o
teorema de Ascoli-Arzela.
2. Deduza que R
ICIOS 65
5.7. Seja f : M M uma maquina de somar, denida na sec cao 5.1.5.
1. Seja : M R uma fun cao contnua qualquer. Mostre que
(x) = lim
n
1
n
n1
j=0
(f
j
(z))
existe em todo ponto e o limite e uniforme.
2. Justique que e constante em todo ponto e deduza que f tem uma unica
probabilidade invariante.
3. Calcule essa probabilidade, encontrando uma express ao explcita para a
medida de qualquer subconjunto [b
0
, b
1
, . . . , b
k
] das sequencias com
0
=
b
0
,
1
= b
1
, . . . ,
k
= b
k
.
5.8 (Teorema de Kac). Seja uma medida erg odica para uma transforma cao
f : M M e A um conjunto com (A) > 0. Considere n
A
: A N +
como o menor n umero n
A
(x) > 0 tal que f
nA(x)
(x) A. Caso este n umero n ao
exista, denimos n
A
(x) = +.
1. Mostre que n
A
e integr avel com respeito a .
2. Mostre que se
A
(B) =
(AB)
(A)
ent ao:
_
A
n
A
(x) d
A
(x) =
1
(A)
.
5.9. Seja f : M M denida no espaco topologico M tal que existe alguma
medida erg odica tal que para todo A aberto, (A) > 0. Mostre que f e
transitiva e a orbita de -quase todo ponto e densa.
66 CAP
ITULO 5. ERGODICIDADE
Captulo 6
Sistemas Misturadores
Neste captulo estudaremos mais uma propriedade das transforma coes que preser-
vam medida, a saber, a propriedade de misturar conjuntos. Introduziremos os
deslocamentos de Markov, que generalizam os deslocamentos de Bernoulli, in-
troduzidos no Captulo ??. Estudaremos sob que condicoes estas transformacoes
sao erg odicas ou misturadoras.
6.1 Deni coes e exemplos
Comecaremos este captulo, mostrando uma proposi cao que estabelece uma
condi cao equivalente ` a condi cao de ergodicidade de uma medida:
Proposi cao 6.1. Seja f : M M uma transforma cao que preserva uma
medida . S ao equivalentes:
1. e erg odica
2. Para quaisquer par de conjuntos mensur aveis A, B entao
lim
n
1
n
n1
i=0
(f
i
(A) B) = (A)(B). (6.1)
Demonstra cao. Primeiramente, se vale a igualdade como no item 2 acima, dado
um conjunto invariante A qualquer, temos que
(A) = lim
n
1
n
n1
i=0
(f
i
(A) A) = (A)
2
.
Logo, (A) = 0 ou 1, donde e ergodica.
Por outro lado, se e ergodica temos, pelo teorema de Birkho aplicado a
fun cao =
A
, que a sequencia de fun coes
n
(x) =
1
n
n1
i=0
(f
i
(x)
67
68 CAP
i=0
(f
i
(A) B) = lim
n
_
n
d =
_
(A) d = (A)(B),
e isto encerra a prova da Proposi cao.
Observa cao 6.2. Podemos extrair um pouco mais da proposicao anterior.
Mesmo que seja somente invariante, podemos mostrar utilizando o Teorema de
Birkho e a prova da Proposi cao 6.1 que a sequencia lim
n
1
n
n1
i=0
(f
i
(A) B)
converge para quaisquer borelianos A e B. A adapta cao e canonica e ca a
cargo do leitor.
Denicao 6.3. Seja f uma transformacao f : M M preservando uma me-
dida . Dizemos que o sistema (f, ) e misturador, se dados quaisquer conjuntos
mensuraveis A, B M ent ao:
lim
n
(f
n
(A) B) = (A)(B). (6.2)
Em muitos casos, especialmente nos que consideramos f xada e onde n ao
houver perigo de confus ao, diremos simplesmente que a medida e misturadora,
sem mencionar a transformacao f.
E imediato a partir da Proposi cao 6.1 que
toda medida erg odica e misturadora. Em geral, o contr ario n ao vale como
veremos agora:
Exemplo 6.4. A rota cao R
l
(A) sao independentes das restricoes nas coordenadas de B, de onde segue-se
que (
l
(A) B) = (A)(B). Deste modo, os deslocamentos de Bernoulli
sao transforma coes misturadoras.
Em termos de Teoria das Probabilidades, dizer que (
l
(A)B) = (A)(B),
signica dizer que os eventos
l
(A) e B sao independentes, ou seja, a ocorrencia
de B no presente nao inui na possibilidade de ocorrencia de A ap os l unidades
de tempo passadas.
6.2 Deslocamentos de Markov
Os deslocamentos de Markov sao uma classe de transformacoes preservando
medida que surgem naturalmente na Teoria das Probabilidades e em algumas
aplica coes dos Sistemas Dinamicos. Elas podem ser vistas como uma gener-
alizacao do conceito de deslocamento de Bernoulli com k smbolos, onde os
lan camentos n ao sao mais independentes. Alem da perda de independencia,
uma diferen ca entre os deslocamentos de Bernoulli e os de Markov e que, em
geral, o domnio dos deslocamentos de Markov serao subconjuntos pr oprios de
+
k
.
Para denirmos um deslocamento de Markov com k smbolos, antes de mais
nada, e necessario xar uma matriz A = (a
ij
) de tamanho k k e com entradas
iguais a 0 ou 1, chamada matriz de transi cao. A partir desta matriz, podemos
construir um subconjunto
+
A
de
+
k
das sequencias admissveis do seguinte
modo:
+
A
= (x
1
, x
2
, . . . )
+
k
; a
xixi+1
= 1.
Note que se x = (x
1
, x
2
. . . ) pertence `a
+
A
ent ao (x) tambem pertence `a
+
A
. Chamaremos de deslocamento de Markov associado `a matriz de transi cao
A a restri cao de ao conjunto
+
A
.
Esta transforma cao admite uma classe especial de medidas, chamadas me-
didas de Markov. Para construir uma destas medidas, consideraremos uma
matriz P = (p
ij
) e um vetor p = (p
1
, . . . , p
k
) com todas as coordenadas p
i
> 0,
satisfazendo as seguintes propriedades:
0 p
ij
1
j=1
p
ij
= 1.
70 CAP
i=1
p
i
p
ij
= p
j
, para todo j = 1, . . . , k.
Esta matriz e chamada matriz estoc astica e determina a probabilidade da transi cao
do sistema do estado i para o estado j. Analogamente, podemos interpretar a
entrada P
(n)
ij
da matriz P
n
, como sendo a chance de transicao do estado i para
o estado j em n passos. Com estes elementos em maos, denimos a medida de
Markov no cilindro [m; b
m
, . . . , b
n
] como:
([m; b
m
, . . . , b
n
]) = p
bm
p
bmbm+1
. . . p
bn1bn
(6.3)
e estendemos a denicao de para a algebra das uni oes disjuntas A = A
1
A
l
de cilindros por
(A) = (A
1
) + +(A
l
).
Pelo Teorema 0.9, segue-se que pode ser estendida para toda -algebra. Para
mostrar a invari ancia de com respeito `a , basta provar que (
1
(C)) =
(C), onde C e um cilindro. Ora, isso segue diretamente da express ao de (C)
acima, uma vez que a medida ([m; b
m
, . . . , b
n
]) n ao depende do ndice m.
Observe que, ao contr ario dos deslocamentos de Bernoulli, se A e B sao
cilindros disjuntos entao (A B) n ao e necessariamente (A)(B). Para ver
isto, basta por exemplo considerar o cilindro A = [1; i] e o cilindro B = [2; j].
Claramente, (A B) = ([1; i, j]) = p
i
p
ij
que n ao e necessariamente igual ` a
(A)(B) = p
i
p
j
. Apesar disto, ainda podemos calcular, atraves de um fator
corretivo, a medida de A B:
Lema 6.7. Sejam A = [m;
m
, . . . ,
n
] e B = [r;
r
, . . . ,
s
] cilindros com
r > n. Entao:
(A B) = (A)(B)
P
(rn)
nr
p
r
.
Demonstra c ao. Podemos escrever A B como a uni ao disjunta
A B =
_
xF
[m;
m
. . . ,
n1
, x(n), . . . , x(r),
r+1
, . . . , b
s
],
onde x varia no conjunto T das fun coes w : n, . . . , r 1, . . . , k tais que
w(n) =
n
e w(r) =
r
. Deste modo, temos que:
(A B) = (A)(B)
xF
p
nx(n+1)
. . . p
xr1r
p
r
.
o que conclui a demonstracao do nosso lema, uma vez que
P
(rn)
nr
=
xF
p
nx(n+1)
. . . p
xr1r
.
6.2. DESLOCAMENTOS DE MARKOV 71
Iremos agora estudar condicoes que a matriz estocastica P deve satisfazer
para que uma medida de Markov seja erg odica ou misturadora.
Denicao 6.8. Uma matriz estocastica P se diz irredutvel se dados i, j
1, . . . , k ent ao existe n N tal que P
(n)
ij
> 0.
Podemos interpretar a irredutibilidade de uma matriz estoc astica P do seguinte
modo: dizer que uma matriz P e irredutvel equivale a dizer que sempre e
possvel a partir de um estado i do sistema, chegar a um estado j com um
certo n umero n (que depende de i e j) de passos. Como veremos, a condicao de
irredutibilidade e necessaria e suciente para que uma medida de Markov seja
erg odica. Um primeiro passo nessa dire cao e o seguinte lema:
Lema 6.9. Seja P uma matriz estoc astica irredutvel. Ent ao, dados i e j temos
que:
1
n
n1
l=0
P
(l)
ij
= p
j
.
Demonstra cao. Primeiramente, provaremos que
1
n
n1
l=0
P
l
converge. De fato,
observe que se A = [1; j] e B = [0; i] ent ao, pelo Lema 6.7:
1
n
n1
l=0
(
l
(A) B) =
1
p
j
(A)(B)
1
n
n1
l=0
P
(l)
ij
.
Assim, para mostrar a convergencia de
1
n
n1
l=0
P
l
, e suciente observar que a
sequencia
1
n
n1
l=0
(
l
(A) B) converge, de acordo com a observa cao 6.2.
Se v e o vetor v = (1, 1, . . . , 1), as igualdades
k
j=1
p
ij
= 1, para i = 1, 2, . . . , k
na deni cao de matriz estocastica podem ser escritas como Pv = v. Deste
modo, e simples vericar que Qv = v, ou em outros termos, se Q = (q
ij
), ent ao
k
j=1
q
ij
= 1, para i = 1, 2, . . . , k. De modo an alogo, como pP = p, temos que
pQ = p, ou
k
i=1
p
i
q
ij
= p
j
, para todo j = 1, . . . , k.
Alem disso, uma facil verica cao a partir da deni cao de Q mostra que P
n
Q =
Q, para todo n N. Utilizaremos estas propriedades para concluir que q
ij
n ao
depende de i.
De fato, assuma por absurdo que existem r tal que q
rj
< q
sj
, onde s e
escolhido de modo que q
sj
= sup
i
q
ij
. Como P e irredutvel, temos que existe n
72 CAP
i=1
P
(n)
si
q
ij
< (
k
i=1
P
(n)
si
)q
sj
= q
sj
,
o que e uma contradi cao. Logo, q
ij
n ao depende de i. Seja q
j
= q
ij
este valor
comum. Como pQ = p, temos que:
p
j
=
k
i=1
p
i
q
ij
= (
k
i=1
p
i
)q
j
= q
j
,
terminando a prova do Lema.
Uma observa cao simples e que a condi cao do lema anterior e equivalente a
irredutibilidade de P. De fato, se caso contr ario existiriam i, j tais que P
(l)
ij
= 0
para todo l N, onde
1
n
n1
l=0
P
(l)
ij
= 0.
O teorema a seguir mostra que a irredutibilidade e uma condi cao necess aria
e suciente para que uma medida de Markov seja erg odica:
Teorema 6.10. Seja uma medida de Markov relativa a uma matriz estoc astica
P. Entao e erg odica se, e s o se, P e irredutvel.
Demonstra cao. Primeiramente, vamos assumir que e ergodica e mostraremos
que P e irredutvel. De fato, tendo em vista a Proposicao 6.1, como e ergodica,
se considerarmos os cilindros de comprimento 1, A = [1; j] e B = [0; i], temos
que:
lim
n
1
n
n1
l=0
(
l
(A) B) = (A)(B) = p
i
p
j
. (6.4)
Por outro lado, de acordo com o Lema 6.7 temos que
(
l
(A) B) = ([0; i] [l; j]) = p
i
P
(l)
ij
Substituindo na equa cao 6.4 e cancelando p
i
em ambos os lados,
1
n
n1
l=0
P
(l)
ij
= p
j
.
Em particular, existe n tal que P
(n)
ij
> 0.
Agora, mostraremos que se P e irredutvel, ent ao e ergodica. Apelando
para o Lema 6.9, podemos assumir que lim
n
1
n
n1
l=0
P
(l)
ij
= p
j
.
Utilizando a Proposi cao 6.1, para mostrar que e ergodica, basta mostrar
que para todos A, B mensuraveis vale:
1
n
n1
l=0
(
l
(A) B) = (A)(B).
6.2. DESLOCAMENTOS DE MARKOV 73
Mostraremos isto em dois passos: inicialmente, veremos que basta mostrar no
caso em que A e B sao uni oes disjuntas de cilindros. A seguir, mostraremos
essa propriedade para uni oes disjuntas de cilindros. De fato, assumindo que
a equa cao 6.1 vale para uni oes disjuntas de cilindros, dados A e B borelianos
quaisquer e > 0, escolha A
0
e B
0
uni oes disjuntas de cilindros de modo que
(AA
0
) e (BB
0
) . Assim,
1
n
n1
l=0
|(
l
(A)B)(A)(B)|
1
n
n1
l=0
|(
l
(A)B)(
l
(A
0
)B
0
)|+
+
1
n
n1
l=0
|(
l
(A
0
) B
0
) (A
0
)(B
0
)| +
1
n
n1
l=0
|(A
0
)(B
0
) (A)(B)|.
Fazendo arbitrariamente pequeno e n arbitrariamente grande, temos que os
termos acima sao arbitrariamente pequenos, mostrando nossa armacao.
Resta-nos mostrar que a equacao 6.1 vale para uni oes de cilindros disjuntos.
Deixaremos para o leitor a vericacao de que basta mostrar que essa equacao
vale para cilindros. Vericaremos para o caso em que A = [m; a
m
, . . . , a
n
] e
B = [r; b
r
, . . . , b
s
] sao cilindros com m > r. Assim:
(
l
(A) B) =
1
p
am
(A)(B)P
(m+lr)
bram
.
Logo, segue diretamente que
1
n
n1
l=0
(
l
(A) B) =
1
p
am
(A)(B)
1
n
n1
l=0
P
(m+lr)
bram
.
Como
1
n
n1
l=0
P
(l)
ij
= p
j
,
acabamos a prova do teorema.
A seguir, mostraremos que uma condi cao necess aria e suciente para que
uma medida de Markov seja misturadora e que exista algum n umero n N tal
que P
n
ij
> 0 para todos i e j. Ou seja, mostraremos o seguinte teorema:
Teorema 6.11. Sao equivalentes:
1. e misturadora
2. lim
n
P
(n)
ij
= p
j
3. Existe n N tal que P
(n)
ij
> 0 para todos i e j.
74 CAP
i=0
P
(i)
= Q.
Assim, de acordo com o Lema 6.9, Q = (q
ij
) n ao depende de i e q
ij
= p
j
. Neste
ponto, recorreremos a o seguinte teorema (para uma prova do teorema, veja ??):
Teorema 6.12 (Perron-Fr obenius). Seja A uma matriz kk tal que alguma
de suas potencias tem todas as entradas maiores que zero. Ent ao:
1. Existe algum auto-valor de A tal que > ||, para todo auto-valor
de A
2. O auto-espa co associado a tem dimens ao 1.
A partir do Teorema de Perr on, vamos mostrar agora que P
(n)
de fato con-
verge, quando n . Primeiramente, mostraremos que o auto-valor dom-
inante de P obtido pelo Teorema de Perr on e, de fato, igual a um. Para
mostrar isso, utilizaremos a adjunta P
,
tal que
k
i=1
v
i
= 1, obtido como no Teorema de Perr on. Logo:
P
v = v
k
i=1
P
ji
v
i
= v
j
,
6.3. EXERC
ICIOS 75
Somando com respeito `a j e observando que
k
j=1
P
ji
= 1,
1 =
k
i=1
v
i
=
k
i=1
(
k
j=1
P
ji
)v
i
=
k
j=1
v
j
= .
Para concluir a demonstra cao, denote por V o subespaco de R
k
denido por
W
2
= (x
1
, . . . , x
k
);
k
i=1
= 0. Observe que P deixa invariante W
2
, ou seja,
PW
2
= W
2
e que o auto-espaco W
1
associado ao auto-valor 1 de P intersecta W
2
somente na origem, uma vez que pelo Teorema de Perron, W
1
e unidimensional
e tem algum vetor com todas as coordenadas positivas. Logo, pelo item 1 do
Teorema de Perr on, o m odulo de todos os auto-valores de P[W
2
sao menores
que um, de onde obtemos que lim
n
|P
(n)
[W
2
| = 0. Finalmente, dado um vetor
x R
k
, podemos escreve-lo como x = x
1
+ x
2
, com x
1
W
1
e x
2
W
2
. Isto
implica automaticamente que limP
(n)
x = x
1
, concluindo a prova da arma cao
de que a sequencia P
n
era convergente.
6.3 Exerccios
76 CAP
ITULO 7. ENTROPIA M
ETRICA
Assim, o n umero de sequencias tpicas diferentes (que realmente s ao as que
importam no sentido de medida) e exponencial da ordem e
h(f)n
.
Vamos agora tornar um pouco mais rigorosos os conceitos intuitivos que
denimos anteriormente, comecando pela deni cao de entropia metrica. Exis-
tem varias deni coes possveis de entropia metrica e um consenso: sob hip oteses
razoaveis elas coincidem. Nos concentraremos na deni cao de Kolmogorov, via
entropia de parti coes:
Denicao 7.1. Seja f : X X uma transformacao que preserva a probabili-
dade . Dada uma parti cao Q enumer avel de X, a entropia da parti cao Q com
respeito `a e o n umero,
H
(Q) =
QQ
(Q) log (Q),
onde se convenciona que 0 log 0 = 0.
Uma vez xado o n umero de elementos, para obtermos uma parti cao com
entropia maior possvel, temos que tentar escolher seus elementos de modo que
suas medida com respeito `a seja o mais igualpossvel (veja o Exerccio 7.1.)
Em outros termos, se o n umero de elementos das parti coes e xado, ent ao a
parti cao que tem maior entropia possvel e aquela em que a medida de seus
elementos e melhor distribuida.
Isso nos motiva a ilustrar a deni cao de entropia com o seguinte exemplo:
foi acertado um classico entre os principais times de um estado (para dar nomes,
digamos CSA x CRB). O tecnico do CSA tem no seu plantel cerca de 22 jo-
gadores, podendo organizar seu time de 28.158.588.057.600 modos diferentes.
Denotaremos o conjunto dessas conguracoes por X e a cada congura cao x
do time do CSA associaremos um ndice tecnico t(x) e um ndice fsico f(x),
que sao obtidos de acordo com algum padr ao de medicao xado (por exemplo,
atribudo pelo comentarista do jogo, Gavi ao Boemio, tomando valores inteiros
de 0 a 10). Classicaremos uma conguracao x do time de acordo com sua
qualidade tecnica como otima, se t(x) 9, boa, se 7 t(x) < 9, regular, se
6 t(x) < 7 e ruim, se t(x) 6. Isso gera uma parti cao T do espaco das
congura coes X em quatro subconjuntos,
T = T
1
, T
2
, T
3
, T
4
.
Como o time referido e o CSA, a medida do conjunto das congura coes otimas
e quase igual a 1. Assim, a entropia e muito pequena, pois (T
i
) log (T
i
) e
muito pr oxima de 0 para cada i. Aqui n os estamos pensando em como sendo
a medida da contagem, denida por
(A) =
#A
#X
.
Por outro lado, se tivessemos considerado o CRB, as medidas dos conjuntos
T
1
, T
2
, T
3
e T
4
seriam quase iguais a
1
4
e a entropia seria bem proxima de log 4.
7.1. ENTROPIA DE UMA PARTIC
AO 79
Logo, se houvesse um aposta na loteria consistindo em adivinhar a condi cao
tecnica do time do CSA no dia do confronto (assuma que o treinador faltou e que
os times estao sendo escolhidos por meio de um sorteio, para tornar o processo
aleat orio) essa aposta devera pagar muito menos que a aposta consistindo em
adivinhar a condi cao tecnica do time do CRB. Assim, a entropia pode ser vista
como uma certa medida da diculdade em se ganhar essa aposta.
Vamos agora calcular a entropia de algumas particoes que ja estudamos:
Exemplo 7.2. Seja f dada por
f : [0, 1] [0, 1], f(x) = 10x [10x].
Se T e a parti cao por intervalos P
k
= (
k
10
,
k+1
10
] com k = 0, . . . , 9, ent ao a
entropia da parti cao T com respeito `a medida de Lebesgue m de [0, 1] e dada
por H
m
(T) =
9
i=0
1
10
log
1
10
= log 10.
Exemplo 7.3. Consideremos o deslocamento unilateral comd smbolos 1, . . . , d
e a parti cao T
l
formada pelos cilindros de comprimento n, ou seja, T
l
e for-
mada pelos conjuntos C = [0, l; a
0
, . . . , a
l
] = (x
0
, . . . , x
n
, . . . )
+
; a
i
=
x
i
para i = 0, . . . , l 1. A entropia de T
l
com respeito `a medida de Bernoulli
m relativa ao vetor de probabilidades p = (p
1
, . . . , p
d
) e dada por H
m
(T
l
) =
l
d
i=1
p
i
log p
i
(veja exerccio 7.3.)
Porem, nem sempre a entropia de uma parti cao e nita. Realmente, vamos
dar agora um exemplo de uma parti cao com entropia innita. Para tanto,
usaremos os fatos de que a serie
n1
1
n(log n)
2
e convergente com soma igual a
um certo n umero c > 0, enquanto que a serie
n1
c
nlog n
e divergente.
Exemplo 7.4. Considere a transforma cao f(x) = 10x [10x] acima. Clara-
mente a medida de Lebesgue e invariante para f. Para construir a parti cao, de-
componha o intervalo [0, 1] em subintervalos A
n
de modo que m(A
n
) =
1
cnlog n
2
.
Deste modo, se / = A
1
, . . . , A
n
, . . . segue que
H
m
(/) =
+
n=1
log c + log n + 2 log(log n)
cn(log n)
2
+
n=1
1
nlog n
=
Dadas duas parti coes T e Q podemos denir uma nova parti cao T Q de
X do seguinte modo:
T Q = A B; A T e B Q.
Dada a parti cao T, denotaremos por T
n
a parti cao
T
n
=
n1
i=0
f
i
(T).
Observe que se T = P
1
, . . . , P
d
, cada elemento de T
n
e dado por um itiner ario
(a
0
, . . . , a
n1
), a
i
1, . . . , p. Quer dizer, cada elemento de T
n
e formado pelos
pontos x M tais que f
i
(x) P
ai
.
80 CAP
ITULO 7. ENTROPIA M
ETRICA
7.2 Entropia de um sistema erg odico
Novamente, voltando ao exemplo CSA contra CRB, vamos agora considerar a
parti cao das congura coes do time do CSA de acordo com o nvel de prepara cao
fsica dos jogadores como
Ruim: F
1
= x X; f(x) 5
Regular: F
2
= x X; 6 f(x) 7
Boa: F
3
= x X; f(x) = 8
Otima: se F
4
= x X; f(x) 9.
Se denotamos T = F
1
, . . . , F
4
, ent ao
T = T T = T
i
F
j
X; i, j = 1, 2, 3, 4,
representa as possibilidades para o time do CSA, de acordo com a nossa classi-
cacao tecnica e fsica. Digamos agora que o time do CSA est a participando da
Super Copa Nordeste, consistindo de 200 jogos no sistema de pontos corridos.
Para otimizar os resultados e diminuir os custos com treinador, cada jogador
tem seu perl instalado num computador que, a partir da congura cao x da
ultima partida disputada, escolhe a congura cao f(x) para a partida seguinte.
Deste modo, se escolhemos ao acaso a conguracao do time para a primeira par-
tida do campeonato, as demais estarao determinadas pelo computador. Assim,
podemos considerar a particao
T
200
= T f
1
(T) . . . , f
199
(T),
que representa as possveis congura coes do time do CSA ao longo do campe-
onato, de acordo com a classicacao tecnica e fsica adotada. Claramente, essa
parti cao depende da programa cao feita no computador. Por exemplo, se o com-
putador a partir de uma congura cao qualquer, escolhe sempre um certo time,
por exemplo o time x
f
formado pelos lhos dos dirigentes, ent ao se P
f
denota
o elemento da parti cao T que contem x
f
, vem que
f
i
(T) = X,
logo
T
200
= T X X = T.
Assim, descobrir a conguracao do time ao longo do campeonato e tao difcil
quanto descobrir que time jogar a no dia da abertura; a partir da, o time que
entrara em campo sera sempre o mesmo, escolhido pelo computador. Vamos
agora introduzir o conceito de entropia de uma parti cao. A entropia da parti cao
T com respeito `a transforma cao f e `a medida e o n umero:
h
(f, T) = lim
n+
H(T
n
)
n
7.2. ENTROPIA DE UM SISTEMA ERG
ODICO 81
Devemos mostrar que a sequencia
H(P
n
)
n
e convergente para que o limite
acima fa ca sentido. Deixaremos esta demonstra cao a cargo do leitor (veja os
Exerccios 7.4 e 7.5.)
Assim, no nosso exemplo futebolstico, dada uma programa cao f do com-
putador, a entropia da parti cao T representa a diculdade em descobrir qual
ser a a congura cao, de acordo com a nossa classicacao do time do CSA, ao
longo da Super Copa Nordeste, dado que o time inicial e determinado por um
sorteio. Por exemplo, se para cada congura cao x o computador associa para o
pr oximo jogo uma certa congura cao xada que maximiza a qualidade do time
(por exemplo, a soma de t(x) com f(x)), ent ao n ao e difcil ver que a entropia da
parti cao T
200
e igual ` a entropia de T. Ou seja, n ao e nada difcil para um apos-
tador, descobrir a conguracao do time do CSA ao longo de todo campeonato:
basta descobrir a conguracao no primeiro dia. Observe que neste caso:
h
(f, T) = lim
n
1
n
H
(T
n
)
=
H
(T
200
)
200
=
H
(T)
200
= 0.
Ou seja, a aposta descobrir a conguracao do time do CSA ao longo da Super
Copa Nordeste e muito previsvel e devemos pagar pouco ao vencedor dela. Claro
que isso s o acontece se nossa programacao for, em certo sentido, previsvel. Se,
por exemplo, o time do CSA for escolhido a cada rodada por meio de um sorteio,
ent ao descobrir a sua conguracao ao longo do campeonato se torna muito mais
complicado. Neste caso, a entropia da parti cao T depender a da medida de seus
atomos, ou seja, da medida de cada elemento P
i
. Deniremos agora uma forma
global de medir a complexidade de uma transforma cao, no sentido metrico.
A palavra global aqui refere-se que ela n ao depender a de nenhuma parti cao
especca.
Denicao 7.5. A entropia de f com respeito `a medida e:
h
(f) = sup
P
h
(f, T),
onde o supremo e tomado sobre todas as parti coes nitas de X.
Vamos agora ilustrar um pouco a deni cao com alguns exemplos:
Exemplo 7.6. Seja f : X uma transformacao e p X um ponto xo para
f, i.e., tal que f(p) = p. Deste modo, a medida
p
denida por:
p
(A) = 0 , se p / A
1 , se p A,
e uma medida invariante por f. Vamos calcular sua entropia: claramente, a
entropia de qualquer parti cao e zero, j a que a medida de um conjunto A e zero
ou um. Em ambos os casos,
p
(A) log
p
(A) = 0. Assim, segue-se diretamente
que a entropia h
p
(f) e zero.
Um fato interessante que podemos extrair diretamente do exemplo acima
e que a fun cao entropia h
ITULO 7. ENTROPIA M
ETRICA
SRB
absolutamente contnua com respeito `a medida de Lebesgue para uma
transformacao expansora, construda no Captulo 9, pode ser obtida como limite
de medidas de Dirac concentradas nos pontos peri odicos. Porem, sua entropia
e igual a
_
log [ det Df[d
SRB
> 0, como mostra o Teorema 8.18.
Exemplo 7.7. Considere o shift completo com d smbolos
+
:
+
d
+
d
. Se
tomarmos a parti cao T de
+
d
dada pelos cilindros de comprimento 1 podemos
vericar que T
n
e simplesmente a particao por cilindros de comprimento n. No
exemplo 7.3 calculamos a entropia de T
n
com respeito `a medida de Bernoulli
p
com vetor de probabilidades p = (p
1
, . . . , p
d
), obtendo n
d
i=1
p
i
log p
i
. Assim,
h
p
(
+
, T) =
d
i=1
p
i
log p
i
.
De fato, este n umero e a entropia da transforma cao
+
com respeito `a medida
p
: isso e consequencia do fato de que T e uma parti cao geradora e do Teorema
de Kolmogorov-Sinai. Veja a Secao 7.3
Exemplo 7.8. Vamos calcular a entropia da medida de Lebesgue de [0, 1] para
a transforma cao dada por f(x) = 10x [10x]. Se considerarmos a parti cao T
como no exemplo 7.2, note que existem exatamente 10
n
elementos em T
n
e cada
um deles e um intervalo de comprimento 10
n
. Assim, m(C) = 10
n
para todo
C T
n
. Donde
h
m
(f, T) = lim
1
n
CP
n
m(C) log m(C) = lim
log 10
n
n
= log 10.
Alem disso, a entropia desta particao e a entropia da medida de Lebesgue.
Isso e consequencia novamente do Teorema de Kolmogorov-Sinai.
Exemplo 7.9. Esse exemplo e dedicado a calcular a entropia de uma rota cao
R
de angulo do crculo S
1
com respeito `a medida de Lebesgue m. Na
verdade, o argumento que usaremos abaixo se aplica a qualquer bije cao men-
sur avel f : S
1
S
1
(ou f : [0, 1] [0, 1]) que preserve uma dada medida
. Primeiramente, observe que uma particao do crculo T com k elemen-
tos e determinada por uma sequencia p
1
, . . . , p
k
de pontos de S
1
. Observe
tambem que se denotamos por p
j
i
= f
j
(p
i
) ent ao T
n
e determinada pelo con-
junto de pontos C
n
= (p
j
i
) S
1
; i = 1, . . . , k e j = 0, . . . , n 1. Note que
#C
n
#C
n1
+k, pois C
n
C
n1
= p
n
1
, . . . , p
n
k
. Assim, e facil deduzir por
indu cao que #T
n
kn. Deste modo:
h
(f, T) = lim
H
(T
n
)
n
#T
n
n
= lim
log kn
n
= 0.
Como a escolha de T foi arbitr aria, temos que h
(f) = 0.
7.3. TEOREMA DE KOLMOGOROV-SINAI 83
7.3 Teorema de Kolmogorov-Sinai
Denicao 7.10. Seja f : X X uma transformacao invertvel preservando
uma probabilidade no espaco de probabilidade (X, /, ). Uma parti cao T e
dita geradora se
+
_
n=
f
n
T gera a -algebra /. No caso que f e nao-invertvel,
ent ao T e geradora se
+
_
n=0
f
n
T gera a -algebra.
Teorema 7.11. Seja T uma parti cao geradora para f : X X preservando
uma probabilidade no espaco de probabilidade (X, /, ). Entao:
h
(f) = h
(f, T).
7.4 Equivalencia ergodica
Vamos agora denir uma rela cao de equivalencia do ponto de vista ergodico
entre as transformacoes que preservam medida. Duas transforma coes serao
equivalentes se, apos retirarmos conjuntos de medida zero, suas din amicas sao
conjugadas. Mais precisamente:
Denicao 7.12. Sejam f
1
: X
1
X
1
preservando a medida
1
e f
2
: X
2
X
2
preservando a medida
2
. Diremos que o sistema (f
1
,
1
) e equivalente ` a (f
2
,
2
)
se podemos escolher conjuntos Y
1
e Y
2
com
1
(X
1
Y
1
) = 0 e
2
(X
2
Y
2
) = 0,
e uma bije cao mensuravel : Y
1
Y
2
com inversa mensur avel tal que:
1.
1
(
1
(A)) =
2
(A) para todo A Y
2
mensuravel;
2. f
1
= f
2
.
Muitas vezes a rela cao de equivalencia acima e chamada de conjuga cao
erg odica entre (f
1
,
1
) e (f
2
,
2
) e e dita a conjuga cao.
Observa cao 7.13. Observe que os conjuntos Y
1
e Y
2
acima podem ser tomados
de modo que f
1
(Y
1
) Y
1
e f
2
(Y
2
) Y
2
. De fato, se B
1
= X
1
Y
1
n ao
e invariante por f
1
, tome
B
1
=
+
i=0
f
i
(B
1
). Como
1
(B
1
) = 0, temos que
1
(f
i
(B
1
)) =
1
(B
1
) = 0, donde segue-se que
1
(
B
1
). Analogamente para
B
2
= X
2
Y
2
.
Claramente a relacao acima e de equivalencia (prove isto!). Vamos agora ver
alguns exemplos de transforma coes equivalentes do ponto de vista ergodico:
Exemplo 7.14. Considere a transforma cao do intervalo f : [0, 1] [0, 1] tal
que f(x) = 2x [2x] preservando a medida de Lebesgue m, onde [x] e o menor
inteiro menor ou igual a x. Observe que, escrevendo um n umero x [0, 1]
em sua expans ao bin aria x = 0, a
1
a
2
a
3
. . .
2
, a transformacao f e simplesmente
84 CAP
ITULO 7. ENTROPIA M
ETRICA
deslocarumdgito de x para esquerda. Isso nos motiva a considerar a aplica cao
: [0, 1]
+
2
= 0, 1
N
denida por
x = (0, a
1
a
2
a
3
. . . )
2
(x) = (a
1
, a
2
, a
3
, . . . ).
Observe que em alguns pontos n ao est a bem denida. Por exemplo, podemos
escrever (0, 1)
2
de outro modo, a saber, como (0, 1)
2
= (0, 01111 . . . )
2
. Porem,
isso nao gera maiores problemas: o conjunto B dos pontos que se escrevem
de dois modos diferentes e enumeravel (prove isso!) e, logo, tem medida de
Lebesgue nula. Eventualmente, um ponto de [0, 1] pode ser mapeado por f em
um ponto de B. Observe que como cada f
i
(B) e enumeravel, conjunto
B
_
i=0
f
i
(B)
e enumeravel. Em particular o conjunto B
e Y
2
+
2
denido como
sendo o conjunto enumer avel dos itiner arios obtidos a partir dos elementos de
B
1
(P) log
1
(P) =
PP
n
1
2
((P)) log
2
((P))
=
QP
n
2
2
(Q) log
2
(Q) = H
2
(T
n
2
).
Assim, vem diretamente que
h
1
(f
1
, T
1
) = h
2
(f
2
, T
2
).
Como a parti cao T
1
de X
1
foi escolhida de modo arbitrario, tomando o supremo
no lado esquerdo da igualdade acima, vem que h
1
(f
1
) h
2
(f
2
). Aplicando o
mesmo argumento com f
2
no lugar de f
1
, vem que h
2
(f
2
) h
1
(f
1
), o que
encerra a prova.
Apesar da utilidade clara do teorema acima em determinar quando duas
transformacoes preservando medida nao sao equivalentes, a entropia metrica
tem a limita cao de n ao ser um invariante completo para a rela cao de equivalencia
que denimos acima. Por exemplo, j a vimos que a entropia da medida de
Lebesgue de uma rota cao e sempre igual a zero. Porem, rotacoes irracionais
n ao podem ser equivalentes a rota coes racionais. De fato, todas as orbitas de
uma rota cao racional sao peri odicas, enquanto todas as orbitas de uma rotacao
irracional sao densas. Porem, nem tudo esta perdido: se nos restringirmos a
classe dos shifts de Bernoulli a entropia e de fato um invariante completo. Esse
resultado e o famoso:
Teorema 7.18 (Orstein[Orn70]). Dois shifts de Bernoulli com a mesma en-
tropia s ao necessariamente equivalentes.
86 CAP
ITULO 7. ENTROPIA M
ETRICA
Vamos agora introduzir uma nova forma de calcular a entropia de uma me-
dida invariante, devida a Brin e Katok [BK83], com um certo sabor topol ogico.
Primeiramente, vamos denir o conceito de bola din amica:
Denicao 7.19. A bola din amica de tamanho n e raio em torno do ponto x
e o conjunto:
B
(n, x) = y M; d(f
i
(x), f
i
(y)) < , i = 0, 1, . . . , n 1,
ou equivalentemente,
B
(n, x) =
n1
k=0
f
k
(B
(f
k
(x))).
A entropia de e a media da taxa exponencial de decrescimento da medida
das bolas din amicas. Tornando a frase anterior mais clara, dena as fun coes:
h(x, ) = limsup
n
1
n
log (B
(n, x))
e
h(x) = lim
0
h(x, ).
O Teorema de Brin-Katok arma que:
Teorema 7.20 (Brin-Katok [BK83]). A fun cao h(x) denida acima e -
integr avel e, alem disso, vale:
h
(f) =
_
h(x)d.
7.7 Exerccios
7.1. Mostre que se Q = Q
1
, . . . , Q
d
, ent ao H
n
i=1
x
i
= 1,
ent ao
d
i=1
x
i
log x
i
e maximo quando x
1
= x
2
= = x
d
= 1/d.)
7.2. Mostre que a fun cao h(x) e f-invariante. Conclua da que se e ergodica,
ent ao h
d
i=1
p
i
log p
i
.
7.4. Uma sequencia de n umeros reais a
n
e dita subaditiva se a
n+m
a
n
+a
m
.
Mostre que se a
n
0 e subaditiva ent ao o limite lim
n
an
n
existe.
7.5. Mostre que dada uma parti cao nita T de X ent ao a sequencia H
(T
n
) e
subaditiva.
7.7. EXERC
ICIOS 87
7.6. Mostre que se = (
1
, . . . ,
n
)
n
e R
:
n
n
e a rota cao de angulo
denida por R
(x
1
, . . . , x
n
) = (x
1
+
n
, . . . , x
n
+
n
), ent ao h
m
(R
) = 0, onde
m e a medida de Lebesgue.
7.7. Dena A :
2
2
por A(x, y) = (2x,
1
2
y). Mostre que a entropia de A
com respeito `a medida de Lebesgue m e h
m
(A) = log 2.
7.8. Mostre as seguintes propriedades da entropia:
1. Para n N, h
(f
n
) = nh
(f);
2. Se t [0, 1] e
1
,
2
sao medidas f-invariantes, ent ao
h
t1+(1t)2
(f) = th
1
(f) + (1 t)h
2
(f)
3. Se p e um ponto peri odico de perodo n e =
1
n
n1
i=0
f
i
(p)
, ent ao h
(f) = 0
88 CAP
ITULO 7. ENTROPIA M
ETRICA
Captulo 8
Entropia Topol ogica
Introduziremos agora um importante conceito topologico com conexao com a
deni cao de entropia metrica, estudada anteriormente. Este invariante ser a um
n umero que, como veremos, coincide com o supremo das entropias metricas
quando percorremos o conjunto de todas as medidas invariantes. Estudaremos
tambem sua rela cao com a taxa de crescimento do n umero de pontos peri odicos
e sua versao para uxos.
8.1 Deni cao via coberturas
Daremos primeiramente uma denicao de entropia topol ogica com o sabor da
deni cao de entropia via parti coes. Neste caso, o ingrediente que utilizaremos
e a no cao de entropia de uma cobertura (note que aqui n ao iremos nos reportar
a nenhuma medida invariante.)
Denicao 8.1. Seja X um espaco metrico e uma cobertura de X. Deniremos
N() o n umero da cobertura como a menor cardinalidade possvel de uma
subcobertura de , ou seja,
N() = inf#; e subcobertura de X.
A entropia de e simplesmente o n umero H() = log N().
Se | e 1 sao coberturas tais que dado qualquer U | existe algum V 1
isso por tal que U V , ent ao dizemos que | rena 1 e denotamos isso por
1 |.
Do mesmo modo como foi feito para particoes, dadas duas coberturas e
podemos denir uma nova cobertura de X do seguinte modo:
= A B; A e B .
Dada uma parti cao , denimos
n
por
n
= f
n+1
().
89
90 CAP
OGICA
Deixaremos para o leitor a tarefa de mostrar que H(
n
) e uma sequencia sub-
aditiva (Exerccio 8.2.)
Assim, dada uma funcao contnua f : X X, denimos a entropia de f
com respeito a cobertura , como sendo o n umero
h(f, ) = lim
n
1
n
H(
n
).
Finalmente, a entropia topol ogica de f e
h
top
(f) = suph(f, ); e cobertura aberta nita de X.
Exemplo 8.2. Vamos agora calcular a entropia topologica de uma bije cao
mensuravel f : S
1
S
1
(ou f : [0, 1] [0, 1]). Primeiramente, dada uma
cobertura do crculo podemos supor, sem perda de generalidade, que e for-
mada por intervalos abertos. Sejam p
1
, p
2
, . . . , p
k
os extremos desses intervalos.
Observe que se denotamos por p
j
i
= f
j
(p
i
) ent ao
n
e determinada pelo con-
junto de pontos C
n
= (p
j
i
) S
1
; i = 1, . . . , k e j = 0, . . . , n 1. Note que
#C
n
#C
n1
+k, pois C
n
C
n1
= p
n
1
, . . . , p
n
k
. Assim, e facil deduzir por
indu cao que #
n
kn. Deste modo:
h
(f, ) = lim
H
(
n
)
n
#
n
n
= lim
log kn
n
= 0.
Como a escolha de foi arbitr aria, temos que h
(f) = 0.
Exemplo 8.3. Como consequencia do exemplo anterior, a entropia de uma
rota cao R
de angulo do crculo S
1
e sempre igual a zero.
Vamos agora mostrar a seguinte proposicao, util para calcular a entropia
topol ogica de uma transformacao.
Proposi cao 8.4. Seja
n
uma sequencia de coberturas nitas tais que os seus
di ametros diam
n
vao para zero quando n vai para innito. Entao,
h
top
(f) = sup
nN
h(f,
n
) = lim
n
h(f,
n
).
Demonstra cao. Observe primeiramente que dada uma cobertura nita 1, pode-
mos escolher N sucientemente grande de modo que se n > N ent ao diam
n
e
menor que o n umero de Lebesgue da cobertura 1. Relembrando a deni cao,
e um n umero de Lebesgue de 1 se, dado qualquer conjunto C com diamC ,
ent ao existe V 1 tal que C V . Logo, como diam
n
, temos que todo
elemento B de
n
esta contido em algum V 1. Logo, 1
n
, o que implica
diretamente que h(f, 1) h(f,
n
), pois 1
k
k
n
, para todo N. Em particu-
lar, h(f, 1) sup
nN
h(f,
n
). Logo, tomando o supremo sobre todas as coberturas
nitas no lado esquerdo da igualdade anterior:
h
top
(f) = sup h(f, 1) sup
nN
h(f,
n
) h
top
(f).
8.2. DEFINIC
AO VIA CONJUNTOS GERADORES 91
Para mostrar que a sequencia h(f,
n
) e convergente, suponha que uma sub-
sequencia
ni
satisfazendo lim
i
h(f,
ni
) = h. Vamos mostrar que h = h
top
(f).
De fato, dado > 0, podemos escolher N grande de modo que se i > N, ent ao
h h(f,
ni
h + . Deste modo, aplicando a parte que j a mostramos `a
sequencia
i
=
ni+N
, temos que
h
top
(f) = sup
iN
h(f,
i
) (h , h +).
Como e arbitr ario, vem que h
top
(f) = h, provando que a sequencia h(f,
n
) e
convergente.
Corolario 8.5. Se e uma cobertura tal que lim
n
diam
n
= 0, entao
h
top
(f) = h(f, ).
8.2 Deni cao via conjuntos geradores
Vamos agora denir de uma outra forma o conceito de entropia topol ogica,
utilizando a deni cao de conjunto gerador.
Denicao 8.6. Seja f : X X uma aplica cao contnua do espaco metrico
(X, d) e E X. Dado > 0 e n N, dizemos que E e um (n, )-gerador de X,,
se X =
xE
B
(n, x).
Consideraremos daqui por diante X compacto para que sempre exista um
conjunto (n, )-gerador nito. Isso decorre diretamente da denicao de conjuntos
compactos, pois sempre podemos cobrir X por bolas din amicas de raio e
tamanho n. Para cada par (n, ), associaremos um n umero S
n
() denido por
S
n
() = inf#E; E X e (n, )-gerador .
Deixaremos para o leitor a tarefa de vericar que a sequencia log S
n
() e suba-
ditiva (Exerccio 8.3.)
Assim, podemos considerar o limite
h(f, ) = lim
n
1
n
log S
n
().
Observando que a fun cao h() e monotona decrescente, temos que o
limite h(f) = lim
0
h(f, ) existe. De fato, temos que
Proposi cao 8.7. Com as deni coes anteriores vale
h(f) = h
top
(f).
92 CAP
OGICA
8.3 Entropia de uxos
Com as ferramentas introduzidas vamos facilmente denir o conceito de entropia
topol ogica para um uxo de uma variedade compacta
t
: M M. Primeira-
mente, vamos denir o an alogo da bola din amica B
(T, x) = y M; d
T
(x, y) a bola de raio na dist ancia d
T
.
Um conjunto E Xser a chamado de (T, )-gerador de X , se =
xE
B
(n, x).
Assim, de forma analoga ao que zemos no caso de aplica coes, denimos
S
T
() = inf#E; E X e (T, ) gerador e
h(, ) = lim
T
1
T
log S
T
().
Finalmente, a entropia topol ogica do uxo e denida como sendo o n umero:
h
top
() = lim
0
h(, ).
Uma primeira conex ao entre a entropia topol ogica de uxos e aplica coes e:
Teorema 8.8. A entropia topologica h
top
() do uxo
t
coincide com a entropia
topologica h
top
(
1
) da aplicacao
1
.
Um importante resultado (cuja prova foge ao ambito deste texto) e:
Teorema 8.9 (Princpio Variacional). Seja f : X X uma fun cao cont-
nua do espaco metrico compacto X. Denote por 1 o conjunto das medidas (de
probabilidade) invariantes por f. Entao vale a igualdade:
h
top
(f) = sup
I
h
(f).
Podemos tirar algumas conclus oes uteis do teorema acima. A primeira delas
e que se para alguma medida invariante a entropia metrica e positiva ent ao, a
entropia topol ogica tambem o e. Em contrapartida, se a entropia de toda as
medida invariantes e igual a zero, ent ao a entropia topol ogica tambem e igual
a zero. Como consequencia disso e do exemplo 7.9, reobtemos que a entropia
topol ogica de qualquer bije cao do intervalo ou de S
1
e zero, j a que a entropia
metrica de qualquer medida invariante e igual a zero.
Uma das boas propriedades da entropia topol ogica e que ela e um invari-
ante topol ogico: se duas transformacoes sao equivalentes do ponto de vista
topol ogico, ent ao sua entropia topol ogica e a mesma. Como zemos no captulo
anterior, vamos tornar preciso o que entendemos por transforma coes equiva-
lentes (agora no sentido topologico):
8.4. PRESS
AO TOPOL
OGICA 93
Denicao 8.10. Sejam f
1
: X
1
X
1
e f
2
: X
2
X
2
fun coes contnuas dos
espacos metricos X
1
e X
2
. Diremos que f
1
e topologicamente equivalente `a f
2
se existe um homeomorsmo h : X
1
X
2
tal que:
h f
1
= f
2
h.
Neste caso dizemos que f
1
e topologicamente conjugado a f
2
e h e dita uma
conjuga cao entre f
1
e f
2
.
Observa cao 8.11. Observe que se o ponto p X
1
e tal que f
n
1
(p) = p, ent ao
f
n
2
((p)) = (f
n
1
(p)) = (p). Em palavras, leva pontos peri odicos de f
1
em
pontos peri odicos de f
2
. De modo an alogo, n ao e difcil ver que leva pontos
de X
1
com orbita por f
1
densa, em pontos de X
2
com orbita por f
2
densa.
Deixamos a prova da proposi cao abaixo para o leitor:
Proposi cao 8.12. Se f
1
e topologicamente equivalente a f
2
, entao h
top
(f
1
) =
h
top
(f
2
).
Como no caso da entropia metrica, a entropia topologica tem a limita cao de
n ao ser um invariante completo. Por exemplo, duas rota coes quaisquer do circulo
tem sempre a mesma entropia topologica, igual a zero. Porem, uma rotacao
irracional tem todos os pontos com orbita densa, enquanto uma rota cao racional
n ao possui nenhum com esta propriedade, j a que todos s ao peri odicos. De acordo
com a observa cao acima, isso torna impossvel que haja uma conjugacao entre
elas.
8.4 Pressao topol ogica
Vamos agora denir uma generaliza cao do conceito de entropia topologica, in-
troduzindo o conceito de press ao topologica de uma fun cao : X R com
respeito a transformacao f : X X. Esse conceito (oriundo da Fsica, como
o pr oprio nome indica) ser a tambem um invariante topol ogico de f, no sentido
de que duas transformacoes topologicamente equivalentes atribuem a mesma
pressao a uma fun cao . Suporemos que o espaco X e compacto para que as
quantidades tratadas sejam sempre nitas, mas os conceitos expostos sao de
car ater geral e nao dependem desta condicao.
Denicao 8.13. Dado n N vamos denotar
n
(x) =
n1
i=0
(f
i
(x)). Dado
um conjunto C X ent ao
n
(C) = max
xC
n
(x).
Dada uma cobertura de X denimos a pressao de com respeito a cober-
tura como:
P(, ) = lim
n+
1
n
log inf
U
n
UU
e
n(U)
,
onde o nmo e tomado sobre todas subcoberturas | de
n
.
Fica como exerccio para o leitor diligente mostrar que o limite acima existe
(a essa altura o caminho a ser percorrido e standard: mostre que a sequencia e
subaditiva).
94 CAP
OGICA
Denicao 8.14. A press ao P(, f) de com respeito a f e o supremo dos
valores de P(, ) sobre todas as coberturas abertas de X.
Proposi cao 8.15. Sejam , C
0
(X) e C R. Entao:
1. P(0, f) = h
top
(f)
2. P( + C, f) = P(, f) +C
3. Se existir fun cao limitada u : X R tal que se escreve como =
+u f u ( e neste caso diremos que a fun cao e cohomologa a ),
entao P(, f) = P(, f).
Demonstra c ao. Para o item 1, xada uma cobertura observe que como =
0, ent ao dada uma subcobertura | de
n
vale
UU
e
n(U)
= #|. Logo,
P(0, ) = h(f, ) para cada cobertura de X.
No item 2, observe que se denotamos = + C ent ao
n
(x) =
n
(x) +
Cn. Logo, xada uma cobertura , para qualquer subcobertura | de
n
vale
UU
e
n(U)
= e
Cn
UU
e
n(U)
. Assim, segue diretamente que P(, ) =
P(, ) +C e, por conseguinte, que P(, f) = P(, f) +C
Para o ultimo item, inicialmente como = + u f u vale que
n
(x) =
n
(x) + u(f
n
(x)) u(x). Assim,
UU
e
n(U)
= e
u(f
n
(x))u(x)
UU
e
n(U)
.
Logo, como u e limitada, digamos [u(x)[ K, ent ao vale que
UU
e
n(U)
= e
2K
UU
e
n(U)
.
Segue diretamente que P(, ) = P(, ) e, consequentemente, P(, f) =
P(, f).
8.5 Princpio variacional
Denotaremos tambem a pressao da medida com respeito a como sendo o
n umero P
() = h
(f) +
_
d. Para simplicar nossa nota cao, sempre que f
estiver xada e nao houver perigo de confus ao, utilizaremos P() para indicar
P(, f).
IPIO VARIACIONAL 95
Teorema 8.16 (Princpio Variacional). Se 1 e o conjunto das probabilidades
invariantes para uma transforma c ao contnua f : X X do espaco compacto
X e : X R e contnua, ent ao
P(, f) = sup
I
P
() = sup
I
h
(f) +
_
d (8.1)
Outra boa propriedade da press ao e que ela e uma fun cao contnua com o
potencial. Mostraremos, sem muito esfor co, que
Proposi cao 8.17. P : C
0
(X) R e Lipschitz com constante de Lipschitz igual
a 1.
Demonstra cao. De fato, dados os potenciais e C
0
(X) vale que:
| | +| |
De onde , para cada 1:
h
(f) +
_
d | | h
(f) +
_
d h
(f) +
_
d +| |
Tomando o supremo em nas desigualdades acima:
P() | | P() P() +| |
Ou equivalentemente, |P() P()| | |.
Agora vamos estudar a press ao de um potencial particular, a saber, (x) =
log [ det Df(x)[ e tirar conclus oes quando f e uma transformacao expansora
de classe C
2
, estudada no Captulo 9 anterior. Na prova da proposi cao a seguir,
vamos utilizar alguns resultados classicos de teoria ergodica. O leitor que os
desconhece pode recorrer `a Secao 12.2.
Proposi cao 8.18. Seja M
d
uma variedade compacta de dimensao d. Se f e
uma transforma cao expansora de classe C
2
, entao P(log [ det Df(x)[) = 0.
Demonstra cao. Observe primeiramente que se e uma probabilidade invariante
para f, pela desigualdade de Ruelle (veja o Teorema 12.3) se (x) e a soma dos
expoentes de Lyapunov positivos de x, ent ao a entropia de satisfaz:
h
(f)
_
i
(x) d(x).
Por outro lado, como a transforma cao f e expansora, todos os expoentes de
Lyapunov de f sao positivos e, pelo teorema de Oseledets, a soma de todos os
expoentes de Lyapunov
i
(x) e
d
i=1
i
(x) =
i
(x) = log [ det Df(x)[.
96 CAP
OGICA
Consequentemente, a pressao P() satisfaz:
P(log [ det Df[) = sup
I
h
(f)
_
log [ det Df(x)[ d(x) 0.
De fato, P(log [ det Df[) = 0. Para ver isso, basta calcularmos a entropia da
medida
SRB
construda no captulo 9. Note que essa medida tem a propriedade
de ser absolutamente contnua com respeito a medida de Lebesgue de M. Isso
nos coloca em condicoes de aplicar a f ormula de Pesin, que nos garante que:
h
SRB
(f) =
_
i
(x) d
SRB
(x) =
_
log [ det Df(x)[ d
SRB
.
8.6 Exerccios
8.1. Se | e 1 sao coberturas tais que | 1, ent ao H(1) H(|).
8.2. Mostre que H(
n
) e uma sequencia subaditiva.
8.3. Mostre que xado , ent ao a sequencia log S
n
() e subaditiva.
8.4. Mostre que o maximo da fun cao h : R
d
R dada por h(x
1
, . . . , x
d
) =
d
i=1
x
i
log x
i
restrita ao simplexo x
i
0; x
1
+ +x
d
= 1 e igual a log d
e e obtido exatamente quando x
1
= x
2
= = x
d
=
1
d
. Conclua que entre as
medidas de Bernoulli do Shift completo com d smbolos, a de maior entropia e
dada pelo vetor de probabilidade (
1
d
, . . . ,
1
d
).
8.5. Este exerccio e uma generaliza cao do anterior: sejam a
1
, . . . , a
d
n umeros
reais. Mostre que o m aximo da fun cao F : R
d
R dada por
F(x
1
, . . . , x
d
) =
d
i=1
x
i
log x
i
+x
i
a
i
restrita ao simplexo x
i
0; x
1
+ +x
d
= 1 e obtido exatamente quando
x
j
=
e
aj
d
i=1
e
ai
.
Captulo 9
Transforma c oes Expansoras
Nesta secao provamos que para qualquer transforma cao expansora cujo jaco-
biano det Df e Holder
1
existe uma unica probabilidade invariante absoluta-
mente contnua com relacao `a medida de Lebesgue. Essa probabilidade e posi-
tiva em todos os subconjuntos abertos de M, e ergodica, e a sua bacia de atra cao
tem medida de Lebesgue total em M.
Denicao 9.1. Seja M uma variedade compacta e f : M M uma trans-
forma cao de classe C
1
. Dizemos que f e expansora se existe > 1 e alguma
metrica riemanniana | | em M tais que
|Df(x)v| |v| para todo x M e v T
x
M. (9.1)
Exemplo 9.2. Seja F : R
d
R
d
, d 1 um isomorsmo linear satisfazendo
F(Z
d
) Z
d
. Ent ao existe uma unica transformacao f : T
d
T
d
no toro
d-dimensional M = T
d
tal que f = F, onde
: R
d
T
d
, (x
1
, . . . , x
d
) =
_
e
2ix1
, . . . , e
2ix
d
_
e a proje cao can onica. Se todos os autovalores
1
, . . . ,
d
de F tem norma
maior que 1 ent ao a transforma cao f e expansora: podemos tomar qualquer
1 < < inf
i
[
i
[ em (9.1).
Chamamos suporte de uma probabilidade o conjunto dos pontos tais que
toda vizinhanca tem medida positiva para . Note que o suporte de e o espaco
M inteiro se e somente se e positiva em todo aberto de M.
Quando e invariante para f, chamamos bacia de o conjunto B() dos
pontos x M tais que
lim
n
1
n
n1
j=0
(f
j
(x)) =
_
d
1
Dado > 0, dizemos que : M R e -Holder se existe alguma constante C > 0 tal que
|(x
1
) (x
2
)| Cd(x
1
, x
2
)
para todo x
1
, x
2
em M.
97
98 CAP
ITULO 9. TRANSFORMAC
OES EXPANSORAS
para toda fun cao contnua : M R. Note que a bacia sempre e um conjunto
invariante. Se e ergodica ent ao B() tem -medida total.
Teorema 9.3. Seja f : M M uma transforma cao expansora numa variedade
compacta conexa M. Assuma que o logaritmo
M x log [ det Df(x)[
do jacobiano de f e -Holder, para algum > 0. Entao f admite uma unica
probabilidade invariante absolutamente contnua com relacao `a medida de
Lebesgue m. Alem disso, e erg odica, o seu suporte coincide com M e a sua
bacia tem medida de Lebesgue total na variedade.
A estrategia da demonstracao do Teorema 9.3 e a seguinte.
E f acil ver
que a pre-imagem por f de um conjunto com medida de Lebesgue m nula
tambem tem medida de Lebesgue nula. Isto signica que a imagem f
por
f de qualquer medida absolutamente contnua com relacao a m tambem e
absolutamente contnua com relacao a m. Em particular, a nesima imagem
f
n
, da sequencia
1
n
n1
j=0
f
j
m
e uma probabilidade invariante absolutamente contnua com relacao `a medida
de Lebesgue, com densidade limitada pela mesma constante.
Um argumento adicional provar a que tal ponto de acumula cao e unico e
satisfaz todas as propriedades no enunciado do teorema.
9.1 Lema de distor cao
A hip otese de que a transformacao f : M M e expansora serve para obter a
seguinte proposi cao:
Lema 9.4. Existe k 1 tal que todo ponto y M tem exatamente k pre-
imagens por f. Alem disso, existe
0
> 0 tal que, para qualquer pre-imagem x
de um ponto y M, existe uma aplica cao h : B(y,
0
) M de classe C
1
tal
que f h = id , h(y) = x e
d(h(y
1
), h(y
2
))
1
d(y
1
, y
2
) para todo y
1
, y
2
B(y,
0
).
Demonstra cao. A condi cao (9.1) implica que a derivada Df e um isomorsmo
em todo ponto. Logo, dado qualquer x M existe
0
> 0 tal que f envia
9.1. LEMA DE DISTORC
AO 99
alguma vizinhanca V (x) de x difeomorcamente sobre a bola de raio
0
em
torno de y = f(x). Por compacidade, podemos tomar
0
independente de x.
Ent ao o n umero de pre-imagens de qualquer y M deve ser limitado. Alem
disso, o conjunto dos pontos que tem exatamente n pre-imagens e aberto, para
todo n 0. Portanto, por conexidade, o n umero de pre-imagens deve ser o
mesmo para todo y M. Finalmente, seja h = (f [ V (x))
1
. Pela condi cao
(9.1),
|Dh(z)| = |Df(h(z))
1
|
1
para todo z no domnio de h, e portanto h contrai distancias `a taxa
1
como
enunciamos.
Transformacoes h como neste enunciado sao chamadas ramos inversos de f.
Mais geralmente, podemos denir ramos inversos h
n
de f
n
, n 1, da seguinte
maneira. Dado y M e x f
n
(y), sejam h
1
, . . . , h
n
ramos inversos de f com
h
j
(f
nj+1
(x)) = f
nj
(x)
para todo 1 j n. Como cada h
j
e uma contracao, a sua imagem esta contida
numa bola de raio menor que
0
em torno de f
nj
(x). Ent ao h
n
= h
n
h
1
esta bem denida na bola de raio
0
em torno de y.
E claro que f
n
h
n
= id e
h
n
(y) = x.
O pr oximo resultado fornece um bom controle da distorcao de iterados de f
e seus ramos inversos, que e crucial para a demonstra cao do teorema. Este e o
unico lugar onde se usa a hip otese de que o jacobiano e Holder.
Proposi cao 9.5 (lema de distorcao). Existe C
1
> 0 tal que, dado qualquer
n 1, qualquer y M, e qualquer ramo inverso h
n
: B(y,
0
) M de f
n
,
tem-se
[ det Dh
n
(y
1
)[
[ det Dh
n
(y
2
)[
exp(C
1
d(y
1
, y
2
)
) exp(C
1
(2
0
)
)
para todo y
1
, y
2
B(y,
0
).
Demonstra c ao. Escrevamos h
n
como composicao h
n
= h
n
h
1
de ramos
inversos de f. Tambem escrevemos h
i
= h
i
h
1
para 1 i < n, bem como
h
0
= id . Ent ao
log
[ det Dh
n
(y
1
)[
[ det Dh
n
(y
2
)[
=
n
i=1
log [ det Dh
i
(h
i1
(y
1
))[ log [ det Dh
i
(h
i1
(y
2
))[ .
Note que log [ det Dh
i
[ = log [ det Df[ h
i
e, por hip otese, log [ det Df[ is
(C
0
, )-Holder for some C
0
> 0. Alem disso, pelo Lema 9.4, cada h
j
e uma
1
-contra cao. Logo,
log
[ det Dh
n
(y
1
)[
[ det Dh
n
(y
2
)[
n
i=1
C
0
d(h
i
(y
1
), h
i
(y
2
))
i=1
C
0
i
d(y
1
, y
2
)
.
Portanto, para provar o lema basta tomar C
1
= C
0
i=1
i
.
100 CAP
ITULO 9. TRANSFORMAC
OES EXPANSORAS
9.2 Medidas absolutamente contnuas
O pr oximo resultado, que e uma consequencia do lema de distor cao, mostra que
as imagens f
n
m)(B) C
2
m(B) para todo con-
junto mensur avel B M e todo n 1.
Demonstra cao. Podemos, sem restricao, supor que B esta contido em alguma
bola B
0
= B(z,
0
) de raio
0
centrada em algum ponto z M. Usando a
Proposi cao 9.5 vemos que
m(h
n
(B))
m(h
n
(B
0
))
=
_
B
[ det Dh
n
[ dm
_
B0
[ det Dh
n
[ dm
exp(C
1
(2
0
)
)
m(B)
m(B
0
)
,
para todo ramo inverso h
n
de f
n
no ponto z. Alem disso, tambem temos que
(f
n
m)(B) = m(f
n
(B)) e a soma de m(h
n
(B)) sobre todos os ramos inversos,
e analogamente para B
0
. Deste modo, obtemos que
(f
n
m)(B)
(f
n
m)(B
0
)
exp(C
1
(2
0
)
)
m(B)
m(B
0
)
.
Claro que (f
n
m)(B
0
) (f
n
)/
0
.
Tambem precisamos do seguinte resultado auxiliar:
Lema 9.7. Seja uma probabilidade num espa co metrico compacto X, e seja
: X [0, +) uma fun cao integr avel com respeito a . Seja
i
, i 1,
uma sequencia de probabilidades em X convergindo para uma probabilidade
na topologia fraca
. Se
i
para todo i 1 entao .
Demonstra c ao. Seja B um conjunto mensur avel qualquer. Para cada > 0,
seja K
) e ()(B K
)
sao ambos menores que . Ent ao seja A
da
forma A
= z : d(z, K
tem -medida
zero: ha no m aximo uma quantidade enumer avel de valores de r para os quais
isso nao acontece. Ent ao, = lim
i
implica (A
) = lim
i
(A
) ()(A
).
Fazendo 0 obtemos que (B) ()(B).
Aplicando este lema na nossa situacao, obtemos
Corolario 9.8. Todo ponto de acumula cao da sequencia n
1
n1
j=0
f
j
m e
uma probabilidade invariante para f absolutamente contnua com relacao `a me-
dida de Lebesgue.
9.3. EXIST
ODICAS 101
Demonstra cao. Tomemos constante igual a C
2
e = m. Tomemos tambem
i
= n
1
i
ni1
j=0
f
j
n
.
Lema 9.9. Seja T
n
, n 1, uma sequencia de parti coes num espa co metrico
compacto com diametros convergindo para zero quando n . Seja uma
probabilidade nesse espaco, e seja B qualquer conjunto mensur avel com (B) >
0. Entao existem V
n
T
n
, para n 1, tais que
(V
n
) > 0 e
(B V
n
)
(V
n
)
1 quando n .
Demonstra cao. Dado qualquer 0 < < (B), seja K
um subconjunto com-
pacto de B com (B K
satisfaz (A
,n
K
V
n
)
(B)
(B) +
(V
n
)
para todo V
n
T
n
que intersecta K
, deduziramos que
(K
)
(B)
(B) +
(A
,n
)
(B)
(B) +
((K
) +) (B) ,
o que e uma contradi cao. Portanto, deve existir algum V
n
T
n
tal que
(B V
n
) (K
V
n
) >
(B)
(B) +
(V
n
)
e isto implica (V
n
) > 0. Fazendo 0 obtemos a conclusao do lema.
Lembre que A M e um conjunto invariante para f : M M se f
1
(A) =
A. Mais geralmente, dizemos que A e positivamente invariante se f(A) = A.
Note que conjuntos invariantes sempre s ao positivamente invariantes, porque f
e sobrejetiva.
102 CAP
ITULO 9. TRANSFORMAC
OES EXPANSORAS
Lema 9.10. Se A M um conjunto positivamente invariante para f com
medida de Lebesgue m(A) > 0, entao A tem medida de Lebesgue total em algum
U
i
T
0
, ou seja, existe 1 i s tal que m(U
i
A) = 0.
Demonstra cao. Pelo Lema 9.9, existe V
n
T
n
tal que
m(V
n
A)
m(V
n
)
converge para zero quando n . Seja U
i(n)
= f
n
(V
n
). Pela Proposi cao 9.5
aplicada ao ramo inverso de f
n
que envia U
i(n)
em V
n
, conclumos que
m(U
i(n)
A)
m(U
i(n)
)
m(f
n
(V
n
A))
m(f
n
(V
n
))
exp
_
C
1
(2
0
)
_
m(V
n
A)
m(V
n
)
tambem converge para zero. Como T
0
e nito, deve existir 1 i s tal que
i(n) = i para innitos valores de n. Logo, m(U
i
A) = 0.
Corolario 9.11. A transforma cao f : M M admite alguma probabilidade
invariante ergodica e absolutamente contnua com relacao `a medida de Lebesgue.
Demonstra cao. Como consequencia do lema anterior, existem no m aximo #T
0
conjuntos invariantes com medida de Lebesgue positiva disjuntos dois-a-dois.
Portanto, M pode ser particionado num n umero nito de conjuntos invariantes
A
1
, . . . , A
s
, s #T
0
com medida de Lebesgue positiva e que sao minimais
no seguinte sentido de que nao existem subconjuntos invariantes B
i
A
i
com
0 < m(B
i
) < m(A
i
). Dada qualquer medida invariante absolutamente contnua
, existe algum i tal que (A
i
) > 0. Ent ao a restri cao normalizada
i
de a
A
i
,
i
(B) =
(B A
i
)
(A
i
)
e invariante e absolutamente contnua. Alem disso,
i
e ergodica, porque A
i
e
minimal.
9.4 Unicidade e conclusao da prova
O argumento anterior tambem mostra que existe apenas um n umero nito de
probabilidades erg odicas e absolutamente contnuas. O ultimo passo da demon-
stracao e mostrar que, de fato, tal probabilidade e unica. Para isso usamos o
fato de que f e topologicamente misturadora:
Lema 9.12. Dado qualquer aberto n ao vazio U M, existe N 1 tal que
f
N
(U) = M.
Demonstra cao. Seja x U e r > 0 tais que a bola de raio r centrada em
x esta contida em U. Dado qualquer n 1, suponha que f
n
(U) n ao cobre
toda a variedade. Entao existe alguma curva ligando f
n
(x) a um ponto
9.5. EXERC
ICIOS 103
y M f
n
(U), e essa curva pode ser tomada com comprimento menor que
diamM +1. Levantando pelo difeomorsmo local f
n
, obtemos uma curva
n
ligando x a um ponto y
n
M U. Ent ao r comp(
n
)
n
(diamM + 1).
Isto da uma cota superior para o valor possvel de n. Logo, f
n
(U) = M para
todo n sucientemente grande, como armamos.
Corolario 9.13. Se A M e um conjunto positivamente invariante com me-
dida de Lebesgue positiva, entao A tem medida de Lebesgue total na variedade
M.
Demonstra cao. Seja U o interior de um conjunto U
i
como no Lema 9.10, e
seja N 1 tal que f
N
(U) = M. Ent ao m(U A) = 0, e portanto M A =
f
N
(U) f
N
(A) f
N
(U A) tambem tem medida de Lebesgue zero.
O pr oximo enunciado completa a demonstra cao do Teorema 9.3:
Corolario 9.14. Seja qualquer probabilidade invariante absolutamente con-
tnua. Ent ao e erg odica e a sua bacia B() tem medida de Lebesgue total em
M. Alem disso, o suporte de e toda a variedade M.
Demonstra c ao. Se A e um subconjunto invariante qualquer ent ao, pelo corol ario
anterior, A tem medida de Lebesgue zero ou A
c
tem medida de Lebesgue zero.
Uma vez que e absolutamente contnua, segue que (A) = 0 ou (A
c
) = 0.
Isto prova que e ergodica. Ent ao B() e um conjunto invariante com medida
de Lebesgue positiva e, consequentemente, deve ter medida de Lebesgue to-
tal.Analogamente, como o suporte de e um conjunto compacto positivamente
invariante, ele tem que coincidir com M.
Observa cao 9.15.
E possvel mostrar que a derivada d/dm e Holder e lim-
itada de zero. Em particular, a probabilidade e equivalente ` a medida de
Lebesgue m, no sentido de que elas tem os mesmos conjuntos com medida nula.
A conclusao do Teorema 9.3 e falsa, em geral, se omitirmos a hip otese de que o
jacobiano e Holder.
9.5 Exerccios
104 CAP
ITULO 9. TRANSFORMAC
OES EXPANSORAS
Captulo 10
Estados de Equilbrio
Estudaremos neste captulo uma classe especialmente importante de medidas
invariantes, a saber, os estados de equilbrio. A deni cao destas medidas, atraves
de um princpio variacional, tem uma forte motiva cao fsica e encontra aplica coes
em varias areas tais como teoria da dimensao de conjuntos invariantes, estudo de
recorrencias do sistema din amico, crescimento do n umero de pontos peri odicos,
uxos geodesicos, medidas fsicas, etc. Estaremos interessados em estudar que
hip oteses sao relevantes para que perguntas tais como a existencia, unicidade,
ergodicidade destas medidas, possam ter respostas positivas. Como veremos,
este estudo pode ser feito para uma ampla classe de difeomorsmos locais em
variedades compactas.
10.1 Deni cao de Estado de Equilbrio
Neste captulo consideraremos uma funcao f : X X denida em um espaco
metrico X e : X R uma fun cao contnua (que daqui por diante chamaremos
de potencial, invocando o termo fsico). O conjunto das medidas (de probabili-
dade) invariantes por f designaremos pela letra 1.
Denicao 10.1. Uma medida invariante
(f) +
_
d
= P(, f).
Ou seja:
() = h
(f) +
_
d.
Exemplo 10.2. Observe que os estados de equilbrio para o potencial = 0
sao aquelas medidas que maximizam a entropia. Como vimos no exemplo 7.7,
no caso do deslocamento completo com d smbolos 1, . . . , d, a unica medida que
maximiza a entropia e bem conhecida: e a medida de Bernoulli associada ao
vetor de probabilidade (
1
d
, . . . ,
1
d
).
105
106 CAP
IBRIO
Exemplo 10.3. Ainda para a transforma cao deslocamentocom d smbolos,
xados n umeros a
1
, . . . , a
d
podemos considerar o potencial (x) = a
x0
que e
constante nos cilindros [0; i] de comprimento 1. Observe neste caso que a integral
_
d se escreve como
_
d =
d
i=1
([0; i])a
i
Assim, a funcao P numa medida de Bernoulli dada pelo vetor de probabilidades
(p
1
, . . . , p
d
) nada mais e que
d
i=1
p
i
log p
i
+p
i
a
i
. Logo, utilizando o exerccio
8.5 temos que entre todas as medidas de Bernoulli a que maximiza a P e a que
tem vetor de probabilidades p
j
=
e
a
j
d
i=1
e
a
i
.
Exemplo 10.4. Se f e uma transformacao expansora de classe C
2
em uma
variedade compacta M, como ja vimos no Teorema 8.18, a pressao da fun cao
(x) = log [ det Df(x)[ e P(, f) = 0. Alem disso, foi mostrado que se e a
medida SRB de f construda no captulo 9, ent ao e um estado de equilbrio
para j a que P
n
d(f
n
(x), f
n
(y))
n
, o que implica imediatamente que x = y.
Para ilustrar a propriedade de expansividade, vamos provar uma proposi cao
conectando o crescimento do n umero de pontos peri odicos de f com a sua en-
tropia topol ogica. Denotaremos o conjunto Per(n) = x M; f
n
(x) = x.
Ent ao:
Proposi cao 10.9. Se f e expansiva entao
limsup
1
n
log #Per(n) h
top
(f).
Demonstra cao. Seja uma cobertura de M de di ametro menor que constante
de expansividade de f. Observe que em um elemento de
n
so pode existir
no maximo um ponto de Per(n): de fato, se x, y Per(n) estao no mesmo
elemento de
n
, ent ao d(f
i
(x), f
i
(y) < para i = 0, . . . , n1. Como f
n
(x) = x
108 CAP
IBRIO
e f
n
(y) = y, a desigualdade d(f
i
(x), f
i
(y) < vale para todo i N. Logo, pela
expansividade de f, x = y. Assim,
limsup
1
n
log #Per(n) limsup
1
n
log #N(
n
) = h
top
(f, ).
Tomando o limite quando o di ametro de vai a zero, temos a desigualdade
requerida.
Nao e difcil obter transformacoes que nao satisfazem a propriedade de ex-
pansividade. Por exemplo, uma isometria da variedade nunca satisfaz a condicao
de expansividade. Se a transformacao admitir um ponto xo do tipo sela, ent ao
(pelo Teorema da Variedade Estavel) a transformacao tambem nao e expansiva.
Iremos agora tratar as transformacoes expansivas do ponto de vista ergodico.
Mais precisamente, mostraremos o seguinte teorema:
Teorema 10.10. Seja f : M M uma transforma cao expansiva denida
na variedade compacta M e seja C
0
(M) o conjunto das fun coes : M R
contnuas. Dado qualquer C
0
(M) existe algum estado de equilbrio para .
Para o conforto do leitor iremos dividir a demonstra cao do teorema anterior
em um conjunto de lemas. O primeiro deles diz que se T e uma parti cao com
di ametro menor que a constante de expansividade e e uma medida, entao T
e necessariamente uma particao geradora.
Lema 10.11. Seja T = P
1
, . . . , P
k
uma parti cao tal que para todo i = 1, . . . , k
vale diamP
i
. Entao, T e geradora com respeito a qualquer medida invariante
.
Demonstra cao. Dena
T
(n)
= C
(n)
= P
i0
f
n+1
(P
in1
), para cada n 1.
Nos precisamos mostrar que dado um conjunto mensur avel A e > 0, existem
borelianos C
(n)
1
, . . . , C
(n)
m
of T
(n)
tal que
(
_
C
(n)
i
A) .
Primeiramente, observe que se P
n
(x) denota o elemento da parti cao T
n
que
contem x, ent ao lim
n
diamP
n
(x) = 0. De fato, se existe uma sequencia de
pontos y
n
P
n
(x) tais que d(y
n
, x) > > 0, por compacidade de M, existe o
limite y = lim
n+
y
n
(passando a uma subsequencia se necessario). Assim,
temos por um lado que d(y, x) > > 0 e por outro que y P
n
(x) para todo
n, o que implica que d(f
n
(y), f
n
(x)) < , o que contradiz a hip otese de f ser
expansiva.
Considere ent ao K
1
A e K
2
A
c
compactos tais que (K
1
A) e
(K
2
A
c
) . Seja r = d(K
1
, K
2
) > 0. Temos que se n e sucientemente
10.2. TRANSFORMAC
OES EXPANSIVAS 109
grande diamT
(n)
(x)
r
2
, para todo x M. Considere C
(n)
1
, . . . , C
(n)
m
T
(n)
aqueles que intersectam K
1
. Ent ao
(
_
C
(n)
i
A) = (
_
C
(n)
i
A) +(A
_
C
(n)
i
)
(A K
1
) +(A
c
K
2
) 2.
O que prova o lema.
Observa cao 10.12. Relembrando a deni cao de entropia com respeito a uma
parti cao Q,
H
(Q) =
QQ
(Q) log (Q),
temos que se Qe tal que
0
(Q) = 0, para cada Q Q e uma medida
0
xada,
ent ao a fun cao H
(Q) e contnua em
0
. Isso implica diretamente que
h
(f, T) = inf
n
1
n
H
(T
(n)
).
e semi-contnua superiormente em
0
.
Como consequencia do lema 10.11 e da observa cao 10.12 podemos obter o
seguinte lema:
Lema 10.13. Dado C
0
(M), a fun cao P = P
() = h
(f) +
_
d e
semicontnua superiormente.
Demonstra cao. Como a fun cao
_
d e contnua (logo semicontnua su-
periormente), basta mostrar que a transformacao H denida por H() =
h
(f) = h
IBRIO
Uma pergunta que surge naturalmente e se existe estado de equilbrio espe-
cial, ou ate mesmo sob que condicoes para garantem que admite um unico
estado de equilbrio. Claramente precisamos supor que o sistema f : M M
seja indecomponvel no sentido ergodico pois, caso contr ario, poderamos sim-
plesmente construir contra-exemplos da seguinte forma: tomando duas c opias
da variedade M, digamos M
1
e M
2
, disjuntas e consideraramos
f :
M
M
atuando na uni ao
M = M
1
M
2
como sendo f em cada componente M
i
. Neste
caso, um estado de equilbrio para f : M M produz uma innidade de esta-
dos de equilbrio para
f, via combina cao convexa dos estados de equilbrio em
M
1
e M
2
. O que falta a f e a condi cao de transitividade. O grande teorema do
pr oximo captulo dir a que se f e expansora e M e uma variedade compacta e
conexa (neste caso f e transitiva), ent ao todo potencial H older contnuo admite
um unico estado de equilbrio.
10.3 Transforma coes expansoras
Nesta subsecao, generalizaremos a construcao feita no Captulo 9 num contexto
mais abstrato e com alguns novos ingredientes. Porem, a essencia das ideias e
a mesma e tentaremos tracar um parelelo entre os conceitos e teoremas demon-
strados aqui com os do Captulo 9, ressaltando suas semelhan cas.
10.3.1 O operador de transferencia
Fixados f e phi, deniremos agora um operador que desempenhar a um impor-
tante papel na nossa construcao.
Denicao 10.15. O operador de Ruelle-Perron-Frobenius ou operador de trans-
ferencia e o operador L
: C
0
(M) C
0
(M) denido no espaco C
0
(M) das
fun coes contnuas g : M R por
L
g(x) =
f(y)=x
e
(y)
g(y).
O seu dual L
e o operador L
=
_
L
g d.
Algumas propriedades importantes de L
| Ce
e deix-
amos as vericacoes para o leitor. Para mostrar o item 3 usaremos o Teorema
de Tychono-Schauder para pontos xos que arma o seguinte: uma fun cao
contnua denida num espa co compacto e convexo admite necessariamente um
ponto xo. Claramente /
1
o espaco das medidas de probabilidade em M e
convexo, pois a combina cao de duas medidas de probabilidade tambem e uma
medida de probabilidade. Como foi provado na Se cao 3.2, temos que /
1
e
compacto. Logo, se denimos a fun cao contnua G : /
1
/
1
por:
G() =
L
()
_
L
1 d
,
existe /
1
tal que G() = , o que implica que L
= , onde =
_
L
1 d.
As auto-medidas para o dual do operador de transferencia sao chamadas
medidas conformes. Por exemplo, a medida de Lebesgue e uma medida conforme
para o potencial = log [ det Df|, como o leitor pode vericar empregando
diretamente a formula de mudan ca de variaveis. Em geral, as medidas nao sao
invariantes pela transforma cao f.
Denicao 10.17. O jacobiano de uma medida com respeito a f (quando
existe) e uma fun cao J
f d.
Nem sempre o jacobiano de uma medida invariante existe. Quando cada
ponto de M admite somente um n umero nito de pre-imagens por f, ent ao
J
f
n
(x) =
n1
i=0
J
f(f
i
(x)).
Deixaremos isso como exerccio para o leitor (veja 10.4
Uma das importantes propriedades das medidas conformes e o fato de que
seu jacobiano e bem determinado pela fun cao e que vale a f ormula de mudan ca
de vari aveis:
Lema 10.18. Se L
= , entao
1. O jacobiano de com respeito a f e dado por J
f(x) = e
(x)
.
112 CAP
IBRIO
2. Se u C
0
(M) entao
_
u f d =
_
f(y)=x
(J
f(y))
1
u(x) d(x).
Demonstra cao. Comecaremos mostrado a f ormula de mudan ca de variaveis do
item 2. Ora,
_
u f d =
1
_
u f dL
() =
1
_
L
(u f) d.
Por outro lado, L
(u f) =
f(y)=x
(e
(y)
u(x), de onde:
_
u f d =
_
f(y)=x
1
e
(y)
u(x) d(x) =
_
f(y)=x
(J
f(y))
1
u(x)d(x)).
Para mostrar o item 1, considere um conjunto mensur avel A tal que f[
A
e
injetiva. Tome uma sequencia g
n
C
0
(M) tal que g
n
A
em -q.t.p. e
sup [g
n
[ 2 para todo n. Ent ao,
L
(e
g
n
)(x) =
f(y)=x
e
(y)
e
(y)
g
n
(y) =
f(y)=x
g
n
(y).
Observe que a ultima expressao converge para
f(A)
(x) em -quase todo ponto.
Assim, pelo Teorema da Convergencia Dominada,
_
e
g
n
d =
_
e
g
n
d(L
) =
_
L
(e
g
n
) d (f(A)).
Como o lado esquedo tambem converge para
_
A
e
d, concluimos que
(f(A)) =
_
A
e
d,
terminando a prova do lema.
Lembre-se que B
(B
(n, x))
e
Sn(x)nP()
K. (10.1)
Antes de iniciarmos a prova do Teorema 10.19 vamos fazer alguns comentarios
a respeito de sua relacao com Teorema 9.3.
A primeira observa cao e que o Teorema 9.3 e uma caso particular do Teo-
rema 10.19, tomando-se = log [ det Df|. Neste caso, a pressao de e igual
a zero. Uma segunda observa cao e que a medida conforme , obtida como na
proposi cao 10.16,desempenha aqui o mesmo papel que a medida de Lebesgue
desempenha no Teorema 9.3.
Apesar disso, nosso conhecimento `a priori da medida e mnimo, se re-
sumindo ao seu jacobiano e a f ormula de mudan ca de variaveis, obtidos no
Lema 10.18. Observe tambem que a conexidade do domnio M e um ingre-
diente indispens avel para mostrar a unicidade de
,
mostraremos que existe uma funcao contnua h tal que L
h = h e alem
disso, h(x) > 0, para todo x M;
Mostraremos que satisfaz a equa cao 10.1 com a constante P = log ;
Construiremos
= h e mostraremos que
e invariante, satisfaz a
equa cao 10.1 e que
|S
n
(x) S
n
(y)| Ad(f
n
(x), f
n
(y))
.
Demonstra c ao. Observe que como d(f
n
(x), f
n
(y)) < , segue-se pelo Lema 9.4
que
114 CAP
IBRIO
d(f
ni
(x), f
ni
(y)) <
i
d(f
n
(x), f
n
(y)). (10.2)
Logo,
|S
n
(y) S
n
(x)|
n1
i=0
|(f
i
(x)) (f
i
(y))|
n1
i=0
i
d(f
n
(x), f
n
(y))
Ad(f
n
(x), f
n
(y))
f
n
(x)
J
f
n
(y)
K
2
.
Demonstra c ao. Como J
f(x) =
1
e
(x)
, segue-se diretamente da denicao que
J
f
n
(x) =
n
e
Sn(x)
.
Como d(f
n
(x), f
n
(y)) < , segue-se pelo Proposicao 10.20 que
J
f
n
(x)
J
f
n
(y)
= e
Sn(y)Sn(x)
e
Ad(f
n
(x),f
n
(y))
,
Assim, nos so precisamos escolher K = e
AD
, onde D =
.
Tendo em maos esses resultados, mostraremos agora a propriedade de Gibbs
para a medida conforme.
Lema 10.22. Se e uma medida satisfazendo a equa cao L
= e e
pequeno, entao tomando P = log e x pertence ao suporte de existe algum
n umero K > 0, dependendo somente de , tal que vale:
K
1
(B
(n, x))
e
Sn(x)nP
K.
Demonstra cao. De fato, como f
n
[
cB(n,x)
e injetiva e J
f(x) =
1
e
(x)
, temos
que J
f
n
=
n
e
Sn(x)
, onde
(f
n
(B
(n, x)) =
_
B(n,x)
J
f
n
(y)d(y).
10.3. TRANSFORMAC
OES EXPANSORAS 115
De acordo com a Proposi cao 2.3, o valor de J
f
n
num ponto qualquer y
B
f
n
em x pela multiplica cao por uma constante K,
que n ao depende de x ou n. Logo:
K
1
2
(f
n
(B
(n, x)) J
f
n
(x)(B
(n, x)) K
2
(f
n
(B
(n, x)).
Para concluir, como qualquer ramo inverso de f e uma contracao, de acordo
com o que foi provado no lema 9.4, temos que f
n
(B
(f
n1
(x)).
Assim, como f e um difeomorsmo local, podemos escolher independente de
n ou x sucientemente pequeno de modo que B
(f
n
(x)) f
n
(B
f
n
(x))
1
= e
Sn(x)nP
temos que
K
1
(B
(n, x))
e
Sn(x)nP
K,
como queriamos provar.
Lema 10.23. Existe uma constante K > 0 such
L
n
(x
1
)
L
n
(x
2
)
1
Kd(x
1
, x
2
)
para todos x
1
e x
2
com d(x
1
, x
2
) < . Em particular, existe A tal que para todos
x, y M :
L
n
(x)
L
n
(y)
A.
Demonstra c ao. Fixada uma pre-imagem y
1
de x
1
por f
n
, como d(x
1
, x
2
) <
ent ao temos que x
2
tem uma unica pre-imagem por f
n
na mesma bola din amica
de comprimento n+1 e raio , que iremos denotar por y
2
. Pela proposi cao 10.20,
existe uma constante uniforme K tal que
Ae
d(x1,x2)
[e
Sn(y1)Sn(y2)
[ Ae
d(x1,x2)
Ent ao,
e
Ad(x1,x2)
L
n
(x
1
)
L
n
(x
2
)
=
f
n
(y1)=x1
e
Sn(y1)
f
n
(y2)=x2
e
Sn(y2)
e
Ad(x1,x2)
1[ Kd(x
1
, x
2
)
IBRIO
Para mostrar que L
1(z
n
) 1 e
n
L
n
1(y
n
) 1. De acordo com o Lema 10.23,
temos que para todo x M vale:
n
L
n
(x) AL
n
(z
n
) A
e
1
A
1
A
n
L
n
(y
n
) L
n
(x),
o que termina a prova do Lema.
Lema 10.25. A sequencia
n
L
n
1 e equicontnua.
Demonstra cao. Para mostrar que sequencia de fun coes
n
L
n
1 e equicontnua,
observe que para todos x, y com d(x, y) < , pelo Lema 10.23:
|
n
L
n
1(x)
n
L
n
1(y)|
|
n
L
n
1(x)|
Kd(x, y)
ou seja,
|
n
L
n
1(x)
n
L
n
1(y)| K|
n
L
n
1(x)|d(x, y)
.
Pelo lema 10.24, a sequencia de fun coes
n
L
n
1 e limitada uniformemente em
M. Utilizando esse fato na equacao acima, acabamos a prova do Lema 10.25
Baseado nas informa coes obtidas sobre a sequencia de fun coes
n
L
n
1,
vamos agora mostrar que existe alguma auto-funcao h para o operador L.
Primeiramente, observe que pelos lemas 10.24 e 10.25 a sequencia
n
L
n
1 e
limitada e equicontnua. Naturalmente, isso implica que a media dessas fun coes
h
n
=
1
n
n1
i=0
i
L
i
1,
ainda e uma sequencia limitada e equicontnua. Como M e compacto, pelo
Teorema de Ascoli-Arzela, segue-se que a sequencia h
n
possui uma subsequencia
h
ni
convergindo uniformemente para uma certa fun cao contnua h. Mostraremos
que esta funcao h e que h e de fato uma auto-fun cao de L
.
10.3. TRANSFORMAC
OES EXPANSORAS 117
Ora, se h
ni
h para uma certa subsequencia n
i
ent ao, como L
e
contnua
L
h = lim
ni
L
h
ni
= lim
ni
1
n
i
ni1
k=0
k
L
k+1
1 =
= lim
ni
n
i
n
k
1
k=0
(k+1)
L
k+1
1 = lim
ni
n
n1
k=0
(k)
L
k
1
1
ni
L
ni
1
n
i
.
Como
ni
L
ni
1 e uma sequencia limitada, de acordo com o Lema 10.24, o
segundo termo da ultima igualdade acima vai para zero e o primeiro converge
para h, provando que L
h = h.
Observe ainda que, utilizando o fato que e uma medida conforme, que
_
ni
L
ni
1 d = 1, para todo n N. Deste modo, segue-se diretamente que
_
h
n
d = 1 e como hlimh
ni
, tomando o limite mostramos que
_
hd = 1.
Resumindo, mostramos que:
Proposi cao 10.26. Existe alguma fun cao contnua h : M R tal que:
1. L
h = h;
2. h > 0;
3.
_
hd = 1.
Como a fun cao h e contnua e n ao-negativa, podemos denir uma medida
por
(A) =
_
A
hd.
Da Proposi cao 10.26 vem que e uma medida de probabilidade, uma vez que
(M) =
_
hd = 1. Observe tambem que como existe c > 0 tal que 1/c h c,
temos que para todo boreliano A M, vale
c
1
(A) (A) (A)c. (10.3)
Alem disso, a medida e invariante, como veremos no:
Lema 10.27. Sejam tal que L
(B
(n, x))
e
Sn(x)nP
K, (10.4)
Demonstra cao. Para mostrar que e f invariante, de acordo com a Proposi cao ??
basta mostramos que para toda fun cao contnua g : M R vale:
_
g f d =
_
g d.
118 CAP
IBRIO
Primeiro, observe que L
(g fh)(x) = g(x)L
h. Assim,
_
g f d =
_
g fhd =
1
_
g fhdL
() =
1
_
L
(g fh) d =
1
_
gL
hd =
_
ghd =
_
g d.
A equa cao 10.4 vem diretamente da equacao 10.3.
Vamos agora utilizar a equa cao 10.4 para calcular o valor de h
(f) +
_
d.
Corolario 10.28. Se = h construida anteriormente, ent ao
h
(f) +
_
d = P.
Demonstra cao. O Teorema de Brin-Katok arma que a fun cao h dada por
H(x) = lim
0
lim
n
1
n
log (B
(n, x)),
esta bem denida para quase todo x M, e -integr avel e vale:
h
(f) =
_
H d.
Observe que a equa cao 10.4 fornece que H(x) = lim
n
1
n
S
n
(x) +P. Sub-
stituindo acima, vem que:
h
(f) =
_
lim
n
1
n
S
n
d +P.
Logo, usando o Teorema de Birkho
h
(f) =
_
lim
n
1
n
S
n
d +P =
_
d +P,
como era nosso intuito inicial.
Para completar a prova do Teorema 10.19 resta-nos duas tarefas. A primeira
delas e mostrar que de fato o n umero P na equacao 10.4 e igual ` a P(),
mostrando que e um estado de equilbrio e de Gibbs. Outra tarefa refere-
se `a mostrar que e unico. Faremos isso no seguinte lema :
Lema 10.29. Seja tal que existe e h com L
= e L
h = h. Entao
= e
P()
.
Na proposi cao a seguir utilizaremos o seguinte lema de c alculo:
Lema 10.30. Sejam p
i
, x
i
(i = 1, 2, . . . , n) n umeros reais tais que p
i
> 0, x
i
> 0,
e
n
i=1
p
i
= 1. Entao
n
i=1
p
i
log x
i
log(
n
i=1
p
i
x
i
) e a igualdade acontece
se, e s o se, os n umeros x
i
s ao iguais.
10.3. TRANSFORMAC
OES EXPANSORAS 119
Deixaremos como exerccio para o leitor (exerccio ??) a prova deste fato.
Proposi cao 10.31. Vale o seguinte:
1. P = P(f, );
2. Se e um estado de equilbrio para , entao L
(h
1
) = h
1
.
Demonstra c ao. Dena g : M (0, ) por
g(x) =
1
e
(x)
h(x)
h(f(x))
,
e seja g
= (J
f)
1
. Observe que:
f(y)=x
g(y) =
f(y)=x
e
(y)
h(y)
h(x)
=
L
h(x)
h(x)
= 1 (10.5)
Vamos mostrar que g = g
(f) +
_
g d 0, pois:
h
(f) +
_
log gd = h
(f) log +
_
( + log h log h f) d 0.
Usaremos agora o fato que h
(f) =
_
log J
d =
_
f(y)=x
g
(y) log
g(y)
g
(y)
d,
onde a segunda igualdade segue do fato que g
= 1/J
f. De acordo com a
equa cao (10.5), a primeira arma cao do Lema 10.30 nos d a:
0
f(y)=x
g
(y) log
g(y)
g
(y)
log
_
f(y)=x
g
(y)
g(y)
g
(y)
_
= log
_
f(y)=x
g(y)
_
= 0
em -quase todo ponto. Uma vez em que a expressao na esquerda e nao-negativa,
segue-se a igualdade. Assim, temos que h
(f) +
_
d log = 0, o que implica
log = P(f, )
Para mostrar que g = g
(y)
= c(x) para todo y f
1
(x).
A hip otese de ser invariante implica que
f(y)=x
g
(x) = 1
120 CAP
IBRIO
para -quase todo x M. Combinando isso com (10.5), conclumos que
c(x) =
f(y)=x
g(y)
f(y)=x
g
(y)
= 1.
Finalmente, vamos mostrar que L
(h
1
) = h
1
. Dada uma fun cao
contnua
_
d(L
h
1
) =
_
(L
)(x)h(x)
1
d(x) =
_
f(y)=x
e
(y)
h(f(y))
1
(y) d(x).
usando a deni cao de g e , temos que
e
(y)
h(f(y))
1
= g(y)h(y)
1
= g
(y)h(y)
1
.
Substituindo na f ormula anterior,
_
d(L
(h
1
)) =
_
_
log
f(y)=x
g
(y)(y)h(y)
1
_
d(x) =
_
h
1
d.
Uma vez que e arbitr ario, temos que L
(h
1
) = (h
1
), como armamos.
O lema a seguir mostra que duas medidas conformes sao necessariamente
equivalentes:
Lema 10.32. Sejam
1
e
2
tais que L
i
=
i
, para i = 1, 2. Entao
1
e
2
s ao equivalentes.
Demonstra cao. Pela equa cao 10.1, dado x M e n N, temos que
A
1
2
(B
(n, x))
1
(B
(n, x)) A
2
(B
(n, x)).
Como a sequencia de coberturas
U
n
= h
1
, temos que L
. Pelo
10.4. EXERC
ICIOS 121
Lema 10.32
= ( f)f
= ( f).
Como a derivada de Radon-Nikodym essencialmente unica, temos que = f
em -quase todo ponto. Observando que e ergodica, segue-se que e constante.
Usando que 1 = (M) =
_
d = c
_
d = c, n os temos que = . Observe que
isso termina a prova, desde que qualquer componente erg odica de um estado de
equilbrio tambem e um estado de equilbrio.
10.4 Exerccios
10.1. Seja uma medida em M. Dado > 0, mostre que existe a > 0 tal que
(B
f
n
(x) =
n1
i=0
J
f(f
i
(x)).
10.5. Seja f uma transformacao expansora e uma medida invariante. Mostre
que para -quase todo x existe n
0
= n
0
(x) e K = K(x) tais que se n > n
0
ent ao
K
1
< J
f
n
(x)(B
(f) =
_
log J
f d.
Dica: Use o exerccio 10.5 e o Teorema de Brin-Katok.
122 CAP
IBRIO
Captulo 11
Aplica c oes em Teoria dos
N umeros
Neste captulo apresentamos duas aplicacoes da Teoria Erg odica no domnio
da Teoria dos N umeros: o Teorema de S. Szemeredi [Sze75] sobre existencia
de progressoes aritmeticas dentro de subconjuntos sucientemente densos do
conjunto Z dos n umeros inteiros, e o teorema de H. Weyl [Wey16] sobre equidis-
tribui cao da parte fracion aria dos valores de fun coes polinomiais restritas a Z.
11.1 Teorema de Szemeredi
A nossa apresenta cao e inspirada por Furstenberg [Fur81], onde o leitor pode
encontrar muita informa cao adicional sobre este tema.
11.1.1 Densidade superior
Chamamos intervalo do conjunto Z dos n umeros inteiros qualquer subconjunto
I da forma n Z : a n < b, para quaisquer a b em Z. O seu cardinal e
#I = b a.
Denicao 11.1. A densidade superior D
s
(S) de um subconjunto S de Z e
D
s
(S) = limsup
#I
#(S I)
#I
onde I representa qualquer intervalo em Z. Do mesmo modo se dene a densi-
dade inferior D
i
(S), trocando limite superior por limite inferior.
Em outras palavras, D
s
(I) e o maior n umero D tal que existe uma sequencia
de intervalos I
j
Z tais que
#I
j
e
#(S I
j
)
#I
j
D
123
124 CAP
UMEROS
e D
i
(S) e o menor n umero nessas condi coes. Note que 0 D
i
(S) D
s
(S) 1.
No Exerccio 11.1 tambem veremos que D
i
(S) = D
s
(Z S) para todo S Z.
Exemplo 11.2. Seja S o conjunto dos n umeros pares. Dado qualquer intervalo
I Z, temos que #(S I) = #I/2 se o cardinal de I e par e #(S I) =
#(I 1)/2 se o cardinal de I e mpar, onde o sinal e positivo se o menor
elemento de I e um n umero par, e e negativo caso contr ario. Desta observa cao
segue, imediatamente, que D
s
(S) = D
i
(S) = 1/2.
Exemplo 11.3. Seja S o seguinte subconjunto de Z:
1, 3, 4, 7, 8, 9, 13, 14, 15, 16, 21, 22, 23, 24, 25, 31, 32, 33, 34, 35, 36, 42, . . ..
Isto e, para cada k 1 inclumos em S um bloco de k inteiros consecutivos e
omitimos os k inteiros seguintes. Este conjunto contem intervalos com compri-
mento arbitrariamente grande. Portanto D
s
(S) = 1. Por outro lado, o com-
plementar de S tambem contem intervalos com comprimento arbitrariamente
grande. Portanto, D
i
(S) = 1 D
s
(Z S) = 0.
Exemplo 11.4. Seja S o seguinte subconjunto de Z:
1, 3, 4, 5, 6,9, 10, 11, 12, 14, 15, 16, 17, 18,
22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 42, . . ..
Ou seja, para cada k 1 inclumos em S um bloco de k
2
inteiros consecutivos
e depois exclumos os k inteiros seguintes. Neste caso temos
lim
n
#(S [1, 2, . . . , n])
n
= 1.
Isto implica D
s
(S) = 1. Mas, tal como no caso anterior, D
i
(S) = 0.
11.1.2 Enunciados
Nos anos 30, Erd os e Turan [ET36] conjecturaram que todo subconjunto de
Z com densidade superior positiva contem sequencias aritmeticas nitas com
comprimento arbitrariamente grande. Esta conjectura foi demonstrada por Sze-
meredi [Sze75], quase quatro decadas mais tarde:
Teorema 11.5 (Szemeredi). Se S e um subconjunto de Z com densidade
superior positiva, ent ao para todo k N existem m Z e n N tais que m,
m+n, m + 2n, . . . , m+kn pertencem a S.
Em geral, n ao podemos esperar que S contenha progressoes aritmeticas com
comprimento innito, como mostram os Exemplos 11.3 e 11.4.
A demonstra cao original do Teorema 11.5 usa argumentos combinat orios
bastante intrincados. No entanto, poucos anos depois Furstenberg [Fur77] deu
uma nova demonstra cao, utilizando ideias de Teoria Ergodica. Na verdade, ele
deduziu o Teorema 11.5 de uma generalizacao do Teorema 1.1 para famlias de
transformacoes que comutam entre si:
11.1. TEOREMA DE SZEMER
EDI 125
Teorema 11.6 (Recorrencia Simultanea de Poincare). Sejam f
i
: M
M, i = 1, 2, . . . , k transforma coes que preservam uma probabilidade em M
e tais que f
i
f
j
= f
j
f
i
para todo i, j = 1, 2, . . . , k. Entao, para qualquer
conjunto E M tal que (E) > 0, existe algum n 1 tal que
_
E f
n
1
(E) f
n
2
(E) f
n
k
(E)
_
> 0.
Em outras palavras, este teorema arma que existe algum tempo n tal que
os iterados de um subconjunto com medida positiva de pontos de E, por todas
as transformacoes f
i
, regressam a E simultaneamente nesse momento n.
A demonstra cao do Teorema 11.6 escapa ao ambito deste texto. Mas, na
Secao 11.1.6, explicaremos porque ele implica o Teorema 11.5. Alem disso,
vamos discutir vers oes um pouco mais fracas destes resultados, que chamamos
teorema de van der Waerden e teorema de Recorrencia Simultanea de Birkho,
respectivamente.
O teorema de van der Waerden [vdW27] arma que dada qualquer parti cao
do conjunto Z num n umero nito de subconjuntos, algum desses subconjuntos
deve conter progressoes aritmeticas com comprimento arbitrariamente grande:
Teorema 11.7 (van der Waerden). Sejam S
1
, S
2
, . . . , S
q
subconjuntos dois-
a-dois disjuntos de Z tais que S
1
S
2
S
q
= Z. Dado qualquer k 1 existe
algum S
i
que contem alguma progress ao aritmetica com comprimento k+1. Em
particular, algum elemento S
j
da particao contem progress oes aritmeticas com
comprimento arbitrariamente grande.
Na Secao 11.1.3 veremos que este resultado e uma consequencia simples do
Teorema 11.5. Tambem veremos, na Secao 11.1.4, que ele pode ser deduzido da
seguinte extensao do Teorema 3.11:
Teorema 11.8 (Recorrencia Simultanea de Birkho). Seja M um espa co
metrico compacto e f
i
: M M, i = 1, 2, . . . , k transforma coes contnuas tais
que f
i
f
j
= f
j
f
i
para todo i, j = 1, 2, . . . , k. Entao existe algum x M e
alguma sequencia n
j
tal que
f
nj
i
(x) x quando j , para todo i = 1, 2, . . . , k.
Em outras palavras, as trajet orias de x por todas as transforma coes recorrem
para x simultaneamente nos momentos n
j
.
Na Secao 11.1.5 veremos que o Teorema 11.8 e uma consequencia simples
do Teorema 11.6. Alias, como veremos na Secao 11.1.6, este ultimo teorema
tambem implica o Teorema 11.5. Portanto, o diagrama a seguir resume as
rela coes logicas entre os quatro enunciados, que ser ao discutidas nas pr oximas
secoes:
T. Szemeredi 11.5 T. R. S. Poincare 11.6
T. van der Waerden 11.7 T. R. S. Birkho 11.8.
126 CAP
UMEROS
11.1.3 T. de Szemeredi implica T. van der Waerden
Seja S
1
, S
2
, . . . , S
N
uma parti cao nita de Z qualquer. De acordo com o
Exerccio 11.1, pelo menos um dos elementos S
i
da parti cao deve ter densidade
superior positiva. Aplicando o Teorema 11.5 a S = S
i
conclumos que ele contem
progressoes aritmeticas com comprimento arbitrariamente grande. Isto prova o
Teorema 11.7.
11.1.4 T. de Birkho implica T. de van der Waerden
Vamos comecar por traduzir o Teorema 11.7 num enunciado sobre o desloca-
mento (shift) f : M M no espaco M = 1, 2, . . . , q
Z
das sequencias bila-
terais com valores em 1, 2, . . . , q. Observe que cada sequencia = (
n
)
nZ
em M dene uma parti cao de Z em subconjuntos
S
i
= n Z :
n
= i, i = 1, 2, . . . , q
e, reciprocamente, toda parti cao de Z em q subconjuntos determine uma se-
quencia M. Portanto, o teorema pode ser reformulado do seguinte modo:
para todo M e todo k 1, existem m Z e n 1 tais que
m
=
m+n
= =
m+nk
. (11.1)
Para provarmos este fato, vamos munir M da metrica d(, ) =
N(, )
,
N(, ) = max
_
N 0 :
n
=
n
para todo n Z com [n[ < N
_
,
que foi denida no Exerccio 5.1, sendo um n umero qualquer em (0, 1). Note
que
d(, ) < 1 se e somente se
0
=
0
. (11.2)
Como o espaco metrico (M, d) e compacto, o fecho A =
_
f
n
() : n Z
_
da
trajetoria de e tambem um compacto, para a metrica induzida. Lembre que
o deslocamento f : M M e denido por
f ((
n
)
nZ
) = (
n+1
)
nZ
. (11.3)
Consideremos as transformacoes f
1
= f, f
2
= f
2
, . . . , f
k
= f
k
denidas de
A em A.
E claro que as f
i
comutam entre si. Portanto, podemos aplicar
o Teorema 11.8 e concluir desta maneira que existe A e uma sequencia
n
j
tal que
f
nj
i
() para todo i = 1, 2, . . . , k.
Observe que f
nj
i
= f
i nj
. Em particular, podemos xar n = n
j
tal que os
iterados f
n
(), f
2n
(), . . . , f
kn
() estao todos a distancia menor que 1/3 do
ponto . Logo, os pontos
, f
n
(), f
2n
(), . . . , f
kn
()
11.1. TEOREMA DE SZEMER
EDI 127
estao todos a distancia menor que 2/3 uns dos outros. Ent ao, como esta
no fecho A da orbita de , podemos encontrar m Z tal que f
m
() esta t ao
pr oximo de que os pontos
f
m
(), f
m+n
(), f
m+2n
(), . . . , f
m+kn
()
estao a dist ancia menor que 1 uns dos outros. Tendo em conta a observa cao
(11.2) e a deni cao (11.3) da transforma cao f, isto quer dizer que
m
=
m+n
= =
m+kn
,
como pretendamos provar. Isto completa a demonstracao do teorema de van
der Waerden a partir do teorema de Recorrencia Simultanea de Birkho.
De fato, a conclusao do Teorema 11.7 ainda vale para parti coes de subcon-
juntos nitos de Z, desde que sejam sucientemente grandes:
Teorema 11.9 (van der Waerden). Dados k 1 e q 2 existe N 1 tal
que, dada qualquer parti cao do intervalo 1, 2, . . . , N em q subconjuntos, algum
desses subconjuntos contem progress oes aritmeticas com comprimento k + 1.
E f acil ver que o Teorema 11.9 implica o Teorema 11.7. No Exerccio 11.2
veremos que a recproca tambem e verdadeira.
11.1.5 T. de Poincare implica T. de Birkho
Comecemos por lembrar (Exerccio 3.4) que se f
i
: M M, i = 1, 2, . . . , k
sao transforma coes contnuas num espaco metrico compacto que comutam en-
tre si, entao existe alguma probabilidade invariante comum a todas essas
transformacoes.
Em seguida, observemos que o Teorema 11.6 tem a seguinte consequencia:
Corolario 11.10. Sejam f
i
: M M, i = 1, 2, . . . , k transforma coes que
preservam uma probabilidade em M e tais que f
i
f
j
= f
j
f
i
para todo
i, j = 1, 2, . . . , k. Entao, para qualquer conjunto E M tal que (E) > 0, e
para quase todo x E existe uma sequencia n
j
tal que f
nj
i
(x) E para
todo i = 1, . . . , k e todo j 1.
Deixaremos a prova desta proposicao como exerccio para o leitor (Ex-
erccio 11.6). Compare tambem com o Exerccio 1.1. Este corolario ser a util
na:
Prova do Teorema de Recorrencia M ultipla de Birkho. Considere uma base enu-
meravel de abertos U
j
de M com o diametro de U
j
indo a zero quando j .
Seja alguma medida invariante simultaneamente para todos os f
i
(note que o
Exerccio 3.4 nos garante a existencia de alguma destas medidas).
Para cada j representamos por D
j
o conjunto dos pontos x U
j
tais que
existe n > j tal que f
n
i
(x) U
j
para todo i = 1, 2, . . . , k. Observe que de
acordo com o Corolario 11.10, o conjunto U
j
D
j
tem medida igual a zero,
128 CAP
UMEROS
uma vez que quase todo ponto retorna simutaneamente a U
j
em algum momento.
Consequentemente, como U
j
jN
e uma cobertura de M, temos que o conjunto:
D =
n=1
_
mn
D
m
,
tem medida (D) = 1. Em particular, D ,= .
Mostraremos que todo ponto x D e simultaneamente recorrente para as
transformacoes f
1
, f
2
, . . . , f
k
. Ora, se x D x
mn
D
m
para todo n N.
Logo, existe m n tal que x D
m
. De acordo com a deni cao de D
m
,
existe algum n
m
> m tal que f
nm
i
(x) U
m
para todo i = 1, 2, . . . , k. Logo,
d(x, f
nm
i
(x)) 0, uma vez que os pontos x e f
mn
i
(x) pertencem a U
m
e o
di ametro de U
m
vai a zero quando m . Isto encerra a prova do Teorema de
Recorrencia M ultipla de Birkho.
11.1.6 Prova do Teorema de Szemeredi
Mostraremos nesta seccao como deduzir o Teorema de Szemeredi (Teorema 11.5)
a partir do Teorema de Recorrencia Simultanea (Teorema 11.6). Novamente,
utilizaremos o dicionario entre particoes de Z e sequencias de inteiros, como ja
zemos na prova do Teorema de Van der Waerden (Teorema 11.7).
Prova do Teorema de Szemeredi. Considere S um conjunto com densidade su-
perior positiva qualquer. Vamos associar a S uma sequencia = (
n
)
nZ
M = 0, 1
Z
denida por:
n
= 1 n S.
Como S possui densidade superior positiva, existe c > 0 e uma sequencia de
intervalos I
n
= [a
n
, b
n
) de Z com lim#I
n
= e tais que
D
s
(S) = lim
#In
#(S I
n
)
#I
n
> c > 0.
Considere o deslocamento f : M M e dena o subconjunto A M por
A = y M; y
0
= 1.
Note que o fato de f
j
() A equivale a dizer que
j
= 1, ou seja, j S.
Resumindo,
f
j
() A j S (11.4)
O conjunto A e um aberto e ao mesmo tempo um fechado de M, considerando
a topologia dada onde os cilindros s ao abertos, pois A e um cilindro de compri-
mento 1 em M e seu complementar e uma uni ao de cilindros. Deste modo, tendo
em vista (11.4), mostrar que m+in S equivale a mostrar que f
m+in
() A.
Logo, para mostrar o Teorema de Szemeredi, basta provar que para todo k N
existem m Z e n N tais que
f
m
(), f
m+n
(), f
m+2n
(), . . . , f
m+kn
() A.
11.2. TEOREMA DE WEYL 129
Para mostrar este fato, vamos denir a sequencia
n
de probabilidades em
M por:
n
=
1
#I
n
bn1
i=an
f
i
()
(11.5)
Como ja vimos no Teorema 3.4, o conjunto das probabilidades /
1
(M) mu-
nido com a topologia fraca
. Observe que e uma probabilidade f-invariante, pois para toda fun cao
contnua : M R, vale
_
f d = lim
n
_
f d
n
= lim
n
1
#I
n
bn1
i=an
(f
i
())
+ lim
n
(f
bn
()) (f
an
())
#I
n
= lim
n
_
d
n
=
_
d.
Para utilizar o Teorema de Recorrencia Simultanea de Poincare para o con-
junto A, precisamos mostrar inicialmente que (A) > 0. De fato, observe que
A e um conjunto fechado e aberto de M. Logo, pela Proposi cao 3.3 temos que
(A)
n
(A) = lim
#In
#(S I
n
)
#I
n
> c > 0.
Dado k N, considerando as fun coes f, f
2
, f
3
, . . . , f
k
(que claramente comutam
entre si) o Teorema de Recorrencia Simultanea de Poincare nos garante que
existe algum n 1 tal que
_
A f
n
(A) f
2n
(A) f
kn
k
(A)
_
> 0.
Em particular, como A e aberto, existe algum l tal que
l
_
A f
n
(A) f
2n
(A) f
kn
(A)
_
> 0.
Como
l
= (1/#I
l
)
b
l
1
i=a
l
f
i
()
, podemos garantir que pelo menos para algum
a
n
m b
l
1, o ponto f
m
() pertence a Af
n
(A) f
kn
(A). Assim,
f
m+in
() A, para i = 0, 1, . . . , k, como queramos provar.
11.2 Teorema de Weyl
Vamos descrever outra bela aplica cao da Teoria Erg odica ` a Teoria dos N umeros,
devida a H. Weyl [Wey16]. Consideramos fun coes polinomiais
P(x) = a
0
+a
1
x +a
2
x
2
+ +a
d
x
d
,
130 CAP
UMEROS
com coecientes reais e grau d 1. Para cada inteiro positivo n, calculamos o
valor da fun cao P em n e chamamos z
n
a parte fracion aria do valor P(n) obtido.
De maneira mais formal,
z
n
= P(n) = P(n) [P(n)]
onde x = parte fracion aria e [x] = parte inteira de x. Observe que z
n
[0, 1)
para cada n. Mas podemos, igualmente, considerar que a sequencia toma valores
no crculo S
1
= R/Z, e faremos isso no que segue. Estamos interessados em
entender como se distribui a sequencia z
n
no crculo.
Denicao 11.11. Dizemos que uma sequencia x
n
S
1
e equidistribuda se
para qualquer fun cao contnua : S
1
R tem-se
lim
n
1
n
n
j=1
(x
j
) =
_
(x) dx.
Veremos no Exerccio 11.4 que isto equivale a dizer que, para todo intervalo
I S
1
, a fra cao dos termos da sequencia que estao em I e igual ao comprimento
m(I) desse intervalo.
Teorema 11.12 (Weyl). Se algum dos coecientes a
1
, a
2
, . . . , a
d
e irracional
entao a sequencia z
n
= P(n) e equidistribuda.
Podemos, sem restricao, supor que o coeciente a
d
e irracional. De fato, a
sequencia z
n
sempre pode ser decomposta numa soma
z
n
= x
n
+y
n
, x
n
= a
d
n
d
, y
n
= Q(n)
onde Q(x) = a
0
+a
1
x + +a
d1
x
d1
. Suponha que a
d
e racional, isto e, que
existem inteiros p e q tais que a
d
= p/q. Ent ao a primeira parcela x
n
toma no
maximo q valores distintos. De fato esta sequencia e peri odica com perodo q:
x
n+p
=
_
p
q
(n +q)
d
_
=
_
p
q
n
d
_
= x
n
para todo n Z.
Por outro lado, a segunda parcela y
n
e do mesmo tipo que z
n
, exceto que o
polin omio Q que lhe esta associado tem grau d 1. Portanto, por indu cao no
grau, podemos supor que y
n
e equidistribuda. Mais que isso, podemos supor
que as subsequencias
y
qn+r
= Q(qn +r), n Z
sao equidistribudas para todo r 0, 1, . . . , q1. Na verdade, estas sequencias
podem ser escritas como y
nq+r
= Q
r
(n) para algum polin omio Q
r
com o
mesmo grau que Q (verique), e portanto a hip otese de inducao se aplica a
elas tambem. Destas duas observacoes segue que a soma z
n
tambem e equidis-
tribuda, porque cada uma das subsequencias z
qn+r
, n Z e equidistribuda.
11.2. TEOREMA DE WEYL 131
11.2.1 O caso am
Para desenvolvermos alguma intui cao sobre o problema, comecemos por con-
siderar o caso especial d = 1. Neste caso a funcao polinomial resume-se a
P(x) = a
0
+a
1
x. Estamos supondo que o coeciente a
1
e irracional. Consider-
emos a transformacao
f : S
1
S
1
, f() = +a
1
mod Z.
Foi visto na Proposi cao 3.6 que esta transforma cao f admite uma unica prob-
abilidade invariante, que e a medida de Lebesgue m. Consequentemente, dada
qualquer fun cao contnua : S
1
R, e dado qualquer ponto S
1
,
lim
n
1
n
n
j=1
(f
j
()) =
_
dm.
Considere = a
0
mod Z. Ent ao, f
j
() = a
0
+ a
1
j mod Z = P(j) mod Z e
isto signica que podemos identicar z
j
= P(j) com a sequencia dos iterados
f
j
(a
0
). Ent ao a relacao anterior d a
lim
n
1
n
n
j=1
(z
j
) =
_
dm.
Isto e precisamente o que signica dizer que z
j
e equidistribuda.
11.2.2 Ergodicidade
Vamos estender os argumentos acima para provar o caso geral do Teorema 11.8.
Seja T
d
o toro d-dimensional, isto e,
T
d
= R
d
/Z
d
= S
1
S
1
(d vezes).
Introduzimos a transformacao f : T
d
T
d
f(
1
,
2
, . . . ,
d
) = (
1
+,
2
+
1
, . . . ,
d
+
d1
), (11.6)
onde e um n umero irracional que ser a escolhido mais tarde. Observe que f
preserva a medida de Lebesgue m em T
d
. Isto pode ser visto usando as ideias
da Secao 2.2: a derivada de f em cada ponto vem dada pela matriz
_
_
_
_
_
_
1 0 0 0 0
1 1 0 0 0
0 1 1 0 0
0 0 0 1 1
_
_
_
_
_
_
cujo determinante e 1. Observe que a transformacao f e invertvel.
132 CAP
UMEROS
Proposi cao 11.13. A transforma cao f e erg odica relativamente ` a medida de
Lebesgue no toro T
d
.
Demonstra c ao. O metodo e analogo ao da Proposi cao 5.5, baseado em an alise
de Fourier. Seja : T
d
R uma fun cao em L
2
(m). Escrevemos
() =
nZ
d
a
n
e
2in
onde = (
1
, . . . ,
d
), n = (n
1
, . . . , n
d
), n = n
1
1
+ +n
d
d
, e
nZ
d
[a
n
[
2
=
_
[()[
2
d
1
d
d
< . (11.7)
Suponhamos que a fun cao e invariante, isto e, f = em quase todo ponto.
Observe que
(f()) =
nZ
d
a
n
e
2i(n1(1+)+n2(2+1)+n
d
(
d
+
d1
))
=
nZ
d
a
n
e
2in1
e
2iL(n)
onde L(n) = (n
1
+ n
2
, n
2
+ n
3
, . . . , n
d1
+ n
d
, n
d
). Portanto, a rela cao de
invari ancia f = se traduz por
a
n
e
2in1
= a
L(n)
para todo n Z
d
. (11.8)
Isto implica que a
n
e a
L(n)
tem o mesmo valor absoluto. Por outro lado, a
rela cao de integrabilidade (11.7) implica que existe no maximo um n umero nito
de termos com um dado valor absoluto n ao-nulo. Conclumos que a
n
= 0 para
todo n Z
d
cuja orbita L
j
(n), j Z seja innita. Observando a expressao de
L deduzimos que a
n
= 0 exceto, possivelmente, se n
2
= = n
d
= 0. Alem
disso, para os valores de n restantes, ou seja, para n = (n
1
, 0, . . . , 0), tem-se que
L(n) = n e portanto a rela cao (11.8) torna-se
a
n
= a
n
e
2in1
.
Como e irracional, o ultimo fator e diferente de 1 sempre que n
1
e nao-nulo.
Portanto esta rela cao d a que a
n
= 0 tambem para n = (n
1
, 0, . . . , 0) com n
1
,= 0.
Deste modo, mostramos que se e uma fun cao invariante ent ao todos os termos
da sua expans ao de Fourier se anulam exceto, possivelmente, o termo constante.
Isto mostra que e constante, e isso prova que f e ergodica.
11.2.3 Unicidade erg odica
O pr oximo passo da demonstracao do Teorema 11.12 e a seguinte
Proposi cao 11.14. A transforma cao f e unicamente ergodica, isto e, a medida
de Lebesgue no toro e a sua unica medida invariante.
11.2. TEOREMA DE WEYL 133
Demonstra cao. A demonstra cao ser a por indu cao no grau d do polin omio P. O
caso de grau 1 j a foi tratado na Se cao 11.2.1, portanto s o precisamos explicar
como o caso de grau d pode ser deduzido do caso de grau d 1. Para isso,
escrevemos T
d
= T
d1
S
1
e
f : T
d1
S
1
T
d1
S
1
f(
0
, ) = (f
0
(
0
), +
d1
) (11.9)
onde
0
= (
1
, . . . ,
d1
) e f
0
(
0
) = (
1
+ ,
2
+
1
, . . . ,
d1
+
d2
). Vamos
representar por : T
d
T
d1
a proje cao () =
0
. Por indu cao, a trans-
forma cao
f
0
: T
d1
T
d1
e unicamente erg odica. Para mostrar que f e unicamente erg odica so precisamos
mostrar que a medida de Lebesgue m e a sua unica probabilidade invariante
erg odica.
Lema 11.15. Se e uma probabilidade invariante por f entao a proje cao
)(f
1
0
(E)) = (
1
f
1
0
(E)).
Usando f = f
0
e o fato de que e f-invariante, se verica que a expressao
do lado direito e igual a
(f
1
1
(E)) = (
1
(E)) = (
)(E).
Portanto (
)(f
1
0
(E)) = (
e probabilidade f
0
-invariante. Como supomos que f
0
e unicamente
erg odico, segue que
dos pontos T
d
tais que
lim
1
n
n1
j=0
(f
j
()) =
_
d para toda fun cao contnua : T
d
R (11.10)
tem medida total. Seja G
0
() o conjunto dos
0
T
d1
tais que G() intersecta
0
S
1
. Em outras palavras, G
0
() = (G
).
E claro que
1
(G
0
()) contem
G
0
um ponto qualquer na intersec cao. Por deni cao, G() intersecta
0
S
1
.
Mas o pr oximo resultado arma que G(m) contem
0
S
1
:
134 CAP
UMEROS
Lema 11.16. Se
0
G
0
(m) entao
0
S
1
esta contido em G(m).
Demonstra cao. A observacao crucial e que a medida m e invariante por toda a
transformacao da forma
R
: T
d1
S
1
T
d1
S
1
, (, ) (, +).
A hip otese
0
G
0
(m) signica que existe algum S
1
tal que (
0
, ) G(m),
ou seja,
lim
1
n
n1
j=0
(f
j
(
0
, )) =
_
dm
para toda fun cao contnua : T
d
R. Qualquer outro ponto de
0
S
1
pode ser escrito como (
0
, + ) = R
(
0
, ) para algum S
1
. Recordando
(11.6), vemos que
f
_
R
(
0
, )
_
= (
1
+,
2
+
1
, . . . ,
d1
+
d2
, + +
d1
) = R
_
f(
0
, )
_
para todo (
0
, ) T
d1
S
1
. Logo, por indu cao,
f
j
(
0
, +) = f
j
_
R
(
0
, )
_
= R
_
f
j
(
0
, )
_
para todo j 1. Portanto, dada qualquer fun cao contnua : T
d
R,
lim
1
n
n1
j=0
(f
j
(
0
, +)) = lim
1
n
n1
j=0
( R
)(f
j
(
0
, ))
=
_
( R
) dm =
_
dm.
Isto prova que (
0
, +) esta em G
m
para todo S
1
, conforme armado.
Segue do que dissemos ate agora que G() e G(m) se intersectam em algum
ponto de
0
S
1
. Tendo em vista a deni cao (11.10), isto implica que as
duas medidas tem a mesma integral para cada fun cao contnua. De acordo
com o Teorema de Riesz-Markov 3.7, isto implica que = m, como queramos
demonstrar.
Corolario 11.17. A orbita de todo ponto T
d
e equidistribuda no toro: para
toda fun c ao contnua : T
d
R tem-se
lim
1
n
n1
j=0
(f
j
()) =
_
dm.
Demonstra cao. Isto e uma consequencia imediata da Proposi cao 11.14 e da
Proposi cao 3.7.
11.2. TEOREMA DE WEYL 135
11.2.4 Demonstra cao do Teorema de Weyl
Para completarmos a demonstracao do Teorema 11.12, introduzimos os polin o-
mios denidos por p
d
(x) = P(x) e
p
j1
(x) = p
j
(x + 1) p
j
(x) for j = 2, . . . , d. (11.11)
Lema 11.18. 1. O polinomio p
j
(x) tem grau j, para todo 1 j d.
2. p
1
(x) = x + onde = a
d
d! e irracional.
Deixamos a demonstracao deste lema para o Exerccio 11.5.
Lema 11.19. Para todo n 0,
f
n
_
p
1
(0), p
2
(0), . . . , p
d
(0)
_
=
_
p
1
(n), p
2
(n), . . . , p
d
(n)
_
.
Demonstra c ao. A demonstra cao ser a por indu cao em n. Como o caso n = 0 e
obvio, s o precisamos tratar do passo indutivo. Lembre que f foi denida em
(11.6). Se
f
n1
(p
1
(0), p
2
(0), . . . , p
d
(0)) = (p
1
(n 1), p
2
(n 1), . . . , p
d
(n 1))
ent ao f
n
(p
1
(0), p
2
(0), . . . , p
d
(0)) e igual a
(p
1
(n 1) +, p
2
(n 1) +p
1
(n 1), . . . , p
d
(n 1) +p
d1
(n 1)).
Usando a deni cao (11.11) e o Lema 11.18, obtemos que esta express ao e igual
a
(p
1
(n), p
2
(n), . . . , p
d
(n)),
e isto prova o lema.
Finalmente, estamos prontos para provar que a sequencia z
n
= P(n) e
equidistribuda, conforme arma o Teorema 11.12. Seja : S
1
R uma fun cao
contnua qualquer. Considere : T
d
R denida por
(
1
,
2
, . . . ,
d
) = (
d
).
Fixemos = (p
1
(0), p
2
(0), . . . , p
d
(0)). Usando o Lema 11.19 e o Corolario 11.17,
lim
1
n
n1
j=0
(z
n
) = lim
1
n
n1
j=0
(f
n
()) =
_
dm =
_
dx.
Isto termina a demonstracao do Teorema 11.12.
136 CAP
UMEROS
11.3 Exerccios
11.1. Prove que
1. D
i
(S) = D
s
(Z S) para qualquer subconjunto S de Z.
2. Se S
1
, S 2, . . . , S
N
e uma parti cao de Z ent ao
D
s
(S
1
) +D
s
(S
2
) + +D
s
(S
N
) 1.
11.2. Deduza o Teorema 11.9 a partir do Teorema 11.7.
11.3. Mostre que dadas quaisquer transforma coes contnuas f
i
: M M,
i = 1, 2, . . . , k num espaco metrico compacto M, tais que f
i
f
j
= f
j
f
i
para
todo i, j = 1, 2, . . . , k, existe alguma medida de probabilidade que e invariante
por todas essas transforma coes.
11.4. Mostre que uma sequencia x
n
e equidistribuda se e somente se, dado
qualquer intervalo I [0, 1], tem-se
lim
n
1
n
#j = 1, 2, . . . , n : x
j
I = m(I)
onde m representa a medida de Lebesgue em [0, 1].
11.5. Demonstre o Lema 11.18.
11.6. Sejam f
i
: M M, i = 1, 2, . . . , k transformacoes que preservam uma
probabilidade em M e tais que f
i
f
j
= f
j
f
i
para todo i, j = 1, 2, . . . , k.
Ent ao, para qualquer conjunto E M tal que (E) > 0, e para quase todo
x E existe uma sequencia n
j
tal que f
nj
i
(x) E para todo i = 1, . . . , k
e todo j 1.
Captulo 12
Resultados em Teoria
Ergodica Diferenciavel
12.1 Fluxos geodesicos
12.2 Hiperbolicidade nao-uniforme
Nesta secao enunciar sem provas alguns resultados centrais da Teoria Erg odica
diferenci avel. Para os interessados em suas provas, recomendamos a leitura de
[Ma n87].
Denicao 12.1. Seja f : M
d
M
d
um difeomorsmo da variedade M. Um
ponto x M e dito regular se existe n umeros
1
<
2
<
l
(x) e uma
decomposicao E
1
(x) E
l
(x) = T
x
M tal que em cada subespaco E
i
vale:
lim
n
1
n
log |Df
n
(x)v| =
i
(x),
para todo v E
i
(x).
Denotaremos por o conjunto dos pontos regulares. O n umeros
i
(x) sao
chamados os expoentes de Lyapunov de x e dimE
i
(x) e a multiplicidade de
i
(x).
Observe que se x e regular, ent ao f
n
(x) e regular e seus expoentes coincidem
com os expoentes de x. Para ver isso, basta denir E
i
(f
n
(x)) = Df
n
(x)E
i
(x).
Vale o seguinte teorema:
Teorema 12.2 (Oseledets). Seja f um difeomorsmo C
1
de uma variedade
compacta M. Entao () = 1 para toda medida invariante . Ou seja, o
conjunto dos pontos regulares e um conjunto com medida total. Alem disso:
1. Se e erg odica, entao l(x) e
1
(x), . . . ,
l
(x) s ao constantes para -quase
todo ponto x M.
137
138CAP
ODICADIFERENCI
AVEL
2.
_
log [ det Df(x)[d(x) =
l
i=0
(x)
i
(x)d(x).
Deniremos a fun cao : R por
(x) =
lim
i(x)>0
i
(x)dimE
i
(x).
Ent ao,
Teorema 12.3 (desigualdade de Ruelle). Se e uma medida invariante
para um difeomorsmo (ou endomorsmo) C
1
de uma variedade compacta M,
entao:
h
(f)
_
(x)d(x).
Teorema 12.4 (formula de Pesin). Se e uma medida invariante absoluta-
mente contnua com respeito ` a medida de Lebesgue para um difeomorsmo (ou
endomorsmo) C
1+
de uma variedade compacta M, entao:
h
(f) =
_
(x)d(x).
12.3 Exerccios
Bibliograa
[BK83] M. Brin and A. Katok. On local entropy. In Geometric dynamics
(Rio de Janeiro, 1981), volume 1007 of Lecture Notes in Math., pages
3038. Springer, 1983.
[Cas04] A. A. Castro. Teoria da medida. Projeto Euclides. IMPA, 2004.
[ET36] P. Erd os and P. Tur an. On some sequences of integers. J. London.
Math. Soc., 11:261264, 1936.
[Fal90] K. Falconer. Fractal geometry. John Wiley & Sons Ltd., 1990. Math-
ematical foundations and applications.
[Fer02] R. Fernandez. Introdu c ao `a teoria da medida. Projeto Euclides. IMPA,
2002.
[Fur77] H. Furstenberg. Ergodic behavior and a theorem of Szemeredi on
arithmetic progressions. J. dAnalyse Math., 31:204256, 1977.
[Fur81] H. Furstenberg. Recurrence in ergodic theory and combinatorial num-
ber theory. Princeton Univertsity Press, 1981.
[Ma n87] R. Ma ne. Ergodic theory and dierentiable dynamics. Springer Verlag,
1987.
[Orn70] D. Ornstein. Bernoulli shifts with the same entropy are isomorphic.
Advances in Math., 4:337352 (1970), 1970.
[Rok66] V.A. Rokhlin. Selected topics from the metric theory of dynamical
systems. A. M. S. Transl., 49:171240, 1966. Transl. from Uspekhi
Mat. Nauk. 4 - 2 (1949), 57128.
[Rud87] W. Rudin. Real and complex analysis. McGraw-Hill, 3 edition, 1987.
[Sze75] S. Szemeredi. On sets of integers containing no k elements in arith-
metic progression. Acta Arith., 27:199245, 1975.
[vdW27] B. van der Waerden. Beweis eibe Baudetschen Vermutung. Nieuw
Arch. Wisk., 15:212216, 1927.
139
140 BIBLIOGRAFIA
[Wey16] H. Weyl. Uber die Gleichverteilungen von Zahlen mod Eins. Math.
Ann., 77:313352, 1916.