Sei sulla pagina 1di 97

Algunas aplicaciones de la Teora Erg

odica a la
Teora de N
umeros
Carlos Matheus
12 de julio de 2007

2
.

A los amigos Carlos Isnard y Paulo Rogerio Sabini (en memoria)

Prefacio
Este peque
no libro nace del convite del profesor Andres Navas para dictar
un cursillo en la VI Escuela Internacional de Sistemas Din
amicos del 17 al 25
de julio de 2007 (en la Universidad de Santiago de Chile) sobre la utilizacion
de los metodos de la la Teora Ergodica en el estudio de problemas de Teora
de N
umeros. Esta tematica esta recibiendo bastante atencion desde la reciente
soluci
on de Ben Green y Terence Tao de la conjetura clasica (propuesta hace
mucho tiempo) sobre la existencia de progresiones aritmeticas (PAs) arbitrariamente largas de n
umeros primos. Destacamos que el profesor T. Tao recibio en
el a
no 2006 una medalla Fields principalmente por este trabajo.
El objetivo principal de este libro es presentar algunos de los elementos
principales de la demostracion de Green y Tao de la existencia de progresiones
aritmeticas arbitrariamente largas. Para cumplir con este objetivo, pasaremos
un tiempo considerable discutiendo algunos problemas (de caracter aditivo) de
la Teora de N
umeros hasta llegar al teorema de Szemeredi. En este punto,
estudiaremos la demostracion (ergodica) de Furstenberg del teorema de Szemeredi, porque las ideas introducidas por esta prueba son parte de la base de
los argumentos de Green y Tao. Mas precisamente, las ideas de Furstenberg
son utilizadas por Green y Tao para demostrar una generalizacion del teorema
de Szemeredi que llamaremos teorema de Green-Tao-Szemeredi. En seguida,
describiremos rapidamente los trabajos de Goldston e Yldrm1 para obtener
los requisitos necesarios para la aplicacion directa del teorema de Green-TaoSzemeredi (a saber, la existencia de mayorantes pseudoaleatorios para la funcion
de van Mangoldt modificada).
Con esta meta, dividiremos el libro en los siguientes captulos (los cuales
corresponden a versiones expandidas de las 5 sesiones del cursillo):
En el captulo 1 veremos algunos problemas abiertos clasicos de la Teora
de N
umeros; en seguida, discutiremos algunos resultados conocidos, especialmente los teoremas de van der Waerden, Roth y Szemeredi; finalmente,
en el apendice del captulo 1 presentaremos una demostracion del teorema
de los n
umeros primos.
En el captulo 2 demostraremos el teorema de van der Waerden de dos
maneras distintas: primeramente utilizando argumentos puramente combinatorios y luego a traves de argumentos de la Teora Ergodica; despues, probaremos el teorema de Roth usando una estrategia de Analisis
Armonico (la cual servira tanto para motivar la introduccion de las normas
de Gowers como del argumento de incremento de energa).
En el captulo 3 discutiremos las ideas (de Teora Ergodica) de Furstenberg
para a demostracion del teorema de Szemeredi2 ; despues de esto, comenzaremos la prueba del teorema de Green y Tao a traves de su reduccion
1 El apellido Yldrm est
a escrito correctamente: los puntos de las is no existen en la
grafa de esta palabra.
2 La cual originalmente tiene ra
ces de naturaleza combinatoria.

4
para dos resultados: el teorema de Green-Tao-Szemeredi y la existencia de
mayorantes pseudoaleatorios para a funcion de van Mangoldt modificada
(usando las ideas de Goldston e Yldrm).
El en captulo 4 dedicaremos nuestros esfuerzos a presentar los principales
pasos de la prueba del teorema de Green-Tao-Szemeredi.
Finalmente, en el captulo 5 veremos como el conocimiento de ciertas regiones libres de ceros para la funcion zeta de Riemann conducen al resultado de existencia de mayorantes pseudoaleatorios para los n
umeros
primos.

Agradecimientos
El autor agradece al profesor Andres Navas por la invitacion a dictar el cursillo que origino este peque
no libro y a los amigos Alexander Arbieto, Carlos
Gustavo Moreira y Jimmy Santamaria cuyos excelentes seminarios en el IMPA
(Instituto de Matematica Pura e Aplicada) ayudaron al esclarecimiento de los
puntos importantes del trabajo de Green y Tao. Ademas, agradezco a Jimmy
Santamaria por la enorme ayuda con la traduccion de este texto3 para el Espa
nol. Finalmente, agradezco a mi esposa Aline Gomes Cerqueira por todo su
apoyo, paciencia, comprension y amor durante el periodo en el que este libro
fue escrito.

3 Escrito originalmente en Portugu


es por falta de conocimiento de la lengua Espa
nola por
parte del autor.

Indice general
1. N
umeros Primos
1.1. Un poco de historia de la teora aditiva de los n
umeros primos .
1.2. Conteos Heursticos Ingenuos . . . . . . . . . . . . . . . . . . .
1.2.1. Conteo Heurstico I . . . . . . . . . . . . . . . . . . . . . .
1.2.2. Conteo Heurstico II . . . . . . . . . . . . . . . . . . . . .
1.3. N
umeros casi primos . . . . . . . . . . . . . . . . . . . . . . . . .
1.4. Esquema general del argumento de Green y Tao . . . . . . . . .
1.5. Apendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.5.1. Demostracion del teorema de Dirichlet para el caso a = 1
1.5.2. Demostracion del teorema de los n
umeros primos . . . . .

9
9
16
16
17
19
20
21
21
22

2. Demostraci
on de los teoremas de van der Waerden y de Roth
2.1. Demostracion Combinatoria del teorema de van der Waerden . .
2.2. Demostracion Ergodica del teorema de van der Waerden . . . . .
2.3. Demostracion del teorema de Roth va Analisis Armonico . . . .

29
29
31
33

3. Las ideas de Furstenberg y el teorema de Green-Tao


3.1. Demostracion Ergodica del teorema de Szemeredi . . .
3.1.1. Breve Introduccion a Teora Ergodica . . . . .
3.1.2. El teorema de Furstenberg . . . . . . . . . . . .
3.1.3. Demostracion del teorema de Szemeredi . . . .
3.1.4. El Teorema de Szemeredi cuantitativo . . . . .
3.2. Demostracion del teorema de Green y Tao . . . . . . .
3.2.1. Demostracion del teorema de Green y Tao . . .
3.3. Apendice del Captulo 3 . . . . . . . . . . . . . . . . .
3.3.1. El ejemplo de F. Behrend . . . . . . . . . . . .
3.3.2. El tama
no del n
umero N0 (k, ) . . . . . . . . .
3.3.3. La magnitud del primer primo en una k-PA . .

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

41
41
41
44
46
46
49
52
53
53
54
55

4. Demostraci
on del teorema de Green-Tao-Szemer
edi
4.1. Normas de Gowers . . . . . . . . . . . . . . . . . . . . . . . .
4.2. Antiuniformidad . . . . . . . . . . . . . . . . . . . . . . . . .
4.3. Sigma-algebras generadas por funciones antiuniformes basicas
4.4. El argumento de incremento en la energa . . . . . . . . . . .

.
.
.
.

.
.
.
.

57
57
64
68
70

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

INDICE GENERAL
4.5. Final de la demostracion del teorema de Green-Tao-Szemeredi . .

75

5. Medidas pseudoaleatorias soportadas en los primos


77
5.1. Construccion de la Medida Pseudoaleatoria . . . . . . . . . . . . 77
5.2. Condicion de formas lineales para R . . . . . . . . . . . . . . . 83
5.3. Correlaciones de orden superior de R . . . . . . . . . . . . . . . 89
5.4. Apendice del Captulo 3: dos resultados elementales de la teora
de n
umeros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.4.1. La formula de inversion de Mobius . . . . . . . . . . . . . 93
5.4.2. El orden maximo de d(n) . . . . . . . . . . . . . . . . . . 94

Captulo 1

N
umeros Primos
En nuestros primeros contactos con la Matematica, cuando aprendemos a
utilizar los n
umeros naturales y enteros para problemas basicos de conteo, etc.,
somos presentados a los n
umeros primos: ellos son, por definicion, los n
umeros
enteros p cuyos divisores son apenas 1 y p. En seguida, vemos algunos indicios
de la importancia de este concepto: por ejemplo, el teorema fundamental de
la aritmetica dice que cualquier n
umero entero n puede ser escrito como un
producto de factores primos; mas a
un, esta factorizacion es u
nica (a menos de
permutacion de los factores primos).
Un hecho inmediato de la definicion de n
umero primo es que las propiedades
umeros son poco cautivantes: el producto de dos n
umeros
multiplicativas de estos n
primos nunca es primo y no existen progresiones geometricas de tama
no mayor
o igual a 3 formadas solo por n
umeros primos.
Por otro lado, un aspecto fascinante de estos n
umeros es la existencia de
conjeturas muy antiguas sobre sus propiedades de naturaleza aditiva que a
un
hoy se resisten a los esfuerzos de varias generaciones de matematicos.
En particular, estas notas seguiran las lneas del trabajo de Ben Green y
Terence Tao donde resuelven el siguiente problema antiguo:
Existen progresiones aritmeticas (PAs) de tama
no k mayor o igual a 3
formadas solamente por n
umeros primos? Y, si fijamos el tama
no k,
cual es la cantidad de tales progresiones aritm
eticas?
Para motivar el estudio subsecuente de las propiedades aditivas de los n
umeros
primos, haremos una revision historica de algunos problemas importantes de la
Teora de N
umeros.

1.1.

Un poco de historia de la teora aditiva de


los n
umeros primos

Un problema interesante sobre las propiedades aditivas de los n


umeros primos es saber cuando la suma de dos primos es a
un un primo. Logicamente la
9


CAPITULO 1. NUMEROS
PRIMOS

10

respuesta depende de los primos considerados, como podemos ver a traves de


ejemplos simples: 2 + 3 = 5 es primo pero 3 + 5 = 8 no es primo. Por otro lado,
una pregunta mas especfica seria saber si existen muchos primos p cuya suma
con 2 a
un es un primo. N
umeros primos con esta caracterstica son denominados
primos gemelos, es decir, p y p + 2 son primos gemelos si ambos son n
umeros
primos. En este sentido, existe a siguiente conjetura muy antigua:
Conjetura de los primos gemelos (Euclides, 300 AC): Existen infinitos
primos gemelos.
Los primeros seis pares de primos gemelos son: (3, 5), (5, 7), (11, 13), (17, 19),
(29, 31) y (41, 43). Un resultado interesante1 sobre los primos gemelos debido
a V. Brun [B] : mismo que existan infinitos primos gemelos, ellos son cada vez
m
as raros de encontrar; mas precisamente, la serie de los inversos de los primos
gemelos impares es convergente:
1 1
1 1
1
1
1
1
( + ) + ( + ) + ( + ) + ( + ) + . . . < .
3 5
5 7
11 13
17 19
Otra de las preguntas2 relacionadas a las sumas de primos son:
Conjetura de Goldbach par (Euler 1742): Todo n
umero par n 4 es la
suma de dos n
umeros primos: 4 = 2 + 2, 6 = 2 + 3, 8 = 3 + 5, etc.
Conjetura de Goldbach impar (Goldbach 1742): Todo n
umero impar n 7
es la suma de tres n
umeros primos: 7 = 2+2+3, 9 = 3+3+3, 11 = 2+2+7,
etc.
La conjetura de Goldbach (par y/o impar) es uno de los grandes desafos de
la Teora de N
umeros a pesar de su enunciado ser bastante simple.
Observaci
on 1.1.1. Una version mas fuerte de la conjetura impar de Goldbach
es:
Conjetura de Levy: Todo n
umero impar n 7 es la suma de un primo con
el doble de otro primo.
Sin embargo, la historia de la Matematica no esta hecha solamente de derrotas (felizmente) conforme muestran los siguientes resultados parciales profundos:
Chen (1966): existen infinitos pares (p, p + 2) donde p es primo y p + 2 es
casi primo (es decir, p + 2 es primo o el producto de dos primos).
Schnirelman (1939): todo n
umero primo puede ser escrito como la suma
de una cierta cantidad ( 300000) de sumandos formados solo por primos.
Vinogradov (1937): todo n
umero impar grande es la suma de tres primos;
de hecho, Liu y Wang (2002) mostraron que el teorema de Vinogradov
vale para n > 101346 ; ademas, este resultado es conocido para n < 1020 .
1 Que

es una muestra de la dificultad de la conjetura de los primos gemelos


del intercambio de cartas entre Golbach y Euler en 1742.

2 Nacidas


1.1. UN POCO DE HISTORIA DE LA TEORIA ADITIVA DE LOS NUMEROS
PRIMOS11
Todava continuando con la investigacion de las caractersticas aditivas de
los n
umeros primos, ahora vamos a estudiar la relacion entre progresiones aritmeticas y los primos.
Uno de los resultados clasicos sobre este asunto se debe a Dirichlet:
Teorema 1.1.2 (Dirichlet). Dados a y b enteros primos entre s (es decir,
(a, b) = 1), la progresi
on aritmetica a + nb, donde n N, contiene infinitos
n
umeros primos.
La prueba de este resultado usa el concepto de L-series (una definicion importante para la Matematica) y esta fuera del objetivo de este libro. Sin embargo,
presentaremos una prueba elemental de este teorema en un caso particular en
el apendice de este captulo (en la subseccion 1.5.1).
Una pregunta no respondida por el teorema de Dirichlet es la existencia
de progresiones aritmeticas (PAs) formadas solamente por primos. El primer
resultado en este sentido se debe a Lagrange y Waring, el cual obstruye la
existencia de PAs de primos de tama
no infinito:
Teorema 1.1.3 (Lagrange y Waring (1770)). Dada una progresi
on aritmetica
de n
umeros primos de tama
no k y raz
on d, tenemos que d es divisible por todos
los n
umeros primos menores que k. En particular, PAs de primos de tama
no
infinito no existen.
Por otro lado podemos fijar un tama
no k 3 y preguntar sobre la existencia
de progresiones aritmeticas de tama
no k formada solamente por primos.
Para aclarar nuestra discusion, adoptaremos un procedimiento padron en
Matematica: en vez de restringir nuestra atencion al conjunto P de n
umeros
primos, vamos a considerar conjuntos mas generales A Z y buscaremos progresiones aritmeticas de tama
no k contenidas en A.
Intuitivamente sabemos que conjuntos muy magros no pueden contener
muchas PAs de tama
no k. Logicamente, para formalizar esta intuicion, debemos precisar la nocion de conjunto gordo. Para eso, vamos a analizar dos o
tres ejemplos simples: consideremos o intervalo [1, N ] := {n Z : 1 n N }.
Observe que el conjunto de n
umeros pares de [1, N ] contiene progresiones aritmeticas de tama
no grande (de razon 2); por el mismo motivo, los n
umeros
impares de este intervalo tambien contienen progresiones aritmeticas largas.
Dada esta observaci
on, sera natural llamar a estos conjuntos gordos. Observando mas profundamente, vemos que el motivo por el cual estos conjuntos
contienen PAs es que ellos ocupan 1/2 del intervalo [1, N ] (de hecho, en este
intervalo aproximadamente la mitad de los n
umeros son pares y mitad de los
n
umeros son impares). Mas generalmente, fijando un entero k y considerando
los m
ultiplos de k en el intervalo [1, N ], vemos que este conjunto contiene PAs de
tama
no k porque el ocupa 1/k de este intervalo. Esto motiva la siguiente definicion de conjuntos gordos (a los cuales llamaremos en adelante de conjuntos
de densidad positiva):
Definici
on 1.1.4. Dado A N, denotamos por
d(A) := lm sup
N

|A {1, . . . , N }|
N


CAPITULO 1. NUMEROS
PRIMOS

12

a la densidad de A (en N), donde |B| es la cardinalidad del conjunto B N.


Provistos de esta definicion, decimos que A N tiene densidad positiva
siempre que d(A) > 0.
En la direccion del estudio de PAs en subconjuntos A N, tenemos los
siguientes resultados:
Teorema 1.1.5 (Roth (1956)). Conjuntos de densidad positiva contienen infinitas progresiones aritmeticas de tama
no 3.
Teorema 1.1.6 (van der Waerden (1927)). Tomemos k colores y fijemos una
coloraci
on de N usando estos colores. Entonces, una clase de colores contendr
a infinitas progresiones aritmeticas de tama
no cualquier.
Teorema 1.1.7 (Szemeredi (1975)). Conjuntos de densidad positiva contienen
infinitas progresiones aritmeticas de tama
no k, para todo k 3.
Relacionado estos tres enunciados, proponemos el siguiente ejercicio:
Ejerccio 1. El teorema de Szemeredi implica los teoremas de Roth y de van
der Waerden.
Logicamente, el teorema de Szemeredi consigue formalizar nuestra intuicion
de que conjuntos gordos deben contener PAs largas: en efecto, el en enunciado
de Szemeredi no asumimos estructura alguna sobre el conjunto en consideracion
(excepto que el ocupa una fraccion visible del intervalo [1, N ] para N grande)
y obtenemos una conclusion fuerte sobre la naturaleza aditiva de este conjunto
(el contiene muchas PAs!)
Sin embargo, el teorema de Szemeredi no puede ser utilizado para inferir la
existencia de PAs largas de primos porque el conjunto P de los n
umeros primos
tiene densidad nula. En efecto, este hecho se sigue del famoso teorema de los
n
umeros primos:
Teorema 1.1.8 (Teorema de los n
umeros primos). Dado n un n
umero natural,
sea
(n) := |{p n : p es primo }| = |P [1, n]|.
Entonces,
lm

(n) log n
= 1.
n

Ejerccio 2. Muestre que el teorema de los n


umeros primos implica que el conjunto P de los n
umeros primos posee densidad nula (d(P ) = 0).
Observaci
on 1.1.9. Queda en evidencia de la prueba (en la subseccion 1.5.2 del
apendice) del teorema de los n
umeros primos que el conocimiento de regiones
libres de ceros de la funcion zeta de Riemann implica buenas estimativas para el
otesis de Riemann es un problema
error (n) logn n . En particular, la famosa hip
central en la Teora de N
umeros (entre otros ramos de la Matematica).


1.1. UN POCO DE HISTORIA DE LA TEORIA ADITIVA DE LOS NUMEROS
PRIMOS13
El teorema de los n
umeros primos fue conjeturado por varios matematicos
(entre ellos Legendre y Gauss) y su prueba completa fue dada independientemente por los matematicos de la Vallee Pousin y Hadamard en 1896. Presentaremos una prueba de este resultado3 en la subseccion 1.5.2 del apendice de
este captulo. Por ahora, veremos solamente una version debil de este resultado
(debida a Tchebycheff) suficiente para obtener como corolario un resultado de
Euler sobre la sumabilidad de la serie de los inversos de los primos.
Proposici
on 1.1.10 (Tchebycheff). Para todo x 3,
1
x
x
log 2
(x) 5 log 2
.
2
log x
log x

Demostraci
on. Sabemos que 2n
n es divisible por todos los primos n < p 2n
2n
2n
P
2n
y n
= 22n . Luego, el producto de todos los primos entre n y 2n
k
k=0

es menor que 22n y en particular tenemos que n(2n)(n) < 22n . Por tanto,
((2n) (n)) log n < 2n log 2, o sea,
(2n) (n) <

2n log 2
.
log n

Notando que (2k ) 2k1 para 1 k 5 y haciendo induccion en k (comenzando en k = 5), la desigualdad arriba implica que
(2k+1 )

5 2k
.
k

De ah se sigue que, para todo 2k < x 2k+1 ,


(x) (2k+1 )

5 2k
5x log 2

k
log x

porque la funcion x log 2/ log x es creciente para x 3. Esto prueba la estimativa


superior de (x) deseada.
Para probar la estimativa inferior de (x), note que el exponente de p en

P
la factorizacion de n! es wp (n) :=
c b pnk c {0, 1} y
b pnk c porque4 b n+1
pk
k=1

b n+1
c b pnk c = 1 si y solamente si pk divide a n + 1; luego, wp (n + 1) wp (n) es
pk
el exponente de p en la factorizacion de n + 1, de donde concluimos que wp (n)
es el exponente de p en
la factorizacion 2de n!. En particular, el exponente de p
en la factorizacion de 2n
n := (2n)!/(n!) es


X
2n
n
b k c 2b k c .
p
p
k=1

3 Utilizando

una regi
on trivial libre de ceros de la funci
on zeta de Riemann y un poco
de an
alisis de Fourier.
4 Aqu
la sumatoria est
a bien definida porque la suma es finita: b pnk c = 0 siempre que
k > log n/ log p.


CAPITULO 1. NUMEROS
PRIMOS

14

Por otro lado, tenemos5 b 2n


c 2b pnk c {0, 1}. Luego, el exponente de p en la
pk
2n
factorizacion de n es log n/ log p a lo maximo. A
un mas, ya sabemos que el

exponente de n < p 2n en la factorizacion de 2n
es
1. Por tanto, si escribimos
n

Q p 2n
como
p
=
,
entonces
la factorizacion de 2n
n
n
p

X
X
2n
log
=
p log p =
p log p +
n
p
pn

p log p

n<p2n

(n) log n + ((2n) (n)) log(2n)


(2n) log(2n).

2n
2n 2n1
n+1
O sea, (2n) log 2n
2n , se sigue
n / log(2n). Como
n = n n1 . . . 1
x log 2
que (x) 2 log x para todo x entero par. Esto implica la misma estimativa
(x)

x log 2
2 log x

para todo x entero porque (2n 1) = (2n).


Corol
ario 1.1.11 (Euler (1737)).
X1
= +.
p

pP

Demostraci
on. Esto se sigue de la siguiente afirmacion mas general (que se deja
como ejercicio para el lector):
Ejerccio 3. Dada f : N [0, ) una funcion decreciente, entonces la serie
X
f (p)
p primo

es convergente si y solo si la serie


X f (n)
log n

nN

es convergente.
Sugerencia: Use la proposicion (de Tchebycheff) anterior.
Despues de esta pausa para rever las propiedades elementales de los primos,
retornamos a la cuestion de la existencia de progresiones aritmeticas de n
umeros
primos. En esta direccion, tenemos los siguientes teoremas:
Teorema 1.1.12 (van der Corput (1939)). Existen infinitas progresiones aritmeticas de tama
no 3 dentro del conjunto P de los n
umeros primos.
5 Porque

0 x bxc < 1 para todo x R.


1.1. UN POCO DE HISTORIA DE LA TEORIA ADITIVA DE LOS NUMEROS
PRIMOS15
Teorema 1.1.13 (Green y Tao (2004)). Los primos contienen progresiones
aritmeticas arbitrariamente largas.
Conforme mencionamos al inicio del libro, nuestro objetivo principal es estudiar en detalle la demostracion del teorema 1.1.13. Pero antes de iniciar esta
larga jornada, mencionaremos algunos otros problemas no resueltos y resultados
recientes:
Conjetura de P
Erd
os-Tur
an (1936): Todo conjunto A de enteros cuya suma
1
de inversos
diverge
contiene progresiones aritmeticas arbitrariaa
aA

mente largas.6

Conjetura de Hardy y Littlewood (1923): Esta conjetura preve (a traves de


un argumento heurstico basado en el teorema de los n
umeros primos) la
cantidad asintotica exacta de k-tuplas de primos satisfaciendo propiedades
aditivas predeterminadas. En particular, esta conjetura preve la existencia de una constante ck > 0 explcita tal que el n
umero asintotico de PAs
de tama
no k de primos en el intervalo [1, N ] es ck N 2 / logk N . Aun mas,
esta conjetura implicara directamente la conjetura de los primos gemelos, la conjetura de Goldbach (para enteros grandes) y la existencia de
progresiones largas de primos. Volveremos a discutir esta conjetura mas
tarde.
Teorema de Heath-Brown (1981): Existen infinitas progresiones aritmeticas
de tama
no 4 tales que 3 elementos son primos y uno es casi primo (es decir,
o primo o producto de dos primos).
Teorema de Balog (1992): Para todo k, existen p1 , . . . , pk primos distintos
tales que (pi + pj )/2 son todos primos.
Teorema de Green y Tao (2004): Acerca del caso especial de la conjetura
de Hardy-Littlewood sobre a existencia de PAs de tama
no k, existe una
constante k > 0 tal que el n
umero de PAs de tama
no k de primos en el
intervalo [1, N ] es por lo menos (k + o(1))N 2 / logk N .
Teorema de Tao y Ziglier (2006): Dados P1 , . . . , Pk polinomios en Z[r] con
Pi (0) = 0. Entonces, existen infinitos enteros x y m tales que x + Pi (m)
es primo para todo i = 1, . . . , k. En particular, tomando Pi (r) = (i 1)r,
obtenemos el teorema de Green y Tao.
Teorema de Green y Tao (2006): El caso particular de la conjetura de
Hardy-Littlewood sobre el recuento de PAs de tama
no k de primos es
valido para k = 4.
6 El resultado de Euler sobre la suma de inversos de los primos muestra que el teorema de
Green-Tao es una consecuencia de la conjetura de Erd
os-Tur
an. Sin embargo, esta conjetura se
encuentra en estos das a
un totalmente abierta: por ejemplo, ni siquiera se sabe si los conjuntos
descritos en esta conjetura deben contener progresiones aritm
eticas de tama
no 3.


CAPITULO 1. NUMEROS
PRIMOS

16

Como curiosidad, mencionamos que actualmente la mayor progresion aritmetica explcita de primos 468395662504823 + k 45872132836530 para 0
k 23 posee 24 terminos y fue encontrada el 18 de enero de 2007 por Jaroslaw
Wroblewski.
Obviamente podramos continuar describiendo mas problemas abiertos y resultados recientes sobre la estructura aditiva de los primos. Sin embargo, como
nuestro objetivo fundamental es probar el teorema de Green y Tao, cerraremos
esta seccion de revision historica hablando sobre nuestros proximos pasos en este
captulo. Durante el resto de este captulo introductorio, vamos a usar el teorema
de los n
umeros primos para describir mejor la conjetura de Hardy-Littlewood
en el caso del recuento de pares de primos gemelos, veremos como argumentos
heursticos ingenuos motivan la introduccion de los n
umeros casi primos en
el estudio de propiedades aditivas de los primos y haremos un itinerario grosero
de la prueba del teorema de Green-Tao.

1.2.

Conteos Heursticos Ingenuos

Desde mucho tiempo atras se sabe que formulas explcitas para los n
umeros
primos no son u
tiles en la practica, de modo que un metodo popular de establecer
resultados sobre primos consiste en contar (aproximadamente) la cantidad de
primos en un cierto intervalo 1, . . . , N (o sea, estimar (N )). En esta direccion,
es claro que el teorema 1.1.8 de los n
umeros primos es una herramienta basica.
Para ilustrar este metodo, haremos algunos conteos errados sobre los primos
gemelos.

1.2.1.

Conteo Heurstico I

Como un primer ejercicio elemental, calcularemos (erroneamente) la cantidad de primos gemelos en el intervalo 1, . . . , N usando probabilidad basica:
tome n entero entre 1 y N aleatoriamente;
el teorema de los n
umeros primos dice que la probabilidad de n ser primo
es:
(N )
1

;
N
log N
analogamente, la probabilidad de n + 2 ser primo es

1
log N ;

luego, la probabilidad de n y n + 2 ser ambos primos es


1
;
log2 N
o sea, la cantidad de primos gemelos entre 1 y N es
N .

N
log2 N

1
log N

1
log N

cuando

1.2. CONTEOS HEURISTICOS INGENUOS

17

En particular, el argumento descrito prueba la existencia de infinitos primos gemelos (resolviendo as el problema propuesto por Euclides por el a
no 300
AC). Naturalmente surge la pregunta: por que los matematicos no percibieron
eso antes y respondieron prontamente a la conjetura de Euclides (abierta por
tanto tiempo)?
La respuesta es muy sencilla: el argumento descrito esta errado! En efecto, en
el cuarto paso de la prueba usamos implcitamente el hecho de que los eventos
n es primo y n + 2 es primo sean independientes (de modo que la probabilidad
de n y n + 2 ser ambos primos sera el producto de las probabilidades de n ser
primo y n + 2 ser primo). Sin embargo, este hecho es falso porque si n 6= 2
es primo, entonces n es impar (o sea, los primos gustan mas de ser impares
que de ser pares); por tanto, como n par implica n + 2 par, vemos que n ser
primo tiene una cierta correlacion con n + 2 ser primo. Otro motivo para que
el argumento de arriba este errado es que el implicara (sustituyendo n + 2 por
n + 1) la existencia de infinitos primos n tales que n + 1 tambien es primo, lo
que claramente no puede ser verdadero!
Pero no todo esta perdido, podemos hacer un conteo tomando en consideracion el hecho de que los primos gustas de ser impares.

1.2.2.

Conteo Heurstico II

Para este conteo, el hecho importante sera que


n 3 primo implica n y n + 2 impares.
Enseguida, repetimos los pasos del conteo heurstico I:
n par aleatorio entre 1 y N tiene probabilidad 0 de ser primo;
n impar aleatorio entre 1 y N tiene probabilidad
primo;

N/ log N
N/2

2
log N

de ser

logo, n impar implica que n y n + 2 son ambos primos con probabilidad


log42 N (asumiendo independencia de los eventos);
o sea, la cantidad de primos gemelos entre 1 y N es

1
1
4
2N
N
,
0+
=
2
2 log2 N
log2 N
cuando N .
Por las mismas razones anteriores, logicamente este argumento tiene un error
(porque los primos no gustan de ser congruentes a 0 modulo 3), a pesar de que
el esta menos errado que el argumento del recuento heurstico I (en un cierto
sentido). Claramente podemos usar esta nueva informacion para hacer un conteo heurstico II, con el que obtendramos #{ primos gemelos entre 1 y N }
3 N
2 log2 N .


CAPITULO 1. NUMEROS
PRIMOS

18

En general, haciendo todos los recuentos posibles (y esperando que estos


sean los u
nicos problemas al contar primos), se conjetura que
2 (N ) := #{ primos gemelos entre 1 y N } 22
donde
2 :=

Y
p primo impar

1
1
(p 1)2

N
,
log2 N

= 0, 660161858...

es la llamada constante de los primos gemelos.


Observaci
on 1.2.1. Una conjetura mas fina sobre el n
umero de primos gemelos
RN
es 22 2 logdx2 x ; esta formula tambien toma en consideracion el hecho de que
los n
umeros peque
nos gustan mas de ser primos que los n
umeros grandes.
Para apoyar esta conjetura, presentamos la siguiente tabla (retirada de una
diapositiva de una exposicion del Prof. Tao):

N
106
108
1010
1012

22 N/ log2 N
6917
389107
2490284
1,72936 109

RN

dx/ log2 x
8248
440368
27411417
1,87061 109

22

2 (N )
8168
440312
27412679
1,87059 109

Esta conjetura, sobre la cantidad de primos gemelos, puede ser generalizada


para k-tuplas de primos (bajo ciertas condiciones) y existen previsiones similares de la cantidad de k-tuplas de primos, cuyo enunciado esta contenido en la
conjetura de Hardy-Littlewood, la cual a pesar de tener fuertes evidencias a su
favor, permanece todava abierta.
Observaci
on 1.2.2. El analisis heurstico en el cual la conjetura de HardyLittlewood se basa asume fuertemente que los primos, ademas de la estructura
obvia (es decir, la mayora son impares, coprimos con 3, etc.), no poseen estructuraras adicionales! O sea, de cierta forma, Hardy-Littlewood dice que los
primos no deben poseer estructuras exoticas que afecten el conteo heurstica de
arriba.
Resumamos esta seccion, vimos que podemos hacer muy buenas conjeturas
sobre primos (por ejemplo, la conjetura de Hardy-Littlewood ) a pesar de que
no consigamos probarlas. Felizmente, los matematicos no se quedan parados y,
como de costumbre, pasaron a investigar n
umeros enteros similares a los primos
(a saber, los n
umeros casi primos) y sus buenas propiedades (las cuales podemos
probar a costa de esfuerzos muchas veces no triviales).


1.3. NUMEROS
CASI PRIMOS

1.3.

19

N
umeros casi primos

Se dice que un n
umero es casi primo si el posee pocos factores primos; aqu la
palabra pocos depende del contexto (por ejemplo, en el caso del teorema de
Chen, pocos primos significa apenas dos primos).
Las ventajas de los n
umeros casi primos son diversas; entre ellas, destaca el
hecho de que la conjetura de Hardy-Littlewood vale para los casi primos (este
resultado es conocido como el teorema fundamental de la teora de la criba). Un
buen motivo para considerar casi primos en el estudio de las propiedades de los
primos proviene de la criba de Erast
otenes:
considere los enteros

N
2

n N;

retire todos los m


ultiplos de 2;
retire todos los m
ultiplos de 3;
.
.
.
retire todos los m
ultiplos de primos
todos los primos entre N/2 y N .

N ; los n
umeros que sobran son

Observe que los pasos iniciales de la criba son bien comportados (porque
retiramos pedazos grandes
y relativamente faciles de identificar) mientras que

N
los pasos finales (entre 2 y N ) son mal comportados; en efecto, la mayor
prueba de esto es que todava no se sabe usar la teora de la criba para probar
el teorema de los n
umeros primos.
Pero, si paramos en N 1/100 en vez de N 1/2 , podemos controlar el proceso.
Sin embargo, note que lo que sobra de este nuevo proceso no son todos primos,
mas casi primos (en el caso especfico de parar en N 1/100 , estos casi primos son
productos de 100 factores primos como maximo).
Por otra parte, el lector puede ver rapidamente que #{casi primos N }
100 (N ), de modo que pasar a los casi primos no es tan malo as. Es decir,
al pasar para los casi primos no incrementamos muchos n
umeros. Esta observacion nos lleva a imaginar que esta idea puede ser aplicada para estudiar las
propiedades aditivas de los primos. De hecho, una de las cosas que podemos
estudiar (a traves de casi primos) es el problema de la existencia de peque
nas
lagunas en los primos. En esta direccion, tenemos:
Teorema 1.3.1 (Goldston, Pintz e Yldrm [GPY]). Si denotamos por P =
{p1 < p2 < . . . < pn < . . . } al conjunto de los n
umeros primos, entonces
lm inf
n

pn+1 pn
= 0.
log pn

Observaci
on 1.3.2. La conjetura de los primos gemelos equivale a lm inf (pn+1
pn ) = 2


CAPITULO 1. NUMEROS
PRIMOS

20

Otra cosa que podemos intentar hacer para encontrar progresiones aritmeticas
en los primos es notar que los casi primos son suficientemente gordos (o sea,
ellos estan distribuidos aleatoriamente) para permitir una aplicacion del teorema
de Szemeredi y ellos no exceden mucho el n
umero de primos. De hecho, conforme veremos en la proxima seccion, esta intuicion es la gua del itinerario de
la prueba de Green y Tao para la demostracion de la existencia de progresiones
aritmeticas.
Observaci
on 1.3.3. El teorema de Szemeredi no es muy adecuado para encontrar lagunas cortas: los m
ultiplos de 3 tienen densidad 1/3 (grande) pero no
contienen gemelos (n, n + 2).

1.4.

Esquema general del argumento de Green


y Tao

Considere el problema de encontrar progresiones aritmeticas de tama


no k
3 en un subconjunto A de N; podemos ver que este problema puede ser resuelto
facilmente en dos casos particulares:
A pseudoaleatorio: ejemplos tpicos de estos conjuntos son obtenidos al
lanzar un dado de 100 lados para cada entero n y declarar que n esta en
A cuando la cara del dado muestre un n
umero determinado (digamos 23);
este proceso define un conjunto con densidad 1 %. En general, A pseudoaleatorio significa que A se distribuye aleatoriamente sobre cualquier
progresion aritmetica n, . . . , n + (k 1)r; o sea, los eventos n A, . . . , n +
(k 1)r A son independientes. En este caso, es evidente como encontrar muchas PAs en A: denotando por > 0 la densidad de A, tenemos
que la probabilidad de los eventos n A, . . . , n + (k 1)r A es , de
donde la probabilidad del evento n, . . . , n + (k 1)r A es k > 0.
A estructurado: la idea de conjunto estructurado es opuesta a lo que ocurre
en el caso anterior: los eventos n A, . . . , n + (k 1)r A deben tener
una fuerte correlaci
on para que A sea llamado estructurado; la definicion
precisa es complicada, pero podemos dar algunos ejemplos de conjuntos
estructurados para despertar la intuicion del lector:
conjuntos peri
odicos, por ejemplo los m
ultiplos de 1000, son estructurados: los eventos n A y n + r A implican n + 2r A;
conjuntos
odicos, por ejemplo A := {n N :
linealmente casi peri
0 < { 3n} 1/1000} donde {x} es la parte fraccionaria de x, son
estructurados: esto puede ser visto a traes de la identidad (lineal)

3n + 2 ( 3(n + r)) 3(n + 2r) = 0;


conjuntoscuadr
aticamente casi peri
odicos, por ejemplo A := {n
N : 0 < { 5n2 } 1/1000}, son estructurados: a pesar de este conjunto no ser estructurado para progresiones aritmeticas de tama
no


1.5. APENDICE

21

3 (porque
no existe relacion obvia entre los n
umeros 5n2 , 5(n +

r)2 , 5(n + 2r)2 ), este conjunto es estructurado para progresiones


aritmeticas de tama
no 4 como muestra la identidad (cuadratica):
2

5n 3 ( 5(n + r)2 ) + 3 ( 5(n + 2r)2 ) 5(n + 3r)2 = 0.


La idea de Green y Tao en este punto es probar un teorema de estructura
(siguiendo el esquema de la prueba de Furstenberg del teorema de Szemeredi)
seg
un el cual todo conjunto de enteros puede ser descompuesto como union finita
de subconjuntos pseudoaleatorios de ciertos conjuntos estructurados. En seguida, se usa este teorema de estructura para descomponer los primos en una parte
pseudoaleatoria despreciable y en una parte estructurada. Para analizar la parte
estructurada de los primos, consideramos los casi primos y recordamos que ellos
estan distribuidos pseudoaleatoriamente. Esto implica que la parte estructurada
de los primos que estamos por analizar es bastante simple: su distribucion de
probabilidad es constante. Esto permite usar el teorema de Szemeredi y concluir
la prueba del resultado de Green y Tao.
Para cerrar este captulo introductorio, mostraremos al lector algunas escenas del proximo captulo:
como el esquema recientemente propuesto de la prueba del teorema 1.1.13
esta lejos de ser sencillo, comenzaremos por revisar en el proximo captulo
las demostraciones de dos teoremas ya citados aqu, a saber, los teoremas
de van der Waerden y Roth;
nuestro plan es presentar dos pruebas del teorema de van der Waerden y
una prueba del teorema de Roth; la primera demostracion del teorema de
van der Waerden tendra tenor combinatorio y la segunda demostracion
de este resultado tendra tenor ergodico; en seguida, presentaremos una
prueba de Analisis Armonico del teorema de Roth;
la razon de mostrar diversas pruebas de estos resultados es que todas ellas
inspiran (de una manera u otra) los argumentos de la prueba del teorema
de Green y Tao .

1.5.
1.5.1.

Ap
endice
Demostraci
on del teorema de Dirichlet para el caso
a=1

En esta seccion daremos una prueba del teorema 1.1.2 en este caso particular
usando polinomios ciclotomicos.
2
k
Sean n = cos( 2
n + sin n ). Entonces tenemos que n 6= 1 para todo k =
k
j
1, . . . , n 1 y n 6= n para todos 1 k < j n 1. Podemos escribir entonces:
Xn 1 =

n1
Y
j=0

(X nj ).


CAPITULO 1. NUMEROS
PRIMOS

22

Observe que = nk es una raz primitiva de la unidad si, y solo si, (k, n) = 1.
Ademas, el n
umero de races n-esimas primitivas de la unidad es dado por (n)
donde es la funcion de Euler. Por tanto el polinomio siguiente es el polinomio
de menor grado que posea todas las races n-esimas primitivas de la unidad:
Y
n (x) =
(X nk ).
1kn1 , (k,n)=1

Y tenemos que X n 1 =

m (X).

m|n

Es un ejercicio demostrar que si p es primo y r 1 entonces:


p (X)
pr (X)

=
=

X p 1
X1
pr

X p1 + X p2 + + X + 1

X 1
X pr1 1

Xp

r1

(p1)

r1

+ Xp

(p2)

+ + Xp

r1

+ 1.

Observe que para todo k 1, k (X) es monico con coeficientes enteros y


que si k > 1 tenemos que k (0) = 1. Tambien se puede probar que k (1) es
igual a p si k es una potencia de p y es igual a 1 caso contrario. Finalmente se
puede demostrar que |k (a)| > 1 para todo a > 1.
Vamos a usar las siguientes identidades. Si p es primo y divide n entonces
pm (X) = m (X p ) y si p no divide m y r 1 entonces:
r

m (X p )
mpr (X) =
.
m (X pr1 )
Ademas, utilizaremos un resultado debido a Legendre que dice que los siguientes conjuntos formados por primos son iguales:
E1
E2
E3

= {p ; p|an 1 ,pero p am 1, 1 m n 1}
= {p ; p|n (a) y p 1 (mod n)}
= {p ; p n y p|n (a)}.

Con este resultado, podemos probar el teorema de Dirichlet en el caso en el


que a = 1. Sean pi 1 (mod b) primos con i = 1 . . . r y defina N = bp1 . . . pr .
Tenemos entonces que |b (N )| > 1.
Tome p un primo que divide b (N ). Por las identidades arriba citadas, vemos
que b (N ) b (0) 1 (mod N ). Por tanto p no divide a N , luego p no divide a
b. Usando el resultado de Legendre, tenemos entonces p 1 (mod b) y p 6= pi con
i = 1 . . . r. Repitiendo el proceso, encontramos infinitos primos en la progresion
aritmetica {1 + kb} con k 1.

1.5.2.

Demostraci
on del teorema de los n
umeros primos

Seguiremos la prueba presentada en el libro [DMcK]. Denotemos por a la


funcion de van Mangoldt:
(
log p si n = pm
(n) :=
0 caso contrario


1.5. APENDICE
y Q(x) =

23

(n). Probaremos el teorema 1.1.8 en 4 etapas:

nx

Primera etapa: El teorema de los n


umeros primos
lm

es equivalente a

(x) log x
= 1.
x

1X
(n) = 1.
x x
lm

nx

En efecto, dado p primo, tenemos que |{n x : n = pr para algun r}|


Luego,
X
X
(n) =
|{n x : n = pr para algun r}| log p

log x
log p .

nx

px

X log x
log p (x) log x.
log p

px

Por otro lado, fijando y = x/ log2 x, tenemos


(x) = (y) +

1y+

y<px

X
X (n)
x
(n)

.
+
=
2
x
log y
log x nx log
2
nx
log x

Esto termina la primera etapa.


Segunda etapa: Comparaci
on entre la funci
on de van Mangoldt
y la de Riemann.
Recordemos que la funcion zeta de Riemann esta definida por
(s) =

ns ,

n=1

donde s = a + ib. Observe que es holomorfa en a = <(s) > 1 porque |ns | =


na . Derivando esta expresion tenemos
0 (s) =

ns log n =

n=1

donde

ns

XX

P (n, p, k),

p k=1

n=1

(
log p si pk |n
P (n, p, k) :=
0 caso contrario .

En particular,
0 (s) =

X
p

log p

X
X
k=1 pk |n

ns =

X
p

log p

(pk n)s =

k=1 n=1

X
p

log p

X
k=1

pks (s).


CAPITULO 1. NUMEROS
PRIMOS

24
Como (s) 6= 0 en {a > 1}, tenemos

f
ty

X
X
X
0 (s) X
ks
s
=
p
=
n (n) =
ns (Q(n) Q(n 1))

log p
(s)
p
n=2
n=2
k=1

(x)(n

n=1 xn

=s

(n + 1)

)=

n+1
Z

y s1 dy

(x)

n=1 xn

X
X

(n) xs1 dx.

nx

(1.1)
Tercera Etapa: Considere la funci
on
f (b) =

1
0 (s)

,
(s)
s1

donde s = 1 + + ib, 0 < < 1.


De la ecuacion (1.1) vemos que el cambio de variables x ey implica
Z

f (b) =

(ey Q(y) 1)ey eiby dy.

Dada k una funcion suave con decaimiento en el infinito, multiplicamos esta


igualdad por eibx k(b), integramos en b R y usamos la estimativa trivial Q(x)
x log x para obtener
Z

Z
e

ibx

b
k(x y)(ey Q(y) 1)ey dy.

k(b)f (b)db =
0

En la cuarta etapa adelante vamos a probar que |f (b)| es acotada por un


m
ultiplo constante de 1 + b4 y que existe una funcion f0+ tal que f f0+
cuando 0+.
Asumiendo moment
aneamente estos dos hechos, vamos a concluir la prueba
del teorema 1.1.8 de los n
umeros primos: haciendo 0+, tenemos
Z

Z
e

ibx

k(b)f0+ (b)db =

b
k(x y)(ey Q(y) 1)dy.

Como kf0+ es integrable, el lema de Riemann-Lebesgue implica


Z
lm b
k(x y)ey Q(y)dy = lm b
k(x y)dy =

b
k(y)dy.


1.5. APENDICE

25

Tomamos b
k una funcion suave soportada en [, ] tal que b
k 1 en [, ],
donde 0 < < < son parametros ajustables. Se sigue que
Z
b
2 <
k(y)dy = lm b
k(x y)ey Q(y)dy

x+

ey Q(y)dy lm inf ex+ Q(ex+ )2


x

Q(x) 2
= lm inf
e 2.
x
x

lm inf
x

y
Z

2 >

b
k(y)dy = lm b
k(x y)ey Q(y)dy

x+

ey Q(y)dy lm sup ex Q(ex )2


x

Q(x) 2
= lm sup
e
2.
x
x

lm sup
x

Uniendo estas dos desigualdades, obtenemos


2
Q(x)

Q(x)
e
lm inf
lm sup
e2 .
x

x
x

x
Haciendo y 0 (en este orden), finalizamos la prueba del teorema de
los n
umeros primos (modulo la cuarta etapa a seguir).
Cuarta Etapa: |f (b)| C(1 + b4 ) y f f0+ cuando 0+.
Probaremos estas dos propiedades a traves de 6 afirmaciones
R bxcx+ 21
1
1. (s) = s 1
dx + s1
+ 12 ; en particular, (s) es holomorfa
xs+1
en {a > 0} excepto por un u
nico polo (simple) en a = 1.
Demostraci
on.

Z n+1
n x + 12
1
1
1
s
1
1
s
dx = n +

.
xs+1
2
ns
(n + 1)s
s 1 ns1
(n + 1)s1
n
Por tanto,

Z


X
X
bxc x + 12
1
1
s
s
s
dx =
n+
n
n
ns
=
s+1
x
2
2
s1
1
n=1
n=2
X
3
s
3 s1
1
=
ns +
= (s) 1 +

=
2
s

1
2
s

1
s

1
n=2
= (s)

1
1
.
s1 2


CAPITULO 1. NUMEROS
PRIMOS

26
2. (s) =

(1 ps )1 para a > 1 (formula del producto de Euler).

pP

Demostraci
on. Tenemos las formulas
(1 2s )

X
n=1

(1 3s )(1 2s )

ns =

ns

n no es divisible por 2

ns =

n=1

n no es divisible por 2,3

..
.
(1 ps ) . . . (1 3s )(1 2s )

ns =

n=1

ns .

n no es divisible por 2,3,...,p

Esto termina la prueba de la afirmacion porque


X
ns 1
n no es divisible por 2,3,...,p

cuando p .
3. (a)3 |(s)|4 |(s + ib)| 1 para s = a + ib , a > 1.
Demostraci
on. Esta desigualdad es una consecuencia inmediata de la formula de Euler y de la identidad trigonometrica 3 + 4 cos() + cos(2) =
2(1 + cos())2 . En efecto, la formula de Euler implica
!

X
XX
1 ns
s
n p
(s) = exp
log(1 p ) = exp
p

de donde

p n=1

|(s)| = exp

XX

!
n1 pna cos(nb log p) .

p n=1

Por tanto, la identidad trigonometrica 2(1+cos())2 = 3+4 cos()+cos(2)


implica
(a)3 |(s)|4 |(s + ib)| =

XX
exp
n1 pna (3 + 4 cos(nb log p) + cos(2nb log p))
p n=1

1
porque 2(1 + cos())2 0.


1.5. APENDICE

27

4. (s) 6= 0 para s = 1 + ib.


Demostraci
on. Suponga que existe s = 1 + ib con (s) = 0. Logicamente
b 6= 0 (es decir, s 6= 1). Entonces, siendo holomorfa en 1 + ib, tenemos
|(1++ib)| C para 0 < < 1/2 (donde C es una constante numerica).
Pero, las afirmaciones 1 y 3 anteriores dicen que
1 (1 + )3 |(1 + + ib)|4 |(1 + + 2ib)| C 3 4 ,
una contradiccion para > 0 peque
no.
5. f0+ existe.
1
Demostraci
on. La funcion 1 := s1
es holomorfa en {a > 0} por la
afirmacion 1 y (s 1) 6= 0 en a = 1 por las afirmaciones 1 y 4. Luego,

f (b) =

1
(s 1)10 (s) + s1 (s) + 1
0 (s)

=
s(s) s 1
s(s 1)(s)

es analtica en un abierto conteniendo la region {a 1}. De ah resulta


directamente la existencia de f0+ .
6. |f (b)| C(1+b4 ) para 0 < < 1, donde C es una constante num
erica.
Demostraci
on. |f (b)| es limitado por una constante para 0 < < 1 y
|b| 1 por los mismos argumentos de la prueba de la afirmacion 5. En
la porcion restante 0 < < 1, |b| > 1, estimamos |f (b)| de la siguiente
manera: en esta region, por la afirmacion 1, existen constantes numericas
c1 , c2 tales que |(a + ib)| c1 |b| y (a) c2 (a 1)1 para a (1, 2) ;
luego, la afirmacion 3 implica la existencia de una constante c3 con
|(a + ib)| (a)3/4 |(a + 2ib)|1/4 c3 (a 1)3/4 |b|1/4
para 1 < x a < 2. Ademas, una segunda aplicacion de la afirmacion 1
implica | 0 (a + ib)| c4 |b| para una constante c4 ; de ah se sigue que
Z x
|(a+ib)| |(x+ib)|
| 0 (y+ib)|dy c3 (x1)3/4 |b|1/4 c4 (x1)|b|
a

para 1 < a x < 2. Combinando estas dos estimativas, tenemos que existe
una constante numerica c5 tal que, para todo 1 < a < 2 y 1 < x < 2,
|(a + ib)| c3 (x 1)3/4 |b|1/4 (1 c5 (x 1)1/4 |b|5/4 ).
Tomando x = 1 + c6 |b|5 (con c6 < 1 para que 1 < x < 2 cuando |b| 1)
, tenemos
3/4

1/4

|(a + ib)| c3 c6 |b|15/4 (1 c5 c6 ) c7 |b|4

28

CAPITULO 1. NUMEROS
PRIMOS
para una eleccion adecuada de c6 . Luego, existe una constante numerica
c8 > 0 tal que
0

(s)
c4 |b|

+ 1
|f(b) |

+ 1 c8 (1 + b4 ).

s(s)
|s 1|
|b|c7 |b|4

Con esto terminamos la cuarta etapa y la demostracion del teorema 1.1.8.

Captulo 2

Demostraci
on de los
teoremas de van der
Waerden y de Roth
En este captulo veremos tres argumentos de distinta naturaleza para resolver el problema de encontrar progresiones aritmeticas en ciertos conjuntos de
n
umeros enteros.

2.1.

Demostraci
on Combinatoria del teorema de
van der Waerden

Esta seccion esta reservada para la demostracion del teorema de Van der
Waerden a traves del metodo de colorear de Combinatoria. Para no sobrecargar
la notacion, vamos a denotar a la progresion aritmetica a, a + r, . . . , a + (k 1)r
por a + [0, k)r, y vamos a suponer que tenemos m colores, con los cuales vamos
a colorear los n
umeros naturales del 1 al N .
Definici
on 2.1.1. Sea c : {1, . . . , N } {1, . . . , m} una manera de colorear.
Dados k 1, d 0 y a {1 . . . , N }, un ventilador de radio k, grado d con punto
base a es una d-tupla de progresiones aritmeticas (a + [0, k)r1 , . . . , a + [0, k)rd )
donde r1 , . . . , rd > 0. Para cada 1 i d las progresiones a + [1, k)ri son
llamadas de aspas del ventilador. Decimos que el ventilador es policromatico si
su punto base y sus aspas son monocromaticas. Es decir, existen colores distintos
c0 , c1 , . . . , cd tales que c(a) = c0 y c(a + jri ) = ci para j = 1, . . . k y i = 1, . . . d.
Observe que por la distincion de los colores, si tenemos m colores, es imposible obtener un ventilador policromatico con grado mayor o igual a m.
Es claro que el teorema de van der Waerden sigue del siguiente teorema:
Teorema 2.1.2. Sean k, m 1. Entonces existe N tal que cualquier coloraci
on
de {1, . . . , N } con m colores contiene una progresi
on aritmetica monocrom
atica
29

DE LOS TEOREMAS DE VAN DER WAERDEN Y DE ROTH


30CAPITULO 2. DEMOSTRACION
de tama
no k .
Demostraci
on. La prueba sera realizada en dos pasos inductivos. Primero, realizaremos induccion en k: observe que el caso k = 1 es trivial; tomemos k 2
y supongamos que el teorema es verdad para k 1.
Entonces hacemos induccion en d. Es decir, afirmamos que dado d, existe
N tal que cualquier coloracion con m colores de {1, . . . , N } contiene o una
progresion aritmetica monocromatica de tama
no k o un ventilador policromatico
de radio k y grado d. Note que el caso d = 0 es trivial y si probasemos que eso
vale para d = m entonces por la observacion hecha anteriormente, obtendramos
la progresion monocromatica.
Vamos a tomar d 1 y suponer que la afirmacion vale para d 1. Sea N =
4kN1 N2 , donde N1 y N2 seran escogidos despues y A = {1, . . . , N }. Sea entonces
c : {1, . . . , N } {1, . . . , m} la coloracion. Obviamente {bkN1 + 1, . . . , bkN1 +
N1 } es un subconjunto de A con N1 elementos para b = 1, . . . N2 . Por la hipotesis
de induccion en k y d si N1 es muy grande, este conjunto posee una progresion
monocromatica de tama
no k o un ventilador policromatico de radio k y grado
d 1. Si para alg
un b encontramos una progresion monocromatica, terminamos.
Por tanto, vamos a suponer que para todo b = 1, . . . N2 siempre encontramos
un ventilador policromatico.
Luego, para cada b = 1, . . . , N encontramos a(b), r1 (b), . . . , rd1 (b) {1, . . . , N1 }
y colores distintos c0 (b), c1 (b), . . . , cd1 (b) {1, . . . m} tales que c(bkN1 +a(b)) =
c0 (b) y c(bkN1 + a(b) + jri (b)) = ci (b) para j = 1, . . . , k 1 y i = 1, . . . , d 1,
que llamaremos primera y segunda propiedad del ventilador generado por b.
En particular, la aplicacion b (a(b), r1 (b), . . . , rd1 (b), c0 (b), . . . , cd1 (b)) es
una coloracion con md N1d colores del conjunto {1, . . . , N2 }. Nuevamente por la
hipotesis de induccion en k si N2 es muy grande, entonces existe una progresion
monocromatica b + [0, k 1)s en esta nueva coloracion, cuyo color es de la forma
(a, r1 , . . . , rd1 , c1 , . . . , cd1 ). Revirtiendo la posicion de la progresion, podemos
asumir que s es negativo, de ser necesario.
Ahora, la idea es transformar una progresion de ventiladores identicos en un
nuevo ventilador con grado aumentado en uno, para completar el paso de induccion. Sea entonces b0 = (b s)kN1 + a {1, . . . , N } y considere el ventilador:
(b0 + [0, k)skN1 , b0 + [0, k)(skN1 + r1 ), . . . , b0 + [0, k)(skN1 + rd1 ))
de radio k, grado d y punto base b0 .
Vamos a verificar que las aspas son monocromaticas. En la primera aspa:
c(b0 + jskN1 ) = c((b + (j 1)s)kN1 + a) por substitucion y por la primera
propiedad del ventilador generado por b + (j 1)s tenemos que c((b + (j
1)s)kN1 + a) = c0 (b + (j 1)s) = c0 (b) (pues la progresion b + [0, k 1)s
es monocromatica si 1 j k 1). Da la misma forma, usando la segunda
propiedad del ventilador, tenemos que si 1 j k 1 y 1 t d entonces:
c(b0 + j(skN1 + rt )) = c((b + (j 1)s)kN1 + a + jrt ) = ct (b + (j 1)s) = ct .
Si el punto base b0 tiene el misma color de un aspa, entonces encontramos una
progresion monocromatica de tama
no k, caso contrario el punto base tiene color

ERGODICA

2.2. DEMOSTRACION
DEL TEOREMA DE VAN DER WAERDEN31
distinto al de sus aspas y por tanto encontramos un ventilador policromatico de
radio k y grado d. Esto termina el paso inductivo y la prueba de los teorema.

2.2.

Demostraci
on Erg
odica del teorema de van
der Waerden

Uno de los objetos basicos del estudio de la Teora Ergodica es la transformacion shift. A continuacion daremos la definicion de shift y veremos como
Furstenberg uso tal maquinaria para dar una prueba del teorema de van der
Waerden.
Sea A = {a1 , . . . , ak } un alfabeto finito. Entonces consideramos todas las
palabras infinitas compuestas por letras de este alfabeto:
= {(x1 , x2 , . . . , xn , . . . ) ; xi A}.
Este conjunto puede ser visto como un espacio metrico, a traves de la siguiente distancia: dados x = (x1 , x2 , . . . ) y y = (y1 , y2 , . . . ), defina
1
si k es el menor entero tal que xk 6= yk .
k
El shift es la transformacion T : definida por:
d(x, y) :=

T (x1 , x2 , x3 , . . . ) = (x2 , x3 , x4 , . . . ).
Es sencillo mostrar que el shift es una aplicacion continua con respecto a la
metrica definida arriba.
Con estas definiciones, Furstenberg uso el siguiente teorema de dinamica
topologica para demostrar el teorema de Van der Waerden.
Teorema 2.2.1 (Recurrencia M
ultiple Topologica - Furstenberg y Weiss). Sea
T : X X continua y X un espacio metrico compacto. Para todo k N y
> 0 existe x X y n N tal que d(T in (x), x) < para todo i = 1 . . . n. Si
Z X es denso entonces podemos tomar x Z.
Asumiendo momentaneamente este resultado, veremos como cerrar la prueba del teorema de Van der Waerden. Sea A = {c1 , . . . , ck } el conjunto de colores y z = z1 , z2 , z3 , . . . una coloracion N donde zi A indica el color del
n
umero i. Consideremos entonces z AN y T : AN AN el shift, recordando
la definicion de distancia, tenemos que para x, y AN y m, l N tenemos que
d(T m (x), T l (y)) < 1 si y solo si xm+1 = yl+1 .
En particular, si z AN entonces la progresion aritmetica m, m + n, . . . , m +
kn tiene el misma color si zm = zm+n = = zm+kn , o sea si:
d(T m1 (z), T m1+in (z)) = d(T m1 (z), T in (T m1 (z))) < 1, para i = 1, . . . k.
Tomando X = {T m (z)}
m=0 tenemos que X es compacto, T es continua en X
y el conjunto Z = {T m (z)}
m=0 es denso en X. Entonces el teorema de Van der
Waerden sigue del teorema 2.2.1.

DE LOS TEOREMAS DE VAN DER WAERDEN Y DE ROTH


32CAPITULO 2. DEMOSTRACION
Demostraci
on del teorema 2.2.1. La primera observacion es que si para alg
un
k y la primera parte del teorema vale para x, entonces ella vale para una
vecindad entera de x y por tanto para alg
un punto de Z.
Despues, usando el lema de Zorn, podemos suponer que X es minimal, es
decir que X no posee ning
un subconjunto cerrado Y proprio tal que T (Y ) Y .
En particular, los conjuntos {T m (x)}
m=0 son densos en X. Esto muestra la
afirmacion para k = 1, pues por densidad existe n N tal que d(T n (x), x) < .
La demostracion seguira por induccion. Supongamos que el teorema vale
para alg
un k 1, es decir, para todo > 0 existen x X y n N tales que
d(T in (x), x) < para i = 1, . . . , k. Afirmamos que el conjunto de tales puntos
es denso en X. De hecho, sea U X un abierto y B U una bola de radio
menor que . Definimos Bm = (T m )1 (B), entonces estos conjuntos forman
un recubrimiento de X por la minimalidad de X. Por compacidad tenemos un
subrecubrimiento finito {Bm1 , . . . , Bmr }. Sea > 0 el n
umero de Lebesgue de
este recubrimiento, o sea, tal que toda bola de radio esta contenida en alguna
abierto de este recubrimiento. Sea entonces x y n tales que d(T in (x), x) <
para i = 1, . . . , k y D la bola de centro x y radio . Entonces existe j tal que
D Bmj . En particular T mj (D) B, o sea, T m (T in (x)) pertenece a bola de
radio centrada en T mj (x) U . Esto prueba la densidad.
Ahora vamos a finalizar la demostracion del teorema. Dado > 0, por la
hipotesis de induccion podemos encontrar x y n0 tales que d(T in0 x0 , x0 ) < /2
para i = 1, . . . , k. Tomando x1 tal que T n0 (x1 ) = x0 , tenemos que d(T (i+1)n0 x0 , x0 ) <
/2 para i = 1, . . . , k. Por tanto tenemos que d(T in0 (x), x) < /2 para i =
1, . . . , k + 1. Por continuidad, existe 1 < tal que si d(y, x) < 1 entonces
d(T in0 (y), x) < /2 para i = 1, . . . , k + 1. Por la hipotesis de induccion nuevamente, existe y1 tal que d(y1 , x1 ) < 1 y n1 tal que d(T in1 (y1 ), y1 ) < 1 /2 para
i = 1, . . . , k. Por la desigualdad triangular tenemos que:
d(T in0 (T (i1)n1 (y1 )), x0 ) < 2 para i = 1, . . . , k + 1.
Procediendo de esta manera (tomando x2 tal que T n1 (x2 ) = y1 ) encontramos
puntos x2 , x3 , X y naturales n2 , n3 , . . . tales que para todo l tenemos:
d(T inl1 (xl ), xl1 )
d(T i(nl1 +nl2 ) (xl ), xl2 )
d(T i(nl1 ++n0 ) (xl ), x0 )

<
<
...
<

/2
/2
/2 para i = 1, . . . , k + 1.

Por compacidad, existen l > m tal que d(xl , xm ) < /2. Por desigualdad triangular tenemos que:
d(T i(nl+1 ++nm ) (xl ), xl ) < , para i = 1, . . . , k + 1.
Para concluir, es suficiente tomar x = xl y n = nl1 + + nm .

DEL TEOREMA DE ROTH VIA ANALISIS

2.3. DEMOSTRACION
ARMONICO33

2.3.

Demostraci
on del teorema de Roth va An
alisis Arm
onico

Conforme dijimos en el primer captulo del libro, vamos a ver un peque


no
argumento para encontrar progresiones aritmeticas de tama
no 3 (es decir, 3PAs) en conjuntos de densidad positiva, lo que a pesar de ser muy particular y
especfico, contiene buena parte de las ideas que iremos a estudiar mas tarde.
Definici
on 2.3.1. Dada f : ZN C una funcion y A ZN un subconjunto de
ZN , denotamos por
1 X
E(f |A) :=
f (n).
|A|
nA

Cuando A = ZN , escribimos por brevedad E(f ) := E(f |ZN ).


Definimos 3 (f, g, h) = E(f (n)g(n + r)h(n + 2r) : n, r ZN ). El teorema 1.1.5 de Roth es una consecuencia del siguiente resultado:
Teorema 2.3.2. Para toda f : ZN R no negativa con
0 < kf kL1 (ZN ) kf kL (ZN ) 1
se tiene
3 (f, f, f ) c(3, ) o (1).
En otras palabras, queremos cotas inferiores para 3 (f, f, f ). Comenzamos
con la observacion simple de que cotas superiores son faciles de obtener: por
ejemplo, por la desigualdad de Young,
|3 (f, g, h)| kf kLp kgkLq khkLr ,
si 1 p, q, r y p1 + 1q + 1r 2.
Por otro lado, estamos interesados solamente por cotas inferiores para 3
y, a priori, las estimativas superiores no parecen ser u
tiles para probar cotas
inferiores. Sin embargo, podemos descomponer f en una parte buena g = E(f )
y otra parte ruin b = f E(f ). Usando la multilinealidad de 3 , podemos
descomponer 3 (f, f, f ) en ocho pedazos:
3 (f, f, f ) = 3 (g, g, g) + + 3 (b, b, b).
Por hipotesis, E(f ) , de donde el primer termino es 3 (g, g, g) 3 .
Luego, buenas cotas superiores para los otros terminos (por ejemplo, la suma de
los siete terminos restantes es de magnitud menor que 3 ) nos llevara a concluir
del teorema de Roth.
La estimativa arriba (va desigualdad de Young) no es suficiente buena, a
menos que este proximo a 1 (digamos > 2/3). Sin embargo, podemos refinar
nuestro argumento de cotas superiores usando la transformada de Fourier :
fb() := E(f (x)eN (x) : x ZN ),

DE LOS TEOREMAS DE VAN DER WAERDEN Y DE ROTH


34CAPITULO 2. DEMOSTRACION
donde eN (x) := exp(2ix/N ). De la formula de inversion
X
f (x) =
fb()eN (x)
ZN

obtenemos que
X
3 (f, g, h) =
fb(1 )b
g (2 )b
h(3 )E(eN (n1 +(n+r)2 +(n+2r)3 ) : n, r ZN ).
1 ,2 ,3

Las esperanzas del lado derecho son 1 si 1 = 3 y 2 = 21 y 0 caso contrario.


En particular,
X
3 (f, g, h) =
fb()b
g (2)b
h().
ZN

De la formula de Plancherel kf kL2 (ZN ) = kfbkl2 (ZN ) y de la desigualdad de


Holder, se sigue que
|3 (f, g, h)| kf kL2 (ZN ) kb
g kL4 (ZN ) kb
hkl4 (ZN ) .

(2.1)

Usando esta estimativa, podemos demostrar:


Proposici
on 2.3.3. Supongamos que f admite una descomposici
on f = g + b
donde
kgkL (ZN ) , kbkL (ZN ) = O(1)
y
kgkL1 (ZN ) , kbkL1 (ZN ) = O().
Entonces
y

3 (f, f, f ) = 3 (g, g, g) + O( 5/4 kbbkl4 (ZN ) )


3 (f, f, f ) = 3 (g, g, g) + O(kbbkl (ZN ) ).

Demostraci
on. Por hipotesis, kgkL2 (ZN ) , kbkL2 (ZN ) = O( 1/2 ), de ah una aplicacion de Plancherel nos dice que
kb
g kl2 (ZN ) , kbbkl2 (ZN ) = O( 1/2 ).
Ademas, las cotas L1 de g y b implican
kb
g kl (ZN ) , kbbkl (ZN ) = O().
Luego, la desigualdad de Holder nos conduce a
kb
g kl4 (ZN ) , kbbkl4 (ZN ) = O( 3/4 ).
La proposicion sigue descomponiendo 3 (f, f, f ) en ocho partes y usando (2.1).

DEL TEOREMA DE ROTH VIA ANALISIS

2.3. DEMOSTRACION
ARMONICO35
Esta proposicion sugiere que una estrategia para encontrar cotas inferiores
no triviales de 3 (f, f, f ) es descomponer f = g + b en una funcion buena g
poseyendo el valor 3 (g, g, g) alto y una funcion ruin b con norma l4 de su
transformada de Fourier peque
na.
El lector atento debe haber percibido que ya indicamos una posible descomposiciones: g = E(f ) y b = f E(f ). Note que tenemos la cota 3 (g, g, g)
3 , una estimativa relativamente buena, mas no tenemos buenas cotas para
kbbkl4 (ZN ) ; nuestras mejores cotas hasta ahora son O( 3/4 ), lo que es ruin porque
permite que el error domine al termino principal.1
Sin embargo, podemos eliminar el caso b = f E(f ) linealmente uniforme, es
decir, kbbkl 2 /100. El problema consiste en que hacer si b no es linealmente
uniforme. En este caso, se adopta la idea de usar un argumento de incremento
en la energa, es decir,
Argumento de incremento de energa: cada vez que b no es uniforme,
sustituimos g por una funcion con norma L2 mayor. Al final de un n
umero
finito de pasos, se espera llegar a una funcion b uniforme (ya que la energa
es finita).
Logicamente, esta idea tiene que ser trabajada en detalle para ver que ella
conduce a la conclusion de la demostracion del teorema de Roth. Para esto,
vamos a introducir la definicion:
Definici
on 2.3.4. Dado K un entero positivo, llamaremos a las funciones f :
ZN C de la forma
f (x) =

K
X

cj exp(2ij x/N ),

j=1

donde |cj | 1 y j ZN , funciones K-casiperi


odicas. Ademas, fijando > 0,
decimos que una funcion f es (, K)-casiperi
odica si kf fqp kL2 (ZN ) para
alguna funcion K-casiperiodica fqp .
Observaci
on 2.3.5. Note que si f y g son funciones (, K)-casiperiodicas entonces f g es (2, K 2 )-casiperiodica.
Una propiedad importante al ser f una funcion casiperiodica es que podemos
obtener buenas cotas inferiores de 3 (f, f, f ), en este caso:
Lema 2.3.6 (Recurrencia M
ultiple de funciones casiperiodicas). Dados 0 <
< 1, M 1, 0 < 3 /100M y 0 f M una funci
on no negativa acotada
(, K)-casiperi
odica con E(f ) , entonces
3 (f, f, f ) c(K, M, ) oK, (1),
para algun c(K, ) > 0.
1 En

efecto, f = [1,N ] posee 3 (f, f, f ) 2 y 3 (g, g, g) = 3 , por mencionar un ejemplo.

DE LOS TEOREMAS DE VAN DER WAERDEN Y DE ROTH


36CAPITULO 2. DEMOSTRACION
PK
Demostraci
on. Sea fqp (x) = j=1 cj exp(2ixj /N ) una funcion K-casiperiodica aproximando f y tome = (K, ) > 0 una constante peque
na.
Por el teorema de aproximacion simultanea de Dirichlet (el cual resulta del
principio del palomar), tenemos
E(krj k para todo j ; r ZN ) c(, K).

(2.2)

Aqu es fundamental resaltar que la constante c(, K) > 0 no depende de


N . Por otro lado, considerando la dinamica T (x) := x + 1 y fijando r tal que
krj k (donde 1 j K), tenemos:
kfqp T r fqp kL2 (ZN ) C(K).
Esto combinado con la desigualdad triangular implica:
kf T r f kL2 (ZN ) 3 /50M + C(K).
Aplicando T r nuevamente en la estimativa de arriba obtenemos tambien
kf T 2r f T r k 3 /50M + C(K).
Como la funcion f es acotada, de estas estimativas resulta que:
kf (f T r ) (f T 2r ) f 3 kL1 (ZN ) 3 /2 + C(K).
Sin embargo, siendo f 0, usando nuestra hipotesis E(f ) y a desigualdad
de Holder, obtenemos
kf 3 kL1 (ZN ) kf k3L1 (ZN ) 3 .
Luego, E(f (f T r ) (f T 2r )) 3 /2 C(K). Escogiendo > 0 peque
no
dependiendo de y K, se sigue que
E(f (f T r ) (f T 2r )) 3 /4.
Como f 0, tomando la media en r y usando (2.2), podemos concluir
E(f (n) (f T r )(n) (f T 2r )(n) | n, r ZN ) 3 c(, K)/4.
Siendo 3 (f, f, f ) = E(f (n) (f T r )(n) (f T 2r )(n) | n, r ZN ), terminamos
la demostracion del lema.
Pretendiendo utilizar este lema estaremos interesados en descomponer funciones arbitrarias en una suma de una funcion casiperiodica y una funcion linealmente uniforme. Con esta meta, veremos como construir sigma-algebras cuyas
funciones medibles sean todas casiperiodicas:
on de la forma (x) := exp(2ix/N ).
Lema 2.3.7. Sean 0 < 1 y una funci
Entonces, existe una sigma-
algebra B, tal que k E(|B, )kL (ZN ) C
y para todo > 0 existe K = K(, ) > 0 con la siguiente propiedad: toda
f funci
on B, -medible satisfaciendo la estimativa kf kL (ZN ) 1 es (, K)casiperi
odica.

DEL TEOREMA DE ROTH VIA ANALISIS

2.3. DEMOSTRACION
ARMONICO37
Demostraci
on. Seguiremos un proceso aleatorio para obtener la sigma-algebra
deseada: tome un n
umero complexo en el cuadrado unitario y sea B, la
sigma-algebra cuyos atomos tienen la forma 1 (Q), donde Q es un cuadrado
tal que os vertices de Q estan sobre Z2 . Note que esta sigma-algebra posee
O(1/) atomos y k E(|B, )kL (ZN ) C. En particular, resta solamente
verificar la segunda parte del lema para finalizar la demostracion. Observe que
es suficiente verificar el resultado deseado para = 2n (donde n 1) con
probabilidad 1 O() en . Como B, posee O(1/) atomos, es suficiente
considerar el caso cuando f es igual a la funcion caracterstica de un atomo A
de B, y probar la propiedad deseada con probabilidad 1 O(c()). Note que
en esta situacion podemos reescribir f como f (x) = 1Q ((x) ). Aplicando
el teorema de aproximacion de Weiertrass en el disco |z| O(1/), encontramos
un polinomio P (z, z) con C(, ) terminos y coeficientes acotados por C(, ) tal
que |P | 1 en el disco |z| O(1/) y |1Q (z) P (z, z)| = O(c()) para todo z
en este disco excepto por un conjunto de medida O(c()2 2 ). Esto implica que
k1Q ((x) ) P ((x) , (x) )kL2 (ZN ) c()
con probabilidad 1 O(c()) en . Pero P ((x) , (x) ) es una combinacion lineal de C(, ) funciones de la forma exp(2ix/N ) con coeficientes
acotados por C(). O sea, P ((x) , (x) ) es una funcion K-casiperiodica (donde K = C(, )). En particular, f es una funcion (, K)-casiperiodica.
Esto concluye la demostracion de este lema.
Un corolario u
til de este lema es:
Corol
ario 2.3.8. Sean 0 < j 1 y j (x) = exp(2ixj /N ), donde j =
1, . . . , n. Denote por Bj ,j las sigma-
algebras provistas por el lema de arriba.
Entonces, para todo > 0, existe K = K(n, , 1 , . . . , n ) tal que toda f funci
on
B1 ,1 Bn ,n -medible satisfaciendo la estimativa kf kL (ZN ) 1 es (, K)casiperi
odica.
Demostraci
on. Como el n
umero de atomos en la sigma-algebra B1 ,1
Bn ,n es C(n, 1 , . . . , n ), basta demostrar el corolario en el caso cuando f es
la funcion caracterstica de un atomo de B1 ,1 Bn ,n . Pero, en esta
situacion f es el producto de n funciones de caractersticas de atomos de las
sigma-algebras Bj ,j . Luego, el corolario sigue directamente de la combinacion
del lema anterior con la observaci
on 2.3.5.
Otra propiedad interesante de estas sigma-algebras (ademas de contener funciones casiperiodicas) es que permiten obtener obstrucciones para la uniformidad
lineal :
Lema 2.3.9. Sean b una funci
on acotada con kbbkl (ZN ) > 0 y 0 < .
Entonces, existe una funci
on de la forma (x) = exp(2ix/N ) tal que la sigma
algebra B, asociada satisface
kE(b|B, )kL2 (ZN ) /2.

DE LOS TEOREMAS DE VAN DER WAERDEN Y DE ROTH


38CAPITULO 2. DEMOSTRACION
Demostraci
on. Por definicion, existe una frecuencia tal que |bb()| , es
decir,
|E(b(n) exp(2in/N )|n ZN )| .
Definimos (x) := exp(2ix/N ) y reescribimos la desigualdad de arriba como
|hb, iL2 (ZN ) | .
Por el lema anterior, sabemos que existe una sigma-algebra B, tal que
k E(|B, )kL (ZN ) C.
Por otro lado, siendo b acotada y la esperanza condicional auto-adjunta, podemos combinar las dos estimativas de arriba para concluir que
hE(b|B, ), i = hb, E(|B, )i C.
Esto implica que kE(b|B, )kL2 (ZN ) C /2, lo que finaliza la demostracion del lema.
El u
ltimo ingrediente para la demostracion completa del teorema de Roth
es la siguiente proposicion de estructura:
Proposici
on 2.3.10 (teorema cuantitativo de Koopman-von Neumann). Sean
F : R+ R+ R+ una funci
on arbitraria, 0 < 1, f una funci
on no negativa
acotada satisfaciendo E(f ) y := 3 /100. Entonces, existen una constante
0 < K C(, F ) y una descomposici
on f = g + b tales que g es acotada no
negativa, E(g) = E(f ), g es (, K)-casiperi
odica y b verifica
kbbkl (ZN ) F (, K).

(2.3)

Demostraci
on. La idea sera utilizar el argumento de incremento de energa para
construir g y b. Para esta construccion, necesitaremos de dos sigma-algebras: B
e las cuales siempre tendran la forma B , B , chi durante todo el
y B,
1
1
n
n
argumento. Aun mas, vamos a querer estimativas del tipo
2
2
e 22
kE(f |B)k
L (ZN ) kE(f |B)kL2 (ZN ) + /4.

(2.4)

Observe que por el teorema de Pitagoras, la estimativa de arriba equivale a


e E(f |B)k2 2
kE(f |B)
L (

mathbbZN )

/2.

La demostracion de esta proposicion utilizara el siguiente algoritmo:


Paso 0 : Comenzamos con B y Be iguales a la sigma-algebra trivial {0, ZN }.
Note que la desigualdad (2.4) se satisface automaticamente en este paso.
Paso 1 : Considere B una sigma-algebra de la forma B1 ,1 Bn , chin ,
donde j (x) = exp(2ixj /N ). Siendo la funcion E(f |B) una funcion acotada y B-medible, el corolario 2.3.8 dice que podemos encontrar K dependiendo de , n, 1 , . . . , n tal que E(f |B) es (/2, K)-casiperiodica.

DEL TEOREMA DE ROTH VIA ANALISIS

2.3. DEMOSTRACION
ARMONICO39
e y b = f E(f |B).
e Si kbbkl (Z ) F (, K),
Paso 2 : Hacemos g = E(f |B)
N
terminamos el algoritmo. Caso contrario, vamos para el paso 3;
Paso 3 : Como no terminamos el algoritmo en el paso 2, tenemos kbbkl >
F (, K). Por el lema 2.3.9, podemos encontrar F (, K) y una funcion
de la forma (x) = exp(2ix/N ) con una sigma-algebra asociada B,
tal que
kE(b|B, )kL2 (ZN ) F (, K)/2.
De la identidad
e , )
E(b|B, ) = E(E(f |Be B, ) E(f |B)|B
y del teorema de Pitagoras concluimos tambien que
e L2 (Z ) F (, K)/2.
kE(f |Be B, ) E(f |B)k
N
Aplicando el teorema de Pitagoras nuevamente, obtenemos la estimativa
de incremento de energa:
2
e 22
kE(f |Be B, ) |2L2 (ZN ) kE(f |B)k
L (ZN ) F (, K) /4.

Paso 4 : Sustituimos Be por Be B, . Si a


un la estimativa (2.4) se satisface,
retornamos al paso 2; caso contrario, sustituimos B por Be y vamos para
el paso 1.
Afirmamos que este algoritmo termina. En efecto, fijado B (y consecuentee 22
mente K), cada vez que pasamos por el paso 4 la energa kE(f |B)k
L (ZN )
aumenta en F (, K)2 /4. Luego, el algoritmo termina o la estimativa (2.4) es
infringida en C(, K, F ) = C 2 /F (, K)2 pasos. En el segundo caso, sustituimos B por la sigma-algebra asociada a las C(, K, F ) funciones y parametros
C(, F, K)1 apareciendo en este proceso. Esto implica que la cantidad K
asociada a esta nueva sigma-algebra B sera cambiada por una cantidad de la
forma C(, K, F ) y la energa kE(f |B)k2L2 (ZN ) crece por lo menos 2 /4 gracias a
la infraccion de (2.4). Por otro lado, el hecho de f ser acotada garantiza que esta
energa no puede ser mayor que O(1). Luego, estos cambios de B descritos anteriormente solo pueden ser realizados a lo maximo O( 2 ) veces. Combinando
estas informaciones vemos que el algoritmo entero termina en C(, F ) pasos (y
la cantidad K nunca sobrepasa C(, F ) durante todo el proceso). Esto concluye
la demostracion de la proposicion.
Finalmente, veamos como terminar la demostracion del teorema de Roth:
sea F : R+ R+ R+ una funcion que escogeremos en algunos instantes y
apliquemos la proposicion de arriba para encontrar la descomposicion f = g + b.
Por el lema 2.3.6, sabemos que
3 (g, g, g) c(, K) o,K (1).

DE LOS TEOREMAS DE VAN DER WAERDEN Y DE ROTH


40CAPITULO 2. DEMOSTRACION
Combinando esta desigualdad con (2.3) y la proposicion 2.3.3, tenemos
3 (f, f, f ) c(, K) + O( F (, K)) o,K (1).
Tomando F suficientemente peque
na, podemos absorber el segundo sumando
del lado derecho por el primer sumando, de manera que
3 (g, g, g) c(, K)/2 o,K (1).
Como K C(, F ) = C(), el teorema de Roth esta demostrado.
Para cerrar esta seccion, recapitularemos a continuacion los dos pasos principales de la demostracion del teorema de Roth (lo que inspirara los argumentos
del captulo 4):
primer paso: definir una clase de normas (llamadas normas de Gowers
k.kU k1 ) para controlar la esperanza de que una k-PA este en el soporte
de f ; note que, por la proposicion 2.3.3, en el caso k = 3, la norma l4 de
la transformada de Fourier es un buen candidato;2
segundo paso: generalizar el proceso de incremento en la energa anteriormente discutido.
Finalizando este captulo, adelantamos al lector que nuestro proximo paso sera el estudio del refinamiento de Furstenberg del teorema de recurrencia
m
ultiple topologica usado en la demostracion del teorema de Szemeredi y de la
utilizacion de estas ideas en la prueba del teorema de Green y Tao.

4
2 De hecho, en el caso k = 3, la norma de Gowers k.k
U 2 es la norma l de la transformada;
vea el captulo 4.

Captulo 3

Las ideas de Furstenberg y


el teorema de Green-Tao
Este captulo tiene dos objetivos: estudiar las herramientas de Teora Ergodica envueltas en la demostracion de Furstenberg del teorema de Szemeredi y
presentar la prueba del teorema de Green-Tao modulo dos resultados cuyas
demostraciones seran presentadas en los captulos subsiguientes.

3.1.
3.1.1.

Demostraci
on Erg
odica del teorema de Szemer
edi
Breve Introducci
on a Teora Erg
odica

La Teora Ergodica estudia iteraciones de una transformacion T : X X,


donde X es un espacio medible, desde el punto de vista de una medida que
es invariante por la transformacion T (es decir, para todo subconjunto medible
A tenemos que (A) = (T 1 (A))).
La presencia de la medida invariante da mucha informacion estadstica sobre
la estructura de las orbitas da transformacion T , es decir, de los conjuntos
{T n (x)}
n=0 , para casi todo x X respecto de la medida . Por ejemplo, el
teorema de Poincare afirma que
Teorema 3.1.1 (Recurrencia de Poincare). Si T : X X es -invariante
y (A) > 0 entonces para x -ctp en A tenemos que existe n(x) 1 tal que
T n(x) (x) A. En particular, existe N tal que:
(A T N (A)) > 0.
Demostraci
on. Considere los conjuntos
Bm := {x A : T j (x)
/ A, j m}.
41

42CAPITULO 3. LAS IDEAS DE FURSTENBERG Y EL TEOREMA DE GREEN-TAO


Logicamente, el teorema de recurrencia estara demostrado si mostramos que

S
(B) = (A), donde B := A
Bm . Con esta meta, vemos que es suficiente
m=1

probar que (Bm ) = 0 para todo m 1. Para esto, note que


Bm = A

T j (A)

T j (A)

j=0

j=m

T j (A).

j=m

En particular,
(Bm ) (

T j (A)) (

j=0

T j (A)).

j=m

Por otro lado, siendo una probabilidad T -invariante,


(

T j (A)) = (T m ((

j=m

j=0

T j (A)))) = (

T j (A)).

j=0

Esto concluye la demostracion.


En otras palabras, el teorema de Poincare afirma que, por peque
no que sea
un conjunto, si el tiene medida positiva, existen muchas orbitas (desde el punto
de vista de ) que comienzan dentro de ese conjunto y vuelven infinitas veces
para este conjunto.
A
un sobre el teorema de recurrencia de Poincare observamos que si el espacio
medible X fuese topologico, entonces podemos reformular este resultado de la
siguiente manera:
Sean T : X X una transformaci
on de un espacio medible X el cual es
metrico respecto a una metrica d y es una medida invariante por T .
Entonces, casi todo punto con respecto a es recurrente, es decir, para casi
todo punto x existe una sucesi
on nk de naturales tales que
d(T nk (x), x)) 0 cuando k .
Una pregunta natural es si existen siempre medidas invariantes para una
transformacion T dada. Cuando el espacio X es compacto y la transformacion
es continua, la respuesta es si. En efecto, la idea para la prueba de este hecho es
sencilla: tome una medida arbitraria, y vejamos como esa medida muda por
la accion de la transformacion, o mejor, por la accion de iterados de la transformacion; haciendo una media de esas medidas hasta el iterado N , se puede ver
que, conforme N crece, esa nueva medida tiende a ser menos sensible a la accion
de T ; en este punto tomamos un cierto limite cuando N y esperamos que
exista una medida limite, el cual de acuerdo con nuestro argumento (informal)
sera invariante por T .
Haremos ahora esta construccion con mas detalles. Como vimos en el parrafo
anterior, vamos a tomar un cierto limite de medidas, entonces precisamos de un

ERGODICA

3.1. DEMOSTRACION
DEL TEOREMA DE SZEMEREDI
43
concepto de convergencia de medidas. Como el espacio de medidas de Radon es
el dual del espacio de funciones continuas, es natural usar la topologa debil, una
vez que por el Analisis Funcional tendremos de gracia resultados de compacidad
(ayudando sobre el problema sobre la existencia de un limite).
Definici
on 3.1.2. Decimos que una sucesion de medidas k en X converge debilmente para si para toda funcion continua f : X R vale:
Z
Z
f dk
f d.
X

Como esta topologa es la topologa debil, tenemos por el teorema de BanachAlaoglu que:
El espacio de probabilidades en X, es decir, de medidas tales que (X) = 1
es compacto respecto a la convergencia debil.
Analicemos el problema de la existencia de medidas invariantes. Sea una
probabilidad arbitraria. La accion de los iterados de T en la medida sera dada
por el push-forward, es decir, ((T n ) )(A) := (T n (A)) para todo conjunto
medible A. Una observacion importante es que la propiedad de una medida
ser invariante puede ser traducida en la ecuacion T = .
Vamos a considerar la siguiente sucesion de probabilidades:
k =

k1
1X i
(T ) .
k i=0

En suma, estamos tomando medias temporales de las medidas obtenidas


por push-forward. Por compacidad, vemos que existe una subsucesion nk que
converge debilmente para alguna probabilidad . Afirmamos que es invariante.
De hecho, tenemos las siguientes igualdades que seran explicadas inmediatamente despues:
T = T (lm nk )
= lm(T (nk ))
= lm(

nk 1
1 X
(T i+1 ) ())
nk i=0

= lm(

nk
1 X
( (T i ) () + (T nk ) ))
nk i=0

= lm
=

nk
1 X
(T i ) ()
nk i=0

En segunda igualdad usamos el hecho que el operador T es continuo con


la topologa debil, pues T es continua. De hecho, supongamos que k

44CAPITULO 3. LAS IDEAS DE FURSTENBERG Y EL TEOREMA DE GREEN-TAO


debilmente y sea f : X R continua entonces tenemos que f T tambien es
continua y por tanto:
Z
Z
Z
Z

f d(T k ) =
f T dk
f T d =
f d(T ).
X

Para justificar la quinta igualdad observamos que, para toda f : X R


continua, tenemos por la compacidad de X:
Z
Z
Z
1
1
1
f d 0 y
f d((T nk ) ) =
f T nk d 0.
nk X
nk X
nk X
Luego, los dos u
ltimas sumandos convergen a cero debilmente.
Un ejemplo relevante para nuestras consideraciones futuras de transformaciones con medidas invariantes es el siguiente: sean X = {0, 1}N y T el shift
T (x0 , x1 , . . . , xn , . . . ) = (x1 , . . . , xn , . . . ).
Recordemos que la medida de Dirac x de un punto x X es dada por x (A) = 0
si x
/ A y x (A) = 1 si x A. Por lo que vimos antes, sabemos que la sucesion
Pk1
k = k1 j=0 T j (x) posee un punto de acumulacion en a topologa debil y este
punto es una medida invariante por el shift.

3.1.2.

El teorema de Furstenberg

Con relacion al teorema de Poincare una pregunta natural es saber si dado


un conjunto A con medida positiva existe alguna estructura en el conjunto
de iterados que retornan a A; mas precisamente sabemos que este conjunto
es infinito, pero sera que existe una estructura aritmetica en este conjunto?
Esta pregunta fue resuelta por Furstenberg y su respuesta es conocida como el
teorema de Recurrencia Ergodica M
ultiple de Furstenberg.
Teorema 3.1.3 (Recurrencia Ergodica M
ultiple de Furstenberg). Sean T :
X X -invariante, k 3 y A X con (A) > 0. Entonces existe N tal que
(A T N (A) T (k1)N (A)) > 0.
Este teorema es el corazon de la prueba del teorema de Szemeredi a traves de
metodos de la Teora Ergodica. Enseguida veremos la demostracion del teorema
de Furstenberg en ciertos casos particulares importantes.
El primer ejemplo es tomar un sistema de Bernoulli. Nuevamente, sea A
N
un conjunto finito con r elementos, X = AP
y T el shift en este espacio. Sean
p1 , . . . , pr n
umeros no negativos tales que
pi = 1. Esto da una probabilidad
en A y tomando la medida producto tenemos una probabilidad en X.
La -algebra producto es generada por los cilindros con un n
umero finito n de
coordenadas, estos son conjuntos de la forma C = {w Z; wi1 = j1 , . . . wjn =
jn } y la medida de Bernoulli es dada por (C) = pj1 . . . pjn siendo despues
extendida para la -algebra generada. Es sencillo mostrar que esta medida es

ERGODICA

3.1. DEMOSTRACION
DEL TEOREMA DE SZEMEREDI
45
invariante por el shift (de hecho basta mostrar que (B) = (T 1 (B)) solamente
cuando B es un cilindro).
De la misma manera, como los cilindros generan la -algebra, basta probar
el teorema de Furstenberg para tales conjuntos. Sean entonces C0 , C1 , . . . , Ck
cilindros y observe que si n es muy grande entonces las coordenadas que definen
los cilindros T nl (Cl ) son todas disjuntas. Por tanto, tenemos:
(C0 T n (C1 ) T kn (Ck )) = (C0 )(C1 ) . . . (Ck ) > 0.
Esto demuestra el teorema en este ejemplo.
Otro ejemplo sera un sistema periodico, es decir, una dinamica tal que
T p = T para alg
un p. En este caso, el resultado es totalmente trivial. Una
dinamica menos trivial todava en esta lnea raciocinio es el siguiente ejemplo
casiperiodico: sea X = S 1 = R/Z, la medida de Lebesgue en el crculo y
T (x) = x + (mod 1) para alg
un .
R
Dado A un conjunto medible tal que (A) > 0, note que 1A (x + y)d(x)
es continua en y. Luego, para todo > 0 existe tal que si |y| < entonces
(A (A y)) > (A) . Por tanto:
(A (A y) (A 2y) (A ky)) > (A) (k + 1).
Escoja entonces < (A)
k+1 y tomando el correspondiente, sea el conjunto D =
{n 1; n (, )(mod 1)}. Entonces si n D tenemos que:
(A T n (A) T nk (A)) > (A) (k + 1) > 0.
Notemos que el primer ejemplo es un caso particular de sistema debilmente
misturador (weak-mixing), esto son sistemas que satisfacen la siguiente igualdad, para todo A y B subconjuntos medibles:
N
1 X
lm
((A T n B) (A)(B))2 = 0.
N N
n=1

Adaptando la idea del caso Bernoulli, se prueba que el teorema de Furstenberg


vale para sistemas debilmente misturadores (que podemos llamar tambien de
caso pseudoaleatorio) .
El segundo ejemplo es un caso particular de sistemas compactos, estos son
sistemas tales que para toda funcion f L2 () la clausura del conjunto {f, T f, . . . , T n f, . . . }
es compacto. Adaptando la idea usada para rotaciones, se prueba el teorema de
Furstenberg para sistemas compactos (que podemos llamar tambien de caso
estructurado).
En el contexto general, el teorema de Furstenberg sigue entonces de una
descomposicion en varios niveles del sistema en partes debilmente misturadoras
y compactas que no tienen mucha correlacion entre s a lo largo de una torre de
extensiones. Cabe resaltar que la existencia de esta torre de extensiones es un
hecho altamente no trivial (conocido como teorema de estructura) y esta fuera
del proposito de este libro. Sin embargo, una version de esta idea en un contexto
finitario sera expuesta no captulo 2 do libro.

46CAPITULO 3. LAS IDEAS DE FURSTENBERG Y EL TEOREMA DE GREEN-TAO

3.1.3.

Demostraci
on del teorema de Szemer
edi

Antes de presentar la demostracion correcta del teorema de Szemeredi, veamos


una prueba errada de este resultado como un ejercicio instructivo (sobre la importancia de usar Teora Ergodica adecuadamente).
Demostraci
on ERRADA del teorema de Szemeredi. Considere la transformacion T : Z Z definida por T (n) = n + 1 y la probabilidad dada por
(A) := lm

1
#(A {1, . . . , N }).
N

Note que (A) = (T 1 (A)) (es decir, es T -invariante), de modo que, dados
k 3 entero y A N subconjunto con densidad positiva (es decir, (A) > 0),
k1
T jN
el teorema de Furstenberg proporciona un entero N tal que (
T
(A)) >
j=0

0. En particular,

k1
T
j=0

T jN (A) 6= . Escogiendo x

k1
T

T jN (A), vemos que

j=0

x, x + N, . . . , x + (k 1)N A, lo que finalizara la demostracion. Pero, el error


de este argumento reside en el hecho de que no es una medida!
A pesar de que la demostracion anterior esta errada, una vez provistos del
teorema de recurrencia m
ultiple de Furstenberg, podemos dar una prueba rapida
del teorema 1.1.7 de Szemeredi modificando la idea anterior (basicamente usando
el shift).
Demostraci
on CORRECTA del teorema de Szemeredi. Sea X = {0, 1}N y T :
X X el shift. Sea (xn ) = 1A (n), donde 1A (x) es la funcion caracterstica
Pk1
de A, y considere k = k1 j=0 j (x) . Entonces como vimos, pasando a una
subsucesion si fuese necesario, podemos suponer que = lm k es una medida
invariante para T .
Sea Y = {(yn ); y1 = 1}. Entonces (Y ) = lm k (Y ) = lm k1 |A [1, k]| > 0
por hipotesis. Luego por el teorema de Furstenberg tenemos que existe N tal
que (Y T N (Y ) T (k1)N (Y )) > 0. En particular, existen infinitos
z Y T N (Y ) T (k1)N (Y ). Por tanto, existe x tal que x, x+N, . . . , x+
(k 1)N A. Esto demuestra el teorema de Szemeredi.

3.1.4.

El Teorema de Szemer
edi cuantitativo

En esta seccion veremos algunas reformulaciones del teorema 1.1.7 de Szemeredi (muy u
tiles para nuestros propositos futuros).
Comenzaremos por observar que el teorema de Szemeredi es equivalente a la
siguiente afirmacion:
Para todo k 1 y 0 < 1, existe un entero NSZ (k, ) 1 tal que para todo
N NSZ , todo conjunto A {1, . . . , N }, con cardinalidad |A| N , contiene
por lo menos una progresi
on aritmetica de tama
no k.

ERGODICA

3.1. DEMOSTRACION
DEL TEOREMA DE SZEMEREDI
47
Logicamente, la afirmacion anterior implica directamente el teorema de Szemeredi.
En la otra direccion, mostraremos ahora que, si la afirmacion es falsa para
alg
un par (k, ) entonces existe un conjunto Y N con |Y {1, 2, . . . , n}| r,
r N tal que Y no contiene ninguna progresion aritmetica de tama
no k.
Para eso, probaremos inicialmente que, si no existe NSZ (k, ), entonces, para
cada n N , existe un conjunto Xn {1, 2, . . . , n} con |Xn {1, 2, . . . , k}| k
para 1 k n tal que Xn no contiene ninguna progresion aritmetica de
tama
no k.En efecto, sea n = max ((dke 1)/k) < . Afirmamos que, si N es
1kn

suficientemente grande y A {1, 2, . . . , N } tiene por lo menos N elementos,


entonces existe m N n tal que |A{m+1, . . . , m+k}| k, para 1 k n.
De hecho, si no fuese el caso, existen s N , k1 , k2 , . . . , ksP
{1, 2,
P. . . ,n} tales
que N k1 +k2 + +ks > N n y, para 1 r s, |A
kj ,
kj | < kr ,
j<r

jr

P
P
1
de donde
|A
kj ,
kj | n < , y luego N |A| n+n N , lo que
kr
j<r
jr
n
es absurdo para N >
Luego, basta tomar un conjunto A {1, 2, . . . , n}
n
con por lo menos N elementos que no contenga ninguna progresion aritmetica
de tama
no k para concluir la existencia de Xn .
Ahora, para cada r N , sea r : 2N 2{1,2,...,r} dada por r (A) =
A {1, 2, . . . , r}. Construimos inductivamente conjuntos Y1 , Y2 , Y3 , . . . con Yr
{1,2,. . ., r} para cada r N tales que Yr+1 {1, 2, . . . , r} = Yr , r N de
la siguiente forma: Y1 := {1} Xn , para todo n N . Dado Yr , r N
tal que Yr = r (Xn ) para infinitos n N, existe Yr+1 {1, 2, . . . , r + 1} con
Yr+1 {1, 2, . . . , r} = Yr tal que Yr+1 = r+1 (Xn ) para infinitos n N (de
hecho, si r (Xn ) = Yr , existen
S solamente dos posibilidades para r+1 (Xn )).
Ahora, es facil ver que Y =
Yn satisface r (Y ) = Yr , r N , de donde
nN

r (Y ) = r (Xn ) para infinitos n N. En particular, |Y {1, 2, . . . , r}| r,


r N y Y no contiene ninguna progresion aritmetica de tama
no k.
Enseguida, vamos a introducir un lenguaje mas analtico y finitario para
obtener una otra reformulacion del teorema 1.1.7.
Definici
on 3.1.4. Dada f : ZN R una funcion, podemos definir T n f : ZN R
los shifts de la funcion por n
umeros naturales n ZN (o n Z) a traves de la
f
ormula: T n f (x) := f (x + n). Diremos tambien que una funcion f : ZN C es
acotada si kf kL 1.
Con esta notacion, podemos reformular el teorema de Szemeredi de la siguiente manera:
Teorema 3.1.5 (Szemeredi version cuantitativa). Para todo entero k 1, N
n
umero primo grande, 0 < 1 y f : ZN R+ una funci
on acotada tal que
E(f |ZN ) , tenemos que existe c(k, ) > 0 tal que:
k1
Y

E(

j=0

T jr f (x)|x, r Z/N Z) c(k, ).

48CAPITULO 3. LAS IDEAS DE FURSTENBERG Y EL TEOREMA DE GREEN-TAO


Observaci
on 3.1.6. En relacion a la version cuantitativa del teorema de Szemeredi recientemente enunciada, vamos a construir (en el apendice de este
captulo) algunos ejemplos, debidos
a F. Behrend, de subconjuntos S del interva
1 2

2 log 2+

log N
lo [1, N ] tales que |S| N
y S no contiene progresiones aritmeticas
de tama
no 3. Aun mas, modificando el esquema del argumento de Behrend,
veremos que, con respecto al comportamiento de c(k, ) en terminos de , no
podemos esperar en general que c(k, ) tenga comportamiento polinomial en
(es decir, c(k, ) Ck para alg
un Ck > 0): en efecto, demostraremos que
c(3, ) c log(1/) .
Observaci
on 3.1.7. En el apendice de este captulo presentaremos tambien algunos resultados sobre el tama
no de N0 (k, ).
Observe que el enunciado del teorema 3.1.5 proporciona (en principio) una
conclusion mucho mas poderosa que el teorema de Szemeredi usual. En efecto,
mientras el teorema de Szemeredi permite concluir apenas la existencia de una
k-PA, la version cuantitativa permite inferir la existencia de c(k, )N 2 k-PAs (al
menos). Sin embargo, a pesar del teorema cuantitativo de Szemeredi aparentar
tener un enunciado mas fuerte, afirmamos que los teoremas 1.1.7 y 3.1.5 son
equivalentes.
Iniciaremos viendo porque el teorema de Szemeredi sigue de la version cuantitativa: fije k y y tome N un primo bien grande. Vamos a suponer que
A {1, . . . , N } tiene cardinalidad |A| N , pues A tiene densidad positiva.
Sea N 0 un primo entre kN y 2kN , por el postulado de Bertrand. Vamos a considerar {1, . . . , N } como subconjunto de Z/N 0 Z y A0 le conjunto respectivo de
Z/N 0 Z.
As, tenemos E(1A0 |Z/N Z) /2k. Y por el teorema de Szemeredi cuantitativo concluimos que:

k1
Y

E(

T jr 1A0 (x)|x, r Z/N 0 Z c(k, /2k).

j=0

Reescribiendo, tenemos que:


|{(x, r) (Z/N 0 Z)2 ; x, x + r, . . . , x + (k 1)r A0 }| c(k, /2k)(N 0 )2 .
Como N 0 kN y A0 {1, . . . , N } tenemos que 1 x N y N r N .
Observe que las progresiones con r = 0 contribuyen solamente con N elementos
como maximo. Removiendo estas progresiones y tomando N grande, el lado
derecho de la estimativa todava es positivo y por tanto A contiene la progresion
x, x+r, . . . , x+(k1)r. Vamos a ver ahora que, de hecho, la version cuantitativa
del teorema de Szemeredi es equivalente a su version original. Ya sabemos que
la version original es equivalente a la version finita, es decir, la existencia de
NSZ (k, ), k N , > 0. Luego, para concluir la equivalencia entres las dos
formulaciones del teorema de Szemeredi, basta mostrar lo siguiente

Proposici
on 3.1.8. Suponga que existe NSZ k, . Entonces existen N0 N
2
y (k, ) > 0 tales que, si N N0 para todo A {1, 2, . . . , N } con |A| N ,

DEL TEOREMA DE GREEN Y TAO


3.2. DEMOSTRACION

49

existen por lo menos (k, ) N 2 progresiones aritmeticas de tama


no k contenidas
en A.
Demostraci
on. Sea m0 = NSZ (k, /2). Entonces, para todo m m0 , todo
subconjunto de {1, 2, . . . , m} con por lo menos m/2 elementos contiene una
progresion aritmetica de largo k. Sea N grande. Para cada r con 1 r
bN/m0 c, dividimos {1, 2, . . . , N } en r progresiones aritmeticas de razon r, del
tipo {1 n N | n a(mod r)}, para cada a con 0 a r 1. Cada
una de esas PAs tiene por lo menos bN/rc elementos, y por tanto puede ser
descompuesta como la union de bbN/rc/m0 c progresiones aritmeticas disjuntas
de razones iguales a r, tama
nos m0 (y casi iguales) y por tanto diametros
entre r(m0 1) y r(2m0 1). Si A {1, 2, . . . , N } satisface |A| N , para cada
3
r
r, #{0 a r 1 | #A {1 n N | n a(mod r)}
bN/rc}
4
4 3

3
(pues t <
t + (1 t) < ), y (como t <
t + (1 t) < )
4 3
4
4 2
2
4
3

si #A {1 n N | A a(mod r)}
bN/rc, por lo menos

4
4 2
bbN/rc/m0 c de las progresiones de tama
no m0 que creamos tiene interseccion
con A con proporcion relativa de por lo menos /2, y luego contiene una k-PA.
bN/m
P 0 c r

Esto proporciona por lo menos

bbN/rc/m0 c > (, m0 )N 2
r=1 4 3 4 2
k-PAs contenidas en A para N grande, donde (, m0 ) = 2 /64m20 . Cada una
de esas PAs puede estar siendo contada repetidamente algunas veces, para
diferentes elecciones de r, pero si d es su diametro, r debe ser un divisor de d
d
d
d
entre
y
, es decir, r = 0 , donde k 1 r0 2m0 1. Tenemos
2m0 1 k 1
r
as como maximo 2m0 k + 1 posibilidades para r0 , y luego para r, es decir,
cada PA es contada como maximo 2m0 k + 1 veces. As, A contiene por lo
2
menos (k, )N 2 kPAs, donde (k, ) =

2
64m0 (2m0 k + 1)
Observaci
on 3.1.9. La diferencia de la demostracion del Teorema de Szemeredi
cuantitativo de las demostraciones anteriores es que, debida a la naturaleza
finitaria de los argumentos, podemos obtener cotas explcitas para el n
umero
NSZ . Las otras demostraciones, como son de caracter infinito (usan de cierta
manera el Axioma da Eleccion) solamente muestran la existencia de tal n
umero
y no dicen nada sobre el orden de magnitud del mismo. La estrategia de la
prueba de este teorema fui usada en el resultado de Green-Tao y sera estudiada
enseguida.

3.2.

Demostraci
on del teorema de Green y Tao

Durante el resto de este captulo, vamos a fijar k 3 el tama


no da progresion
aritmetica (PA) de primos que deseamos encontrar y N := |ZN | sera un n
umero

50CAPITULO 3. LAS IDEAS DE FURSTENBERG Y EL TEOREMA DE GREEN-TAO


primo (grande) de modo que los elementos 1, . . . , N 1 tengan inversos en
ZN . Escribimos o(1) para denotar cantidades que tienden a cero cuando N
y O(1) para denotar cantidades que sean acotadas cuando N . En
ciertos lugares del texto, las cantidades o(1) (resp., O(1)) tienden a cero (resp.,
permanecen acotadas) dependiendo de ciertos par
ametros (por ejemplo, j, ).
Cuando esto ocurra, colocaremos los parametros subscritos en las cantidades
(por ejemplo, oj, (1)). Ademas, abreviaremos cantidades de la forma O(1)X
(resp., o(1)X) como O(X) (resp., o(X)).
Con estas notaciones en las manos, podemos iniciar la contextualization del
teorema de Green y Tao. Recuerde que este teorema dice que para todo k 3,
existen infinitas k-PA (es decir, progresiones aritmeticas de tama
no k) formadas
(solamente) por n
umeros primos. Ademas, sabemos que el teorema de Szemeredi
garantiza la existencia de muchas k-PA en subconjuntos de enteros con densidad
positiva. Aun mas, ya sabemos tambien que el teorema de Szemeredi no implica
el teorema de Green y Tao porque los primos poseen densidad cero. Sin embargo,
la idea de Green y Tao es :
a pesar de que el teorema de Szemeredi no se aplica directamente, podemos modificarlo para que el funcione en subconjuntos con comportamiento
(aditivo) debilmente aleatorio1 (o mas precisamente pseudoaleatorio); este
resultado sera llamado en este libro de teorema de Green-Tao-Szemeredi ;
esto reduce el teorema de Green-Tao a demostrar que el conjunto de los
n
umeros primos es pseudoaleatorio, un hecho que mas o menos sigue directamente de los trabajos de Goldston e Yldrm.
En adelante, vamos a detallar a los items discutidos anteriormente. Para ese
efecto, comenzaremos con la definicion de pseudoaleatoriedad :
Definici
on 3.2.1.
Decimos que : ZN R+ es una medida si E() =
1 + o(1).
Una medida : ZN R+ satisface la (m0 , t0 , L0 )-condici
on de formas
lineales si, para toda familiaP
de m m0 formas lineales i : ZtN
ZN , t t0 , digamos i (x) =
Lij xj + bi , donde Lij son racionales con
numeradores y denominadores menores que L0 , las t-tuplas (Lij )1jt no
son m
ultiplos racionales entre s y bi Z son arbitrarios, entonces:
E((i (x)) . . . (m (x))|x ZtN ) = 1 + om0 ,t0 ,L0 (1).
Una medida : ZN R+ satisface la m0 -condici
on de correlaci
on si para
todo m m0 existen pesos m : ZN R+ tales que E( q ) = Om,q (1)
(condicion de momentos) para todo 1 q < y
X
E((x + h1 ) . . . (x + hm )|x Z)
(hi hj ).
i<jm

para cualesquiera hi ZN (no necesariamente distintos).


1 El

punto de pedir aleatoriedad d


ebil es que despu
es deseamos usar el resultado para los
primos.

DEL TEOREMA DE GREEN Y TAO


3.2. DEMOSTRACION

51

Una medida : Z R+ es k-pseudoaleatoria si : ZN R+ satisface


la (k 2k1 , 3k 4, k) condicion de formas lineales y la 2k1 condicion de
correlacion.
La definicion puede parecer extra
na a inicio, pero ella es basada en trabajos
de Goldston-Yldrm, donde se estudian mayorantes para funciones modificadas
de von Mangoldt (que por su lado estan ntimamente ligadas a los n
umeros primos). Intuitivamente, las condiciones anteriores dices que el conjunto de enteros
en el soporte de tienen propiedades aritmeticas (aditivas) debilmente aleatorias. La principal ventaja de estas condiciones es que ellas son suficientemente
debiles para incluir el caso de los primos (a pesar de que este hecho este lejos
de ser trivial) y permitir el uso de una version del teorema de Szemeredi para
el soporte de estas medidas (vea el teorema 3.2.2 abajo).
Provistos del concepto de pseudoaleatoriedad, estamos aptos para enunciar
uno de los resultados principales del trabajo de Green y Tao [GT, Theorem 3.5]:
Teorema 3.2.2 (Green-Tao-Szemeredi). Si k 3, 0 < 1 y es kpseudoaleatoria entonces para toda f : ZN R+ tal que 0 f (n) (n)
y E(f ) tenemos que:
E(f (n)f (n + r) . . . f (n + (k 1)r)|n, r ZN ) c(k, ) ok, (1).
Observaci
on 3.2.3. Note que haciendo const 1 en el teorema anterior
obtenemos automaticamente el teorema de Szemeredi como corolario.
La demostracion del teorema 3.2.2 es basada en las ideas de Furstenberg (de
recurrencia m
ultiple en teora ergodica) y en las normas de Gowers. Por ahora,
pospondremos la demostracion del teorema 3.2.2 para el proximo captulo.
Con el objetivo de aplicar el teorema 3.2.2 para finalizar la prueba del teorema de Green y Tao, ahora vamos a ver como construir medidas aleatorias
relacionadas a los primos. Iniciamos por recordar la definicion:
Definici
on 3.2.4. La funci
on de von Mangoldt es
(
log p si n = pm
(n) :=
0 caso contrario .
Recuerda que esta funcion esta (esencialmente) soportada en los primos
(pues la contribucion de potencias de primos es peque
na), de modo que ella
funciona como una funcion caracterstica de los primos. En terminos de ella, sabemos que el teorema de los n
umeros primos puede ser reformulado como
E((n)) = 1+o(1). Para usar el teorema de Green-Tao-Szemeredi en el contexto
de los n
umeros primos, precisamos encontrar una medida k-pseudoaleatoria tal
que (n) c(n)(n). Pero es sabido que tales medidas no existen!2
2 B
asicamente porque los primos y la funci
on de van Mangoldt est
an concentrados, para
todo q > 1 entero, en las (q) clases residuales a( mod q) tales que (a, q) = 1 (donde (q)
es la funci
on de Euler), mientras que medidas pseudoaleatorias deben estar equidistribuidas
en todas las clases de congruencias m
odulo q; como el cociente (q)/q puede ser hecho arbitrariamente peque
no, vemos que no existen mayorantes pseudoaleatorios de la funci
on de van
Mangoldt.

52CAPITULO 3. LAS IDEAS DE FURSTENBERG Y EL TEOREMA DE GREEN-TAO


Para contornar ese problema es usa el W-trick. Sea w = w(N ) un
1
parametro que puede crecer con N pero lentamente (es decir, w(N
) = o(1)) y
sea W = pw(N ); p es primo p. La funcion de von Mangoldt modificada es:
(
(W )
W log(W n + 1) si W n + 1 es primo
e
(n)
=
0 caso contrario .
Ahora tenemos una funcion que todava ve a los primos pero dejamos de
ver potencias y ciertas no uniformidades provenientes de productos de factores peque
nos. Considere w(n) con crecimiento lento 3 , digamos w(n) <<
log log log n, de manera que el teorema de Dirichlet dice que:
1 X e
(n) = 1 + o(1).
N
nN

e es una medida. En esta situacion, el segundo resultado


En otras palabras,
clave del trabajo de Green-Tao [GT, Proposition 9.1] (basado en los trabajos de
Goldston-Yldrm) es:
Teorema 3.2.5. Si k = 1/(k + 4)!2k y N es un primo grande entonces existe
e
una medida k-pseudoaleatoria tal que (n) 2k5 k 1 (n)
para k N n
2k N .
As como buena parte de los resultados importantes sobre los n
umeros primos, la demostracion del teorema 3.2.5 pasa por el uso de ciertas regiones libres
de ceros de la funcion zeta de Riemann. Pero, para no interrumpir el flujo de
ideas, dejamos para el captulo 5 de este libro la idea de la demostracion del
teorema 3.2.5.
Finalmente, asumiendo momentaneamente los teoremas 3.2.2 y 3.2.5, demostraremos el teorema de Green y Tao.

3.2.1.

Demostraci
on del teorema de Green y Tao

Suponga que los teoremas 3.2.2 y 3.2.5 sean validos. Si


f (n) =

1 e
(n)1[k N,2k N ]
k2k+5

entonces:
E(f ) =

1
N k2k+5

X
k N n2k N

b
(n)
=

1
k (1 + o(1)).
k2k+5

Como el teorema 3.2.5 garantiza la existencia de una medida k-pseudoaleatoria


e en [k N, 2k N ], podemos aplicar el teorema 3.2.2 de
mayorando 2k+5 k 1
Green-Tao-Szemeredi para concluir que:
E(f (n) . . . f (n(k 1)r)|n, r ZN ) c(k, k 1 2k3 k ) o(1).
3 A pesar de pedir crecimiento lento para w(n), se puede constatar que, al revisar los argumentos del captulo 5, basta tomar w(n) una constante bien grande (dependiendo solamente
de k mas no de N .


3.3. APENDICE
DEL CAPITULO 3

53

Como el caso r = 0 contribuye con un factor O( N1 logk N ) = o(1) en la expresion,


obtenemos la existencia de una P.A. en ZN (tomando N grande). Mas aun,
siendo k < 1/k y k 3 tenemos que esa P.A. es una P.A. legtima de enteros
(y no apenas una k-PA en ZN ).
Para finalizar este captulo, observamos que en el final del apendice de este
captulo veremos algunas estimativas sobre la magnitud del primer n
umero primo apareciendo en una PA de tama
no k.

3.3.

Ap
endice del Captulo 3

3.3.1.

El ejemplo de F. Behrend

Conforme anunciamos en la observacion 3.1.6, primeramente vamos a construir ejemplos de subconjuntos S del conjunto de los enteros no negativos
N
sin ninguna progresion aritmetica de tama
no 3 y con cardinalidad |S|
1 2

2 log 2+

log N
N
; enseguida, adaptaremos esta tecnica para estudiar el comportamiento de la funcion c(3, ).
Dados d 2, n 2 y k n(d 1)2 , considere Sk (n, d) el conjunto de todos
los n
umeros enteros de la forma

x = a1 + a2 (2d 1) + + an (2d 1)n1


cuyos dgitos ai en la base (2d 1) estan sujetos a las restricciones
0 ai < d

kxk2 := a21 + + a2n = k.

Note que Sk (n, d) no contiene progresiones aritmeticas de tama


no 3: en
efecto, caso existiesen x, x0 , x00 Sk (n, d) tales que x + x0 = 2x00 , entonces

kx + x0 k = k2x00 k = 2 k
y

kxk + kx0 k = 2 k.

Luego, como la igualdad en la desigualdad triangular kx + x0 k kxk + kx0 k


solo puede ocurrir cuando los vectores (a1 , . . . , an ) y (a01 , . . . , a0n ) son proporcionales, vemos que x = x0 = x00 (porque estos vectores tienen normas iguales
por hipotesis).
Por otro lado, existen dn vectores (a1 , . . . , an ) satisfaciendo la restriccion
0 ai < d y n(d 1)2 + 1 valores posibles para k. Consecuentemente, para
alg
un k = K0 , Sk (n, d) debe tener cardinalidad de por lo menos menos
dn2
dn
>
.
n(d 1)2 + 1
n
Como todos los elementos de Sk (n, d) poseen modulo < (2d 1)n , si definimos
(N ) := max{|S| ; S [1, N ], S sin ninguna 3-PA},

54CAPITULO 3. LAS IDEAS DE FURSTENBERG Y EL TEOREMA DE GREEN-TAO


obtenemos que

((2d 1)n ) > dn2 /n.

Ahora, fijado > 0 y dado N grande, escogemos n = b

2 log N
log 2 c

(2d 1)n N < (2d + 1)n ,


de manera que
(N ) ((2d 1)n ) >
>

(N 1/n 1)n2
N 1(2/n)
dn2
>
=
(1 N 1/n )n2
n
2n2 n
2n2 n

(n1) log 2
log n
N 1(2/n)
= N 1(2/n) log N log N
n1
2 n

>N

1 2

2 log 2+

log N

Ahora pretendemos modificar ligeramente el raciocinio anterior para estudiar


el comportamiento de la funcion c(3, ): fijamos d, n 1 enteros (a ser escogidos
mas tarde) y definimos : {1, . . . , N } {0, . . . , 2d 1}n por
(x) := (bx/(2d 1)i cmod(2d 1))n1
i=0 .
Para cada k entre 1 y n(d 1)2 , considere nuevamente los conjuntos
Sk (n, d) := {(x1 , . . . , xn ) {0, . . . , d 1}n : x21 + + x2n = k}
y defina Ak (n, d) := 1 (Sk (n, d)). Conforme ya sabemos, Bk (n, d) es libre
de 3-PA (excepto las 3-PAs triviales {x, x, x}). Esto implica que Ak (n, d) solo
puede contener progresiones aritmeticas (n, n + r, n + 2r) donde r es un m
ultiplo de (2d 1)n . En particular, el n
umero maximo de 3-PAs en Ak (n, d) es
N 2 /(2d 1)n . Por otro lado, cuando (x) {0, . . . , d 1}n , la probabilidad de
1
x pertenecer a Ak (n, d) es n(d1)
2 +1 . Luego, tenemos la siguiente cota inferior
para la cardinalidad de Ak (n, d):
c n
|Ak (n, d)|
2 N.
nd2
Tomando n = c log(1/) y d = c , obtenemos que, para alg
un k, el conjunto
Ak (n, d) satisface |Ak (n, d)| c N y el n
umero maximo de 3-PAs en Ak (n, d)
es c log(1/) N 2 . En otras palabras, c(3, ) c log(1/) .

3.3.2.

El tama
no del n
umero N0 (k, )

Sobre la magnitud del n


umero N0 (k, ) en el teorema de Szemeredi cuantitativo, tenemos los siguientes resultados:
T. Gowers [G1], [G2] demostro que N0 (k, ) 22

ck

, donde ck = 22

k+9

R. Rankin [R] demostro que N0 (k, ) exp(C(log 1 )1+blog2 (k1)c );


J. Bourgain [Bg] demostro que N0 (3, ) 2C
1

log(1/)

Se espera que N0 (k, ) 2ck , mas este es un problema abierto (relacionado a la conjetura de Erdos-Turan).


3.3. APENDICE
DEL CAPITULO 3

3.3.3.

55

La magnitud del primer primo en una k-PA

Observando con cautela toda la prueba del teorema de Green y Tao (un
trabajo largo mas no muy complicado), se puede constatar que, si denotamos
por p1 (k) al primer primo en una k-PA, entonces
22

p1 (k) 2

22

22

100k

Mas aun, asumiendo que la hip


otesis de Riemann es valida, podemos mejorara la estimativa anterior en una exponencial:
p1 (k) 22

22

100k
22

Sin embargo, algunos argumentos heursticos sugieren que una cota menor
debe valer: por ejemplo, p1 (k) k! + 1 o

p1 (k)

k 1
e
2

k( 12 +o(1))

(conforme conjeturado por Andrew Granville).

56CAPITULO 3. LAS IDEAS DE FURSTENBERG Y EL TEOREMA DE GREEN-TAO

Captulo 4

Demostraci
on del teorema
de Green-Tao-Szemer
edi
4.1.

Normas de Gowers

Sea {0, 1}d el cubo discreto d-dimensional, y w = w(w1 , . . . , wd ) {0, 1}d . Si


h ZdN entonces w.h := w1 .h1 + . . . wd .hd . Si {fw }w{0,1}d entonces el producto
interno de Gowers es:
h(fw )iU d := E(w fw (n + w.h)|n ZN , h ZdN ).
La primera observacion es que si fw = f para todo w entonces h(fw )iU d 0.
As podemos definir las normas de Gowers (usando fw = f ):
1

kf kU d := h(f )iU2dd .
Una herramienta basica para el analisis de las normas de Gowers es la desigualdad de Gowers-Cauchy-Schwarz :
|h(fw )iU d | w kfw kU d .
La prueba de esta desigualdad sigue de que cuando fw no depende de wd , vale
la igualdad
Y
h(fw )iU d = E(E(
fw0 ,0 (y + w0 .h0 ) : y ZN )
E(

w0 {0,1}d1

fw0 ,1 (y + w0 .h0 ) : y ZN |h0 (ZN )d1 )).

w0 {0,1}d1

Luego, por Cauchy-Schwarz, tenemos


1/2

1/2

|h(fw )iU d | h(fw0 ,0 )iU d h(fw0 ,1 )iU d .


57

DEL TEOREMA DE GREEN-TAO-SZEMEREDI

58CAPITULO 4. DEMOSTRACION
Como podemos sustituir wd por cualquier otro dgito, aplicando la desigualdad
anterior d veces, obtenemos la desigualdad de Gowers-Cauchy-Schwarz.
Ademas, la formula binomial y la multilinealidad del producto interno nos
llevan a la desigualdad triangular de Gowers:
kf + gkU d kf kU d + kgkU d .
Finalmente, tenemos la relacion de monotonicidad:
kf kU d1 kf kU d ,
la cual es una consecuencia de Gowers-Cauchy-Schwarz aplicada a fw := 1
cuando wd = 1 y fw := f cuando wd = 0.
Observaci
on 4.1.1. Como k.kU d son homogeneas, acabamos de probar que k.kU d
son seminormas. Sin embargo, k.kU 1 no es norma pues kf kU 1 = E(f ). Pero, se
puede demostrar (por calculo directo) que:
X
1
kf kU 2 = (
fb()4 ) 4 ,
donde fb() = E(f (x)e2i/N ; x ZN ) y vale la formula de la inversa f (x) =
Pb
f ()e2ix/N . Consecuentemente, las normas de Gowers para d 2 son normas genuinas.
Con esta notacion, la generalizacion natural da proposicion 2.3.3 es:
Teorema 4.1.2 (von Neumann generalizado). Si es una medida k-pseudoaleatoria
y f0 , . . . , fk1 L1 (ZN ) son tales que |fj (x)| 1+(x) entonces si c0 , . . . , ck1
ZN son distintos, tenemos que:
E(j fj (n + cj r)|n, r ZN ) = O(nf kfj kU k1 ) + o(1).
Demostraci
on. Comenzamos con algunas simplificaciones: a menos de cambiar
por ( + 1)/2, reordenar fj , cj y trasladar x por c0 r, podemos asumir que
|fj (x)| (x), x ZN , j = 0, . . . , k 1,
nf

0jk1

kfj kU k1 = kf0 kU k1

y
c0 = 0.
Esto reduce el problema a demostrar que

k1
Y
E
fj (x + cj r)|x, r ZN = O(kf0 kU k1 ) + o(1).
j=0

Dividiremos la demostracion de esta igualdad en dos partes: en la primera


probaremos una desigualdad de Cauchy-Schwarz y la aplicaremos k 1 veces al
lado izquierdo de la igualdad anterior, obtenemos as una estimativa de

k1
Y
E
fj (x + cj r)|x, r ZN
j=0

4.1. NORMAS DE GOWERS

59

por una suma con pesos de f0 sobre cubos (k 1)-dimensionales; en la segunda


parte demostraremos que la condicion de formas lineales implica que estos pesos
son iguales a 1 en media, lo que nos permitira deducir el resultado deseado.
Para enunciar la desigualdad de Cauchy-Schwarz de modo razonable, introduciremos un poco de notacion. Dados 0 d k 1, dos vectores y =
0
0
(y1 , . . . , yk1 ) (ZN )k1 y y = (ykd
, . . . , yk1
) (ZN )d , y un conjunto
(S)

(S)

S {k d, . . . , k 1}, definimos el vector y (S) = (y1 , . . . , yk1 ) (ZN )k1


por

yi si i
/S
(S)
yi :=
yi0 si i S.
En otras palabras, S indica cuales componentes de y (S) provienen de y 0 en vez
de y.
Lema 4.1.3. Sean : ZN R+ una medida y 0 , . . . , k1 : (ZN )k1 ZN
funciones de las k1 variables yi tales que i no depende de yi para 1 i k1.
Suponga que f0 , . . . , fk1 L1 (ZN ) son funciones con |fi (x)| (x) para todo
x ZN y 0 i k 1. Para cada 0 d k 1 y 1 i k 1, defina

kd1
Y
Y
Jd :=E
(
fi (i (y (S) ))
S{kd,...,k1}

k1
Y

i=0

1/2 (i (y (S) ))y (ZN )k1 , y 0 (ZN )d

!
,

i=kd

Pd := E

(kd1 (y (S) ))|y (ZN )k1 , y 0 (ZN )d .

S{kd,...,k1}

Entonces para todo 0 d k 2, tenemos la desigualdad


|Jd |2 Pd Jd+1 .
Demostraci
on del lema 4.1.3. Considere Jd . Como kd1 no depende de ykd1 ,
podemos remover las cantidades dependientes de kd1 de la media en ykd1 ,
lo que nos permite escribir
0
0
, . . . , yk1
ZN ),
Jd = E(G(y, y 0 )H(y, y 0 )|y1 , . . . , ykd2 , ykd , . . . , yk1 , ykd

donde

G(y, y 0 ) :=

fkd1 (kd1 (y (S) )) 1/2 kd1 (y (S) )

S{kd,...,k1}

y
H(y, y 0 ) := E(

kd2
Y

S{kd,...,k1}

i=0

fi (i (y (S) ))

k1
Y
i=kd1

1/2 (i (y (S) ))|ykd1 Z).

DEL TEOREMA DE GREEN-TAO-SZEMEREDI

60CAPITULO 4. DEMOSTRACION
Usando Cauchy-Schwarz,
0
0
|Jd |2 E(|G(y, y 0 )|2 |y1 , . . . , ykd2 , ykd , . . . , yk1 , ykd
, . . . , yk1
ZN )
0 2
0
0
E(|H(y, y )| |y1 , . . . , ykd2 , ykd , . . . , yk1 , ykd , . . . , yk1 ZN ).

Por otro lado, como |fkd1 (x)| (x) para todo x,


0
0
E(|G(y, y 0 )|2 |y1 , . . . , ykd2 , ykd , . . . , yk1 , ykd
, . . . , yk1
ZN ) Pd .

Aun mas, escribiendo la definicion de H(y, y 0 ) y expandiendo los cuadrados


0
cambiando la variable ykd1 por las nuevas variables ykd1 , ykd1
, vemos
que
0
0
E(|H(y, y 0 )|2 |y1 , . . . , ykd2 , ykd , . . . , yk1 , ykd
, . . . , yk1
ZN ) = Jd+1 .

Esto completa la demostracion.


Aplicando este lema (k 1) veces, obtenemos
|J0 |2

k1

Jk1

k2
Y

Pd2

k2d

d=0

Observe que, por definicion,


k1
!
Y
J0 = E
fi (i (y))|y (ZN )k1 .
i=0

Para demostrar la desigualdad deseada, escogemos1


i (y) :=

k1
X

j=1

ci
cj

yj

de modo que 0 (y) = y1 + + yk1 , i (y) no dependen de yi , y para todo y,


(y) = x + ci r donde
k1
X yi
r=
.
c
i=1 i
Ahora la transformacion sobreyectiva : (ZN )k1 (ZN )2 definida por
(y) := (y1 + + yk1 ,

y1
yk1
+ +
)
c1
ck1

tiene n
umero constante de preimagenes, de donde una calculo sencillo muestra
que

k1
!
k1
Y
Y
k1

E
fj (x + cj r)|x, r ZN = E
fi (i (y))|y (ZN )
= J0 .
j=0
1 Estamos

i=0

utilizando aqu que los n


umeros cj son distintos.

4.1. NORMAS DE GOWERS

61

Sin embargo, Pd = 1 + o(1) para cada 0 d k 2, pues satisface la


(2d , k 1 + d, k)-condicion de formas lineales. En particular, de las estimativas
anteriores obtenemos
k1
J02
(1 + o(1))Jk1 .
Fije y. Cuando S vara sobre los subconjuntos de {1, . . . , k1}, 0 (y (S) ) vara en
el cubo (k 1)-dimensional {x + w h : w {0, 1}k1 }, donde x = y1 + + yk1
y hi = yi0 yi , i = 1, . . . , k 1. Luego,

Jk1 = E W (x, h)

f0 (x + w h)|x ZN , h (ZN )k1 ,

w{0,1}k1

con el peso W (x, h) dado por


W (x, h) = E(

k1
Y

k2
Y

1/2 (i (y + wh))

w{0,1} i=1

1/2

= E(

(k1 (y + wh))|y1 , . . . , yk2 ZN )

k2
Y

(i (y + wh))

i=1 w{0,1}k1 ,wi =0

(k1 (y + wh))|y1 , . . . , yk2 ZN ),

w{0,1}k1 ,wk1 =0

donde wh (ZN )k1 es el vector con coordenadas (wh)j := wj hj y y (ZN )k1


es el vector con componentes yj para 1 k 2 y yk1 := x y1 yk2 .
Pero, la definicion de la norma de Gowers dice que

Y
k1
E
f0 (x + w h)|x ZN , h (ZN )k1 = kf0 k2U k1 .
w{0,1}k1

Por tanto, basta probar que

Y
E (W (x, h) 1)
f0 (x + w h)|x ZN , h (ZN )k1 = o(1).
w{0,1}k1

Como |fj (x)| (x), sigue que es suficiente demostrar

E |W (x, h) 1|

(x + w h)|x ZN , h (ZN )k1 = o(1).

w{0,1}k1

Por Cauchy-Schwarz, esto resulta inmediatamente del siguiente lema:

DEL TEOREMA DE GREEN-TAO-SZEMEREDI

62CAPITULO 4. DEMOSTRACION
Lema 4.1.4 ( cubre uniformemente sus cubos). Para n = 0, 2, vale

Y
E |W (x, h) 1|n
(x + w h)|x ZN , h (ZN )k1 = o(1).
w{0,1}k1

Demostraci
on. Expandiendo el cuadrado, vemos que basta probar que, para
q = 0, 1, 2, vale

Y
E W (x, h)q
(x + w h)|x ZN , h (ZN )k1 = o(1).
w{0,1}k1

Pero, esto es una consecuencia de la condicion de formas lineales:


en el caso q = 0, aplique la (2k1 , k, 1)-condicion de formas lineales con
variables x, h1 , . . . , hk1 y formas lineales x + w h, w {0, 1}k1 ;
en el caso q = 1, aplique la (2k2 (k + 1), 2k 2, k)-condicion de formas
lineales con variables x, h1 , . . . , hk1 , y1 , . . . , yk2 y formas lineales
(
i (y + w h), w {0, 1}k1 , wi = 0 para 1 i k 1
x + w h, w {0, 1}k1 ;
en el caso q = 2, aplique la (k2k1 , 3k 4, k)-condicion de formas lineales
con variables
0
x, h1 , . . . , hk1 , y1 , . . . , yk2 , y10 , . . . , yk2

y formas lineales

k1

, wi = 0 para 1 i k 1
i (y + w h), w {0, 1}
0
k1
i (y + w h), w {0, 1}
, wi = 0 para 1 i k 1

k1
x + w h, w {0, 1}
;
0
Aqu estamos adoptando las convenciones yk1 = x y1 yk2 y yk1
=
0
0
x y1 yk2 . Claramente esto completa la demostracion del lema.

Como dijimos antes, esto termina la demostracion del teorema 4.1.2 de von
Neumann generalizado.
Observaci
on 4.1.5. Note que solo utilizamos la condicion de formas lineales en
la demostracion del teorema 4.1.2
Terminando el estudio de las normas de Gowers de esta subseccion, enunciaremos un lema sencillo y u
til sobre la distancia de Gowers k.kU k1 entre las
medidas k-pseudoaleatorias y const 1:

4.1. NORMAS DE GOWERS

63

Lema 4.1.6. Suponga que es una medida k-pseudoaleatoria. Entonces,


k 1kU d = o(1),
para todo d k 1.
Demostraci
on. Observe que la condicion de formas lineales para implican
f
acilmente que kkU k1 = 1 + o(1). Sin embargo, podemos refinar un poco mas
este raciocinio. En efecto, note que, por la monotonicidad de las normas de
Gowers, basta ver que k 1kU k1 = o(1). Multiplicando por 2k1 , reducimos
nuestro problema a demostrar que

= o(1).
E
(x + w h)x ZN , h Zk1
N
w{0,1}k1

El lado izquierdo de la identidad anterior puede ser expandido como

!
X
Y

k1
|A|
(1) E
(x + w h)x ZN , h ZN
.
wA

A{0,1}k1

Analizando la expresion

!
Y

k1
E
(x + w h)x ZN , h ZN
wA

para un A {0, 1}k1 fijo, vemos que ella toma la forma

E (1 (x)) . . . (|A| (x))x ZkN ,


donde x := (x, h1 , . . . , hk1 ) y 1 , . . . , |A| es una ordenacion de las |A| formas
lineales x 7 x + w h con w A. Obviamente estas formas lineales no son
m
ultiplos racionales entre s, luego la (2k1 , k, 1)-condicion de formas lineales
puede ser aplicada para concluir la demostracion del lema.
Resumen de la secci
on Normas de Gowers:
En esta seccion identificamos normas naturalmente asociadas al problema de
contar progresiones cuyos elementos pertenecen al soporte de una familia dada
de funciones, a saber las normas de Gowers, y probamos el teorema 4.1.2, el cual
dice que las normas de Gowers mayoran el n
umero de progresiones en el soporte
de una secesion de funciones, a menos de un error insignificante. Como vimos
en el caso del teorema de Roth, esta mayoracion es importante para obtener
buenas cotas inferiores, que fue nuestro objetivo inicial. La proxima etapa es
la introduccion del concepto de antiuniformidad, el cual desempe
nara un rol
importante en el momento de descomponer nuestras funciones en partes buena
y ruin.

DEL TEOREMA DE GREEN-TAO-SZEMEREDI

64CAPITULO 4. DEMOSTRACION

4.2.

Antiuniformidad

Como las normas de Gowers para d 2 son normas genuinas podemos tomar
las normas duales:
kgk(U k1 ) :=
sup
|hf, gi|,
kf kU k1 1

donde hf, gi denota el producto L2 . Decimos que g es antiuniforme si kgk(U k1 ) =


O(1) y kgkL = O(1).
Observaci
on 4.2.1. Aunque no la pretendemos utilizar, note que en el caso k = 3,
la observacion 4.1.1 nos da la formula:

3/4
X
kgk(U 2 ) =
|b
g ()|4/3 .
ZN

Observe que si g es antiuniforme y |hf, gi| es grande entonces f no puede


ser uniforme pues |hf, gi| kf kU k1 kgk(U k1 ) . Luego tenemos una obstruccion
para uniformidad.
Ademas tenemos una manera canonica de construir funciones antiuniformes:
dada F L1 (ZN ), definimos la funcion dual de F como:
DF (x) := E(w6=0 F (x + w.h)|h Zk1
N ).
De entre las varias propiedades elementales de estas funciones, podemos citar:
Lema 4.2.2. Sea una medida k-pseudoaleatoria y F L1 (ZN ) una funci
on
arbitraria. Se tiene:
k1

hF, DF i = kF k2U k1 ,
k1

2
1
kDF k(U k1 ) = kF kU
y
k1

si |F | 1 + , entonces kDF kL 22

k1

+ o(1).

k1

Demostraci
on. La identidad hF, DF i = kF k2U k1 sigue directamente de las
definiciones de la norma de Gowers y DF , y quedan como ejercicio para el
lector. Para demostrar la segunda identidad, considere F 6= 0 (ya que el caso
F = 0 es trivial) y note que la definicion de las normas duales combinadas con
k1
la identidad hF, DF i = kF k2U k1 dicen que es suficiente demostrar que para una
funcion f arbitraria vale
k1

|hf, DF i| kf kU k1 kF k2U k11 .


Sin embargo, la definicion de DF muestra que hf, DF i es el producto interno
de Gowers h(fw )w{0,1}k1 iU k1 donde fw := f cuando w = 0 y fw := F caso
contrario, de ah la desigualdad anterior sigue de la desigualdad de GowersCauchy-Schwarz.

4.2. ANTIUNIFORMIDAD

65

Finalmente, el u
ltimo item sigue de la condicion de formas lineales. De hecho,
como F es acotada por 2(1 + )/2 := 21/2 , vemos que es suficiente demostrar
D1/2 (x) 1 + o(1)
uniformemente para todo x ZN . Por otro lado, la definicion de funcion dual
dice que D1/2 puede ser expandido como

w{0,1}k1 {0}

.
1/2 (x + w h) h Zk1
N

Como 1/2 es una medida k-pseudoaleatoria, se sigue de la condicion de formas


lineales que este termino es 1 + o(1).
Observaci
on 4.2.3. Este es el u
nico punto donde la condicion de formas lineales
con terminos no homogeneos bi 6= 0 es aplicada; en efecto, en la demostracion
anterior, todos los bi son iguales a x.
Llamaremos a las funciones DF , donde F es acotada (puntualmente) por
1 + , de funciones antiuniformes b
asicas; una propiedad relevante de estas
funciones es su buena distribucion con respecto a :
Proposici
on 4.2.4. Si es k-pseudoaleatoria, : I K R es continua y
DF1 , . . . , DFK son funciones antiuniformes b
asicas, definimos
(x) = (DF1 (x), . . . , DFK (x)).
Entonces, h 1, i = ok, (1). Adem
as, la cantidad de la derecha puede ser
tomada uniforme sobre un conjunto compacto de s.
Demostraci
on. La idea sera usar el teorema de aproximacion de Weierstrass y
el hecho de ser una medida para reducir nuestro problema a demostrar esta
proposicion en el caso mas sencillo: cuando es un polinomio.
Como de costumbre, podemos cambiar por ( +1)/2 de modo que |Fj (x)|
(x) para todo x ZN , 1 j K.
Lema 4.2.5. Sea d 1. Para todo polinomio P de grado d con coeficientes
reales (independientes de N ) vale
kP (DF1 , . . . , DFK )k(U k1 ) = OK,d,P (1).
Demostraci
on. Por linealidad y aumentando K para dK si es necesario, es suficiente probar el resultado para P (x1 , . . . , xK ) = x1 . . . xK . O sea, queremos ver
que
K
Y
hf,
DFj i = OK (1)
j=1

DEL TEOREMA DE GREEN-TAO-SZEMEREDI

66CAPITULO 4. DEMOSTRACION
para todo f : ZN R satisfaciendo kf kU k1 1. Expandimos el lado izquierdo
como

Y
Y

E f (x)
E(
Fj (x + w h(j) )|h(j) (ZN )k1 )x ZN

k1
j=1

w{0,1}

:w6=0

Haciendo el cambio h(j) = h + H (j) para todo h (ZN )k1 , tomando la media
en h, expandiendo los productos en j e intercambiando las esperanzas, podemos
reescribir la ultima expresion en terminos del producto interno de Gowers
E(h(fw,H )w{0,1}k1 iU k1 |H ((ZN )k1 )K ),
donde H = (H (1) , . . . , H (K) ), f0,H := f , fw,H := gwH para w 6= 0 con w H =
(w H (1) , . . . , w H (K) ) y
gu(1) ,...,u(K) (x) :=

K
Y

Fj (x + u(j) ) para todo u(1) , . . . , u(K) ZN .

j=1

En particular, la desigualdad de Gowers-Cauchy-Schwarz y kf kU k1 1 reducen


el lema a la demostracion de la estimativa

Y
E
kgwH kU k1 |H ((ZN )k1 )K = OK (1).
w{0,1}k1 :w6=0

Por Holder, basta ver que


k1

E(kgwH k2U k11 |H ((ZN )k1 )K )) = OK (1),


para cada w {0, 1}k1 0.
Fije w. Como 2k1 1 2k1 y como estamos en espacios de probabilidad,
basta demostrar
k1

E(kgwH k2U k1 |H ((ZN )k1 )K )) = OK (1).


Esta u
ltima estimativa es verdadera por el siguiente argumento: w 6= 0 implica que la transformacion w w H es un recubrimiento; esto permite usarla
para cambiar las variable de manera que el lado izquierdo de la ultima expresion
es
k1
E(kgu(1) ,...,u(K) k2U k1 |u(1) , . . . , u(K) ZN ).
Usando las definiciones de norma de Gowers y gu(1) ,...,u(K) , podemos expandir
este termino como

Y
Y

.
E
Fj (x + u(j) + h w)
e x, u(1) , . . . , u(K) ZN , h Zk1
N

k1
w{0,1}
e

j=1

4.2. ANTIUNIFORMIDAD

67

Factorizando, llegamos a la expresion

.
E(Fj (x + u(j) + h w)
e | u(j) ZN ) x ZN , h Zk1
E
N

j=1

Usando la hipotesis |Fj (x)| (x), nuestra tarea queda reducida a estimar

k1
K
.
E E((x + u + h w)
e | u ZN ) x ZN , h ZN

Haciendo el cambio de variables y = x + u y tomando la media sobre x, nuestro


objetivo es probar que

k1
K
= OK (1).
E E((y + h w)
e | y ZN ) h ZN

En este punto, estamos listos para usar la condicion de correlacion, la cual nos
dice que

e y ZN
E (y + h w)
(h (w
ew
e0 )),

0
k1
0
w,
ew
e {0,1}

,w6
e =w
e

donde es una funcion peso satisfaciendo E( ) = Oq (1). Usando la desigualdad


triangular en LK (Zk1
N ), vemos que basta probar que

k1
0 K
E (h (w
ew
e )) h ZN
= OK (1),

para todos w,
e w
e0 {0, 1}k1 distintos entre s. Pero, siendo la transformacion
0
h 7 h(w
e w
e ) un recubrimiento, el lado izquierdo arriba es E( K ) = OK (1).
Volvamos ahora a la demostracion de la proposicion. Recuerde que el lema 4.2.2
dice que las funciones basicas antiuniformes toman valores en el intervalo I =
k1
k1
[22 , 22 ]. Por el teorema de aproximacion de Weierstrass, dado > 0,
podemos encontrar un polinomio P aproximando a la funcion continua de
modo que
k(DF1 , . . . , DFK ) P (DF1 , . . . , DFK )kL .
Como es una medida (es decir, E() = 1 + o(1)), tenemos
|h 1, (DF1 , . . . , DFK ) P (DF1 , . . . , DFK )i| (2 + o(1)).
Por otro lado, combinando los lemas 4.1.6, 4.2.5, obtenemos que
|h 1, P (DF1 , . . . , DFK )i| = oK, (1)
porque P depende solo de K y . Haciendo N grande (dependiendo de K, ),
vemos que
|h 1, (DF1 , . . . , DFK )i| 4.
Esto finaliza la demostracion de a proposicion 4.2.4.

DEL TEOREMA DE GREEN-TAO-SZEMEREDI

68CAPITULO 4. DEMOSTRACION
Observaci
on 4.2.6. La u
nica vez donde aplicamos la condicion de correlaciones
en todo el libro es al final de la demostracion del lema 4.2.5.
Resumen de la secci
on Antiuniformidad:
En esta seccion introducimos el concepto de antiuniformidad, el cual sirve para
identificar funciones no uniformes (o mejor, obstrucciones para la uniformidad).
En efecto, vimos que toda funcion F induce naturalmente una funcion DF
antiuniforme basica tal que la correlacion hF, DF i es grande siempre que F no es
uniforme; ademas, vimos un resultado mostrando que la medida pseudoaleatoria
se distribuye bien en relacion al
algebra generada por las funciones antiuniformes
basicas.
A continuacion, estudiaremos las sigma-algebras generadas por los conjuntos de nivel de funciones antiuniformes, las cuales son las piezas basicas de la
sigma-algebra con respecto a la cual tomaremos esperanzas de modo de obtener
funciones buenas (= uniformes).

4.3.

Sigma-
algebras generadas por funciones antiuniformes b
asicas

Veremos ahora como funciones antiuniformes basicas generan naturalmente


sigma-algebras donde ellas son bien comportadas (es decir permiten el uso del
teorema de Szemeredi en su forma original).
Proposici
on 4.3.1. Si es k-pseudoaleatoria y DF1 , . . . , DFK son funciones
antiuniformes b
asicas. Para todo < 1 y < 1/2 existe una sigma-
algebra B
tal que si N es un primo grande entonces:
kDFj E(DFj |B)kL j.
Existe un B (conjunto excepcional) tal que E(( +1)1 ) = OK, ( 1/2 ).
k(1 1 )E( 1|B)kL = OK, ( 1/2 ).
Demostraci
on. El punto de partida de la prueba de esta proposicion es el siguiente lema garantizando que cada funcion genera una sigma-algebra:
Lema 4.3.2. Sea una medida k-pseudoaleatoria, 0 < < 1 y 0 < < 1/2
par
ametros, y G L (ZN ) una funci
on tomando valores en el intervalo I :=
2k1 2k1
[2
,2
]. Entonces, existe B, (G) una sigma-
algebra tal que
(G pertenece a su propia -
algebra) Para toda B -
algebra,
kG E(G|B B, (G))kL (ZN ) .
(Complejidad acotada) B, (G) tiene O(1/)
atomos.

4.3. SIGMA-ALGEBRAS
GENERADAS POR FUNCIONES ANTIUNIFORMES BASICAS69
(Buena aproximaci
on por funciones continuas de G) Si A es un
atomo de
B, (G), entonces existe A : I [0, 1] tal que
k(1A A (G))( + 1)kL1 (Z) = O().
Aun m
as, A pertenece a un compacto E C 0 (I) que es independiente
de G, , N y A.
Demostraci
on del lema 4.3.2. Combinando que es una medida con el teorema
de Fubini, tenemos
Z 1X
E(1G(x)[(n+),(n++)] ((x) + 1)|x ZN )d
0 nZ

= 2E(1 + (x)|x ZN ) = O().


Por tanto, podemos fijar tal que
X
E(1G(x)[(n+),(n++)] ((x) + 1)|x ZN ) = O().

(4.1)

nZ

Definimos B, (G) como la -algebra cuyos atomos son G1 ([(n + ), (n + +

1)]) para n Z. Esta


esta bien definida porque los intervalos [(n + ), (n +
+ 1)] particionan la recta.
Claramente si B es una -algebra, entonces la funcion G restringida a un atomo de B B, (G) toma valores en un intervalo de diametro , lo que demuestra
la primera afirmacion del lema (G pertenece a su propia -algebra). Ahora, sea
A := G1 ([(n+), (n++1)]) un atomo de B, (G). Como G toma valores en
I, tenemos que n = O(1/) (caso contrario, A = ). Esto demuestra la segunda
afirmacion del lema (complejidad acotada). Finalmente, sea : R [0, 1] una
funcion bump (corte) fija tal que = 1 en [, 1 ] y = 0 en [, 1 + ],
y defina A (x) := ( x n). Obviamente, A varia en un compacto E, de
C 0 (I) (pues n y son acotados) y la igualdad (4.1) implica la tercera afirmacion
del lema (buena aproximacion por funciones continuas de G).
Ahora volvemos a la demostracion de la proposicion 4.3.1. Tomamos B :=
B, (DF1 ) B, (DFK ), donde B, (DFj ) es la sigma-algebra del lema 4.3.2.
Claramente la primera afirmacion de la proposicion 4.3.1 sigue de la primera
afirmacion del lema 4.3.2. Por otro lado, como cada B, (DFj ) tiene O(1/)
atomos, B es generada por OK, (1) atomos. Diremos que un atomo A de B es
peque
no si E(( + 1)1A ) 1/2 . Denote por a la union de todos los atomos
peque
nos. Entonces B y vale la segunda afirmacion de la proposicion 4.3.1.
Para demostrar la u
ltima afirmacion, basta demostrar que
E(( 1)1A )
= E( 1|A) = oK,, (1) + OK, ( 1/2 )
E(1A )
para todo atomo A no peque
no. De la definicion de peque
nez, tenemos que
E(( 1)1A ) + 2E(1A ) = E(( + 1)1A ) 1/2

DEL TEOREMA DE GREEN-TAO-SZEMEREDI

70CAPITULO 4. DEMOSTRACION
para A no peque
no. Luego, como es peque
no y N es grande, es suficiente
verificar que
E(( 1)1A ) = oK,, (1) + OK, ( 1/2 ).
Por otro lado, siendo A la interseccion de K atomos Aj B, (DFi ), j =
1, . . . , K, el lema 4.3.2 y la desigualdad de Holder prueban que existe A :
I K [0, 1] tal que
k( + 1)(1A A (DF1 , . . . , DFK ))kL1 (ZN ) = OK (),
donde
k( 1)(1A A (DF1 , . . . , DFK ))kL1 (ZN ) = OK ().
Ademas, A esta en un compacto E,K, de C 0 (I K ). Esto y la proposicion 4.2.4
(de distribucion uniforme con respecto a funciones antiuniformes basicas) implican
E(( 1)A (DF1 , . . . , DFK )) = oK,, (1) = OK, ( 1/2 ),
pues N es grande dependiendo de K, , . Esta estimativa y la desigualdad
triangular concluyen la demostracion.

Resumen de la secci
on Sigma-Algebras
generadas por funciones
antiuniformes b
asicas:
En esta seccion asociamos a cada funcion antiuniforme basica DF una sigma
algebra B con respecto a la cual la esperanza E(DF |B) de DF aproxima DF (o
sea, DF es casi constante en los atomos de B) y la medida pseudoaleatoria
tiene valores proximos a 1 en media (con relacion a B).
En la siguiente etapa, usaremos esta maquinaria de funciones antiuniformes
basicas y sus sigma-algebras para formalizar el proceso de descomposicion en
partes buenas (uniformes) y ruines (antiuniformes) a traves de un proceso de induccion. Un punto fundamental sera garantizar que este procedimiento termina
en un n
umero finito de iteraciones. Esto seguira del argumento de incremento
de energa.

4.4.

El argumento de incremento en la energa

Usando las sigma-algebras de funciones antiuniformes basicas, podemos obtener la descomposicion deseada en partes uniformes y partes antiuniformes:
Teorema 4.4.1 (Koopman-von Neumann generalizado). Sea k-pseudoaleatoria
y f L1 tal que 0 f (x), << 1 y N es un primo grande. Entonces existe
una sigma-
algebra B y un conjunto excepcional B tal que:
E( 1 ) = o (1) (el conjunto excepcional es peque
no).
k(1 1 )E( 1|B)kL = o (1) (buena distribuci
on de la funci
on fuera
del conjunto excepcional).

4.4. EL ARGUMENTO DE INCREMENTO EN LA ENERGIA

71

k(1 1 )(f E(f |B)kU k1 1/2 (uniformidad en B)


Demostraci
on. La estrategia basica es la misma del teorema de estructura ergodica de Furstenberg2 : comenzamos con la sigma-algebra B = {, ZN } y analizamos
la funcion f E(f |B). Si ella fuese uniforme (es decir, vale el tercer item de arriba), acabamos. Caso contrario, usamos los resultados sobre antiuniformidad
para encontrar una G1 antiuniforme con correlacion no trivial con f y adicionamos a los conjuntos de nivel de G1 la sigma-algebra B. La propiedad de
correlacion no trivial va a garantizar que la norma L2 de E(f |B) aumentara en
una cantidad no trivial3 , mientras que la pseudoaleatoriedad de implica que
E(f |B) permanece uniformemente acotado. En este punto, repetimos este procedimiento hasta f E(f |B) ser suficientemente uniforme; note que el algoritmo
k
va a terminar en un n
umero finito de pasos (del orden de 22 /) debido al
incremento de la energa en cada paso.
Ahora vamos a describir esta estrategia de manera mas organizada. Fije
k
y sea K0 el menor entero mayor que 1 + 22 /. Precisaremos de un parametro
0 < y tomaremos N grande dependiendo de y . Construiremos B y a
traves de una sucesion de funciones antiuniformes basicas DF1 , . . . , DFK en ZN ,
conjuntos excepcionales 0 K ZN y sigma-algebras B0 BK
para alg
un 0 K K0 as:
Paso 0: Iniciamos con K=0, B0 := {, ZN } y 0 := .
Paso 1: Hacemos FK+1 := (1 1K )(f E(f |BK )). Si
kFK+1 kU k1 1/2

definimos := K , B = BK y terminamos con suceso el algoritmo.


Paso 2: Caso

kFK+1 kU k1 > 1/2

definimos BK+1 := BK B, (DFK+1 ).


Paso 3: Procuramos por un conjunto excepcional K+1 K en BK+1
con
E(( + 1)1K+1 ) = OK, ( 1/2 )
(4.2)
y

k(1 1K+1 )E( 1|BK+1 )kL = OK, ( 1/2 ).

Si tal conjunto excepcional no puede ser encontrado, terminamos el algoritmo con error. Caso contrario, vamos para el paso 4.
Paso 4: Aumentamos K para K + 1. Si K > K0 , terminamos el algoritmo
con error. Caso contrario, volvemos al paso 1.
2 Este teorema dice que podemos descomponer cualquier sistema como una extensi
on weakmixing de una torre de extensiones compactas.
3 La idea de usar una correlaci
on no trivial para aumentar la norma L2 es precisamente el
argumento de incremento de la energa.

DEL TEOREMA DE GREEN-TAO-SZEMEREDI

72CAPITULO 4. DEMOSTRACION
Asumamos por ahora que el algoritmo termina sin error en el paso 3 o 4. Entonces es claro que despues de como maximo K0 + 1 iteraciones, habremos
construido una -algebra B y un conjunto excepcional con las propiedades
deseadas, excepto por el hecho de que los terminos de error son OK, ( 1/2 ) en
vez de o (1), para N grande dependiendo de , K, . Sin embargo, esto pode ser
remediado haciendo tender a cero muy lentamente.
O sea, reducimos la demostracion de este teorema a mostrar que el algoritmo
termina sin error. La demostracion es por induccion: como hipotesis para la
induccion en 0 K1 K0 , suponga que el algoritmo o termina sin error o
llega el paso 2 da K1 -esima iteracion sin dar un error. Note que esto es obvio
para K1 = 0. Asumiendo esto demostrado para alg
un K1 < K0 , deseamos
probar lo mismo para K1 + 1. Observe que podemos suponer que el algoritmo
no termino hasta el paso 2 de la K1 -esima iteracion. En esta etapa, tenemos
-algebras B0 , . . . , BK1 +1 , funciones antiuniformes basicas DF1 , . . . , DFK1 +1 y
conjuntos excepcionales 0 , . . . , K1 ya construidos. Afirmamos que
kDFj kL 22

k1

+ Oj, ( 1/2 ),

(4.3)

para todo 1 j K1 + 1. Esto sigue del paso 3 de las iteraciones anteriores (o


del paso 0 cuando j = 1), los cuales dicen que
k(1 1j1 )E( 1|Bj1 )kL = Oj, ( 1/2 ),
de donde

E(|Bj1 )(x) = 1 + Oj1, ( 1/2 ),

para todo x
/ j1 . Como 0 f (x) (x), concluimos las estimativas puntuales
0 (1 1j1 (x))E(f |Bj1 )(x) 1 + Oj, ( 1/2 ),
(4.4)
de las cuales siguen, por la definicion de Fj ,
|Fj (x)| (1 + Oj, ( 1/2 ))((x) + 1).

(4.5)

En particular, una sencilla aplicacion del lema 4.2.2 demuestra nuestra u


ltima
afirmacion.
Por otro lado, como BK1 +1 es la -algebra generada por
B,1 (DF1 ), . . . , B,K1 +1 (DFK1 +1 ),
la proposicion 4.3.1 permite encontrar tal que
E(( + 1)1 ) = OK1 , ( 1/2 )
y

k(1 1 )E( 1|BK1 +1 )kL = OK1 , ( 1/2 ).

Definimos K1 +1 := K1 . Obviamente, K1 +1 tiene las propiedades necesarias para ejecutar el paso 3 sin error, y por tanto podemos ir hasta el paso 2
de la K1 + 1-esima iteracion (o terminar sin error), como queramos demostrar.

4.4. EL ARGUMENTO DE INCREMENTO EN LA ENERGIA

73

En otras palabras, lo que probamos hasta ahora fue que tenemos solamente
dos posibilidades para el algoritmo: o el termina sin error o sigue todo el camino
hasta la K0 -esima iteracion. Para finalizar la demostracion, la propiedad clave
es que en el caso del algoritmo llegar al paso 3 de la K0 -esima iteracion, entonces
vale la estimativa de incremento de energa
k(1 1j )E(f |Bj )k2L2 k(1 1j1 )E(f |Bj1 )k2L2 + 22

Oj, ( 1/2 ) O(2 ),


(4.6)
para todo 1 j K0 (si N es grande dependiendo de K0 y ). Esta propiedad
es suficiente para concluir la demostracion porque la desigualdad (4.4) nos da
0 k(1 1j )E(f |Bj )k2L2 1 + Oj, ( 1/2 ),

(4.7)
k

para todo 0 j K0 . Como K0 es el menor entero mayor que 22 / + 1, el


principio del palomar genera una contradiccion para peque
no, peque
no y N
grande dependiendo de , .
Finalmente, resta solamente demostrar la estimativa del incremento en la
energa. La idea es explotar que el algoritmo no termina en el segundo paso de
la (j 1)-esima iteracion, lo que implica
kFj kU k1 1/2

Esto combinado con la definicion de Fj y el lema 4.2.2 implican que


k1

|h(1 1j1 )(f E(f |Bj1 )), DFj i| = kFj k2U k1 1/2 .
Por otro lado, las estimativas puntuales (4.3), (4.5), (4.2) demuestran que
h(1j 1j1 )(f E(f |Bj1 ), DFj )i = Oj, ( 1/2 ),
en cuanto que el lema 4.3.2 y la estimativa (4.5) dicen que
h(1 1j )(f E(f |Bj1 ), DFj E(DFj |Bj ))i = O().
En particular, por la desigualdad triangular, ganamos la cota inferior:
|h(1 1j )(f E(f |Bj1 )), E(DFj |Bj )i| 1/2 Oj, ( 1/2 ) O().
Como las funciones (1 1j ), E(DFj |Bj ) y E(f |Bj1 )) son todas Bj -medibles,
podemos cambiar f por E(f |Bj ), de modo que obtenemos
|h(1 1j )(E(f |Bj ) E(f |Bj1 )), E(DFj |Bj )i| 1/2 Oj, ( 1/2 ) O().
Usando Cauchy-Schwarz y la estimativa (4.3) concluimos:
k(1 1j )(E(f |Bj ) E(f |Bj1 ))kL2 22

k1

+1 1/2

Oj, ( 1/2 ) O(). (4.8)

Esta estimativa esencialmente implica, por el teorema de Pitagoras, la estimativa de incremento de energa, el u
nico problema es la presencia de los conjuntos excepcionales j1 , j , los cuales precisan de un poco de cuidado para ser

DEL TEOREMA DE GREEN-TAO-SZEMEREDI

74CAPITULO 4. DEMOSTRACION
tratados, ya que no tenemos buenas cotas L2 para . Para resolver este peque
no
contratiempo, comenzamos por notar que (4.2) y (4.4) implican
k(1j 1j1 )E(f |Bj1 )kL2 = Oj, ( 1/2 ).
Luego, la desigualdad triangular y (4.7) implican que la estimativa de incremento
de energa (4.6) sigue de
k(1 1j )E(f |Bj )k2L2 k(1 1j1 )E(f |Bj1 )k2L2 + 1/2 Oj, ( 1/2 ) O().
Sin embargo, el lado izquierdo de la desigualdad anterior puede ser expandido
por la ley de los cosenos como
k(1 1j )E(f |Bj1 )k2L2 + k(1 1j )(E(f |Bj ) E(f |Bj1 ))k2L2
+ 2h(1 1j )E(f |Bj1 ), (1 1j )(E(f |Bj ) E(f |Bj1 ))i.
Por tanto, por (4.8), vemos que es suficiente demostrar la siguiente relacion de
casi ortogonalidad:
h(1 1j )E(f |Bj1 ), (1 1j )(E(f |Bj ) E(f |Bj1 ))i = Oj, ( 1/2 ).
Como (1 1j )2 = (1 1j ), podemos reescribir la expresion anterior como
h(1 1j )E(f |Bj1 ), E(f |Bj ) E(f |Bj1 )i = Oj, ( 1/2 ).
Ahora observemos que siendo la funcion (1 1j1 )E(f |Bj1 ) medible con
relacion a Bj1 , ella debe ser ortogonal a la funcion E(f |Bj ) E(f |Bj1 ) porque
Bj1 es una sub-sigma-algebra de Bj por construccion. En particular, podemos
una vez mas reescribir la expresion anterior como
h(1j 1j1 )E(f |Bj1 ), E(f |Bj ) E(f |Bj1 )i = Oj, ( 1/2 ).
Usando nuevamente el hecho de (1j 1j1 )E(f |Bj1 ) ser una funcion Bj medible (de donde sigue que ella debe ser ortogonal a f E(f |Bj )), vemos que
la identidad anterior equivale a
h(1j 1j1 )E(f |Bj1 ), f E(f |Bj1 )i = Oj, ( 1/2 ).
Pero esta igualdad ciertamente es verdadera porque 0 f y valen las estimativas (4.2), (4.4). Esto completa la demostracion de la estimativa de incremento de energa (4.6) y, consecuentemente, la demostracion del teorema 4.4.1.
Resumen de la secci
on El argumento de incremento de energa:
En esta seccion usamos toda la maquinaria de sigma-algebras asociadas a funciones antiuniformes para exhibir un algoritmo de construccion de conjuntos excepcionales peque
nos y una sigma-algebra (para una densidad f mayorada por
una medida pseudoaleatoria) tales que la funcion f posee un comportamiento
uniforme fuera del conjunto excepcional. En particular, esto nos muestra como

DEL TEOREMA DE GREEN-TAO-SZEMEREDI75

4.5. FINAL DE LA DEMOSTRACION


descomponer la funcion f en una parte uniforme y una parte no uniforme. Este
fue el contenido del teorema de Koopman-von Neumann generalizado 4.4.1. Aun
mas, el algoritmo en la prueba del teorema de Koopman-von Neumann generalizado era finito (es decir, el terminaba en tiempo finito) gracias a un argumento
de incremento de energa en cada paso (de hecho, como la energa siempre creca
en cada paso y ella deba permanecer acotada durante todo el proceso, esto llevaba rapidamente a la conclusion deseada).
El u
ltimo paso sera aplicar la descomposicion provista por el teorema 4.4.1
para finalizar la demostracion del teorema de Green-Tao-Szemeredi.

4.5.

Final de la demostraci
on del teorema de
Green-Tao-Szemer
edi

Una vez que ya formalizamos (y cuantificamos) toda la maquinaria de uniformidad, antiuniformidad y descomposicion en partes uniforme y no uniforme,
la tarea de imitar el esquema propuesto en el captulo 2 para la demostracion
del teorema de Roth, para demostrar el teorema 3.2.2 de Green-Tao-Szemeredi
es sencilla:
Sean f , y como en el enunciado del teorema 3.2.2. Tome << y
considere B la sigma-algebra del teorema 4.4.1 de Koopman-von Neumann generalizado. Defina las funciones:
fU = (1 1 )(f E(f |B))
fAU = (1 1 )E(f |B).
Recuerde que, por hipotesis, 0 f (puntualmente) y E(f ) . Por
tanto, el teorema 4.4.1 garantiza que
E(fAU ) = E((1 1 )f ) E(f ) E(1 ) o (1).
Ademas, tenemos que fAU 1 + o (1), de modo que podemos usar el teorema
de Szemeredi4 . En particular:
E(fAU (n) . . . fAU (n + (k 1)r)|n, r ZN ) c(k, ) o (1).
k

Por otro lado, sabemos que kfU kU k1 1/2 . Luego, por el teorema 4.1.2 de
von Neumann generalizado, tenemos que:
k

E(f1 (n) . . . fk (n + (k 1)r)|n, r ZN ) = O(1/2 )


donde j = U o AU , y j = U para por lo menos un j.
4 Estamos cometiendo una peque
na trampa inofensiva aqu: como fAU no es acotada
por 1 exactamente y E(fAU ) no es minorada por exactamente, el teorema de Szemer
edi no
puede ser usado directamente. Sin embargo, es es f
acilmente contornado aplicando Szemer
edi
a una funci
on que es igual a f m
odulo un termino de la forma o (1), los cuales pueden ser
trivialmente controlados en ese caso

DEL TEOREMA DE GREEN-TAO-SZEMEREDI

76CAPITULO 4. DEMOSTRACION
As obtenemos que:
k

E(f (n) . . . f (n + (k 1)r)|n, r ZN ) c(k, ) O(1/2 ) o (1).


Como es arbitrario, el teorema de Green-Tao-Szemeredi esta demostrado!
Observaci
on 4.5.1. El lector mas atento debe haber percibido la analoga evidente entre las estimativas anteriores y las estimativas de la proposicion 2.3.3.
De hecho, como no poda ser de otra manera, en ambos argumentos, separamos
el termino bueno (en el caso de Roth era 3 (g, g, g) y en el caso do Green-Tao
era E(fAU (n) . . . fAU (n + (k 1)r)|n, r ZN )) el cual es relativamente grande
(en el caso de Roth era 3 y en el caso de Green-Tao es c(k, ) o (1)) y nos
dedicamos a estimar los terminos ruines (en el caso do Roth eran 3 (., ., .)
donde alguna de las entradas tena a la funcion b y en el caso de Green-Tao era
E(f1 (n) . . . fk (n + (k 1)r)|n, r ZN ) donde alguna de las entradas tena a
la funcion fU ). Para cumplir esta tarea, usamos Holder en el caso de Roth y el
teorema de von Neumann generalizado en el caso de Green-Tao para reducir el
problema al hecho (no-trivial) de que b en el caso de Roth y fU en el caso de
Green-Tao podan ser escogidos uniformes. Logicamente, este hecho es obtenido
del teorema de Koopman-von Neumann generalizado, en cuya prueba se utiliza
el argumento de incremento de energa, conforme habamos indicado bien al
inicio.

Captulo 5

Medidas pseudoaleatorias
soportadas en los primos
5.1.

Construcci
on de la Medida Pseudoaleatoria

Pretendemos demostrar en este captulo el teorema 3.2.5, que recapitulamos


a continuacion (con el nombre de teorema 5.1.1):
e la funcion de von Mangoldt modificada, dada por
Sea

(W )
log(W n + 1) si W n + 1 es primo
e
(n)
=
W
0 caso contrario
(donde W = W (n) =

p; aqu w(n) es una funcion que tiende lentamente

pw(n)
p primo

a +, pero observaremos en el final de la demostracion que podemos tomar


w(n) como una constante grande).

Teorema 5.1.1. Si k = 2k (k + 4)! y N es un primo grande, entonces existe


e
una medida k-pseudoaleatoria tal que (n) 2k5 k 1 (n)
para k N n
2k N .
A continuacion vamos a construir la medida . Su construccion y la demostracion de que realmente es una medida pseudoaleatoria estan fuertemente
inspirados en resultados de Goldston e Yldrm.
e es una modificacion de la clasica funcion de von Mangoldt
La funcion
(
log p si n = pk , p primo, k 1
dada por (n) =
. Esa modificacion es hecha
0 caso contrario
para superar la falta de aleatoriedad del conjunto de los primos provocada por
razones locales, es decir, por su comportamiento modulo primos peque
nos.
77

78CAPITULO 5. MEDIDAS PSEUDOALEATORIAS SOPORTADAS EN LOS PRIMOS


k
2
1
Observamos ahora que, si n = p
1 p2 . . . pk , p1 < p2 < . . . < pk primos,
tenemos

X
d|n

(d) =

j
k X
X

(prj ) =

j=1 r=1

j
k X
X

log pj =

j=1 r=1

k
X

j log pj = log n,

j=1

y luego, por la formula de inversion de Mobius (ver apendice) tenemos


X
X
(n) =
(d) log(n/d) =
(d) log+ (n/d),
d|n

d|n

donde es la funcion de Mobius y log+ (x) = max{log x, 0}, para x > 0. Esto
motiva la siguiente definicion, de Goldston y Yldr:
Definici
on 5.1.2 (Suma truncada sobre divisores de Goldston e Yldrm). Sea
R > 0 un parametroP(en las aplicaciones
na de N ).
P sera una potencia peque
Definimos R (n) =
(d) log(R/d) =
(d) log+ (R/d).
d|n
dR

d|n

Podemos ahora definir la medida :

1 k4
Definici
on 5.1.3. Sea R = N k 2
, y sea k = 2k (k + 4)!. Definimos la
funcion : ZN R+ por

2
(W ) R (W n + 1) si N n 2 N
k
k
(n) =
W
log R

1, caso contrario
Demostrar que es de hecho una medida pseudoaleatoria (o mismo una
medida) dara un cierto trabajo. Sin embargo es bastante sencillo mostrar que
e como queremos:
mayora
e
Lema 5.1.4. (n) k 1 2k5 (n)
para k N n 2k N .
e
Demostraci
on. Eso es trivial si W n + 1 no es primo, pues en ese caso (n)
= 0.
Por otro lado, si W n+1 es primo, los divisores de W n+1 son apenas 1 y W n+1
y, como W es grande, W n + 1 > W k N > R (asumiendo, como siempre hacemos implcitamente, que N es suficientemente grande), y luego R (W n + 1) =
P
(W )
(d) log(R/d) = (1) log R = log R, donde (n) =
log R. Como
W
d|W n+1
dR

(W )
(W )
(W ) 1 k4
e
(n)
=
log(W n + 1), y (n) =
log R =
k 2
log N ,
W
W
W
log(W n + 1)
nuestra afirmacion equivale a log N
para k N n 2k N ,
2
log(W N + 1)
pero eso sigue de log N
, lo que ciertamente es verdad si el
2
crecimiento de W es suficientemente lento (W N 1 basta).

DE LA MEDIDA PSEUDOALEATORIA
5.1. CONSTRUCCION

79

Precisaremos de lo dos resultados siguientes, que probaremos posteriormente,


los cuales son esencialmente debidos a Goldston e Yldrm, y que seran usados
para demostrar que es una medida pseudoaleatoria.
Proposici
on 5.1.5. Sean m y t enteros positivos. Para cada 1 i m,
t
P
sean i (x) =
Lij xj + bi formas lineales con coeficientes enteros Lij tales
pj=1
que |Lij | w(N ) 2 para 1 i m y 1 j t. Asumimos que las ttuplas (Lij )1jt nunca son identicamente nulas, ni hay dos de esas t-tuplas
que son m
ultiplos racionales una de la otra. Sea i := W i + 1. Suponga que
t
Q
B es un producto
Ii Rt de t intervalos Ii , cada uno teniendo longitud de
i=1

por lo menos R10m . Entonces (desde que el crecimiento de funci


on w(N ) sea
suficientemente lento)

m
W log R
2
2
E(R (1 (x)) . . . R (m (x)) | x B) = (1 + om,t (1))
.
(W )
Proposici
on 5.1.6. Sea m 1 un entero, y sea B un intervalo de longitud
de por lo menos R10m . Suponga que h1 , .Q
. . , hm son enteros distintos tales que
|hi hj |.
|hi | m2 para 1 i m y sea :=
1i<jm

Entonces (para N suficientemente grande dependiendo de m, y suponiendo que


el crecimiento de w(N ) es suficientemente lento)
E(R (W (x1 + h1 ) + 1)2 . . . R (W (xm + hm ) + 1)2 | x B)
m Y

W log R
(1 + Om (p1/2 )).
(1 + om (1))
(W )
p|
p primo

En general, en lo sucesivo, usaremos la letra p siempre para denotar primos,


como aqu.
Vamos inicialmente a mostrar como concluir la demostracion del Teorema 5.1.1 a partir de las Proposiciones 5.1.5 y 5.1.6 para despues demostrar
las proposiciones. Comenzaremos mostrando que es de hecho una medida.
Lema 5.1.7. La medida construida en la Definici
on 5.1.3 satisface la estimativa E() = 1 + o(1).
Demostraci
on. Aplicamos la Proposicion 5.1.5 con m = t = 1, 1 (x1 ) = x1
y B = [k N, 2k N ]. Comparando con la Definicion 5.1.3 tenemos E((x) | x
[k N, 2k N ]) = 1 + o(1), pues la Proposicion 5.1.5 proporciona E(R (W x + 1)2 |
W log R
Por otro lado, obviamente tenemos E((x) | x
x B) = (1 + o(1))
(W )
ZN \[k N, 2k N ]) = 1, por la misma Definicion 5.1.3.
Combinando los dos resultados concluimos la demostracion del lema.

80CAPITULO 5. MEDIDAS PSEUDOALEATORIAS SOPORTADAS EN LOS PRIMOS


Proposici
on 5.1.8. La funci
on satisface la (k 2k1 , 3k 4, k) condici
on
de formas lineales.
Demostraci
on. Sean i (x) =

t
P
j=1

Lij + bi formas lineales como en la Defini-

cion 3.2.1, es decir, tenemos m k 2k1 , t 3k 4, y los Lij son n


umeros
racionales tal que el valor absoluto del numerador y del denominador es a lo
maximo k, de modo que ninguna de las t-tuplas (Lij )1jt es nula o m
ultiplo
racional de alguna otra. Queremos mostrar que
E((1 (x)) . . . (m (x)) | x Zm
N ) = 1 + o(1).

(*)

Podemos suponer que los Lij son enteros, componiendo 1 , 2 , . . . , m con la


m
m
multiplicacion por k! dada por M : Zm
M ZN , M (x) = k!x(mod N ), x ZN .
Como mcd(k!, N ) = 1, para N grande, M es una biyeccion, y el valor esperado
no muda. Con esto, la cota superior para los |Lij | muda para k k! < (k + 1)!.
Como
w(N
p
) tiende a infinito cuando N crece, podemos suponer que (k + 1)! <
w(N ) 2, tomando N grande. Precisamos de este hecho para poder aplicar la
Proposicion 5.1.5.
Como la definicion de tiene dos partes, no es posible aplicar directamente
t
la Proposicion 5.1.5. Entonces vamos a dividir Zm
N en Q bloques de lados casi
iguales, donde Q = Q(N ) es una funcion de crecimiento lento en N a ser escogida
posteriormente. Sean entonces los bloques
Bu1 u2 ...ut = {x Zm
N ; xj [Luj N/Q], L(uj + 1)N/Q]), 1 j t}
donde u1 , u2 , . . . , ut ZQ , e identificamos ZQ con {0, 1, 2, . . . , Q 1}.
Note que modulo un error multiplicativo de 1 + o(1), podemos escribir el
lado izquierdo de (*) como
E(E((1 (x)) . . . (m (x)) | x Bu1 u2 ...ut )u1 , . . . , ut ZQ ).
Llamamos a una t-tupla (u1 , u2 , . . . , ut ) ZtQ buena si para 1 i m, cada conjunto i (Bu1 u2 ...ut ) esta completamente contenido en el intervalo [k N, 2k N ]
o es completamente disjunto de este intervalo. De la Proposicion 5.1.5 y de la
Definicion 5.1.3, observamos que E((1 (x)) . . . (m (x)) | x Bu1 u2 ...uk ) =
1 + om,t (1), siempre que (u1 , u2 , . . . , ut ) sea buena, pues podemos substituir ca(W ) 2
da factor (i (x)) por
(i (x)) o por 1, y, si el crecimiento de Q es
W log R R
suficientemente lento, N/Q > R10m , por la definicion de R y por la acotacion
de m.
(W ) 2
Si (u1 , u2 , . . . , ut ) no es buena, podemos mayorar por 1+
(i (x)),
W log R R
multiplicar, expandir y aplicar la Proposicion 5.1.5 a cada termino para obtener
una cota del tipo
E((1 (x)) . . . (m (x)) | x Bu1 u2 ...uk ) = Om,t (1).

DE LA MEDIDA PSEUDOALEATORIA
5.1. CONSTRUCCION

81

Veremos ahora que la proporcion de t-tuplas (u1 , u2 , . . . , ut ) ZtQ que no


son buenas es a lo maximo Om,t (1/Q), y luego el lado derecho de (*) es 1 +
om,t (1) + Om,t (1/Q) = 1 + om,t (1), lo que concluye la demostracion. Para tal
efecto, supongamos que (u1 , u2 , . . . , ut ) no es buena. Entonces existen i m y
x, x0 Bu1 u2 ...ut tales que i (x) pertenece al intervalo [k N, 2k N ] mas i (x0 )
no. Por la definicion de Bu1 u2 ...ut (y por la acotacion de los Lij ), tenemos i (x),
t
P
i (x0 ) =
Lij bN uj /Qc + bi + Om,t (N/Q). Por tanto, para alg
un a {1, 2},
a k N =
t
P
j=1

j=1
t
P

j=1

Lij bN uj /Qc + bi + Om,t (N/Q). Dividiendo por N/Q, obtenemos

Lij uj = a k Q + bi Q/N + Om,t (1) (mod Q). Como (Lij )1jt es no nulo, el

n
umero de t-tuplas (u1 , u2 , . . . , ut ) que satisfacen esta ecuacion es como maximo
Om,t (Qt1 ). Haciendo a y i variar, concluimos que la proporcion de t-tuplas que
no son buenas es como maximo Om,t (1/Q), como queramos.
A continuacion veremos como usar la Proposicion 5.1.6 para demostrar que
satisface la condicion de correlaciones. Para eso, vamos inicialmente estimar el
factor
Q
(1 + Om (p1/2 )) que aparece en la proposicion:
p|
p primo

ametro. Existe una funci


on peso = m : Z
Lema 5.1.9. Sea m 1 un par
R+ tal que (n) 1, n 6= 0 y, para cada h1 , h2 , . . . , hm [k N, 2k N ] distintos, tenemos
Y

(1 + Om (p1/2 ))

(hi hj ),

1i<jm

p|
p primo

donde fue definido en la Proposici


on 5.1.6, de modo que E( q (n) | 0 < |n|
N ) = Om,q (1), para 0 < q < .

Demostraci
on. Note que

Q
p|
p primo

(1+Om (p1/2 ))

Q
1i<jm

Om (1)

(1 + p1/2 )

p|hi hj
p primo

Entonces podemos, usando la desigualdad entre las medias aritmetica y geometrica (y absorbiendo las constantes en el factor y en el exponente Om (1)),
tomar Q
m (n)
=
Om (1)
(1 + Om (p1/2 ))Om (1) para cada n 6= 0 (el valor de en 0 es
p|n
p primo

irrelevante para el lema, pues estamos tomando los hj distintos).

82CAPITULO 5. MEDIDAS PSEUDOALEATORIAS SOPORTADAS EN LOS PRIMOS


Para concluir la demostracion del lema, basta mostrar que
Y

1/2 On (1)
E
(1 + p )
| 0 < |n| N = Om,q (1), para 0 < q < .
p|n
p primo

Como (1 + p1/2 )Om (q) 1 + p1/4 para todos los primos p, con excepcion de
a lo maximo Om,q (1) primos, tenemos
Y

1/2 Om (q)
1/4
E
(1+p
)
| 0 < |n| N = Om,q (1)E
(1+p
)|0<nN .
p|n
p primo

Por otro lado,

p|n
p primo

(1 + p1/4 )

p|n
p primo

d1/4 , y luego

d|n

1
1/2 Om (q)
E
(1 + p
)
| 0 < |n| N Om,q (1)
N
p|n
p primo

Om,q (1)

X X

d1/4

1nN d|n

N
1 X N 1/4
d
= Om,q (1),
N
d
d=1

pues

d5/4 < .

d=1

Podemos ahora demostrar la condicion de correlaciones.


Proposici
on 5.1.10. La medida satisface la 2k1 -condici
on de correlaciones.
k1
Demostraci
on. Queremos mostrar que, para 1 m
y h1 , . . . , hm ZN
P2
(hi hj ), donde la
tenemos E((x + h1 ) . . . (x + hm ) | x ZN )
1i<jm

funcion peso = m es acotada en Lq para todo q.


Fijamos m, h1 , . . . , hm . Vamos a tomar la funcion peso construida en el
Lema 5.1.9 (identificando ZN con los enteros entre N/2 y N/2) multiplicada
por un factor constante Om (1) conveniente y definir (0) = exp(Cm log N/ log log N ),
para alguna constante universal grande C. Por el lema anterior concluimos que
E( q ) = Om,q (1) para todo q, pues (0) solamente contribuye con om,q (1) para
el valor de E( q ).
Trataremos inicialmente el caso en el que dos de los hi soniguales. En
esta
2 log N
situacion, podemos usar la estimativa grosera ||||L exp
, que
log log N
sigue de la definicion de (a decir verdad obtenemos facilmente de la definicion
que |(n)| log N d(n)2 , donde d(n) es el n
umero de divisores de n; tenemos,

DE FORMAS LINEALES PARA R


5.2. CONDICION

83

3 log N
por otro lado, d(n) = O exp
ver apendice, de donde sigue
4 log log N
nuestra estimativa), y la afirmacion en ese caso sigue de la eleccion de (0).
Supongamos ahora que los hi son todos distintos. Sea
g(n) :=

(W ) 2R (W n + 1)

1[k N,2k N ] (n).


W
log R

Por la construccion de , tenemos


E((x+h1 ) . . . (x+hm ) | x ZN ) E((1+g(x+h1 )) . . . (1+g(x+hm )) | x ZN ).
El lado derecho de arriba puede ser reescrito como
Y

X
E
g(x + hi ) | x ZN .
A{1,...,m}

iA

Note que para i, j A podemos suponer que |hi hj | k N (pues, caso


contrario, la esperanza correspondiente se anula). Por la Proposicion 5.1.6 y por
el Lema 5.1.9 obtenemos por tanto
Y

X
E
g(x + hi ) | x ZN (1 + Om (1))
m (hi hj ),
iA

1i<jm

y sumando sobre todos los A, obtenemos el resultado, despues de multiplicar


m por una constante adecuada.
Los Lemas 5.1.4 y 5.1.7, y las Proposiciones 5.1.8 y 5.1.10 concluyen la
demostracion de que es una medida pseudoaleatoria y del Teorema 5.1.1.
Ahora nos vamos a dedicar a demostrar las Proposiciones 5.1.5 y 5.1.6.

5.2.

Condici
on de formas lineales para R

Vamos a demostrar la Proposicion 5.1.5. Recordemos que tenemos, para


t
P
cada i con 1 i m, una forma lineal i (x) =
Lij xj + bi en t variables
j=1
p
x1 , . . . , xt . Los coeficientes Lij satisfacen |Lij | w(N )/2, donde w(N ) es una
funcion con crecimiento lento en N . Estamos suponiendo que ninguna t-tupla
(Lij )1jt es nula o m
ultiplo de alguna otra. Definimos i = W i + 1. Sea
t
Q
B=
Ij un producto de intervalos Ij , cada uno con longitud mayor o igual
j=1

a R10m . Queremos demostrar la estimativa


m

W log R
.
E(R (1 (x))2 . . . R (n (x))2 | x B) = (1 + o(1))
(W )

84CAPITULO 5. MEDIDAS PSEUDOALEATORIAS SOPORTADAS EN LOS PRIMOS


La primera etapa de la demostracion sera eliminar el papel del bloque B.
Podemos usar la definicion de R para expandir el lado izquierdo como
Y
m
E

(di )(d0i ) log

i=1 di ,d0i R
di ,d0i |i (x)

R
R
log 0 | x B ,
di
di

lo que puede ser reescrito como


Y
m

X
d1 ,...,dm ,d01 ,...,d0m R

(di )(d0i ) log

i=1

m
R
R
log 0 E
1di ,d0i |i (x) | x B .
di
di
i=1

(5.1)
Debido a la presencia de la funcion de Mobius podemos suponer que los di ,
d0i son libres de cuadrados. Sea D = mcm(d1 , . . . , dm , d01 , . . . , d0m ) el mnimo
com
un m
ultiplo de los di y de los d0i ; tenemos D R2m . Note que la expresion
m
Q
1di ,d0i |i (x) es periodica con perodo D en cada coordenada de x, y por tanto
i=1

puede ser definido con dominio ZtD . Como B es un producto de intervalos de


longitud mayor o igual a R10m , tenemos
Y

m
m
E
1di ,d0i |i (x) | x B = E
1di ,d0i |i (x) | x ZtD + Om,t (R8m ).
i=1

i=1

La contribucion de los terminos de error Om,t (R8m ) para (5.1) puede ser mayorada groseramente por R2m (log R)2m Om,t (R8m ) = Om,t (R6m (log R)2m ).
Basta mostrar, por tanto, que
X
d1 ,...,dm ,d01 ,...,d0m R

Y
m
i=1

m
R
R
t
0
1di ,di |i (x) | x ZD =
log 0 E
di
di
i=1

m
W log R
= (1 + o(1))
.
(5.2)
(W )

(di )(d0i ) log

Para demostrar eso, escribiremos el lado izquierdo como una integral de


lnea de un producto de Euler, que por su vez puede ser escrito en terminos de
la funcion de Riemann y otros factores sencillos.
Comenzamos usando el teorema Chino del resto (y el hecho de que los di , d0i
son libres de cuadrados) para reescribir
Y

m
Y
E
1di ,d0i |i (x) | x ZtD =
E
1i (x)0(mod p) | x Ztp
i=1

p|D
p primo

i,p|di d0i

(el lado izquierdo es la probabilidad de que i (x) sea m


ultiplo de di y de d0i ,
para todo i m, lo que equivale a i ser m
ultiplo de p siempre que p sea
un primo que divide di o di0 , pues los di , d0i son libres de cuadrados). Note

DE FORMAS LINEALES PARA R


5.2. CONDICION

85

que la restriccion p|D en el lado derecho puede ser removida, pues, si p D, p


nunca dividira di d0i , de donde el multiplicando en ese caso es 1. As, escribiendo
Xd1 ,...,dm (p) := {1 i m; p | di } y

Y
t
X (p) := E
1i (x)0(mod p) | x Zp , para cada X {1, 2, . . . , m},
iX

tenemos
Y

m
Y
Xd1 ,...,dm (p) Xd0 ,...,d0
E
1di ,d0i |i (x) | x ZtD =
i=1

p primo

m (p)

(p).

Podemos entonces escribir el lado izquierdo de (5.2) como


X
d1 ,...,dm ,d01 ,...,d0m Z+

Y
m
i=1

(di )(di ) log+


Y

p primo

E
E
log

+
d0i
d0i

Xd1 ,...,dm (p) Xd0 ,...,d0


1

m (p)

(p).

A continuacion, vamos expresar los logaritmos en terminos de funciones multiplicativas de los di , d0i por medio de integrales de lnea. Para eso, usaremos el
siguiente resultado:
Lema 5.2.1. Dado > 0, sea (t) la recta vertical parametrizada Zpor (t) =
1
xz
+ it, < t < +. Tenemos entonces, para cada x > 0 real,
dz =
2i z 2
log+ (x).

Demostraci
on. Dado M > , sea (M ) la restriccion de al intervalo

e (M ) forM 2 2 , M 2 2 . Si 0 < x < 1 considere el camino cerrado


M
(M )
1
1
mado por seguido del camino
e
: [ cos (/M ), cos (/M )] C,

e(M ) (t) = M eit . ComoZla funcion xz /z 2 no tiene singularidades en el inxz


e (M ) , tenemos
terior de
dz = 0. Por otro lado, como 0 < x < 1,
e(M ) z 2

Z
z

x
1

dz = O
, de donde, en ese caso,
2
z
M
(M
)

e
Z z
Z
Z
1
xz
1
xz
x
1
dz
=
l
m
dz
=

l
m
dz = 0 = log+ (x).
2
M 2i (M ) x2
M 2i
2i z 2
e(M ) z
b (M ) formado por (M ) seguido del camino
Si x 1, considere el camino cerrado
(M )
1
1

: [cos (/M ), 2 cos (/M )] C, (M ) (t) = M eit . La u


nica singu
b (M ) es z = 0, y xz /z 2 = ez log x z 2 =
laridad de xz /z 2 en el interior de
1 + z log x + z 2 log2 x/2 + . . .
log2 x
2
1
=
z
+
z
log
x
+
+ . . . tiene residuo
z2
2

86CAPITULO 5. MEDIDAS PSEUDOALEATORIAS SOPORTADAS EN LOS PRIMOS


log x en z = 0, de donde

(M )

1
2i

Z
xz /z 2 dz = log x. Como x 1 y Re z en

b(M )

1
z
2
,
, de donde, en ese caso,
x /z dz = O
M

(M )

1
2i

xz
1
dz = lm
2
M

z
2i

xz
dz =
2
(M ) z
Z
xz
dz = log x = log+ (x).
= log x lm
2
M
(M ) z

A continuacion, 1 (t) denotara la reta vertical (t) correspondiente a =


1
1
, es decir, 1 (t) :=
+ it, < t < . Tenemos, por el lema
log R
log R
anterior,
Z
1
xz
dz = log+ (x).
2i 1 z 2

Note que Rz es acotada en 1 : R1 (t) = R1/ log R = e, t R.


Podemos, usando la identidad de arriba, reescribir el lado izquierdo de (5.2)
como
0
Z
Z
m
Y
Rzj +zj
0
(2i)2m
...
F (z, z 0 )
2 z 02 dzj dzj ,
z
1
1
j j
j=1
0
en 1 ,
donde hay 2m integrales de lnea en las variables z1 , . . . , zm , z10 , . . . , zm
0
)y
z := (z1 , . . . , zm ), z 0 := (z10 , . . . , zm
0

F (z, z ) :=

Y
m

X
d1 ,...,dm ,d01 ,...,dm0 Z+

j=1

(dj )(d0j )
z

Xd1 ,...,dm (p)Xd0 ,...,d0

0z 0

dj j dj j

p primo

(p) (p).

(5.3)
Observe que el sumando en (5.3) es una funcion multiplicativa de los dj , d0j , y
por tanto tenemos (por
Qlo menos 0formalmente) una representacion en producto
de Euler F (z, z 0 ) =
Ep (z, z ), donde
p primo

Ep (z, z 0 ) :=

X
X,X 0 {1,...,m}

(1)|X|+|X | XX 0 (p)
P

jX

zj +

jX 0

zj0

De la definicion de X (p) tenemos (p) = 1 y X (p) 1, de donde Ep (z, z 0 ) =


1 + O (1/p ) cuando Re(zj ), Re(zj0 ) > . Por tanto el producto de Euler de
arriba es absolutamente convergente (y vale la igualdad en (5.3)) en el dominio
{Re(zj ), Re(zj0 ) 1}, por lo menos.
Vamos ahora explotar la hipotesis que las partes lineales de 1 , . . . , m son
no nulas y no son m
ultiplos racionales de ninguna otra.

DE FORMAS LINEALES PARA R


5.2. CONDICION

87

Lema 5.2.2 (Estimativa del factor local). Si p w(N ), entonces X (p) = 0


para todo conjunto no vaco X. En particular, Ep = 1 si p w(N ). Si p >
w(N ), entonces X (p) = p1 cuando |X| = 1 y X (p) p2 cuando |X| 2.
Demostraci
on. La primera afirmacion es inmediata, pues las funciones j : Ztp
Zp son identicamente 1 cuando p w(N ). Para la segunda afirmacion, observe
que si p > w(N ) y X = {j}, cada elemento de Zp es imagen por j de pt1
elementos de Ztp , de donde X (p) = E(1j (x)0(mod p) | x Ztp ) = 1/p.
Supongamos ahora que p > w(N ) y |X| = 2. Vamos a ver que ninguna de
las formas lineales puras W (i bi ) es m
ultiplo de ninguna otra modulo p. De
hecho, si fuese el caso, tendramos Lij Li0 j (mod p) para un cierto y todo
j t, pero,psi a/q
y a0 /q 0 son dos racionales en su forma simplificada con |a|,
0
0
|a |, q, q < w(N ) 2 y a/q = a0 /q 0 (mod p) entonces a = a0 , q = q 0 . Por tanto,
todos los racionales Lij /Li0 j , 1 j t son iguales, y luego las formas lineales
puras i bi y i0 bi0 son m
ultiplos racionales una de la otra, absurdo. Por
tanto, el conjunto de los x (Z/pZ)t para los cuales i (x) 0(mod p) para todo
i X esta contenido en la interseccion de dos subespacios afines de (Z/pZ)t , y
por tanto tiene como maximo pt2 elementos, de donde X (p) p2 .
El lema anterior implica, comparando con la definicion de Ep (z, z 0 ) que
Ep (z, z 0 ) = 1 1p>w(N )

m
X
1zj
0
0
p
+ p1zj p1zj zj +

(5.4)

j=1

+ 1p>w(N )

O(1/p2 )

X,X {1,...,m}
|XX 0 |2

jX

zj +

jX 0

zj0

donde el numerador O(1/p2 ) no depende de z, z 0 .


(1) (2) (3)
Vamos ahora a factorizar Ep como Ep = Ep Ep Ep , donde
Ep(1) (z, z 0 ) := Q
m
j=1

1 1p>w(N ) p1zj

Ep (z, z 0 )
0

1 1p>w(N ) p1zj

1 1p>w(N ) p1zj zj

m
Y

1
0 1
0
Ep(2) (z, z 0 ) :=
1 1pw(N ) p1zj
1 1pw(N ) p1zj
1 1pw(N ) p1zj zj

Ep(3) (z, z 0 ) :=

j=1
m
Y

0
0 1
1 p1zj 1 p1zj 1 p1zj zj
.

j=1

Definiendo Gj :=
menos para

(j)

Ep

p primo
Re(zj ), Re(zj0 )

para j = 1, 2, 3 tenemos F = G1 G2 G3 (por lo

suficientemente grandes). En terminos de la funcion


m

1
(1 + zj + zj0 )
Q
de Riemann, (s) =
11/ps
, tenemos G3 (z, z 0 ) =
0 ,
j=1 (1 + zj )(1 + zj )
p primo
Q

88CAPITULO 5. MEDIDAS PSEUDOALEATORIAS SOPORTADAS EN LOS PRIMOS


y en particular G3 es holomorfa en (Re z > 0)2m , y se extiende de forma meromorfa a una vecindad de la clausura de este dominio (la verdad a todo C2m ).
Para los otros factores, haremos estimativas que permiten continuarlos analticamente un poco a la izquierda de los ejes imaginarios.
Definici
on 5.2.3. Para cada > 0, sea Dm C2m el dominio

Dm = zj , zj0 | < Re(zj ), Re(zj0 ) < 100, 1 j m .


Si G = G(z, z 0 ) es una funcion analtica de 2m variables complejas en Dm ,
definimos la norma de G en C k (Dm ) para cada k N como
||G||C k (Dm ) =
sup
a1 ++am +a01 ++a0m k

a1
a0m
am a01

...
...
GL (Dm )
0
0

z1
zm
z1
zm

donde a1 , . . . , am , a01 , . . . , a0m recorren a los enteros no negativos con suma menor
o igual a k.
Lema 5.2.4. Los productos de Euler

(j)

Ep

para j = 1, 2 son absoluta-

p primo

m
mente convergentes en el dominio D1/30m
. En particular, G1 , G2 pueden ser
continuadas analticamente a ese dominio. Adem
as, tenemos las estimativas
m
m
||G1 ||C m (D1/30m
) Om (1), ||G2 ||C m (D1/30m
) Om,w(N ) (1), G1 (0, 0) = 1+om (1)
y G2 (0, 0) = (W/(W ))m .

Nota: Los resultados del Captulo 1 sobre a funcion muestran que G3 se


m
m
extiende de manera meromorfa a D1/2
D1/30m
. La eleccion de = 1/30m
en el lema anterior no es la u
nica posible: cualquier positivo dependiendo
solamente de m sera suficiente. La dependencia del termino Om,w(N ) (1) en
w(N ) no es importante, pero es posible obtener sin mucha dificultad cotas del
tipo w(N )Om (w(N )) .
Demostraci
on. Vamos a considerar inicialmente el caso j = 1. De (5.4) y de la
expansion en serie de Taylor de las funciones envueltas, tenemos la estimativa

(1)
m
, lo que implica la convergrosera Ep (z, z 0 ) = 1 + Om p2+2/30m en D1/30m
m
gencia del producto y la estimativa de G1 en C m (D1/30m
). La estimativa para
G1 (0, 0) tambien sigue de ah, pues los factores del producto son identicamente
iguales a 1 para p w(N ).
La estimativa para G2 es facil pues G2 es un producto finito de como maximo
Q p 1
w(N ) terminos, y la formula para G2 (0, 0) sigue directamente de
=
p
p primo
pw(N )

(W )

5.3. CORRELACIONES DE ORDEN SUPERIOR DE R

89

Para estimar el lado izquierdo de (5.2), lo escribimos en forma integral de


manera que podamos usar el siguiente lema debido a Goldston e Yldrm, el
cual estima integrales de contorno como las que aparecen en este contexto:
Lema 5.2.5. Sea R un real positivo y sea G = G(z, z 0 ) una funci
on analtica
en 2m variables complejas en el dominio Dm para alg
un > 0. Suponga que

||G||C m (Dm ) = exp Om, ((log R)1/15 ) .


Entonces
1
(2i)2m

G(z, z 0 )

...
1

= G(0, . . . , 0)(log R)m +

m
X

m
Y

(1 + zj + zj0 ) Rzj +zj


0
0 ) z 2 z 02 dzj dzj =
(1
+
z
)(1
+
z
j
j
j
j
j=1

1/10
Om, ||G||C j (Dm ) (log R)mj + Om, e(log R)
,

j=1

para un cierto = (m) > 0.


Este lema no sera demostrado aqu porque su demostracion pasa por exhibir
regiones libres de ceros de la funcion zeta (un poco al izquierda de la region
encontrada en el apendice del captulo 1) y varios calculos basados en el comportamiento de en este dominio. Para el lector curioso por la demostracion de
este lema, recomendamos la lectura de [GT].
Vamos aplicar este lema con G = G1 G2 y = 1/30m. Por el Lema 5.2.4 y
por la regla de Leibnitz, obtenemos las estimativas
m
||G||C j (D1/30m
) Oj,m,w(N ) (1), para todo j m.

En particular, obtenemos ||G||C m (Dm ) = exp Om, (log R)1/15 ) desde que el
crecimiento de w(N ) sea suficientemente lento. El Lema 5.2.4 tambien nos da
G(0, 0)
=
(1 + om (1))(W/(W ))m . Concluimos que, si el crecimiento de w(N ) es suficientemente lento, nuestra expresi
on integral para el lado izquierdo de (5.2) es,

m
por el Lema 5.2.5, (1+om (1) W log R/(W ) , lo que concluye la demostracion
de la Proposicion 5.1.5.

5.3.

Correlaciones de orden superior de R

Vamos ahora adaptar los argumentos anteriores para demostrar la Proposicion 5.1.6. Tenemos ahora solamente una variable, pero no podemos usar el
Lema 5.2.2, pues las formas lineales solamente pueden diferir por los terminos constantes en ese caso. Con todo, los argumentos anteriores a este lema
contin
uan funcionando. En particular, podemos escribir el lado izquierdo de la
desigualdad del enunciado da Proposicion 5.1.6 como
0
Z
Z
m
Y
Rzj +zj
0
...
F (z, z 0 )
(2i)2m
2 z 02 dzj dzj ,
z
1
1
j j
j=1

90CAPITULO 5. MEDIDAS PSEUDOALEATORIAS SOPORTADAS EN LOS PRIMOS


donde F es definido como en (5.3), con la diferencia de que ahora X (p) debe
ser definido como
Y

X (p) := E
1W (x+hi )+10(mod p) | x Zp .
iX

Aun tenemos (p) = 1 para todo p. El analogo del Lema 5.2.2 es el siguiente:
Lema 5.3.1. Si p w(N ), entonces X (p) = 0 para todo X 6= . En particular,
Ep = 1 cuando p w(N ). Si p > w(N ), entonces X (p) = p1 cuando |X| = 1
y X (p) p1 cuando |X| 2. Q
Adem
as, cuando |X| 2, tenemos X (p) = 0
siempre que p no divide :=
|hi hj |.
1i<js

Demostraci
on. Cuando p w(N ), tenemos W (x+hi )+1 1 (mod p), de donde
sigue nuestra afirmacion. Cuando p > w(N ), y |X| 1, X (p) = 1/p cuando
todas las clases de congruencia hi (mod p), i X son iguales, y X (p) = 0 caso
contrario, y da ah sigue el resultado.
Aplicando el lema anterior, obtenemos el siguiente analogo de (5.4):
Ep (z, z 0 ) = 11p>w(N )

m
X

0
0
p1zj +p1zj p1zj zj +1p>w(N ),p| p (z, z 0 )

j=1

donde p (z, z 0 ) es una expresion da la forma


X

p (z, z 0 ) =

X,X 0 {1,...,m}
|XX 0 |2

O(1/p)

pjX

zj +

jX 0

zj0

en la cual la cantidad O(1/p) no depende de z, z 0 . Podemos entonces factorizar


(0) (1) (2) (3)
Ep = Ep Ep Ep Ep , donde
Ep(0) = 1 + 1p>w(N ),p| p (z, z 0 )
Ep(1) =

Ep
(0)
Ep

m
Q

(1 1p>w(N ) p1zj )(1 1p>w(N ) p1zj )(1 1p>w(N ) p1zj zj )1

j=1

Ep(2) =
Ep(3) =

m
Y
j=1
m
Y

(1 p1zj )(1 p1zj )(1 p1zj zj )1 .

j=1

Sea Gj =

Q
p primo

(j)

Ep . Entonces, como antes, F = G0 G1 G2 G3 , y G3 es dado

(1 + zj + zj0 )
0 , como antes. Para G0 , G1 y G2 , tenemos el siguiente
j=1 (1 + zj )(1 + zj )
analogo al Lema 5.2.4:

por

m
Q

(1 1pw(N ) p1zj )1 (1 1pw(N ) p1zj )1 (1 1pW (N ) p1zj zj )

5.3. CORRELACIONES DE ORDEN SUPERIOR DE R


Lema 5.3.2. Sea 0 < 1/30m. Los productos de Euler

91
Q

(`)

Ep

para

p primo

` = 0, 1, 2 son absolutamente convergentes en el dominio Dm . En particular,


G0 , G1 y G2 pueden ser continuados analticamente a ese dominio. Adem
as,
tenemos las estimativas siguientes:
||G0 ||C r (Dm ) Om (1)
||G0 ||C m (Dm )

log R r
log log R

1 + Om (p2m1 )
p|
p primo

exp Om ((log R)1/15 )

||G1 ||C m (Dm ) Om (1)


||G2 ||C m (Dm ) Om,w(N ) (1)

G0 (0, 0) =

1 + Om (p1/2 )
p|
p primo

G1 (0, 0) = 1 + Om (1)
G2 (0, 0) = (W/(W ))m .
Demostraci
on. Las estimativas para G1 y G2 pueden ser probadas exactamente
como en el Lema 5.2.4 (los factores adicionales p (z, z 0 ) que aparecen en el
(1)
numerador y en el denominador de Ep se simplifican a una expresion de segundo orden, y por tanto no crean dificultades adicionales); por tanto amos a
dedicarnos a las estimativas
sobre G0 .
Q
(0)
umero de primos que dividen es como
Tenemos G0 =
Ep . El n
p|
p primo

maximo O(log / log log ) (ver apendice). Usando la estimativa grosera


Y
2
=
|hi hj | N m ROm (1) ,
1i<jm

vemos que el n
umero de factores en el producto de Euler es O(log R/ log log R).
Diferenciando r veces para 0 r m por medio de la regla de Leibnitz,
obtenemos una suma de Om ((log R/ log log R)r ) terminos, cada uno de los cuales
consistiendo de Om (log R/ log log R) factores, los cuales son iguales a alguna
un orden entre 0 y r. En Dm , cada factor es
derivada de 1 + p (z, z 0 ), de alg
2m1
acotado por 1 + Om (p
) (la verdad, los terminos que contiene un n
umero
positivo de derivadas seran peque
nos, pues el termino constante 1 es eliminado).
Eso nos da la primera estimativa sobre ||G0 ||C r (Dm ) .
Para probar la estimativa siguiente, basta mostrar que
Y

1 + Om (p2m1 ) exp Om ((log R)1/15 ) .


p|
p primo

92CAPITULO 5. MEDIDAS PSEUDOALEATORIAS SOPORTADAS EN LOS PRIMOS


Tomando
logaritmos y usando la hipotesis 1/30m, es suficiente demostrar
P 14/15
que
p
O((log )1/15 ), pues ROm (1) . Para eso, como tiene
p|

como maximo O(log / log log ) factores primos (ver apendice), tenemos
X
X
p14/15
n14/15 = O((log )1/15 ),
p|

1nO(log / log log )

como queramos.
(0)
La estimativa para G0 (0, 0) sigue de la estimativa grosera Ep (z, z 0 ) = 1 +
Om (p1/2 ).
Aplicamos ahora el Lema 5.2.5 con := 1/30m
y G := G0 G1 G2 . Aun por
la regla de Leibnitz, tenemos ||G||C m (Dm ) = exp Om, ((log R)1/15 ) , de donde,
por el lema,
1
2i

Om (1)

0
m
Y
Rzj +zj
0
...
F (z, z )
2 z 02 dzj dzj
z
1
1
j
j
j=1

Y
W m
1 + Om (p1/2 ))+
(log R)m
(W )
p|

(log R)m Y

1/10
+ Om,w(N )
1 + Om (p1/2 ) + Om e(log R)
,
log log R
p|

y, eligiendo w(N ) que crezca de modo suficientemente lento en relacion a N (y


luego tambien en relacion a R), el primer termino dominara a los demas, lo que
concluye la demostracion de la Proposicion 5.1.6.
Nota: De hecho el argumento anterior puede ser usado para dar una estimativa
asintotica para el lado izquierdo de la desigualdad del enunciado de la Proposicion 5.1.6, en vez de proporcionar apenas una cota superior. Para eso, basta
estimar G0 (0, 0) mas cuidadosamente. Esto fue realizado en detalle por Goldston e Yldrm en el caso W = 1.
Comentarios Finales: Podemos evitar el uso del teorema de Dirichlet sustie
tuyendo W n + 1 por W n + b en la definicion de (n),
donde b satisface mcd
(b, W ) = 1, 1 b < W y es tal que #{1 n N | W n + b es primo} y maxiP
e
mo, pues, de hecho, solamente precisamos de la estimativa
(n)

k N n2k N

c k N , para alguna constante positiva c. Ese mismo truco debe ser usado en
la demostracion de la generalizacion del teorema principal para la existencia
de progresiones aritmeticas arbitrariamente largas en conjuntos de primos con
densidad relativa positiva (tales conjuntos no necesariamente contendran primos
congruentes a 1 modulo W ). El resto del argumento no precisa de modificaciones
substanciales.
Observando retrospectivamente a la demostracion, vemos que el termino de
error en el teorema principal no precisa ser o(1), sino basta ser, por ejemplo,

5.4. APENDICE
DEL CAPITULO 3: DOS RESULTADOS ELEMENTALES DE LA TEORIA DE NUMEROS93
1
c(k, ) + o(1), lo que permite tomar w(N ) una constante grande dependiendo
2
apenas de k. Esto hace que la perdida de la proporcion de primos debida a
la paso de n para W n + 1 sea uniformemente acotada en N , lo que permite
probar que existe una constante (k) > 0 tal que el n
umero de progresiones
aritmeticas formadas por k n
umeros primos entre 1 y N es por lo menos ((k) +
N2
o(1))
Por otro lado, argumentos de la teora de la criba muestran
(log N )k
que el n
umero de tales progresiones aritmeticas es Ok (N 2 /(log N )k ), y luego
la estimativa inferior obtenida difiere del n
umero correcto apenas por un factor
acotado.

5.4.
5.4.1.

Ap
endice del Captulo 3: dos resultados elementales de la teora de n
umeros
La f
ormula de inversi
on de M
obius

Definimos
la funcion de Mobius como la funcion : N Z dada por
(
0 si existe p primo tal que p2 | n
(n) =
(1)k si n = p1 p2 . . . pk , con p1 < p2 < . . . < pk primos
En particular, (1) = 1 (1 es el producto de 0 factores primos).
Obs.: La funcion es multiplicativa, es decir, mcd(mn) = 1 (mn) =
(m) (n).

Es bastante com
Pun asociar a una funcion f : N C otra funcion g : N C
dada por g(n) =
f (d). La formula de inversion de Mobius permite recuperar
d|n

f a partir de g. Demostraremos inicialmente lo siguiente


(
0, si n > 1
Lema 5.4.1. :
(d) =
1, si n = 1
d|n
P

Demostraci
on. Tenemos

(d) = (1) = 1. Suponga ahora que n > 1. Sea p

d|1

un factor primo de n. Tenemos X = {d 1; q 2 |m q = 1 y d|n} = Y Z,


donde Y = {d X; p d} y Z = {d X; p|d} = {p d, d Y }. Si d|n y (d) 6= 0
entonces d X. Por otro lado, si d Y , (p d) = (d), pues las paridades de
los n
umeros de factores primos de d y de p d son distintas. Por tanto,
X
d|n

(d) =

X
dX

(d) =

X
dY

(d) +

X
dZ

(d) =

X
dY

((d) + (p d)) =

X
dY

0 = 0.

94CAPITULO 5. MEDIDAS PSEUDOALEATORIAS SOPORTADAS EN LOS PRIMOS


Teorema A.2 (FormulaPda inversion de Mobius): Sean f, g : N C funciones tales que g(n) =
f (d), para todo n N . Entonces tenemos f (n) =
d|n

P n
g(d), para todo n N .

d
d|n
Demostraci
on. Queremos demostrar que f (n) =

P n P
P n
g(d) =

f (d0 ) ,

d
d
d|n
d0 |d
d|n

pero
X n X
X

X
X n X
= f (n),

=
f (d0 )
f (d0 ) =
(d)
f (d0 )

d
d
0
0
0
0
n
d|n

pues

d |d

P
n0
d|
d

5.4.2.

d |n

0
d|
d

d |n

d |d|n

(
0
0
= 0, si n/d > 1, i.e., si d < n
(d)
1, si n/d0 = 1, i.e., si d0 = n.

El orden m
aximo de d(n)

Sea d(n), para cada n N , el n


umero de divisores (positivos) de n. Tenemos
entonces lo siguiente
Teorema A.3: Para todo > 0 existe n0 N tal que n > n0 d(n) <
2(1+) log n/ log log n .
k
1 2
Demostraci
on. Sea n = p
1 p2 . . . pk , p1 < p2 < . . . < pk primos la factorizacion prima de n. Tenemos entonces

d(n) =

k
Y

(1+j ) =

j=1

(1+j )

pj (log n)1

(1+j ), donde = /2(1+).

pj >(log n)1

Para todo j, 1 + j 2j , de donde


P

Y
pj

(1 + j ) 2pj >(log n)

2log n/ log((log n)

= 2log n/(1) log log n

>(log n)1

(de hecho, n

pj >(log n)1

pj j ((log n)1 )pj >(log n)

Por otro lado, para todo j, 1 + j 1 +


log n j log 2. As,
Y
pj (log n)1

(1 + j )

log n
1+
log 2

j
1

).

log n

, pues n pj j 2j
log 2

(log n)1

= 2O(log log n(log n)

5.4. APENDICE
DEL CAPITULO 3: DOS RESULTADOS ELEMENTALES DE LA TEORIA DE NUMEROS95
Tenemos entonces
d(n) =

k
Y

(1 + j ) 2log n/(1) log log n+O(log n/ log log n) < 2(1+) log n/ log log n

j=1

si n es suficientemente grande, pues

1
1
<
= 1 + .
1
1 2

Corolario. Para todo > 0 existe n0 N tal que n > n0 #{p primo, p|n} <
(1 + ) log n/ log log n. (De hecho, tenemos 2#{p primo,p|n} d(n), para todo
entero positivo n.)
Nota: Es posible demostrar que, si p1 < p2 < . . . < pk son los k primeros
k
log Nk
Q
n
umeros primos y Nk =
pj entonces d(Nk ) > 2 log log Nk , para k suficientej=1

mente grande. De hecho, pr < 2r log r, para todo r grande, de donde log Nk =
k
k
P
P
log pj < O(1) +
(log 2 + log j + log log j) = O(1) + k log 2 + k log k k +

j=1

j=2

o(k) + k log log k + o(k) = k(log k + log log k (1 log 2)) + o(k), de donde
log Nk / log log Nk < k(log k + log log k)/ log(k(log k + log log k))
< k = log d(Nk )/ log 2,
para todo k suficientemente grande.

96CAPITULO 5. MEDIDAS PSEUDOALEATORIAS SOPORTADAS EN LOS PRIMOS

Bibliografa
[B] V. Brun, La serie 1/5 + 1/7 + 1/11 + 1/13 + 1/17 + 1/19 + 1/29 + 1/31 +
1/41 + 1/43 + 1/59 + 1/61 + . . . , les denominateurs sont nombres premiers
jumeaux est convergente o`
u finie, Bull. Sci. Math., 124128, 43, 1919.
[Bg] J. Bourgain, On triples in arithmetic progression, GAFA, 968984, vol. 9,
1999.
[DMcK] H. Dym, H.P. McKean, Fourier series and integrals, Academic Press,
1972.
[GPY] D. Goldston, Pintz and Yldrm, Primes in tuples I, aceito para publicacao em Annals of Math..
[G1] T. Gowers, A new proof of Szemeredis theorem for arithmetic progressions
of length four, GAFA, 529551, vol. 8, 1998.
[G2] T. Gowers, A new proof of Szemeredis theorem, GAFA, 465588, vol. 11,
2001.
[GT] B. Green and T. Tao, The primes contain arbitrarily long arithmetic
progressions, aceito para publicacao em Annals of Math..
[R] R. Rankin, Sets of integers containing not more than a given number of
terms in arithmetical progression, Proc. Roy. Soc. Edinburgh Sect. A, 332
344, vol. 65, 1960/1961.

97

Potrebbero piacerti anche