universidad nacional de la plata - unlpdemetrio/monografias/tesis... · universidad nacional de la...

109
UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEM ´ ATICA Trabajo de tesis doctoral: F´ ormulas erg´odicas para medias geom´ etricas y curvas minimales Tesista: Eduardo Mario Ghiglioni Director: Jorge Abel Antezana Codirector: Demetrio Stojanoff no: 2018

Upload: others

Post on 13-Aug-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

UNIVERSIDAD NACIONAL DE LA PLATA

FACULTAD DE CIENCIAS EXACTAS

DEPARTAMENTO DE MATEMATICA

Trabajo de tesis doctoral: Formulas ergodicas para

medias geometricas y curvas minimales

Tesista: Eduardo Mario Ghiglioni

Director: Jorge Abel Antezana

Codirector: Demetrio Stojanoff

Ano: 2018

Page 2: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Indice general

1. Introduccion 1

1.1. Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2. Preliminares del Capıtulo 3 15

2.1. Espacios de Hadamard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.1.1. Ejemplos de espacios de Hadamard . . . . . . . . . . . . . . . . . . . 17

2.2. Baricentros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.3. Teorıa ergodica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.4. Teorema ergodico de Birkhoff y la ley de los grandes numeros . . . . . . . . 23

2.5. Sistemas de Kronecker . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.5.1. Sistemas de Kronecker y medidas de Haar. . . . . . . . . . . . . . . . 28

3. Teorema Ergodico en espacios de Hadamard en terminos de la media in-ductiva 30

3.1. Motivacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2. Una variante del Teorema ergodico . . . . . . . . . . . . . . . . . . . . . . . 38

3.2.1. La media inductiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.3. Formula ergodica asociada a la media inductiva en el caso continuo . . . . . 41

3.3.1. El marco de trabajo y notacion basica . . . . . . . . . . . . . . . . . 41

3.3.2. Demostracion del caso continuo . . . . . . . . . . . . . . . . . . . . . 42

3.4. Formula ergodica asociada a la media inductiva en el caso L1 . . . . . . . . . 47

3.4.1. Dos lemas de aproximacion . . . . . . . . . . . . . . . . . . . . . . . 47

3.4.2. Buena aproximacion por funciones continuas (Mollifiers) . . . . . . . 48

3.4.3. Demostracion del caso L1 . . . . . . . . . . . . . . . . . . . . . . . . 55

3.5. Independencia del punto de comienzo . . . . . . . . . . . . . . . . . . . . . . 56

3.6. Otra forma de convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4. Estructura de las curvas minimales en H(n),P(n) y U(n) con respecto a lametrica de Finsler bi-invariante inducida por la norma traza 59

4.1. Motivacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.2. Estructura de las curvas minimales para la norma traza . . . . . . . . . . . . 60

4.2.1. Estudio de curvas minimales en el espacio de matrices Hermitianasdotada de la norma traza . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.2.2. El espacio de matrices positivas . . . . . . . . . . . . . . . . . . . . . 69

4.2.3. El espacio de matrices unitarias . . . . . . . . . . . . . . . . . . . . . 73

4.3. Geometrıa de los puntos medios en P(n) y H(n) . . . . . . . . . . . . . . . . 76

Page 3: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

5. Estructura de las curvas minimales en U(n) con respecto a la metrica deFinsler bi-invariante inducida por la norma espectral 785.1. El grupo de un parametro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 785.2. El grupo de matrices unitarias . . . . . . . . . . . . . . . . . . . . . . . . . . 805.3. Estructura de las curvas minimales en U(n) . . . . . . . . . . . . . . . . . . 81

5.3.1. Demostracion del Teorema 5.3.1 . . . . . . . . . . . . . . . . . . . . . 825.4. Geometrıa de los puntos medios . . . . . . . . . . . . . . . . . . . . . . . . . 855.5. La Grassmaniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

6. Apendice 926.1. Analisis matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 926.2. Geometrıa de las matrices positivas . . . . . . . . . . . . . . . . . . . . . . . 966.3. Teorema de Lusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 996.4. Centro de masa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

Departamento de Matematica - UNLP Hoja iii de 105

Page 4: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:
Page 5: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

1 Introduccion

El espacio de matrices n× n complejas, M(n), es un espacio de Hilbert con el productointerno 〈A,B〉 = tr(A∗B) y la norma asociada ‖A‖2 = (tr(A∗A))1/2. Esta norma es conocidacomo norma Frobenius o Hilbert-Schmidt. El conjunto de matrices Hermitianas H(n) es unsubespacio vectorial real de M(n). Como el subconjunto P(n) de matrices (estrictamente)positivas es un subconjunto abierto en H(n), resulta ser una variedad diferenciable. Enparticular, el espacio tangente a P(n) en un punto A, es el espacio TAP(n) = A × H(n),identificado por simplicidad con H(n). El producto interno en H(n) nos permite definir unametrica Riemanniana en la variedad P(n), la cual en un punto A, esta dada por

ds = ‖A−1/2dAA−1/2‖2 = [tr(A−1dA)2)]1/2.

En otras palabras, dada una curva suave a trozos α : [a, b] → P(n), su longitud se definecomo

L(α) =

∫ b

a

∥∥α−1/2(t)α(t)α−1/2(t)∥∥

2dt.

A partir de esto, como es usual, la distancia rectificable entre A,B ∈ P(n) se define pormedio de

δ(A,B) = ınf L(α) donde α : [a, b]→ P(n) une A con B en P(n) .

Mas aun, la distancia Riemanniana δ puede ser calculada por

δ(A,B) = ‖log(A1−/2BA−1/2)‖2.

El ınfimo es en realidad un mınimo, y la geodesica que conecta dos matrices positivas A yB tiene la siguiente expresion simple:

γAB(t) = A1/2(A−1/2BA−1/2)tA1/2 . (1.0.1)

Es usual en analisis matricial usar la notacion A#tB en vez de γAB(t). El punto medioA#1/2B se conoce como media geometrica o baricentro entre A y B, y tambien admitela siguiente caracterizacion variacional

A# 12B = argmin

C∈P(n)

(δ2(A,C) + δ2(B,C)

).

No hay razon para restringirnos a solo dos matrices. La nocion de media geometrica sepuede generalizar para mas de dos matrices de manera natural

Λ(A1, . . . , An) := argminC∈P(n)

( n∑j=1

δ2(Aj, C)).

Page 6: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

La solucion del problema de minimizacion de cuadrados mınimos, existe y es unica, por laspropiedades de convexidad de la distancia δ(·, ·).

La media geometrica aparece de manera natural en varios problemas aplicados. Por ejem-plo, en el estudio de senales de radar. En este problema, cada senal es detectada por masde un sensor. La informacion de cada sensor se codifica en un nucleo de covarianza, el cuales semidefinido positivo. Estos nucleos tienen que ser promediados para obtener el resultadofinal. Resulta que la mejor manera de promediar estos nucleos no es la media aritmeticaestandar, si no, la media geometrica que introducimos previamente (ver [19] y las referen-cias allı para mas detalles). Otra aplicacion tıpica de la media geometrica es con problemasrelacionados con metodos de optimizacion del tipo Newton (ver [15],[46]).

El inconveniente usual al lidiar con la media geometrica es que, cuando trabajamos contres o mas matrices, no existe en general una formula cerrada para calcularla. Por esta razon,hubo una extensa investigacion con el objetivo de encontrar buenas maneras de aproximarla media geometrica de tres o mas matrices ([14], [35], [42]). Un avance importante se logroal intentar demostrar la monotonıa de la media geometrica. En otras palabras, se desconocıasi Λ(A1, . . . , An) ≤ Λ(B1, . . . , Bn), para Ai ≤ Bi, donde 1 ≤ i ≤ n. La resolucion de esteproblema condujo a la introduccion de las llamadas medias inductivas.

Para motivar la definicion de las medias inductivas, notar que dada una sucesion ann∈Nde numeros complejos tenemos la siguiente relacion

a1 + a2 + a3

3=

2

3

(a1 + a2

2

)+

1

3a3

...

a1 + . . .+ ann

=n− 1

n

(a1 + . . .+ an−1

n− 1

)+

1

nan.

Sea γa,b(t) = (1− t)a+ t b, y por un momento usemos la notacion a ]t b = γa,b(t). Entonces

a1 + a2 + a3

3=(a1 ] 1

2a2) ] 1

3a3

a1 + a2 + a3 + a4

4=((a1 ] 1

2a2) ] 1

3a3) ] 1

4a4

y ası sucesivamente. En el espacio Euclıdeo los segmentos son las geodesicas. En nuestrocontexto, podemos reemplazar los segmentos por las geodesicas asociadas a la estructuraRiemanniana. Esta es la idea que nos lleva a la definicion de la media inductiva. Dada unasucesion de matrices estrictamente positivas Ann∈N, las medias inductivas se definen dela siguiente manera:

S1(A) = A1

Sn(A) = Sn−1(A)# 1nAn (n ≥ 2).

La propiedad de monotonıa primero fue probada por Lawson y Lim (ver [35], Corolario5.1 y Proposicion 5.2), basandose en los resultados de Sturm sobre estadısticas en espaciode curvatura no positiva (ver [56], Proposicion 6.6). Ellos probaron que si la sucesion esta

Departamento de Matematica - UNLP Hoja 2 de 105

Page 7: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

formada por la eleccion aleatoria e independiente de elementos del conjunto A1, . . . , An,entonces la media inductiva converge casi seguro a Λ(A1, . . . , An). Es decir,

lımk→∞

Sk(Aω(1), . . . , Aω(k)) = Λ(A1, . . . , An) c.t.p. ω ∈ 1, . . . , nN.

La relacion con la monotonıa de Λ(·) yace en el hecho que, la media geometrica se obtienede una sucesion binaria de pasos, cada uno de los cuales es monotono. Es decir,

X1 ≤ X2, Y1 ≤ Y2 implica X1#tX2 ≤ Y1#tY2 para todo t ∈ [0, 1]. (1.0.2)

De esta manera, la media inductiva resulta monotona, y esta propiedad se preserva en ellımite. Observar que el resultado de Lawson y Lim puede ser visto como una “ley fuerte delos grandes numeros”, pues como mencionamos en la motivacion de la media inductiva, latraduccion de este resultado al caso Euclıdeo es la convergencia en casi todo punto de lospromedios a su esperanza. Bhatia y Karandikar [14] simplificaron la prueba de la monotonıade la media geometrica notando que una “ley debil de los grandes numeros” es suficiente.

A partir de estos resultados el problema de la monotonıa estaba resuelto. Notar queademas la media inductiva es computable utilizando la conocida expresion de la geodesica(1.0.1). Sin embargo, mientras que el enfoque probabilıstico es muy interesante, tambien esverdad que la sucesion es desconocida. De esta manera, para encontrar una mejor aproxima-cion, todo decanta en encontrar una sucesion concreta que converja a la media geometrica.El candidato para este proposito es la sucesion que simplemente se repite de manera cıclicaen A0, . . . , Am−1. Consideremos m matrices positivas A0, . . . , Am−1, y definamos la funcionF : Zm → P(n) por F (k) = Ak, donde Zm denota el grupo abeliano de enteros modulo m.Si definimos la sucesion periodica A = F (n)n∈N, entonces Holbrook [29] probo

lımk→∞

Sk(A) = Λ(A0, . . . , Am−1).

Ejemplo. Supongamos que tenemos 3 matrices estrictamente positivas A1, A2 y A3. Recor-damos que en este caso particular:

Λ(A1, A2, A3) = argminC∈P(n)

(δ2(A1, C) + δ2(A2, C) + δ2(A3, C)

).

Luego Holbrook probo que

A1# 12A2# 1

3A3# 1

4A1# 1

5A2# 1

6A3# 1

7A1# 1

8A2 . . .→ Λ(A1, A2, A3)

Departamento de Matematica - UNLP Hoja 3 de 105

Page 8: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

a1

a2a3

a1#1/2a2

(a1#1/2a2)#1/3a3

((a1#1/2a2)#1/3a3)#1/4a1

Figura 1.1: Ejemplificacion de la convergencia de la media inductiva en el caso Euclıdeo.

Formulas ergodicas para medias geometricas

Sea (G,+) un grupo topologico compacto, dotado con una medida de Haar m, y seaτ : G → G una transformacion ergodica. El Teorema ergodico clasico de Birkhoff nos diceque, dada f ∈ L1(G), entonces para m-casi todo ω ∈ G

1

n

n−1∑k=0

f(τ k(ω)) −−−→n→∞

∫G

f(ω)dm(ω). (1.0.3)

Luego, el Teorema de Holbrook puede ser visto como un Teorema ergodico para funcionesdefinidas en Zp que toman valores en P(n). En efecto, pensar que la media inductiva juegael papel de los promedios del lado izquierdo y la media geometrica Λ(A0, . . . , Ad−1) juega elpapel de la integral de f con respecto a la medida de Haar en Zd.

Esta interpretacion del resultado de Holbrook nos sugiere que podemos obtener unaaproximacion computable de la media geometrica de varias matrices en termino de promediosergodicos. Uno de los objetivos de esta tesis es probar tal Teorema ergodico en termino dela media inductiva en un contexto mas general. Mas precisamente, consideremos un sistemadinamico (G, τ), donde G es un grupo compacto y τ es ergodico con respecto a la medidade Haar m. Observar que el grupo tiene que ser abeliano porque las orbitas τngn∈N sondensas en G.

En este contexto, dada una funcion F : G→ P(n), decimos que F ∈ Lp(G,P(n)) si∫G

δp(F (g), B)) dm(g) <∞,

donde B es cualquier matriz positiva. Por la desigualdad triangular, la definicion no dependede la eleccion de B. Siguiendo el trabajo de Sturm [56], el baricentro de F ∈ L1(G,P(n))se define como

βF := argminC∈P(n)

∫G

δ2(F (g), C))− δ2(F (g), B)) dm(g).

En otras palabras, βF denota al baricentro del pushforward measure F∗m. En este caso esposible probar la existencia y unicidad de dicho elemento por las propiedades de continuidad

Departamento de Matematica - UNLP Hoja 4 de 105

Page 9: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

y convexidad uniforme de la funcion,

C 7→∫G

δ2(F (g), C))− δ2(F (g), B)) dm(g).

Como antes, esta definicion no depende de B. Notar que si F ∈ L2(G,P(n)) entonces

βF := argminC∈P(n)

∫G

δ2(F (g), C))dm(g).

En esta tesis probamos el siguiente resultado:

Teorema. Dada A ∈ L1(G,P(n)), para casi todo g ∈ G

lımn→∞

Sn(A(g), A(τ(g)), . . . , A(τn−1(g))

)= βA. (1.0.4)

Observacion. Consideremos como grupo topologico compacto al toro T = z ∈ C : |z| = 1,con la estructura de grupo usual. A continuacion vamos a hacer una analogıa entre el resul-tado de Holbrook y el teorema antes mencionado para este grupo particular. Supongamosque tomamos A ∈ L1(T,P(n)) fija:

1. Si tomamos una rotacion racional θ = 2π/3 en el toro entonces

A(θ(g)) = A1;

A(θ2(g)) = A2;

A(θ3(g)) = A3;

A(θ4(g)) = A1;

A(θ5(g)) = A2;

...

Para ciertas matrices positivas A1, A2, A3. Por el Teorema de Holbrook

lımn→∞

Sn(A(g), A(θ(g)), . . . , A(θn−1(g))

)= Λ(A1, A2, A3) = argmin

C∈P(n)

3∑j=1

δ2(Ai, C).

2. El caso complementario es tomar una rotacion irracional τ . Las rotaciones irracionalesson las unicas rotaciones ergodicas en el toro. Por lo cual, el teorema anterior prueba

lımn→∞

Sn(A(g), A(τ(g)), . . . , A(τn−1(g))

)= βA = argmin

C∈P(n)

∫Tδ2(A(g), C))dm(g).

Con esta observacion podrıamos decir de manera figurativa que, en el toro, el Teorema deHolbrook es el caso racional mientras que (1.0.4) corresponde al caso irracional.

Departamento de Matematica - UNLP Hoja 5 de 105

Page 10: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

a1a2

a3

θ = 2π3

Figura 1.2: Rotacion racional.Ejemplificacion de una rotacion racional en el

toro con un angulo igual a 2π3

.

A(g)

A(τ(g))

A(τ2(g))

A(τ3(g))

τ

Figura 1.3: Rotacion irracional.Ejemplificacion de una rotacion con un

angulo irracional en el toro.

Mas aun, probamos este resultado no solo para funciones que toman valores en P(n),si no tambien, para los espacios de Hadamard (M, δ). Recordamos que un espacio metricocompleto (M, δ) se llama espacio de Hadamard si la distancia satisface la ley del semipa-ralelogramo. Es decir, para todo x, y ∈M existe m ∈M tal que

δ2(m, z) ≤ 1

2δ2(x, z) +

1

2δ2(y, z)− 1

4δ2(x, y).

La desigualdad del semiparalelogramo implica que el punto medio es unico. La existencia yunicidad de puntos medios dan lugar a una unica geodesica γa,b : [0, 1]→ M que conectados puntos cualesquiera a y b. En efecto, primero se define γa,b(1/2) como el punto medioentre a y b. Luego, usando un argumento inductivo, se define la geodesica para todos losnumeros dıadicos racionales en [0, 1]. Finalmente por completitud, se extiende para todot ∈ [0, 1]. Continuaremos usando la notacion a#tb en vez de γa,b(t).

Como en el caso de matrices estrictamente positivas, definimos la media inductiva enespacios de Hadamard de la siguiente manera:

Definicion. (Media inductiva). Sea (M, δ) un espacio de Hadamard. Dado a ∈ MN sedefine

S1(a) = a1

Sn(a) = Sn−1(a)# 1nan (n ≥ 2).

Tanto L1(G,M) como βA, al igual que las medias inductivas, se definen mutatis mutandis.En este contexto el enunciado del teorema resulta ser:

Teorema. Dada A ∈ L1(G,M), para casi todo g ∈ G,

lımn→∞

Sn(A(g), A(τ(g)), . . . , A(τn−1(g))

)= βA. (1.0.5)

Con respecto a la media inductiva: la diferencia principal entre (1.0.4) y (1.0.5) es quepara los espacios de Hadamard, en general, no existe una formula para la geodesica que une

Departamento de Matematica - UNLP Hoja 6 de 105

Page 11: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

dos puntos. En otras palabras, al tratar el problema con mas generalidad se puede perder lacomputabilidad de la media inductiva. Sin embargo, en muchos casos particulares de graninteres como el caso de las matrices positivas, operadores positivos en espacios de Hilbert,entre otros, existe una formula cerrada para las geodesicas que unen dos puntos.

Cabe mencionar que en [56], Sturm desarrollo una teorıa de baricentros de medidasde probabilidad para espacios de Hadamard (ver Subseccion 2.2 para algunas definicionesy resultados basicos). Dotado con este baricentro, los espacios de Hadamard juegan unpapel importante en la teorıa de integracion (variables aleatorias, esperanza y varianza),ley de los grandes numeros, teorıa ergodica, desigualdad de Jensen (ver [17], [27], [38], [48],y [56]), generalizaciones estocasticas de retracciones Lipschitz y problemas de extension defunciones Lipschitz o Holder (ver [39], [45], y [50]) y teorıa de transporte optimo en variedadesRiemannianas (ver [52], y [53]), etc.

Mollifiers en espacios de Hadamard

La generalizacion de P(n), o incluso de variedades Riemannianas con curvatura no po-sitiva, a espacios de Hadamard no es directa. Uno de los motivos es que los espacios deHadamard, en general, no tienen un espacio vectorial finito dimensional subyacente, comoen el caso de variedades. Esto hace que algunos pasos de las demostraciones sean muchomas complicados, y nos llevan a una nueva definicion de mollifiers que solo usa la estructurametrica (ver subseccion 3.4.2). Estos resultados originales son interesantes por sı mismos ygeneralizan unos resultados probados por Karcher en [31].

Mejoras que obtuvimos con respecto a resultados previos

En [6] Austin probo un Teorema ergodico general en espacios de Hadamard, el cual ennuestro contexto nos dice que, dada A ∈ L2(G,M), para casi todo g ∈ G tenemos

lımn→∞

Λ(A(g), A(τ(g)), . . . , A(τn−1(g))

)= βA.

Luego, en [48] Navas extendio el resultado de Austin a funciones en A ∈ L1(G,M), y quetoma valores en espacios metricos mas generales (espacios de Busemann). En este resultado,las medias aritmeticas discretas del Teorema de Birkhoff son reemplazadas por la mediageometricas (conjunta) de la n-upla(

A(g), A(τ(g)), . . . , A(τn−1(g))).

Por otro lado, la integral del Teorema de Birkhoff se reemplaza por el baricentro βA. Observarque en la sucesion

A(g), Λ(A(g), A(τ(g))

), Λ(A(g), A(τ(g), A(τ 2(g))

), . . .

del segundo termino en adelante, no hay computabilidad en general, incluso en el caso dematrices positivas. En esta direccion, las medias inductivas son mas simples y proveen enmuchos ejemplos importantes una aproximacion computable al baricentro. Esta es la ventajade nuestro resultado, pero hay un precio que pagar. Por un lado, necesitamos buen controlde la convexidad de la metrica. Por esta razon trabajamos en espacios de Hadamard, comoen el caso del resultado de Austin [6]. Por otro lado, las medias inductivas son simplementepromedios de puntos. Esta simplicidad es buena desde el punto de vista computacional, peroconfinan nuestro resultado a Z-acciones. Los resultados mencionados de Austin y Navastambien son validos para acciones mas generales.

Departamento de Matematica - UNLP Hoja 7 de 105

Page 12: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Curvas minimales

El Teorema ergodico que obtuvimos esta basado, en parte, en que existe una unicageodesica γa,b que une dos puntos, lo cual nos permite dar una buena definicion de la mediainductiva. Es interesante entonces preguntarse si al cambiar la metrica seguimos teniendoesta propiedad y podemos generalizar aun mas el Teorema ergodico.

Si consideramos como en un comienzo el espacio de matrices (estrictamente) positivasP(n) entonces: Dada una curva suave a trozos α : [a, b]→ P(n), podemos definir su longitudde curva por

L‖·‖p(α) =

∫ b

a

∥∥α−1/2(t)α(t)α−1/2(t)∥∥pdt,

donde ‖ · ‖p es la norma Schatten p definida como

‖A‖p = tr(|A|p)1/p si 1 ≤ p <∞

‖A‖∞ = supx∈Cn\0

‖Ax‖‖x‖ .

La distancia rectificable entre A,B ∈ P(n) se define como antes

δ‖·‖p(A,B) = ınfL‖·‖p(α) donde α : [a, b]→ P(n) une A con B en P(n)

.

Es conocido que para las normas Schatten p, donde 1 < p <∞, el ınfimo se alcanza en unaunica curva que une A con B y tiene la expresion antes mencionada:

A#tB = A1/2(A−1/2BA−1/2)tA1/2 .

Existen infinitos puntos medios (y geodesicas minimales) entre un cierto par de matricesdefinidas positivas con respecto a la metrica de Finsler asociada a la norma espectral ‖·‖∞,que coincide con la metrica de Thompson,

d∞(A,B) =∥∥log(A−1/2BA−1/2)

∥∥∞ = max

log λ1(A−1/2BA−1/2), log λ1(A−1/2B−1A−1/2)

.

Mas aun, estan caracterizadas las curvas minimales con respecto a la metrica de Thom-pson. Recordamos la construccion de Nussbaum para curvas minimales con respecto a lametrica de Thompson.

Teorema ([49]). Sean A,B ∈ P(n) y sea λk = λk(A−1B), k = 1, . . . , n.

i) Si λ−1n ≤ λ1, entonces para todo α ∈ [λ−1

1 , λn],

fα(t) =

λt1−αtλ1−α B +

λ1αt−αλt1λ1−α A λ1 6= λn

λt1A λ1 = λn

es una curva minimal de A a B con respecto a la metrica de Thompson.

ii) Si λ1 ≤ λ−1n , entonces para todo α ∈ [λ1, λ

−1n ],

fα(t) =

αt−λtnα−λn B + αλtn−λnαt

α−λn A λ1 6= λn

λt1A λ1 = λn

es una curva minimal de A a B con respecto a la metrica de Thompson.

Departamento de Matematica - UNLP Hoja 8 de 105

Page 13: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Un subconjunto Ω ⊂ P(n) es geodesicamente convexo si A#tB ∈ Ω para todo t ∈[0, 1], siempre que A,B ∈ Ω. Se puede definir el conjunto de los dΦ-puntos medios t-pesadosentre A y B de la siguiente manera

M(t;A,B) := X ∈ P(n) : dΦ(X,A) = tdΦ(A,B), dΦ(B,X) = (1− t)dΦ(A,B) .

En [40] Lim demostro que este conjunto es compacto y geodesicamente convexo para lametrica de Thompson. A partir del estudio de este conjunto tambien obtuvo el siguientecriterio para la unicidad de curvas minimales con respecto a la metrica de Thompson.

Teorema ([40]). Sean A,B ∈ P(n). Entonces existe una unica d∞-geodesica minimal si,y solo si, existe un unico punto medio entre A y B si, y solo si, σ(A−1B) ⊂ a, a−1 paraalgun a > 0.

Luego, la construccion de Nussbaum nos llevo a pensar en una caracterizacion paralas curvas minimales en el espacio de matrices (estrictamente) positivas en el caso p = 1.Para estudiar propiedades de las curvas minimales en el espacio de matrices positivas, nosenfocamos en el estudio del espacio de matrices Hermitianas H(n), porque toda matrizpositiva P ∈ P(n) se puede escribir de la forma P = eA, donde A ∈ H(n).

A continuacion desarrollamos este nuevo problema: Dadas dos matrices A,B ∈ H(n) yuna curva α : [0, 1]→ H(n) tal que α(0) = A,α(1) = B, podemos medir la longitud de estacurva de la siguiente manera:

L(α) =

∫ 1

0

‖α(t)‖1 dt, (1.0.6)

donde ‖·‖1 es la norma traza. La distancia rectificable inducida, denotada d1(·, ·), se calculacomo antes, como el ınfimo de las longitudes de todas las curvas suaves a trozos que unendos puntos dados:

d1(A,B) = ınf L(α) donde α : [a, b]→ H(n) une A con B en H(n) .

En este contexto es posible probar que el segmento

α(t) = (1− t)A+ tB,

es una curva minimal que une la matriz A con la matriz B. Es decir,

L(α) = d1(A,B).

Sin embargo es facil construir ejemplos para probar que no es la unica.

Ejemplo. Sean

Id =

(1 00 1

), X =

(π2

00 π

4

).

Entonces la curva

α(t) =

(π2t 0

0 π2t2

),

une Id con X y es minimal.

Departamento de Matematica - UNLP Hoja 9 de 105

Page 14: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Con este problema en vista, obtuvimos la siguiente estructura para las curvas minima-les que unen dos matrices Hermitianas.

Teorema. Sea X : [0, 1] → H(n) una curva minimal. Supongamos tambien que X(0) = 0,y que D = X(1) = diag ( d1 , . . . , dn ), es una matriz diagonal tal que las entradas dj estanordenadas de manera decreciente. Entonces la curva minimal que une 0 con D tiene lasiguiente estructura:

X(t) =

P (t) 0 00 0 00 0 N(t)

S1

S2

S3

,

donde

S1 = span ej : dj > 0 , S2 = span ej : dj = 0 y S3 = span ej : dj < 0 .

Mas aun, P : [0, 1] → H(S1) es una curva minimal que une 0S1 con DS1, tal que P (t) ≥ 0,para todo t ∈ [0, 1], y N : [0, 1]→ H(S3) es una curva minimal que une 0S3 con DS3, tal queN(t) ≤ 0, para todo t ∈ [0, 1].

La implicacion que es mas facil de demostrar es que las curvas que tienen esa estructurason curvas minimales. La otra implicacion es posible lograrla utilizando el operador pinchingy reduciendo, de alguna manera, el problema a caracterizar las curvas minimales en matrices2×2. Ademas es interesante que las condiciones que se requieren, son las extensiones naturalesde las condiciones que se necesitan para caracterizar las curvas minimales en Rn. Recordamosque si α : [0, 1]→ Rn una curva minimal que une el vector O = (0, . . . , 0) con V = (v1, . . . , vn)en Rn. Son equivalentes:

• La curva α : [0, 1]→ Rn es minimal.

• Las curvas αj : [0, 1]→ R que unen 0 con vj son minimales.

• Las curvas αj : [0, 1]→ R que unen 0 con vj son tales que αj(t) > 0, si vj es estricta-mente positivo, o αj(t) < 0, se vj es estrictamente negativo, para todo t ∈ [0, 1]. Si αjune 0 con 0 entonces es la curva identicamente nula.

Este resultado se puede probar pensado que la distancia entre dos puntos de Rn es lasuma de las diferencias (absolutas) de sus coordenadas. Esta geometrıa es conocida como lametrica del taxista. Podemos pensar que para llegar de un punto a otro lo importante es,por ejemplo, cuantas cuadras nos movemos hacia la derecha y cuantas hacia arriba.

Departamento de Matematica - UNLP Hoja 10 de 105

Page 15: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Por otro lado, las matrices inversibles actuan en P(n) de manera natural por conjugacion.Dicha accion es transitiva e induce una estructura metrica dada por

ds = ‖A−1/2dAA−1/2‖1.

Es decir, la longitud de una curva γ : [0, 1]→ P(n) se define como

L(γ) =

∫ 1

0

‖γ−1/2(t) γ(t) γ−1/2(t)‖1 dt.

Con esta estructura metrica, la accion de los inversibles resulta isometrica. Como consecuen-cia de este cambio, el espacio P(n) resulta un espacio de curvatura no positiva (NPC). Lascurvas minimales tambien cambian, al igual que en el caso de H(n), se ve que en general pue-de existir mas de una. En esta tesis daremos una caracterizacion de dichas curvas minimales,la cual pasa por relacionar las curvas minimales en el espacio de matrices positivas, conlas de H(n), utilizando la funcion exponencial.

Teorema. Sea α : [0; 1] → P(n) una curva que une I con eX , donde X es una matrizHermitiana diagonal. En otras palabras, α(t) = eX(t) donde la curva X : [0, 1] → H(n) estal que: X(0) = 0, X(1) = X y X es una matriz Hermitiana diagonal. La curva X(t) esminimal si, y solo si, α(t) es una curva minimal.

Asimismo, mostraremos como la misma idea se puede utilizar en el grupo de Lie de lasmatrices unitarias U ∈ U(n), donde la longitud de una curva en U se mide como en (1.0.6).No obstante, debido a que la curvatura de este espacio es no negativa, si bien el metodopermite construir familias de curvas minimales, no permite probar que dichas familias sontodas. En ambos casos, las tecnicas utilizadas provienen de la teorıa espectral de matricesnormales, y en particular, de ciertas desigualdades de matrices.

Para completar el estudio que realizamos para p = 1 y los trabajos existentes paramatrices positivas donde p = ∞, surge el siguiente problema: Si consideramos U(n) ⊂L(H) como subvariedad, resulta natural, considerar la estructura asociada a la norma deoperadores. La metrica de Finsler bi-invariante dada por la norma espectral es la siguiente,

‖X‖U

= ‖U∗X‖sp = ‖X‖sp,para todo X tangente a un operador unitario U . Con respecto a esta metrica de Finsler, lalongitud de la curva α : [0, 1]→ U(n), se puede calcular de la siguiente manera

L(α) =

∫ 1

0

‖α(t)‖sp dt.

La distancia rectificable inducida, denotada por d∞(·, ·), se calcula como en el caso Rieman-niano, como el ınfimo de las longitudes de todas las curvas suaves a trozos que unen dospuntos dados:

d∞(U, V ) = ınf L(α) donde α : [a, b]→ U(n) une U con V en U(n) .Sean U, V ∈ U(n) donde V = UeiX con X ∈ H(n) y ‖X‖ ≤ π. Entonces la curva δ(t) = UeitX

es mas corta que cualquier otra curva suave a trozos γ en U(n) que una U con V . Es decir,

L(δ) = d∞(U, V ).

Sin embargo es facil construir ejemplos para probar que no es la unica.

Departamento de Matematica - UNLP Hoja 11 de 105

Page 16: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Ejemplo. Sean

U = eiX =

(eiπ2 0

0 eiπ4

), X =

(π2

00 π

4

).

Entonces la curva

α(t) =

(eit

π2 0

0 α(t)

), α(t) =

eiπ2t t ∈ [0, 1/4]

eiπ2 ( 1

2−t) t ∈ [1/4, 1/2]

eiπ2 (t− 1

2) t ∈ [1/2, 1]

une Id con U y es minimal.

Con este problema en vista, obtuvimos la siguiente estructura para las curvas minima-les que unen dos matrices unitarias con respecto a la norma espectral.

Teorema. Dado U ∈ U(n), sea X ∈ H(n) tal que U = eiX y ‖X‖ ≤ π. Entonces:

a) Si σ (|X|) ⊆ [0, π) y tiene mas de un elemento, entonces una curva minimal que uneI con U tiene la siguiente estructura:

α(t) =

(eitXS 0

0 α1(t)

)SS⊥ ,

donde S = ker(‖X‖I − |X|), XS = X|S ∈ H(S), y α1 : [0, 1] → U(S⊥) es cualquiercurva que une IS⊥ con US⊥ = U |S⊥ tal que ‖α1‖sp ≤ ‖X‖sp.

b) Si π ∈ σ (|X|), entonces una curva minimal que une I con U tiene la siguiente estruc-tura:

α(t) =

(eitYS 0

0 α1(t)

)SS⊥ ,

donde S = ker(πI − |X|), YS ∈ H(S) y satisface que σ (YS) ⊆ π,−π, y α1 : [0, 1]→U(S⊥) es cualquier curva que une IS⊥ con US⊥ = U |S⊥ tal que ‖α1‖sp ≤ π.

Por otro lado, esto lleva a una caracterizacion de aquellos pares de matrices unitariasconectadas por una unica curva minimal.

Corolario. La geodesica es la unica curva minimal que une U, V ∈ U(n) si, y solo si, elespectro de U∗V esta contenido en eiθ, e−iθ.

Este resultado es analogo al que obtuvo Y. Lim en [40] para matrices positivas con lametrica de Thompson. A su vez estudiamos la geometrıa de los puntos medios obteniendoel siguiente resultado.

Proposicion. Dados U, V ∈ U(n) tal que d∞(U, V ) < π/2, y t ∈ (0, 1), el conjunto

Mt(U, V ) = W ∈ U(n) : d∞(U,W ) = t d∞(U, V ) y d∞(W,V ) = (1− t) d∞(U, V )

es geodesicamente convexo.

Departamento de Matematica - UNLP Hoja 12 de 105

Page 17: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Una vez obtenidos estos resultados pasamos al estudio de la Grassmaniana. La Grass-maniana, que denotaremos por Gn, es el conjunto de subespacios de Cn, que puede ser iden-tificado con el conjunto de proyecciones ortogonales en Mn(C). Si consideramos en Mn(C)la topologıa definida por cualquiera de sus normas equivalentes, el espacio Grassmanianodotado con esta topologıa, es un conjunto compacto. Sin embargo, no es conexo. En efecto,es suficiente considerar la traza, la cual es una funcion continua definida en todo el espacioMn(C), y restringida a Gn toma solo valores naturales. En particular, esto prueba que lascomponentes conexas de Gn son subconjuntos Gm,n, definidos como:

Gm,n := P ∈ Gn : tr(P ) = m .

Cada una de estas componentes es una subvariedad de Mn(C). Para una norma simetricadada ‖ · ‖ en Mn(C), el espacio Grassmanniano lleva la estructura de Finsler dada por

‖X‖P = ‖X‖ para X ∈ TPGn .

Con esta estructura, la componente Grassmanniana UPU∗ : U ∈ U(n) es isometrica (modu-lo un factor 2) a la orbita USPU∗ : U ∈ U(n) de la simetrıa SP = 2P − I. Una cuentasencilla muestra que, si X = XP + PX, entonces

eiXSP = SP e−iX .

Esta simple observacion nos permite usar los resultados previos obtenidos en el grupo unitarioy aplicarlos a la Grassmaniana. En este caso, obtuvimos los siguientes resultados.

Teorema. Sean P,Q ∈ Gn con ‖P −Q‖sp < 1. Sea X ∈ H(n) tal que X = PX+XP ∈ TPGny Q = eiXPe−iX . Entonces ‖X‖sp < π/2 por lo cual σ (|X|) ⊆ [0, π/2). Si σ (|X|) tiene masde un elemento, entonces una curva minimal que une P con Q tiene la siguiente estructura:

δ(t) =

(γX(t) 0

0 α1(t)

)SXS⊥X

,

donde α1 : [0, 1] → G(S⊥X) es cualquier curva que une, P∣∣S⊥X

con Q∣∣S⊥X

, tal que ‖α1‖sp ≤‖X‖sp.

Corolario. Dados P,Q ∈ Gn con ‖P −Q‖ < 1, existe una unica curva minimal que los unesi, y solo si, σ (SQSP ) ⊆ eiθ, e−iθ para algun |θ| < π/2.

1.1 Estructura de la tesis

La tesis se divide como sigue:

• En el capıtulo 2 damos las herramientas que necesitamos para el capıtulo 3. Definimoslos espacios de Hadamard, damos ejemplos de los mismos y algunos resultados prelimi-nares. Luego definimos el baricentro. A continuacion pasamos a dar algunas nocionesbasicas de Teorıa ergodica. Particularmente nos interesa el Teorema de Birkhoff y surelacion con la ley de los grandes numeros. Por ultimo pasamos a sistemas de Kronec-ker. Estos resultados son necesarios para el desarrollo del capıtulo 3. No obstante, si ellector conoce estos temas, puede obviar este capıtulo y pasar al siguiente.

Departamento de Matematica - UNLP Hoja 13 de 105

Page 18: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

• En el capıtulo 3 damos la demostracion del Teorema ergodico para espacios de Hada-mard. Comenzamos el capıtulo con una motivacion del mismo. La relevancia de estamotivacion yace en el hecho que utilizamos algunos lemas relacionados con la misma.Los resultados originales se encuentran en las secciones 3.3 y 3.4, donde demostramosel Teorema ergodico para el caso continuo y L1 respectivamente. A su vez, utilizamosuna nueva nocion de mollifiers en espacios de Hadamard, la cual es interesante por sımisma y habıa sido probada por Karcher para variedades Riemannianas [31].

• En el capıtulo 4 estudiamos la estructura de las curvas minimales en el caso de lanorma traza. Comenzamos el capıtulo motivando este problema, a partir de un estudioanalogo realizado por Y. Lim en [40], en el espacio de matrices positivas. Los resultadosoriginales se encuentran en la seccion 4.2 y los resultados mas importantes obtenidosson: la caracterizacion de las curvas minimales para matrices Hermitianas y positivas.

• En el capıtulo 5 estudiamos la estructura de las curvas minimales para matrices uni-tarias medidas con la norma espectral. Los resultados originales se encuentran en lassecciones 5.3, 5.4 y 5.5. En la primera, estudiamos dicha estructura. En la segunda, lageometrıa de los puntos medios y en la tercera, la Grassmaniana. .

• En el capıtulo 6 incluımos resultados que utilizamos del analisis matricial. Entre estosse encuentran resultados de mayorizacion, normas unitariamente invariantes u otros. Asu vez se pueden encontrar resultados que utilizamos sobre la geometrıa de las matricespositivas. Tambien agregamos algunos resultados que son conocidos, pero tal vez noen toda su generalidad (para espacios metricos), como el Teorema de Lusin.

Departamento de Matematica - UNLP Hoja 14 de 105

Page 19: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

2 Preliminares del Capıtulo 3

2.1 Espacios de Hadamard

En esta seccion resumimos algunos hechos basicos sobre espacios de Hadamard, tambienllamados espacios globales CAT(0) o de curvatura no positiva. Esta area de estudio empezocon el trabajo de Alexandrov [1] y Reshetnyak [55]. Hoy en dıa existe una gran bibliografıasobre este tema [7], [8], [18], [30] y otros.

Definicion. Un espacio metrico completo (M, δ) se llama espacio de Hadamard si ladistancia satisface la ley del semiparalelogramo, es decir, para todo x, y ∈ M existe m ∈ Mtal que

δ2(m, z) ≤ 1

2δ2(x, z) +

1

2δ2(y, z)− 1

4δ2(x, y) (2.1.1)

para todo z ∈M . El punto m se llama punto medio entre x e y.

Unicidad y propiedades del punto medio: Tomando z = x y z = y en la desigualdad(2.1.1), es facil ver que,

δ(x,m) = δ(m, y) =1

2δ(x, y).

En efecto, tomando z = x, obtenemos

δ(m,x) ≤ 1

2δ(x, y).

Analogamente, tomando z = y, obtenemos

δ(m, y) ≤ 1

2δ(x, y).

Pero comoδ(x, y) ≤ δ(x,m) + δ(y,m) ≤ δ(x, y),

deducimos las igualdades antes mencionadas. Mas aun, la desigualdad del semiparalelogramoimplica que el punto medio es unico. En efecto, si m,m

′son puntos medios entre x e y,

δ2(m,m′) ≤ 1

2δ2(x,m

′) +

1

2δ2(y,m

′)− 1

4δ2(x, y)

≤ 1

2

[1

2δ2(x, x) +

1

2δ2(y, x)− 1

4δ2(x, y)

]+

+1

2

[1

2δ2(x, y) +

1

2δ2(y, y)− 1

4δ2(x, y)

]− 1

4δ2(x, y) = 0.

Page 20: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

La existencia y unicidad de puntos medios dan lugar a una unica geodesica γa,b : [0, 1]→Mque conecta dos puntos cualesquiera a y b. Para probarlo, primero se define γa,b(1/2) comoel punto medio entre a y b. Luego, usando un argumento inductivo, se define la geodesicapara todos los numeros dıadicos racionales en [0, 1]. Finalmente por completitud, se extiendepara todo t ∈ [0, 1]. De ahora en adelante vamos a usar la notacion a#tb en vez de γa,b(t).

La desigualdad (2.1.1) se extiende tambien para puntos arbitrarios en geodesicas.

Proposicion 2.1.1. Sea (M, δ) un espacio de Hadamard. Entonces para todo t ∈ [0, 1] yx, y, z ∈M ,

δ2(x#ty, z) ≤ (1− t)δ2(x, z) + tδ2(y, z)− t(1− t)δ2(x, y). (2.1.2)

Demostracion. El razonamiento es analogo al anterior: Si t = 1/2 la desigualdad queobtenemos es la del semiparalelogramo. Luego se prueba inductivamente para todos losnumeros dıadicos racionales en [0, 1]. Finalmente por continuidad, se extiende para todot ∈ [0, 1].

Una consecuencia de este resultado es:

Corolario 2.1.2. Dados cuatro puntos a, a′, b, b

′ ∈M sea

f(t) = δ(a#ta′, b#tb

′).

Entonces f es convexa en [0, 1]; es decir,

δ(a#ta′, b#tb

′) ≤ (1− t)δ(a, b) + tδ(a

′, b′). (2.1.3)

Demostracion. Como f es continua es suficiente probar que es convexa en t = 1/2. Seam1 = a#1/2a

′, m2 = b#1/2b

′y m = a#1/2b

′. Por la desigualdad del semiparalelogramo

(2.1.1): δ(m1,m) ≤ δ(a′, b′)/2 y δ(m,m2) ≤ δ(a, b)/2. Luego

δ(m1,m2) ≤ δ(m1,m) + δ(m,m2) ≤ 1

2

(δ(a, b) + δ(a

′, b′)).

a

a′

b′

b

m2m1 m

Concluimos esta seccion con el llamado Teorema de cuadruple comparacion de Res-hetnyak.

Teorema 2.1.3. Sea (M, δ) un espacio de Hadamard. Para todo x1, x2, x3, x4 ∈M ,

δ2(x1, x3) + δ2(x2, x4) ≤ δ2(x2, x3) + δ2(x1, x4) + 2δ(x1, x2)δ(x3, x4). (2.1.4)

Departamento de Matematica - UNLP Hoja 16 de 105

Page 21: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

x2

x1

x4

x3

f

e

a

b

c

d

e2 + f 2 ≤ b2 + d2 + 2ac.

La demostracion original de Reshetnyak [55] esta basada en el hecho que el cuadruplepuede ser embebido en un espacio Euclıdeo de dimension dos, de manera que, las longitudesde los laterales se preserva y las diagonales se expanden. Otra demostracion que evita elembedding se encuentra en [30].

2.1.1 Ejemplos de espacios de Hadamard

Acabamos de definir los espacios de Hadamard como los espacios metricos completos queposeen como propiedad la ley del semiparalelogramo. Puede resultar poco intuitivo darnoscuenta que espacios cumplen esta propiedad. Sin embargo, hay varios espacios que son muyutilizados que son espacios de Hadamard. En esta subseccion vamos a mencionar algunos deellos. Los ejemplos mas conocidos de espacios de Hadamard son las variedades, los espaciosde Hilbert y los espacios de arbol. Tambien pueden ser construidos a partir de un espacio deHadamard dado, como subconjuntos, imagenes, productos o espacios L2.

Comenzamos entonces con los ejemplos mas utilizados:

Proposicion 2.1.4. (variedades). Sea (M,d) una variedad Riemanniana y sea d su distanciaRiemanniana. Luego, (M,d) es un espacio de Hadamard si, y solo si, es un espacio completo,simplemente conexo y de curvatura seccional no positiva.

Proposicion 2.1.5. Todo espacio de Hilbert es un espacio de Hadamard.

Tambien podemos encontrar un ejemplo en la teorıa de grafos. Un arbol es un grafono dirigido en el que dos vertices estan conectados por exactamente un camino. En otraspalabras, cualquier grafo conectado acıclico es un arbol.

Proposicion 2.1.6. Todo arbol es un espacio de Hadamard.

Un ejemplo, particularmente importante de arbol, son las telaranas.

Ejemplo. (telaranas). Sea K un conjunto arbitrario y para todo i ∈ K, sea

Ni :=

(i, r) : r ∈ R+,

la copia de R+ (dotada con la metrica usual). Definimos la telaranas sobre K o K-telaranas(M,d) a partir del pegado de todos estos espacios juntos Ni, i ∈ K, en el origen. Es decir,

M =

(i, r) : i ∈ K, r ∈ R+/ ∼

Departamento de Matematica - UNLP Hoja 17 de 105

Page 22: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

donde (i, 0) ∼ (j, 0) para todo i, j. La distancia que consideramos es

d((i, r), (j, s)) =

|r − s| si i = j|r|+ |s| en caso contrario

.

Los rayos ni pueden ser considerados como subconjuntos cerrados de M . Dos rayos Ni y Nj

con i 6= j se intersecan en el origen o := (i, 0) = (j, 0) de N.

Los siguientes ejemplos se construyen a partir de un espacio de Hadamard.

Lema 2.1.7. (Subconjuntos). Un subconjunto N ⊂M de un espacio de Hadamard M es unespacio de Hadamard si, y solo si, es cerrado y convexo.

Lema 2.1.8. (Imagenes). Sea ϕ : M → M′

una isometrıa entre los espacios (M,d) y(M

′, d′). Luego, (M,d) es un espacio de Hadamard si, y solo si, (M

′, d′) es un espacio de

Hadamard.

Lema 2.1.9. (Productos). El producto directo de espacios metricos (Mi, di), i = 1, . . . , k esel espacio metrico (M,d) definido por

M =k⊗i=1

Mi, d(x, y) =

(k∑i=1

d2i (xi, yi)

)1/2

.

Este es un espacio de Hadamard si todos sus factores lo son.

Lema 2.1.10. (Espacios L2). Para cada espacio medible (Ω,M,m), cada espacio metrico(M,d) y cada funcion fuertemente medible h : Ω → M , el espacio L2(Ω,M, h) de todaslas funciones fuertemente medibles f : Ω → M con d2(f, h) < ∞, es un espacio metricocompleto con la metrica

d2(f, g) =

(∫Ω

d(f(x), g(x))2m(dx)

)1/2

.

Si (M,d) es un espacio de Hadamard entonces el espacio L2(Ω,M, h) tambien lo es.

Proposicion 2.1.11. (Lımites). El lımite de Gromov-Hausdorff (M,d) de una sucesionconvergente de espacios de Hadamard (Mk, dk), k ∈ N, es un espacio de Hadamard.

2.2 Baricentros

Sea (M, δ) un espacio de Hadamard, y sea B(M) la σ-algebra de Borel (es decir, la σ-algebra mas chica que contiene los conjuntos abiertos). Denotemos por P(M) al conjuntode todas las medidas de probabilidad en B(M) con soporte separable. Para 1 ≤ θ <∞, seaPθ(M), el conjunto de µ ∈ P(M) tales que∫

δθ(x, y)dµ(y) <∞,

para algun (y por lo tanto para todo) x ∈M . Por medio de P∞(M) denotamos al conjuntode todas las medidas en P(M) con soporte acotado.

Departamento de Matematica - UNLP Hoja 18 de 105

Page 23: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Proposicion 2.2.1. Sea (M, δ) un espacio de Hadamard y fijemos y ∈ M . Para cada µ ∈P1(M) existe un unico punto βµ ∈ M que minimiza la funcion continua uniformementeconvexa

z 7→∫M

[δ2(z, x)− δ2(y, x)]dµ(x).

Este punto es independiente de y.

Utilizaremos la notacion del trabajo de Sturm [56]: llamaremos baricentro al punto βµde µ. Notar que si µ ∈ P2(M) entonces βµ coincide con la definicion usual de baricentro deCartan:

argminz∈M

∫M

δ2(z, x)dµ(x).

La siguiente desigualdad que satisfacen los baricentros resulta de mucha utilidad.

Proposicion 2.2.2 (Desigualdad de la varianza). Sea (M, δ) un espacio de Hadamard. Paratoda medida de probabilidad µ ∈ P1(M) y para todo z ∈M :

δ2(z, βµ) ≤∫M

[δ2(z, x)− δ2(βµ, x)]dµ(x). (2.2.1)

Sea (Ω, P ) un espacio de probabilidad arbitrario y sea F : Ω→M una funcion medible.Esta funcion define una medida de probabilidad F∗P ∈ P(M) dada por

F∗P (A) := P (F−1(A)) = P (ω ∈ Ω : F (ω) ∈ A) (∀A ∈ B(M)),

la cual se llama pushforward measure de P por la funcion F . En lenguaje probabilıstico, elpushforward measure F∗P se llama funcion de distribucion de F .

Dado 1 ≤ θ ≤ ∞, decimos que F ∈ Lθ(Ω,M) si F∗P ∈ Pθ(M). En otras palabras, para1 ≤ θ < ∞, decimos que F ∈ Lθ(Ω,M) si para algun (y por lo tanto para todo) y ∈ M setiene que ∫

Ω

δθ(F (ω), y) dP (ω) <∞. (2.2.2)

Por otro lado, decimos que F ∈ L∞(Ω,M) si para algun (y por lo tanto para todo) y ∈ Mla funcion ω 7→ δ(F (ω), y) esta esencialmente acotada.

2.3 Teorıa ergodica

El siguiente enunciado: “Si dos sistemas estan en equilibrio termico con un tercer sistema,entonces estan en equilibrio termico entre sı”, es una conocida ley de la termodinamica. Desdeun punto de vista microscopico, tal vez es sorprendente que cualquier sistema aproxime unpunto de equilibrio, ya que microscopicamente, no hay estados estables, y por lo tanto nohay equilibrio. Sin embargo, por su naturaleza, las leyes de la termodinamica no son estadosabsolutos en un sistema en un tiempo fijo. Esto sugiere que se estudie el siguiente hecho:Sea Γ un estado de fases. Para todo t (tiempo) existe una funcion Tt : Γ → Γ, donde Tt(x)es un estado que resulta de tomar el estado x en el tiempo t0 y esperar al tiempo t0 + t. En

Departamento de Matematica - UNLP Hoja 19 de 105

Page 24: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

mecanica clasica, los observables de un sistema como la energıa o el momento angular, sonfunciones en un espacio de fases. Esto sugiere estudiar

lımT→∞

1

T

∫ T

0

f(Tt(x))dt.

Los resultados clasicos de la teorıa ergodica estudian este fenomeno.

Para motivar la siguiente definicion, sea s fijo y supongamos que χF es la funcion carac-terıstica de un conjunto medible F . Entonces

1

T

∫ T

0

χs−1F (Tt(w))dt =1

T

∫ T

0

χF (TsTt(w))dt.

Si el lımite cuando T →∞ existe, entonces µ(T−1s F ) = µ(F ).

Definicion. Sean (X,A, µ) un espacio de medida y T : X → X. Decimos que T preserva µo que µ es T-invariante si para todo A ∈ A, T−1(A) ∈ A y µ(A) = µ(T−1(A)).

El siguiente teorema nos da una condicion suficiente para la existencia de una medidaT -invariante.

Teorema 2.3.1. (Krylov-Bogoliubov). Sean X un espacio metrico compacto, T : X → Xuna funcion continua y B la σ-algebra de Borel. Entonces existe una medida µ de probabilidadT -invariante.

Uno de los teoremas clasicos de la teorıa ergodica es el Teorema de Birkhoff. Esteteorema permite sustituir promedios temporales del sistema, por un promedio espacial sobreuna region del espacio de las fases. Mas precisamente:

Teorema 2.3.2. (Birkhoff.) Sean (X,A, µ) un espacio de probabilidad y T : X → X unatransformacion que preserva medida. Sea f ∈ L1(X), entonces

1

n

n−1∑j=0

f(T j(x))

,

converge casi en todo punto a f ∈ L1(X) y∫X

fdµ =

∫X

fdµ.

Demostracion. Para α ∈ R, sean

E+α (f) = x : f+(x) > α, E−α (f) = x : f−(x) < α.

Luego

T−1(E+α (f)) = E+

α (f);

T−1(E−α (f)) = E−α (f);

E+α (f) = E+

0 (f − α);

E−α (f) = E+−α(−f).

Departamento de Matematica - UNLP Hoja 20 de 105

Page 25: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Afirmamos que si A ⊂ E+α (f) y T−1A = A, entonces∫

A

fdµ ≥ αµ(A).

En efecto ∫A

fdµ =

∫A

(f − α)dµ+ αµ(A).

Como A ⊂ E+α (f) = E+

0 (f − α) ⊂ E(f − α), entonces∫A

(f − α)dµ ≥ 0.

Analogamente, si A ⊂ E−β (f) y T−1A = A, entonces∫A

fdµ ≤ βµ(A).

Por lo tanto, tomandoA = E+

α (f) ∩ E−β (f),

tenemos

αµ(A) ≤∫A

fdµ ≤ βµ(A),

y ası µ(E+α (f) ∩ E−β (f)) = 0.

Tomando una sucesion αn en R tenemos

x : f+(x) > f−(x) =⋃

αn>αm

E+αn(f) ∩ E−αm(f),

lo que implica µ(x : f+(x) > f−(x)) = 0.

lımn→∞

1

n

n−1∑j=0

|f(T j(x))| = g,

en casi todo punto y|f | ≤ g.

Como T preserva µ,∫X

1

n

n−1∑j=0

|f T j|dµ =1

n

n−1∑j=0

∫X

|f T j|dµ =

∫X

|f |dµ.

Por el Lema de Fatou ∫X

gdµ ≤∫X

|f |dµ,

y ası ∫X

|f |dµ ≤∫X

|f |dµ.

Departamento de Matematica - UNLP Hoja 21 de 105

Page 26: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Si f ∈ L∞(X), ∥∥∥∥∥ 1

n

n−1∑j=0

f T j∥∥∥∥∥∞

≤ ‖f‖∞.

Ası

‖f‖∞ ≤ ‖f‖∞ y

∥∥∥∥∥f − 1

n

n−1∑j=0

f T j∥∥∥∥∥∞

≤ 2‖f‖∞.

Por convergencia dominada

lımn→∞

∫X

∣∣∣∣∣f − 1

n

n−1∑j=0

f T j∣∣∣∣∣ dµ =

∫X

lımn→∞

∣∣∣∣∣f − 1

n

n−1∑j=0

f T j∣∣∣∣∣ dµ = 0.

En el caso general, dado ε > 0, existe f0 ∈ L1(X) tal que∫X

|f − f0|dµ ≤ ε,

y tomamos N tal que si n ≥ N ,∫X

∣∣∣∣∣f0 −1

n

n−1∑j=0

f0 T j∣∣∣∣∣ dµ ≤ ε.

Entonces ∫X

∣∣∣∣∣f − 1

n

n−1∑j=0

f T j∣∣∣∣∣ dµ ≤

∫X

∣∣∣f − f0

∣∣∣ dµ+

∫X

∣∣∣∣∣f0 −1

n

n−1∑j=0

f0 T j∣∣∣∣∣ dµ

+

∫X

∣∣∣∣∣ 1nn−1∑j=0

(f − f0) T j∣∣∣∣∣ dµ.

Pero ∫X

∣∣∣f − f0

∣∣∣ dµ =

∫X

∣∣∣ ˜(f − f0)∣∣∣ dµ ≤ ∫

X

|f − f0| dµ ≤ ε,

y ∫X

∣∣∣∣∣ 1nn−1∑j=0

(f − f0) T j∣∣∣∣∣ ≤

∫X

|f − f0| dµ ≤ ε.

Luego, ∫X

∣∣∣∣∣f − 1

n

n−1∑j=0

f T j∣∣∣∣∣ dµ ≤ 3ε,

si n ≥ N . Luego, ∫X

fdµ = lımn→∞

1

n

n−1∑j=0

f T j =

∫X

fdµ.

Es util a veces expresar la ergodicidad en terminos de la medida.

Departamento de Matematica - UNLP Hoja 22 de 105

Page 27: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Definicion. Sean (X,A, µ) un espacio de probabilidad y T : X → X una transformacionque preserva medida. Decimos que T es µ-ergodica o que µ es una medida T-ergodica, sipara B ∈ A, T−1(B) = B implica µ(B) = 0 o 1.

Lema 2.3.3. Son equivalentes

1. T es µ- ergodica,

2. f T = f , f ∈ L1(X,A, µ) entonces f es constante,

3. f T = f , f ∈ L2(X,A, µ) entonces f es constante.

Una consecuencia inmediata del Teorema de Birkhoff y las equivalencias dadas en el Lemaanterior 2.3.3 es la siguiente.

Corolario 2.3.4. Si T es µ- ergodica entonces

lımn→∞

1

n

n−1∑j=0

f(T j(x)) =

∫fdµ, (2.3.1)

para toda f ∈ L1(X,A, µ).

2.4 Teorema ergodico de Birkhoff y la ley delos grandes numeros

Primero necesitamos recordar diferentes maneras en las cuales una sucesion de variablesaleatorias puede converger. Sea Yn una sucesion de variables aleatorias e Y una variablealeatoria a la cual queremos que la sucesion converja.

Definicion. La nocion mas fuerte de convergencia es casi seguro. Decimos que

Yna.s.−−→ Y

si

P(Yn → Y ) = 1.

Si Ω es un espacio de probabilidad en el cual las variables aleatorias estan definidas y ν esla medida de probabilidad definida por P, entonces esta condicion puede ser reescrita como

νω ∈ Ω | Yn(ω)→ Y (ω) = 1.

Definicion. Una nocion mas debil de convergencia es la convergencia en probabilidad.Decimos que

Ynp−→ Y

si

P(|Yn − Y | ≥ ε)→ 0 para todo ε > 0.

En terminos de Ω y ν, esta condicion es

νω ∈ Ω | |Yn(ω)− Y (ω)| ≥ ε → 0.

Departamento de Matematica - UNLP Hoja 23 de 105

Page 28: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Definicion. Una nocion aun mas debil de convergencia es la convergencia en distribu-cion. Decimos que

Ynd−→ Y

si, escribiendo Fn, F : R→ [0, 1] para la funcion de distribucion acumulada de Yn e Y res-pectivamente, tenemos

Fn(t)→ F (t)

para todo t donde F (t) es continua.

Ley debil de los grandes numeros: Dada una sucesion de variables aleatorias Xn,consideremos las sumas

Sn = X1 +X2 + · · ·+Xn.

Entonces Snn

es el promedio de las primeras n observaciones. Supongamos que la sucesionXn es independiente e identicamente distribuida (IID) y que Xn es integrable. Es decir,

E(|Xn|) < ∞. Luego, en particular, la esperanza µ = E(Xn) es finita. La ley debil degrandes numeros dice que Sn

nconverge en probabilidad a la funcion constante µ. Como la

distribucion lımite es constante, es suficiente probar convergencia en distribucion. Este hechonos lleva a una prueba muy conocida de la ley debil usando funciones caracterısticas.

Si una variable aleatoria Y es absolutamente continua, es decir, si tiene funcion de den-sidad f , entonces su funcion caracterıstica ϕY es la trasformada de Fourier de f . Mas gene-ralmente, la funcion caracterıstica de Y es

ϕY (t) = E(eitY ).

Las funciones caracterısticas estan relacionadas a la convergencia en distribucion por el

Teorema de continuidad de Levy, el cual dice (entre otras cosas) que Ynd−→ Y si, y solo si,

ϕYn(t)→ ϕY (t) para todo t ∈ R. En particular, para probar la ley debil de grandes numeroses suficiente demostrar que las funciones caracterısticas de 1

nSn convergen a la funcion eitµ.

Sea ϕ la funcion caracterıstica de Xn. Observar que cada Xn tiene la misma funcioncaracterıstica porque estan identicamente distribuidas. Sea ϕn la funcion caracterıstica de1nSn. Luego

ϕn(t) = E(eitn

(X1+···+Xn)).

Como las variables Xn son independientes, tenemos

ϕn(t) =n∏j=1

E(eitnXj) = ϕ

(t

n

)n. (2.4.1)

Por el Teorema de Taylor y por linealidad de la esperanza, tenemos para t ≈ 0 que

ϕ(t) = E(eitXj) = E(1 + itXj + o(t2)) = 1 + itµ+ o(t),

y junto con (2.4.1) obtenemos

ϕn(t) =

(1 +

itµ

n+ o(t/n)

)n→ eitµ,

lo que completa la prueba.

Departamento de Matematica - UNLP Hoja 24 de 105

Page 29: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Teorema ergodico y ley fuerte de los grandes numeros: la ley fuerte de los grandesnumeros establece que no solo 1

nSn converge a µ en probabilidad, si no tambien casi seguro.

En este caso no incluiremos la demostracion clasica, pero vamos a ver que la ley fuerte degrandes numeros se puede ver como un caso especial del Teorema ergodico de Birkhoff (enparticular del Corolario 2.3.4). Sea Xn : Ω → R una sucesion de variables aleatorias IID, ydefinamos la funcion π : Ω→ RN por

π(ω) = (X1(ω), X2(ω), . . . ).

Sea ν la medida de probabilidad en Ω que determina P, y sea µ = π∗ν = ν π−1 la medidade probabilidad correspondiente en RN.

Como las variables Xn son independientes, µ tiene la forma µ = ν1×ν2×· · · , y como sonidenticamente distribuidas todas las distribuciones marginales νj son las mismas, entoncesµ = νN para alguna distribucion de probabilidad ν en R.

La medida µ es invariante y ergodica con respecto a las dinamicas en RN dadas por lafuncion shift f(x1, x2, x3, . . . ) = (x2, x3, x4, . . . ). Escribiendo x = (x1, x2, x3, . . . ) ∈ RN ytomando ϕ(x) = x1, vemos que para x = π(ω) tenemos

π(ω) = (X1(ω), X2(ω), . . . );

fn(π(ω)) = (Xn+1(ω), Xn+2(ω), . . . , );

ϕ(fn(π(ω))) = Xn+1(ω).

Luego

X1(ω) + · · ·+Xn(ω)

n=ϕ(f 0(π(ω))) + ϕ(f 1(π(ω))) + . . . ϕ(fn−1(π(ω)))

n

=1

n

n−1∑j=0

ϕ(f j(π(ω))).

En particular, la convergencia en (2.3.1) implica la ley de los grandes numeros.

2.5 Sistemas de Kronecker

Un sistema dinamico es un sistema en el que una funcion describe el comportamiento deun punto dependiente del tiempo (de manera continua o discreta) en un espacio geometrico.Por ejemplo: una partıcula o conjunto de partıculas cuyo estado varıa con el tiempo, y porlo tanto, obedece a ecuaciones diferenciales que implican derivadas. Con el fin de hacer unaprediccion sobre el comportamiento futuro del sistema, se realiza una solucion analıtica detales ecuaciones. Esta seccion esta basada en [57] (capıtulo 2). Un sistema dinamico puededefinirse formalmente, como una transformacion que preserva la medida de una σ-algebra.

Definicion. Un sistema topologico dinamico (X,T ) = (X,F , T ) es un espacio topologi-co, compacto y metrizable (y por lo tanto Hausdorff) tal que T es un isomorfismo topologico(es decir, un homeomorfismo).

En particular estamos interesados en dos tipos de sistemas.

Departamento de Matematica - UNLP Hoja 25 de 105

Page 30: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Definicion. (Sistemas equicontinuos e isometricos). Sea (X,F , T ) un sistema topologicodinamico.

• Decimos que un sistema es isometrico si existe una metrica d en X tal que lasfunciones shift T n : X → X son todas isometrıas. Por lo tanto, d(T nx, T ny) = d(x, y)para todo n ∈ N, x, y ∈ X. Notar que una vez que T es una isometrıa, entonces todaslas potencias T n son isometrıas.

• Decimos que un sistema es equicontinuo si existe una metrica d en X tal que lasfunciones shift T n : X → X forman una familia uniformemente equicontinua. Por lotanto, para todo ε > 0 existe δ > 0 tal que d(T nx, T ny) ≤ ε siempre que n, x, y sontales que d(x, y) ≤ δ. Notar que como X es compacto, equicontinuidad y uniformementeequicontinua son conceptos equivalentes.

Proposicion 2.5.1. Todo sistema topologico dinamico es isometrico si, y solo si, es equi-continuo.

Demostracion. Si el sistema es isometrico entonces es equicontinuo, se deduce directamentede la definicion. Por otro lado, si T n es una familia equicontinua con respecto a la metricad, considerar la metrica

d(x, y) = supn∈N

d(T nx, T ny).

En vista de este resultado podemos mejorar la estructura topologica (equicontinuidad)utilizando la estructura geometrica (isometrıas). Tambien podemos mejorar la estructurageometrica de isometrıas utilizando la estructura algebraica de acciones de grupos compactosabelianos.

Definicion. (Sistemas de Kronecker). Un sistema topologico dinamico (X,F , T ) es un sis-tema de Kronecker si es isomorfo a un sistema de la forma (K,K, S) donde (K,+,K)es un grupo topologico abeliano, compacto y metrizable, y S : x 7→ x+ α es una rotacion delgrupo para algun α ∈ K.

Observar que un sistema de Kronecker es equicontinuo (y por lo tanto isometrico).En efecto, la compacidad del grupo topologico K nos asegura que la rotacion del grupog : x 7→ x + g es uniformemente equicontinua cuando varıa g ∈ K. Como los shifts T n :x 7→ x+ nα son todas rotaciones del grupo, obtenemos el resultado. Por otro lado, no todosistema isometrico o equicontinuo es un sistema de Kronecker. Sin embargo, contienen unsistema de Kronecker.

Definicion. Un sistema dinamico minimal es un sistema (X,T ) que no tiene subsistemaspropios (Y, S). Un sistema topologico dinamico minimal es un sistema (X,F , T ) que no tienesubsistemas propios (Y,G, S).

Dado un punto x de un sistema (X, f), denotamos por,

Orbf = x, f(x), f2(x), . . .,

la orbita de f y ωf (x) denota su conjunto ω-lımite, es decir, el conjunto de puntos lımitesde la sucesion x, f(x), f2(x), . . ..

Departamento de Matematica - UNLP Hoja 26 de 105

Page 31: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Proposicion 2.5.2. Las siguientes condiciones son equivalentes:

1. (X, f) es minimal,

2. Toda orbita es densa en X,

3. ωf (x) = X para todo x ∈ X.

Una funcion minimal f es necesariamente suryectiva si X es un conjunto compacto Haus-dorff.

Proposicion 2.5.3. Todo sistema (X,F , T ) minimal equicontinuo (o isometrico) es unsistema de Kronecker. Es decir, es isomorfo a una rotacion del grupo abeliano (K,K, x 7→x+ α). Mas aun, la orbita nα : n ∈ Z es densa en K.

Demostracion. Por la Proposicion anterior 2.5.1 podemos suponer que el sistema es isometri-co, por lo tanto, podemos encontrar una metrica d tal que las funciones shift T n son iso-metrıas. Hemos visto que T n pertenece al espacio C(X → X) de funciones continuas deX en sı mismo (dotado de la topologıa uniforme). Sea G ⊂ C(X → X) la clausura de lasfunciones T n : n ∈ Z. Es facil ver que G es un grupo topologico, cerrado y metrizable deisometrıas en C(X → X); por el Teorema de Arzela-Ascoli G es compacto. Ademas, comoT n y Tm conmutan para todo n,m, G es abeliano.

Sea x ∈ X, entonces la imagen f(x) : x ∈ G de G bajo la evaluacion f 7→ f(x) esun subconjunto compacto, no vacıo, invariante de X, y por lo tanto, es igual a todo X porminimalidad. Si definimos el estabilizador Γ := f : f(x) = x, entonces Γ es un subgrupocerrado (por lo tanto compacto) del grupo abeliano G. Como X = f(x) : f ∈ G, hay unabiyeccion continua fΓ 7→ f(x) del grupo cociente K := G/Γ (dotado de la topologıa cocien-te) en X. Como ambos espacios son compacto Hausdorff, la funcion es un homeomorfismo.Luego, esta funcion es un isomorfismo de sistemas topologicos dinamicos entre el sistema deKronecker K y X. Como K es un grupo topologico compacto metrizable (por la distanciaHausdorff) obtenemos el resultado. Notar que la densidad de nα : n ∈ Z en K es directapor la construccion.

Proposicion 2.5.4. Todo sistema isometrico (X,F , T ) se puede partir en una union dis-junta de sistemas isometricos minimales.

Demostracion. Como los sistemas minimales son automaticamente disjuntos, es suficienteprobar que todo punto x ∈ X esta contenido en un sistema dinamico minimal, o equiva-lentemente, que la clausura de la orbita T Zx es minimal. Si esto no sucede, entonces existey ∈ T Zx tal que x no pertenece a la clausura de la orbita de y. Pero por definicion de laclausura de la orbita, podemos encontrar una sucesion nj tal que T njx converge a y. Porpropiedad de las isometrıas, esto implica que T−njy converge a x. Luego, x esta en la clausurade la orbita de y, lo cual es una contradiccion.

Departamento de Matematica - UNLP Hoja 27 de 105

Page 32: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

2.5.1 Sistemas de Kronecker y medidas de Haar.

En esta parte vamos a considerar aquellos sistemas que preservan medida (X,X , µ, T ),que son compactos o casi periodicos. Estos sistemas son analogos a los sistemas equicontinuoso isometricos en dinamicas topologicas y, con estos sistemas, vamos a poder caracterizaralgebraicamente los sistemas que preservan medida (mas precisamente los ergodicos) comosistemas de Kronecker.

Definicion. Sea (X,X , µ, T ) un sistema que preserva medida. Una funcion f ∈ (X,X , µ)es casi periodica si la clausura de la orbita T nf : n ∈ Z es compacta en L2(X,X , µ).

Definicion. Un sistema que preserva medida (X,X , µ, T ) es compacto si toda funcion enL2(X,X , µ) es casi periodica.

Una fuente de sistemas compactos proviene de sistemas de Kronecker. Tales sistemas sontopologicos, y vamos a necesitar dotarlos con una medida canonica, que es la medida deHaar.

Sea G un grupo topologico compacto metrizable (no necesariamente abeliano). Sin unambiente, no podemos definir la convolucion f ∗ g de dos funciones continuas f, g ∈ C(G).Sin embargo, podemos definir la convolucion µ ∗ f de una medida de Borel finita µ en G yuna funcion continua f ∈ C(G) como la funcion

µ ∗ f(x) :=

∫G

f(y−1x)dµ(y),

la cual (por la continuidad uniforme de f) es otra funcion continua. Analogamente definimos

f ∗ µ(x) :=

∫G

f(xy−1)dµ(y).

Decimos que un numero c es una media a izquierda (resp. media a derecha) de una funcionf ∈ C(G) si existe una medida de probabilidad µ tal que µ ∗ f (resp. f ∗ µ) es igual a laconstante c. Para grupos compactos metrizables G, esta media c, esta bien definida.

Lema 2.5.5. (Existencia y unicidad). Sea G un grupo topologico compacto metrizable, y seaf ∈ C(G). Entonces existe una unica constante c que es media a derecha e izquierda de f .

La funcion f 7→ c que toma una funcion continua y nos devuelve su media es un funcionallineal acotado no negativo en C(G) que preserva constantes, y por lo tanto, por el Teoremade representacion de Riesz esta dada por una unica medida de probabilidad µ. Como laconvolucion a izquierda y derecha conmutan, esta medida es invariante a derecha e izquierda.Recıprocamente, dada cualquier medida µ de probabilidad Boreliana, se puede probar quef ∗ µ = µ ∗ f = c. Luego, tenemos el siguiente teorema:

Teorema 2.5.6. (Existencia y unicidad de medidas de Haar). Si G es un grupo topologicocompacto metrizable, entonces existe una unica medida de probabilidad Boreliana µ en G quees invariante a izquierda y derecha.

Como caso particular obtenemos el siguiente corolario.

Corolario 2.5.7. Todo sistema topologico de Kronecker (K, x 7→ x+ α) se puede convertircanonicamente en un sistema dinamico que preserva medida, el cual es compacto.

Departamento de Matematica - UNLP Hoja 28 de 105

Page 33: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

La demostracion de este resultado esta basada en los mismos argumentos que veremosen el siguiente ejemplo.

Ejemplo. Consideremos el toro T y el sistema shift (T, x 7→ x + α). Entonces toda fun-cion f ∈ L2(T) es casi periodica, porque la clausura de la orbita pertenece al conjuntof(·+ θ) : θ ∈ T, que es la imagen continua del toro T, y por lo tanto, es compacta.

Teorema 2.5.8. (Clasificacion de sistemas ergodicos compactos)

1. Todo sistema ergodico compacto es equivalente a un sistema de Kronecker (abeliano).

2. Todo sistema compacto se puede desintegrar en sistemas de Kronecker ergodicos.

Departamento de Matematica - UNLP Hoja 29 de 105

Page 34: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

3 Teorema Ergodico en espacios de Ha-damard en terminos de la media in-ductiva

3.1 Motivacion

El problema que vamos a estudiar en este capıtulo surge de manera natural en el estudiode la media geometrica y sus propiedades. Sin embargo es necesario recapitular algunosresultados recientes, particularmente en el espacio de matrices positivas, para entender mejorel problema. Parte de la motivacion fue mencionada en la introduccion de la tesis. En estaseccion vamos a desarrollar con mas profundidad ciertas cuestiones.

El espacio de matrices n× n complejas, M(n), es un espacio de Hilbert con el productointerno 〈A,B〉 = tr(A∗B) y la norma asociada ‖A‖2 = (tr(A∗A))1/2. Esta norma es conocidacomo norma Frobenius o Hilbert-Schmidt. El conjunto de matrices Hermitianas H(n) es unsubespacio vectorial real de M(n). Como el subconjunto P(n) de matrices (estrictamente)positivas es un subconjunto abierto en H(n), resulta ser una variedad diferenciable. Enparticular el espacio tangente a P(n) en un punto A, es el espacio TAP(n) = A × H(n),identificado por simplicidad con H(n). El producto interno en H(n) nos permite definir unametrica Riemanniana en la variedad P(n), la cual en un punto A esta dada por,

ds = ‖A−1/2dAA−1/2‖2 = [tr(A−1dA)2)]1/2.

En otras palabras, dada una curva suave a trozos α : [a, b] → P(n), su longitud se definecomo

L(α) =

∫ b

a

∥∥α−1/2(t)α(t)α−1/2(t)∥∥

2dt.

A partir de esto, como es usual, la distancia rectificable entre A,B ∈ P(n) se define pormedio de

δ(A,B) = ınf L(α) donde α : [a, b]→ P(n) une A con B en P(n) .

Mas aun, la distancia Riemanniana δ puede ser calculada por

δ(A,B) = ‖log(A1−/2BA−1/2)‖2.

El ınfimo es en realidad un mınimo, y la geodesica que conecta dos matrices positivas A yB tiene la siguiente expresion simple:

γAB(t) = A1/2(A−1/2BA−1/2)tA1/2 . (3.1.1)

Page 35: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Es usual en analisis matricial usar la notacion A#tB en vez de γAB(t). El punto medioA#1/2B se conoce como media geometrica o baricentro entre A y B, y tambien admitela siguiente caracterizacion variacional

A# 12B = argmin

C∈P(n)

(δ2(A,C) + δ2(B,C)

).

No hay razon para restringirnos a solo dos matrices. La nocion de media geometrica sepuede generalizar para mas de dos matrices de manera obvia

Λ(A1, . . . , An) := argminC∈P(n)

( n∑j=1

δ2(Aj, C)). (3.1.2)

La solucion del problema de minimizacion de cuadrados mınimos, existe y es unica, porlas propiedades de convexidad de la distancia δ(·, ·). Esta media recibe muchos nombresdiferentes dependiendo del contexto en el que se use. Algunos de ellos son: media de cuadradosmınimos, centro de gravedad, media de Frechet, media de Cartan, centro Riemanniano demasa, media geometrica Riemanniana, o mas frecuentemente media de Karcher para el casode matrices positivas.

La media geometrica aparece de manera natural en varios problemas aplicados. Por ejem-plo en el estudio de senales de radar. En este problema, cada senal es detectada por mas deun sensor. La informacion de cada sensor se codifica en un nucleo de covarianza, el cual essemidefinido positivo. Estos nucleos tienen que ser promediados para obtener el resultadofinal. Resulta que la mejor manera de promediar estos nucleos no es la media aritmeticaestandar, si no, la media geometrica que introducimos previamente (ver [19] y las referen-cias allı para mas detalles). Otra aplicacion tıpica de la media geometrica es con problemasrelacionados con metodos de optimizacion del tipo Newton (ver [15],[46]).

El inconveniente usual al lidiar con la media geometrica es que, cuando trabajamos contres o mas matrices, no existe en general una formula cerrada para calcularla. Por esta razon,hubo una extensa investigacion con el objetivo de encontrar buenas maneras de aproximarla media geometrica de tres o mas matrices ([14], [35], [42]). Un avance importante se logroal intentar demostrar la monotonıa de la media geometrica. En otras palabras, se desconocıasi Λ(A1, . . . , An) ≤ Λ(B1, . . . , Bn), para Ai ≤ Bi, donde 1 ≤ i ≤ n. La resolucion de esteproblema condujo a la introduccion de las llamadas medias inductivas.

Para motivar la definicion de las medias inductivas, notar que, dada una sucesion ann∈Nde numeros complejos tenemos la siguiente relacion

a1 + a2 + a3

3=

2

3

(a1 + a2

2

)+

1

3a3

...

a1 + . . .+ ann

=n− 1

n

(a1 + . . .+ an−1

n− 1

)+

1

nan.

Sea γa,b(t) = (1− t)a+ t b, y por un momento usemos la notacion a ]t b = γa,b(t). Entonces

a1 + a2 + a3

3=(a1 ] 1

2a2) ] 1

3a3

a1 + a2 + a3 + a4

4=((a1 ] 1

2a2) ] 1

3a3) ] 1

4a4

Departamento de Matematica - UNLP Hoja 31 de 105

Page 36: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

y ası sucesivamente. En el espacio Euclıdeo los segmentos son las geodesicas. En nuestrocontexto, podemos reemplazar los segmentos por las geodesicas asociadas a la estructuraRiemanniana. Esta es la idea que nos lleva a la definicion de la media inductiva. Dada unasucesion de matrices estrictamente positivas Ann∈N, las medias inductivas se definen dela siguiente manera:

S1(A) = A1

Sn(A) = Sn−1(A)# 1nAn (n ≥ 2).

La propiedad de monotonıa primero fue probada por Lawson y Lim (ver [35], Corolario5.1 y Proposicion 5.2), basandose en los resultados de Sturm sobre estadısticas en espaciode curvatura no positiva. El resultado en el que se basaron es el siguiente:

Proposicion 3.1.1. ([56] Ley de los grandes numeros). Sea (M,d) un espacio de Hadamardcon un baricentro contractivo

β : P1(M)→M,

y fijemos p ∈ P∞(M). Mas aun, sea (Ω,A,P) un espacio de probabilidad y (Xi)i∈N unasucesion independiente de funciones medibles Xi : Ω→M con distribucion identica PXi = p.Definimos el valor medio del baricentro sn : Ω→M como

sn(ω) := β

(1

n

n∑i=1

δXi(ω)

).

Entonces para P-casi todo ω ∈ Ω,

sn(ω) −−−→n→∞

β(p).

Demostracion. Ver [56], Proposicion 6.6.

Lawson y Lim probaron que si la sucesion esta formada por la eleccion aleatoria e in-dependiente de elementos del conjunto A1, . . . , An, entonces la media inductiva convergecasi seguro a Λ(A1, . . . , An). Es decir,

lımk→∞

Sk(Aω(1), . . . , Aω(k)) = Λ(A1, . . . , An) c.t.p. ω ∈ 1, . . . , nN.

La relacion con la monotonıa de Λ(·) yace en el hecho que, la media geometrica se obtienede una sucesion binaria de pasos, cada uno de los cuales es monotono. Es decir,

X1 ≤ X2, Y1 ≤ Y2 implica X1#tX2 ≤ Y1#tY2 para todo t ∈ [0, 1]. (3.1.3)

De esta manera la media inductiva resulta monotona y esta propiedad se preserva en ellımite. Observar que el resultado de Lawson y Lim puede ser visto como una “ley fuerte delos grandes numeros”, pues como mencionamos en la motivacion de la media inductiva, latraduccion de este resultado al caso Euclıdeo es la convergencia en casi todo punto de lospromedios a su esperanza. Bhatia y Karandikar [14] simplificaron la prueba de la monotonıade la media geometrica notando que una “ley debil de los grandes numeros” es suficiente.

Con el fin de profundizar en la conexion que existe entre los resultados que obtuvimosy la “ley debil de los grandes numeros” obtenida por Bhatia y Karandikar, vamos a dar lademostracion de la monotonicidad de la media geometrica que se encuentra en [14].

Departamento de Matematica - UNLP Hoja 32 de 105

Page 37: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Ley debil de los grandes numeros: Sean A1, . . . , Am elementos de P(n), sea G = Λ(A)la media geometrica de estas matrices, y

α :=m∑j=1

1

mδ2

2(G,Aj). (3.1.4)

Para n ≥ 1, sea Jn el conjunto de todas la n-uplas ordenadas (j1, . . . , jn), con jk ∈ 1, . . . ,m.Este conjunto tiene mn elementos. Para cada elemento de este conjunto definimos una media,Mn(j1, . . . , jn), de las matrices dadas A1, . . . , Am, a partir del siguiente proceso inductivo:

M1(j) = Aj, para todo j ∈ JnMn+1(j1, . . . , jn, k) =Mn(j1, . . . , jn)# 1

n+1Ak,

para todo (j1, . . . , jn) ∈ Jn y k ∈ J1. En otras palabras

Mn+1(j1, . . . , jn, k) = (. . . (((Aj1# 12Aj2)# 1

3Aj3)# 1

4Aj4) . . .)# 1

n+1Ak,

con (j1, . . . , jn) ∈ Jn y k ∈ J1. La clave de la demostracion es la siguiente estimacion:

Teorema 3.1.2. Para todo n ∈ N, tenemos

1

mn

∑(j1,...,jn)∈Jn

δ22(G,Mn(j1, . . . , jn)) ≤ 1

nα. (3.1.5)

Idea de la demostracion. La prueba es por induccion. El caso n = 1 es trivial ya quetenemos α en ambos lados. Supongamos que es verdadero para n, y vamos a probar que esverdadero para n + 1. El argumento clave es la desigualdad del semiparalelogramo (2.1.1),que nos permite reducirMn+1 aMn y luego aplicar la hipotesis inductiva, y la desigualdadde la varianza (2.2.1) que nos permite estimar el termino que queremos.

Ahora damos la prueba para la monotonıa [14]:

Teorema 3.1.3. Sean A1, . . . , Am y A′1, . . . , A

′m matrices definidas positivas tales que Aj ≤

A′j para 1 ≤ j ≤ m. Entonces

G(A1, . . . , Am) ≤ G(A′

1, . . . , A′

m). (3.1.6)

Demostracion. Denotemos por G y G′

los dos lados de (3.1.6) y α, α′, M, M′

las sumascorrespondientes a las m-uplas y sus medias. Para todo ε > 0, existe n, tal que

α

n<ε2

4,

α′

n<ε2

4.

Sea In el subconjunto de Jn, tal que δ2(G,M(j1, . . . , jn)) > ε. Por (3.1.5) tenemos

#In ≤1

4#Jn.

Departamento de Matematica - UNLP Hoja 33 de 105

Page 38: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Analogamente, sucede lo mismo para I ′n. Esto prueba que la interseccion de ambos con-juntos

C1 = (j1, . . . , jn) ∈ Jn : δ2(G,M(j1, . . . , jn)) < ε,

y

C2 =

(j1, . . . , jn) ∈ Jn : δ2(G′,M′

(j1, . . . , jn)) < ε

contiene al menos un elemento. De hecho, al menos contiene mn

2elementos.

Figura 3.1: Cada bloque contiene al menos mn

4elementos.

Sea (j∗1 , . . . , j∗m) ∈ C1 ∩ C2. Usando (3.1.3) vemos que

Mn(j∗1 , . . . , j∗m) ≤M′

n(j∗1 , . . . , j∗m).

Para ε = 1k, elegimos n y (j∗1 , . . . , j

∗m) como describimos antes. Luego

δ2(G,Mn(j∗1 , . . . , j∗m)) ≤ 1

k

δ2(G′,M′

n(j∗1 , . . . , j∗m)) ≤ 1

k

Mn(j∗1 , . . . , j∗m) ≤M′

n(j∗1 , . . . , j∗m).

De donde concluimos que G ≤ G′

tomando lımite.

Mientras que el enfoque probabilıstico es muy interesante, tambien es verdad que lasucesion es desconocida. Eso llevo a Bhatia a preguntarse si una eleccion mas natural, quees la sucesion que simplemente se repite de manera cıclica en A1, . . . , Am, converge a lamedia geometrica. La respuesta es afirmativa y fue demostrada por Holbrook. Mas aun, laconvergencia es independiente del punto de comienzo. Este ultimo fenomeno es consecuenciade la curvatura del espacio como veremos mas adelante (seccion 3.5).

El resultado de Holbrook [29] es el siguiente: consideremos dmatrices positivasA0, . . . , Ad−1,y definamos la funcion F : Zd → P(n) por F (k) = Ak, donde Zd denota el grupo abelianode enteros modulo d. Si definimos la sucesion periodica A = F (n)n∈N, entonces Holbrookprobo que

lımn→∞

Sn(A) = Λ(A0, . . . , Ad−1).

Departamento de Matematica - UNLP Hoja 34 de 105

Page 39: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Ejemplo. Supongamos que tenemos 3 matrices estrictamente positivas A1, A2 y A3. Recor-damos que en este caso particular:

Λ(A1, A2, A3) = argminC∈P(n)

(δ2(A1, C) + δ2(A2, C) + δ2(A3, C)

).

Luego, Holbrook probo que

A1# 12A2# 1

3A3# 1

4A1# 1

5A2# 1

6A3# 1

7A1# 1

7. . .→ Λ(A1, A2, A3)

a1

a2a3

a1#1/2a2

(a1#1/2a2)#1/3a3

((a1#1/2a2)#1/3a3)#1/4a1

Figura 3.2: Ejemplificacion de la convergencia de la media inductiva en el caso Euclıdeo.

Formulas ergodicas para medias geometricas

Sea (G,+) un grupo topologico compacto, dotado con una medida de Haar m, y seaτ : G → G una transformacion ergodica. El teorema ergodico clasico de Birkhoff nos diceque, dada f ∈ L1(G), entonces para m-casi todo ω ∈ G

1

n

n−1∑k=0

f(τ k(ω)) −−−→n→∞

∫G

f(ω)dm(ω). (3.1.7)

Luego, el Teorema de Holbrook puede ser visto como un Teorema ergodico para funcionesdefinidas en Zp que toman valores en P(n). En efecto, pensar que la media inductiva juegael papel de los promedios del lado izquierdo y la media geometrica Λ(A0, . . . , Ad−1) juega elpapel de la integral de f con respecto a la medida de Haar en Zd.

Esta interpretacion del resultado de Holbrook nos sugiere que podemos obtener unaaproximacion computable de la media geometrica de varias matrices en termino de promediosergodicos. Uno de los objetivos de esta tesis es probar tal Teorema ergodico en termino dela media inductiva en un contexto mas general. Mas precisamente, consideremos un sistemadinamico (G, τ), donde G es un grupo compacto y τ es ergodico con respecto a la medidade Haar m. Observar que el grupo tiene que ser abeliano porque las orbitas τngn∈N sondensas en G.

Departamento de Matematica - UNLP Hoja 35 de 105

Page 40: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

En este contexto, dada una funcion F : G→ P(n), decimos que F ∈ Lp(G,P(n)) si∫G

δp(F (g), B)) dm(g) <∞,

donde B es cualquier matriz positiva. Por la desigualdad triangular, la definicion no dependede la eleccion de B. Siguiendo el trabajo de Sturm [56], el baricentro de F ∈ L1(G,P(n))se define como

βF := argminC∈P(n)

∫G

δ2(F (g), C))− δ2(F (g), B)) dm(g).

En otras palabras, βF denota al baricentro del pushforward measure F∗m. En este caso esposible probar la existencia y unicidad de dicho elemento por las propiedades de continuidady convexidad uniforme de la funcion,

C 7→∫G

δ2(F (g), C))− δ2(F (g), B)) dm(g).

Notar que si F ∈ L2(G,P(n)) entonces

βF := argminC∈P(n)

∫G

δ2(F (g), C))dm(g).

Como antes, esta definicion no depende de B. En esta tesis probamos el siguiente resultado:

Teorema. Dada A ∈ L1(G,P(n)), para casi todo g ∈ G

lımn→∞

Sn(A(g), A(τ(g)), . . . , A(τn−1(g))

)= βA. (3.1.8)

Mas aun, probamos este resultado no solo para funciones que toman valores en P(n), sino tambien, para los espacios de Hadamard M . Recordamos que un espacio metrico completo(M, δ) se llama espacio de Hadamard si la distancia satisface la ley del semiparalelogramo.Es decir, para todo x, y ∈M existe m ∈M tal que

δ2(m, z) ≤ 1

2δ2(x, z) +

1

2δ2(y, z)− 1

4δ2(x, y).

Existencia y unicidad de geodesicas: La desigualdad del semiparalelogramo implica queel punto medio es unico. En efecto, tomando z = x y z = y en la desigualdad (2.1.1), es facilver que,

δ(x,m) = δ(m, y) =1

2δ(x, y).

En efecto, tomando z = x, obtenemos

δ(m,x) ≤ 1

2δ(x, y).

Analogamente, tomando z = y, obtenemos

δ(m, y) ≤ 1

2δ(x, y).

Pero comoδ(x, y) ≤ δ(x,m) + δ(y,m) ≤ δ(x, y),

Departamento de Matematica - UNLP Hoja 36 de 105

Page 41: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

deducimos las igualdades antes mencionadas. Mas aun, la desigualdad del semiparalelogramoimplica que el punto medio es unico. En efecto, si m,m

′son puntos medios entre x e y,

δ2(m,m′) ≤ 1

2δ2(x,m

′) +

1

2δ2(y,m

′)− 1

4δ2(x, y)

≤ 1

2

[1

2δ2(x, x) +

1

2δ2(y, x)− 1

4δ2(x, y)

]+

+1

2

[1

2δ2(x, y) +

1

2δ2(y, y)− 1

4δ2(x, y)

]− 1

4δ2(x, y) = 0.

La existencia y unicidad de puntos medios dan lugar a una unica geodesica γa,b :[0, 1] → M que conecta dos puntos cualesquiera a y b. Para probarlo, primero se defineγa,b(1/2) como el punto medio entre a y b. Luego, usando un argumento inductivo, se definela geodesica para todos los numeros diadicos racionales en [0, 1]. Finalmente por completitud,se extiende para todo t ∈ [0, 1]. De ahora en adelante vamos a usar la notacion a#tb en vezde γa,b(t).

Como en el caso de matrices estrictamente positivas, definimos la media inductiva enespacios de Hadamard de la siguiente manera:

Definicion. (Media inductiva). Sea (M, δ) un espacio de Hadamard. Dado a ∈ MN sedefine

S1(a) = a1

Sn(a) = Sn−1(a)# 1nan (n ≥ 2).

Tanto L1(G,M) como βA, al igual que las medias inductivas, se definen mutatis mutandis.En este contexto el enunciado del teorema resulta ser:

Teorema. Dada A ∈ L1(G,M), para casi todo g ∈ G,

lımn→∞

Sn(A(g), A(τ(g)), . . . , A(τn−1(g))

)= βA. (3.1.9)

Con respecto a la media inductiva, la diferencia principal entre (3.1.8) y (3.1.9) es quepara los espacios de Hadamard, en general, no existe una formula para la geodesica que unedos puntos. En otras palabras, al tratar el problema con mas generalidad se puede perder lacomputabilidad de la media inductiva. Sin embargo, en muchos casos particulares de graninteres como el caso de las matrices positivas, operadores positivos en espacios de Hilbert,entre otros, existe una formula cerrada para las geodesicas que unen dos puntos.

Cabe mencionar que en [56], Sturm desarrollo una teorıa de baricentros de medidasde probabilidad para espacios de Hadamard (ver Subseccion 2.2 para algunas definicionesy resultados basicos). Dotado con este baricentro, los espacios de Hadamard juegan unpapel importante en la teorıa de integracion (variables aleatorias, esperanza y varianza),ley de los grandes numeros, teorıa ergodica, desigualdad de Jensen (ver [17], [27], [38], [48],y [56]), generalizaciones estocasticas de retracciones Lipschitz y problemas de extension defunciones Lipschitz o Holder (ver [39], [45], y [50]) y teorıa de transporte optimo en variedadesRiemannianas (ver [52], y [53]), etc.

Departamento de Matematica - UNLP Hoja 37 de 105

Page 42: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Mollifiers en espacios de Hadamard

La generalizacion de P(n), o incluso de variedades Riemannianas con curvatura no po-sitiva, a espacios de Hadamard no es directa. Uno de los motivos es que los espacios deHadamard, en general, no tienen un espacio vectorial finito dimensional subyacente, comoen el caso de variedades. Esto hace que algunos pasos de las demostraciones sean mucho mascomplicados, y nos llevan a una nueva definicion de mollifiers que solo usan la estructurametrica (ver subseccion 3.4.2). Estos resultados originales son interesantes por sı mismos ygeneralizan unos resultados probados por Karcher en [31].

3.2 Una variante del Teorema ergodico

Antes de encarar un problema general del tipo (3.1.8) pensemos nuevamente en el conjun-to de matrices P(n) pero, esta vez, consideremos que las matrices A1, . . . , Am son mutuamen-te conmutativas. Recordar que en este caso la media geometrica satisface G(A1, . . . , Am) =(A1 . . . Am)1/m. Por otro lado, una consecuencia del Teorema ergodico de Birkhoff tomandof = χB es:

Proposicion 3.2.1. Sea

τ(m)B :=

# 0 ≤ j ≤ m− 1 : T j(x) ∈ Bm

,

donde T : X → X es ergodica. Entonces

τ(m)B −−−→

m→∞µ(B) casi todo x ∈ X.

Esto nos dice que en el caso conmutativo es necesario y suficiente que, a medida que ncrece, la cantidad de veces que aparece cada matriz tienda a ser la misma, para tener

Sn(A)→ Λ(A1, . . . , Am).

Una pregunta previa que podrıamos plantearnos es si permutamos (infinitas) matrices enSn(A) del resultado de Holbrook podemos probar la convergencia a Λ(A1, . . . , Am).

El hecho de poder permutar matrices en la demostracion de Holbrook no es directa, perohay otro resultado que nos puede ayudar en esta direccion, y en nuestro problema ergodico.Existe una version general del Teorema de Holbrook en espacios de Hadamard donde losn puntos tienen asignados diferentes pesos. Para ser mas precisos, sea (M, δ) un espaciometrico completo. El centro de masa Λ(ω; a) de la n-upla a = (a1, . . . , an) ∈ Mn con pesosω = (ω1, . . . , ωn) ∈ ∆n esta definido como el unico minimizador de la funcion

Λ(ω; a) = argminx∈M

n∑i=1

ωiδ2(x, ai).

En [43], Lim Y Palfia probaron el siguiente resultado.

Teorema 3.2.2. Sea ω = (ω1, . . . , ωn) ∈ ∆n y a = (a1, . . . , an) ∈Mn Sea

S1(a) = a1

Sk+1(a) = Sk(a)#sk+1ak+1,

Departamento de Matematica - UNLP Hoja 38 de 105

Page 43: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

donde sk = ωk/l(k) con l(k) =∑k

i=1 ωi. Entonces

δ2(Λ(ω; a), Sk(a)) ≤ 1

l(k)

[3∆(a)2 +

n∑i=1

ωiδ2(Λ(ω; a), ai)

],

para todo k ∈ N, es decir,lımk→∞

Sk(a) = Λ(ω; a),

ya que l(k)→∞ cuando k →∞.

Demostracion. Ver [43] Teorema 3.4.

La prueba del resultado de Lim y Palfia esta basada en las desigualdades propias delespacio de Hadamard. Pero lo que nos interesa es que este nuevo resultado tambien nos diceque

δ2(Λ(ω; a), Sk(a)) ≤ 4∆(a)2

l(k),

donde∆(a) := sup

i,j∈1,...,mδ(ai, aj).

Ahora tenemos una cota superior que depende solamente del diametro del conjunto. Esto noshace suponer que es posible modificar la demostracion para poder realizar permutaciones.De hecho, a partir de modificaciones de sus resultados, obtenemos los primeros resultadosen direccion al Teorema ergodico que buscamos (para el caso de funciones continuas).

3.2.1 La media inductiva

Como en el caso de matrices estrictamente positivas (que consideramos en la introduc-cion), definimos la media inductiva en espacios de Hadamard de la siguiente manera:

Definicion. (Media inductiva). Sea (M, δ) un espacio de Hadamard. Dado a ∈ MN sedefine

S1(a) = a1

Sn(a) = Sn−1(a)# 1nan (n ≥ 2).

Observacion. Dado a ∈ Mn y 1 ≤ k ≤ n, por medio de Sk(a) vamos a denotar la mediak-inductiva de cualquier sucesion cuyos primeros n terminos son los elementos del vector a.

Ejemplo. Supongamos que M pertenece a Cn con la distancia Euclıdea usual. Como lasgeodesicas en este caso son los segmentos, si tomamos una sucesion ann∈N en Cn, entonces

S1(a) = a1,

S2(a) =a1 + a2

2,

S3(a) =2

3

(a1 + a2

2

)+

1

3a3 =

a1 + a2 + a3

3,

y ası sucesivamente. Luego, en este caso la media inductiva coincide con la media aritmetica.N

Departamento de Matematica - UNLP Hoja 39 de 105

Page 44: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

De ahora en mas, sea (M, δ) un espacio de Hadamard. Como una consecuencia de (2.1.3),obtenemos directamente este resultado de contractividad de la media inductiva.

Corolario 3.2.3. (Propiedad de contraccion) Dados a, b ∈MN, tenemos que

δ(Sn(a), Sn(b)) ≤ 1

n

n∑i=1

δ(ai, bi). (3.2.1)

El siguiente lema se deduce de (2.1.2), y es un caso particular de la desigualdad con pesosconsiderada por Lim y Palfia en [43].

Lema 3.2.4. Dados a ∈MN y z ∈M , para todo k,m ∈ N

δ2(Sk+m(a), z) ≤ k

k +mδ2(Sk(a), z) +

1

k +m

m−1∑j=0

δ2(ak+j+1, z)

− k

(k +m)2

m−1∑j=0

δ2(Sk+j(a), ak+j+1).

Demostracion. Por la desigualdad (2.1.2), aplicada a Sn+1(a) = Sn(a) #n+1 (an+1), obte-nemos

(n+ 1) δ2(Sn+1(a), z)− n δ2(Sn(a), z) ≤ δ2(an+1, z)−n

(n+ 1)δ2(Sn(a), an+1).

Sumando estas desigualdades de n = k, a n = k +m− 1, obtenemos que la diferencia

(k +m) δ2(Sk+m(a), z)− k δ2(Sk(a), z),

obtenida de la suma telescopica del lado izquierdo, es menor o igual que

m−1∑j=0

(δ2(ak+j+1, z)−

k + j

(k + j + 1)δ2(Sk+j(a), ak+j+1)

).

Finalmente, Usando que k+jk+j+1

≥ kk+m

para todo j ∈ 0, . . . ,m− 1, esta suma esta acotadapor arriba por

m−1∑j=0

(δ2(ak+j+1, z)−

k

(k +m)δ2(Sk+j(a), ak+j+1)

),

lo que completa la demostracion.

Dada una sucesion a ∈MN, sea ∆(a) el diametro de su imagen, es decir

∆(a) := supn,m∈N

δ(an, am).

Notar que, tambien por (2.1.2), δ(Sn(a), ak) ≤ ∆(a) para todo n, k ∈ N.

Departamento de Matematica - UNLP Hoja 40 de 105

Page 45: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Lema 3.2.5. Dado a ∈MN tal que ∆(a) <∞, entonces para todo k,m ∈ N se tiene que

1

m

m−1∑j=0

δ2(Sk(a), ak+j+1) ≤ Rm,k +1

m

m−1∑j=0

δ2(Sk+j(a), ak+j+1).

donde Rm,k =

(m2

(k + 1)2+ 2

m

k + 1

)∆2(a).

Demostracion. Notar que por (3.2.1), y para todo k,

δ(Sk+j(a), Sk+j+1(a)) ≤ 1

k + j + 1∆(a).

Por lo tanto

δ(Sk(a), ak+j+1) ≤ δ(Sk(a), Sk+j(a)) + δ(Sk+j(a), ak+j+1)

≤j∑

h=1

1

k + h∆(a) + δ(Sk+j(a), ak+j+1)

≤ m

k + 1∆(a) + δ(Sk+j(a), ak+j+1).

Luego, para todo j ≤ m,

δ2(Sk(a), ak+j+1) ≤(

m2

(k + 1)2+ 2

m

k + 1

)∆2(a) + δ2(Sk+j(a), ak+j+1),

donde usamos que δ(Sk+j(a), ak+j+1) ≤ ∆(a) para todo k, j ∈ N. Sumando estas desigual-dades y dividiendo por m, obtenemos el resultado.

3.3 Formula ergodica asociada a la media in-ductiva en el caso continuo

3.3.1 El marco de trabajo y notacion basica

Sea (G,+) un grupo topologico metrizable, compacto y abeliano. En este grupo fijamosuna medida de Haar m, y tomamos un automorfismo ergodico τ(g) = g + h0 para algunh0 ∈ G. A una metrica invariante por desplazamientos (shift) del grupo G la denotamospor dG (para la existencia de tal metrica ver [47], seccion 1.22). En esta seccion vamos atrabajar con un sistema dinamico (G, τ).

Observacion. Todo sistema de grupo dinamico (G, τ) como el descrito antes es equivalentea un sistema de Kronecker (ver Teorema 2.5.8). Es conocido que todo sistema dinamicoisometrico (o equicontinuo) contiene un sistema de Kronecker, pues todo sistema dinamicominimal es un sistema Kronecker (Ver Proposicion 2.5.3 y Proposicion 2.5.4).

Departamento de Matematica - UNLP Hoja 41 de 105

Page 46: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Por otro lado, vamos a fijar un espacio de Hadamard (M, δ). Dada una funcion A : G→M , definimos aτ : G→MN, por

aτ (x) := aτn(x)n∈N donde aτj (x) = A(τ j(x)). (3.3.1)

Finalmente, dada una funcion F ∈ L1(G,M), por medio de βF vamos a denotar elbaricentro del pushforward measure F∗m. En otras palabras, dado cualquier punto y ∈M ,

βF = argminz∈M

∫G

[δ2(z, F (g))− δ2(y, F (g))]dm(g).

Recordar que si F ∈ L2(G,M) entonces,

βF = argminz∈M

∫G

δ2(z, F (g))dm(g).

Luego, si F ∈ L2(G,M), entonces βF coincide con el baricentro de Cartan correspondientea la distribucion F .

3.3.2 Demostracion del caso continuo

En esta seccion vamos a probar la formula ergodica para funciones continuas. Mas preci-samente vamos a probar el siguiente resultado:

Teorema 3.3.1. Sean (M, δ) un espacio de Hadamard, (G,+) un grupo topologico metriza-ble, compacto y abeliano, y A : G→M una funcion continua. Entonces

lımn→∞

Sn(aτ (g)) = βA, (3.3.2)

uniformemente en g ∈ G.

Con este objetivo, primero vamos a probar algunos resultados tecnicos, que vamos acombinar al final de la seccion para probar el Teorema 3.3.1.

Lema 3.3.2. Sea A : G → M una funcion continua, y sea K un subconjunto compacto deM . Para todo n ∈ N, definimos Fn : G×K → R por

Fn(g, x) =1

n

n−1∑j=0

δ2(aτj (g), x).

Entonces, la familia Fnn∈N es equicontinua.

Demostracion. Por la desigualdad triangular, la funcion y 7→ δ2(A(·), y) es continua de(K, δ), en el conjunto de funciones continuas reales definidas en G considerando la normauniforme. ComoK es compacto, la familia δ2(A(·), x)x∈K es (uniformemente) equicontinua.Por lo tanto, dado ε > 0, existe δ > 0 tal que si

dG(g1, g2) < δ entonces |δ2(A(g1), x)− δ2(A(g2), x)| < ε

2,

Departamento de Matematica - UNLP Hoja 42 de 105

Page 47: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

para todo x ∈ K. Como τ es una isometrıa y dG(g1, g2) < δ, obtenemos

|Fn(g1, x)− Fn(g2, x)| =∣∣∣∣∣ 1n

n−1∑j=0

δ2(aτj (g1), x)− δ2(aτj (g2), x)

∣∣∣∣∣ < ε

2.

Sea ∆ el diametro del conjunto (Imagen(A)×K) en M2. Como ambos conjuntos son compac-tos, ∆ <∞. Entonces, tomemos (g1, x1) y (g2, x2) tales que dG(g1, g2) < δ y δ(x1, x2) < ε

4∆.

Luego

|Fn(g1, x1)− Fn(g2, x2)| ≤ |Fn(g1, x1)− Fn(g1, x2)|+ |Fn(g1, x2)− Fn(g2, x2)|

≤ 2∆

n

n−1∑k=0

δ(x1, x2) +ε

2< ε.

Ahora, como consecuencia de los Teoremas de Arzela-Ascoli y Birkhoff obtenemos.

Proposicion 3.3.3. Sea A : G → M una funcion continua, y K un conjunto compacto deM . Entonces

lımn→∞

1

n

n−1∑j=0

δ2(aτj (g), x) =

∫G

δ2(A(γ), x)dm(γ),

donde la convergencia es uniforme en (g, x) ∈ G×K.

Convencion: De ahora en adelante, hasta finalizar la subseccion, vamos a fijar una funcioncontinua A : G→M .

Sea

α := mınx∈M

∫G

δ2(A(g), x)dm(g),

y βA el punto donde se alcanza el mınimo, es decir, βA es el baricentro del pushforward porA de la medida de Haar en G. Entonces obtenemos la siguiente cota superior.

Lema 3.3.4. Para todo ε > 0, existe m0 ∈ N tal que, para todo m ≥ m0 y todo k ∈ N,

δ2(Sk+m(aτ (g)), βA) ≤ k

k +mδ2(Sk(a

τ (g)), βA) +m

k +m(α + ε)

− km

(k +m)2

(1

m

m−1∑j=0

δ2(Sk+j(a

τ (g)), aτk+j+1(g)))

.

Demostracion. Para todo ε > 0, existe m0 ∈ N tal que, para todo m ≥ m0,∣∣∣∣∣ 1

m

m−1∑j=0

δ2(aτk+j+1(g), βA)− α∣∣∣∣∣ < ε.

Departamento de Matematica - UNLP Hoja 43 de 105

Page 48: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Notar que m0 es independiente de k por la Proposicion 3.3.3. Ahora, por el Lema 3.2.4

δ2(Sk+m(aτ (g)), βA) ≤ k

k +mδ2(Sk(a

τ (g)), βA) +1

k +m

m−1∑j=0

δ2(aτk+j+1(g), βA)

− k

(k +m)2

m−1∑j=0

δ2(Sk+j(aτ (g)), aτk+j+1(g))

=k

k +mδ2(Sk(a

τ (g)), βA) +m

k +m

(1

m

m−1∑j=0

δ2(aτk+j+1(g), βA)

)

− km

(k +m)2

(1

m

m−1∑j=0

δ2(Sk+j(aτ (g)), aτk+j+1(g))

)

≤ k

k +mδ2(Sk(a

τ (g)), βA) +m

k +m(α + ε)

− km

(k +m)2

(1

m

m−1∑j=0

δ2(Sk+j(aτ (g)), aτk+j+1(g))

).

Recordar que, dada una sucesion a ∈MN, ∆(a) denota el diametro de su imagen. Es decir,

∆(a) := supn,m∈N

δ(an, am).

Como A : G→M es continua, notar que

Ca := supg∈G

∆(aτ (g)) <∞.

Lema 3.3.5. Para todo ε > 0, existe m0 ∈ N tal que, para todo m ≥ m0 y todo k ∈ N,

δ2(Sk(aτ (g)), βA)− ε+ α−Rm,k ≤

1

m

m−1∑j=0

δ2(Sk+j(aτ (g)), aτk+j+1(g)),

donde Rm,k =

(m2

(k + 1)2+ 2

m

k + 1

)C2a .

Demostracion. Considerar el conjunto compacto

K := cc Sk(aτ (x)) : k ∈ N,

donde la capsula convexa se toma en el sentido geodesico. Para todo ε > 0, existe m0 ∈ N talque, para todo m ≥ m0, por la desigualdad de la varianza (Proposicion 2.2.2) y la Proposicion3.3.3, se tiene que

δ2(Sk(aτ (x)), βA) ≤

∫G

δ2(Sk(a

τ (g)), A(γ))dm(γ) − α

≤ ε+1

m

m−1∑j=0

δ2(Sk(aτ (g)), aτk+j+1(g))− α.

Departamento de Matematica - UNLP Hoja 44 de 105

Page 49: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Finalmente, por el Lema 3.2.5

δ2(Sk(aτ (x)), βA) ≤ ε+

1

m

m−1∑j=0

δ2(Sk+j(aτ (x)), aτk+j+1(x)) +Rm,k − α,

donde Rm,k =

(m2

(k + 1)2+ 2

m

k + 1

)C2a .

Lema 3.3.6. Dado ε > 0, existe m0 ≥ 1 tal que, para todo ` ∈ N

δ2(S`m0(aτ (g)), βA) ≤ L

`+ ε,

uniformemente en g ∈ G, donde L = α + 3C2a .

Demostracion. Fijemos ε > 0. Por los Lemas 3.3.4 y 3.3.5, existe m0 ≥ 1 tal que, paratodo k ∈ N,

δ2(Sk+m0(aτ (g)), βA) ≤ k

k +m0

δ2(Sk(aτ (g)), βA) +

m0

k +m0

(α + ε

)− km0

(k +m0)2

(1

m0

m0−1∑j=0

δ2(Sk+j(aτ (x)), aτk+j+1(x))

),

y

1

m0

m0−1∑j=0

δ2(Sk+j(aτ (g)), aτk+j+1(g)) ≥ δ2(Sk(a

τ (g)), βA)− ε+ α−Rm0,k.

Luego, combinando estas dos desigualdades obtenemos

δ2(Sk+m0(aτ (g)), βA) ≤ k

k +m0

δ2(Sk(aτ (g)), βA) +

m0

k +m0

(α + ε

)− km0

(k +m0)2

(δ2(Sk(a

τ (g)), βA)− ε+ α−Rm0,k

).

Consideremos ahora el caso particular cuando k = `m0. Como Rm0,`m0 ≤3

`C2a tenemos

δ2(S(`+1)m0(aτ (g)), βA) ≤ `

`+ 1δ2(S`m0(a

τ (g)), βA) +1

l + 1

(α + ε

)−

`

(`+ 1)2

(δ2(S`m0(a

τ (g)), βA)− ε+ α−Rm0,`m0

)≤ `2 δ2(S`m0(a

τ (g)), βA) + (2`+ 1)ε+ α + 3C2a

(`+ 1)2. (3.3.3)

Usando la desigualdad recursivamente, el resultado se obtiene por induccion en `. De hecho,si ` = 1 entonces

δ2(Sm0(aτ (g)), βA) ≤ C2

a ≤ L.

Departamento de Matematica - UNLP Hoja 45 de 105

Page 50: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Por otro lado, si suponemos que el resultado es verdadero para algun ` ≥ 1, es decir,

δ2(S`m0(aτ (x)), g) ≤ L

`+ ε.

Combinando esta desigualdad con (3.3.3) tenemos que

δ2(S(`+1)m0(aτ (g)), βA) ≤ `L+ `2ε+ (2`+ 1)ε+ α + 3C2

a

(`+ 1)2=

L

`+ 1+ ε.

Ahora estamos listos para probar la formula ergodica para funciones continuas.

Demostracion del Teorema. 3.3.1. Dado ε > 0, por el Lema 3.3.6, existe m0 ∈ N talque,

δ2(S`m0(aτ (g)), βA) ≤ L

`+ε2

8,

para todo ` ∈ N . Tomemos `0 ∈ N tal que, para todo ` ≥ `0,

δ2(S`m0(aτ (g)), βA) ≤ ε2

4. (3.3.4)

Sea n = `m0 + d tal que ` ≥ `0 y d ∈ 1, . . . ,m0 − 1. Notar que

S`m0(aτ (g)) = S`m0+d

(( aτ1(g), . . . , aτ`m0

(g), S`m0(aτ (g)), . . . , S`m0(a

τ (g))︸ ︷︷ ︸d veces

)).

Entonces, usando el Corolario 3.2.3 con las sucesiones

( aτ1(g), . . . , aτ`m0(g), S`m0(a

τ (g)), . . . , S`m0(aτ (g))︸ ︷︷ ︸

d veces

)

y

( aτ1(g), . . . , aτ`m0(g), aτ`m0+1(g) , . . . , aτ`m0+d(g) ),

obtenemos

δ(S`m0(aτ (g)), S`m0+d(a

τ (g))) ≤ 1

`m0 + d

d∑j=1

δ(S`m0(aτ (g)), aτ`m0+j(g)).

Como δ(S`m0(aτ (g)), aτ`m0+j(g)) ≤ Ca para todo j ∈ 1, . . . ,m0−1, finalmente tenemos que

δ(S`m0(aτ (g)), S`m0+d(a

τ (g))) ≤ d

`m0 + dCa ≤

1

`Ca −−−→

k→∞0.

Combinando esto con (3.3.4) obtenemos que para un n suficientemente grande,

δ(Sn(aτ (g)), βA) < ε.

Departamento de Matematica - UNLP Hoja 46 de 105

Page 51: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

3.4 Formula ergodica asociada a la media in-ductiva en el caso L1

Como mencionamos antes, queremos extender el Teorema 3.3.1 a funciones en L1(G,M).En esta seccion vamos a probar el siguiente Teorema ergodico para funciones en L1(G,M),en termino de la media inductiva, el cual es uno de los resultados principales de esta tesis.

Teorema 3.4.1. Sean (M, δ) un espacio de Hadamard y (G,+) un grupo topologico metri-zable, compacto y abeliano. Dada A ∈ L1(G,M), para casi todo g ∈ G

lımn→∞

Sn(aτ (g)) = βA. (3.4.1)

Observacion. Sea M el cuerpo de numeros complejos con la distancia usual. Como obser-vamos en el ejemplo de la seccion 3.2.1, la media inductiva Sn(aτ (g)) se convierte en la mediaartimetica usual

1

n

n−1∑k=0

A(τn(g)).

Por otro lado, el baricentro βA es la integral de A con respecto a la medida de Haar m.Luego, la ecuacion (3.4.1) se traduce en

lımn→∞

1

n

n−1∑k=0

A(τn(g)) =

∫G

A(g) dm(g),

en casi todo punto g ∈ C, el cual es el Teorema clasico de Birkhoff. N

Es natural pensar entonces, en aproximar una funcion de L1(G,M), por funciones con-tinuas. Para ello necesitamos definir mollifiers en espacios de Hadamard.

3.4.1 Dos lemas de aproximacion

La estrategia de la demostracion consiste en construir una buena aproximacion por fun-ciones continuas, y obtener el resultado en L1 como consecuencia del teorema para funcionescontinuas (Teorema 3.3.1). Las preguntas que surgen son: ¿Que significa una buena aproxi-macion? ¿Que debemos requerir a la aproximacion para obtener el caso L1 como lımite delcaso continuo? Los siguientes lemas contienen las claves para responder estas dos preguntas.

Lema 3.4.2. Sea (Ω,B, P ) un espacio de probabilidad, y A,B ∈ L1(Ω,M). Si

βA = argminz∈M

∫Ω

[δ2(A(ω), z)− δ2(A(ω), y)] dP (ω),

βB = argminz∈M

∫Ω

[δ2(B(ω), z)− δ2(B(ω), y)] dP (ω),

entonces

δ(βA, βB) ≤∫

Ω

δ(A(ω), B(ω))dP (ω). (3.4.2)

Departamento de Matematica - UNLP Hoja 47 de 105

Page 52: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Observacion. Recordar que la definicion de βA (resp. βB) no depende de la eleccion dey ∈M .

Demostracion. Por la desigualdad de la varianza (Proposicion 2.2.2) obtenemos

δ2(βA, βB) ≤∫

Ω

δ2(βA, B(ω))− δ2(βB, B(ω))dP (ω),

δ2(βA, βB) ≤∫

Ω

δ2(βB, A(ω))− δ2(βA, A(ω))dP (ω),

y la combinacion de estas dos desigualdades nos llevan a

2δ2(βA, βB) ≤∫

Ω

δ2(βA, B(ω)) + δ2(βB, A(ω))

− δ2(βB, B(ω))− δ2(βA, A(ω))dP (ω).

Finalmente, usando el Teorema de cuadruple comparacion de Reshetnyak (Teorema 2.1.3)obtenemos

2δ2(βA, βB) ≤ 2δ(βA, βB)

∫Ω

δ(A(ω), B(ω)) dP (ω),

lo cual es, despues de una simplificacion algebraica, el resultado deseado.

Lema 3.4.3. Sean A,B ∈ L1(G,M). Dado ε > 0, para casi todo g ∈ G existe n0, que puededepender de g, tal que

δ(Sn(aτ (g)), Sn(bτ (g))

)≤ ε+

∫G

δ(A(g), B(g))dm(g), (3.4.3)

siempre que n ≥ n0.

Demostracion. Por el Corolario 3.2.3

δ(Sn(aτ (g)), Sn(bτ (g))

)≤ 1

n

n−1∑k=0

δ(aτk(g), bτk(g)

)=

1

n

n−1∑k=0

δ(A(τ k(g)), B(τ k(g))

),

por lo tanto, el lema se deduce del Teorema ergodico de Birkhoff.

3.4.2 Buena aproximacion por funciones continuas (Mo-

llifiers)

Los dos lemas anteriores nos dan indicio de que necesitamos algun tipo de buena apro-ximacion en L1. Mas precisamente, dada A ∈ L1(G,M) y ε > 0, buscamos una funcioncontinua Aε : G→M tal que ∫

G

δ(A(g), Aε(g)) dm(g) < ε.

En algunos casos existe un espacio vectorial finito dimensional subyacente. Este es el caso,por ejemplo, cuando M es el conjunto de matrices estrictamente positivas, o mas general,cuando M es una variedad Riemanniana de curvatura no positiva. En este caso las funcionesAε se pueden construir usando Mollifiers. Esta idea fue usada por Karcher en [31]. En elcaso general, podemos usar una idea similar.

Departamento de Matematica - UNLP Hoja 48 de 105

Page 53: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Mollifiers en variedades Riemannianas

En esta subseccion veremos como es posible definir los Mollifiers para variedades Rieman-nianas. Dicha idea fue utilizada por Karcher en [31]. Recordemos primero como se definenlos mollifiers en Rn. Las siguientes definiciones y resultados son clasicos, cuyas demostra-ciones se encuentran en varios libros, por lo cual, no incluiremos las mismas. Solamente lasmencionamos, para hacer una analogıa con los mollifiers en variedades Riemannianas.

Definicion. Sea η ∈ C∞(Rn) definida por,

η(x) :=

Ce

1|x|2−1 si |x| < 1

0 si |x| ≥ 1

donde la constante C se elige de modo que,∫Rnηdx = 1.

-1 1

Figura 3.3: Ejemplificacion de una funcion η ∈ C∞(R).

Para todo ε > 0, sea

ηε(x) =1

εnη(xε

).

Se suele llamar a η el mollifier estandar. Las funciones ηε cumplen:

1. ηε ∈ C∞,

2.∫Rn ηε(x)dx = 1,

3. spt(ηε) ⊂ B(0, ε).

Esta funcion se utiliza para suavizar a una funcion f dada.

Definicion. Si f : U → R es localmente integrable, definimos su Mollificacion o aproxima-cion de la identidad por

f ε(x) := ηε ∗ f(x),

donde x ∈ Uε = x ∈ U : dist(x, ∂U) > ε.

Departamento de Matematica - UNLP Hoja 49 de 105

Page 54: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Teorema 3.4.4. (Propiedades de los Mollifiers)

1. f ε ∈ C∞(Uε).

2. f ε → f cuando ε→ 0 ctp.

3. Si f ∈ C(U), entonces f ε → f uniformemente en subconjuntos compactos de U .

4. Si 1 ≤ p <∞ y f ∈ Lploc, entonces f ε → f en Lploc.

Ahora si pasamos al contexto de variedades Riemannianas. Sea ϕ : R→ [0, 1] una funcionC∞ tal que

ϕ(r) = 1 para r ≤ ε;

ϕ(r) = 0 para r ≥ 1− ε;ϕ′(r) ≤ 0.

1

ε 1− ε 1

Figura 3.4: Ejemplificacion de dicha funcion.

Sea (M, δ) una variedad Riemanniana e identificamos la bola centrada en m ∈ M , deradio ρ, Bρ(m) ⊂ M vıa exp−1

m con la bola Euclıdea Dρ(0) ⊂ TmM . Por cuestiones deconveniencia se usa, en la definicion de mollifier en variedades, el volumen Euclıdeo dmx(porque las cancelaciones son mas obvias que usando el volumen Riemanniano no linealBρ(m)).

Notacion basica: Sean M, M dos variedades Riemannianas tales que un centro de masapuede ser definido en las bolas Bρ ⊂ M . Supongamos tambien que f : M → M es una funcion

medible y existe un numero ρ0 tal que, para toda bola Bρ0 ⊂ M , existe una bola Bρ ⊂ Mcon f(Bρ0) ⊂ Bρ.

Definicion. Definimos la funcion Φ : M ×M → R por

Φρ(m, y) = ϕ

(1

ρd(m, y)

)(∫Bρ(m)

ϕ

(1

ρd(m, y)

)dmx

)−1

.

Es necesario definir el siguiente espacio de probabilidad para suavizar a f en m:

Aρ,m = (M,Φρ(m, y)dmx).

Como fuera de la bola Bρ(m) la medida Φρ(m, y)dmx es cero, podemos considerar la funcion

f : M → M como una funcion medible

fρ,m = f : Aρ,m → Bρ.

Departamento de Matematica - UNLP Hoja 50 de 105

Page 55: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Hasta ahora las definiciones son obvias, los problemas son causados por el espacio de llegadaM el cual no es lineal. El centro de masa hace posible la siguiente generalizacion de losmollifier estandar:

Definicion. Dado ρ > 0, sea fρ : M → M , definida por

fρ(m) = argminm∈Bρ

1

2

∫Aρ,m

δ(m, f(a))2da.

Notar que el mınimo siempre existe y es unico por las propiedades de convexidad de lafuncion, siempre que trabajemos dentro de bolas convexas. Dentro de tales bolas, es necesarioelegir un subconjunto compacto y una funcion de distribucion de masa total 1. Razon porla cual, es necesario definir el espacio de probabilidad Aρ,m. Este espacio de probabilidadnos otorga la funcion de distribucion da de masa total 1 en Aρ,m, que nos garantiza laexistencia y unicidad del minimizador (Ver apendice seccion 6.4). Por otro lado los mollifiersson funciones suaves y deben aproximar a nuestra funcion original. De esto trata el siguienteresultado.

Teorema 3.4.5.

1. La funcion fρ : M → M es diferenciable, y si M y M son espacios C∞ entonces fρ esuna funcion C∞.

2. Si f es continua en m entonces

lımρ→0

fρ(m) = f(m).

3. Si f es C1 entonces

lımρ→0

dfρ = df.

Por ultimo concluimos esta subseccion con un resultado de continuidad. Una preguntanatural es: dadas dos funciones, si estas se aproximan entre sı ¿Tambien lo hacen sus centrosde masa? Un resultado de este estilo nos serıa de utilidad y tambien fue anticipado porKarcher en su trabajo.

Proposicion 3.4.6. Si f1, f2 : A→ Bρ son distribuciones de masa y δ ≤ K ≤ ∆ son cotasde la curvatura, entonces

d(Cf1 , Cf2) ≤ (1 + const.(δ,∆)(2ρ)2)

∫A

d(f1(a), f2(a))da.

Demostracion. Ver [31], Corolario 1.6, pag. 512.

Observar que ya dimos una demostracion mas sencilla y general (para espacio de Hada-mard) de esta proposicion en la parte anterior (ver Lema 3.4.2).

Departamento de Matematica - UNLP Hoja 51 de 105

Page 56: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Mollifiers en espacios de Hadamard

Para el caso general podemos usar la siguiente idea: Dado η > 0, sea Uη un entorno dela identidad de G tal que m(Uη) < η, cuyo diametro es menor que η. Fijemos y ∈ M , ydefinimos

Aη(g0) = argminz∈M

∫Uη

[δ2(z, A(g + g0))− δ2(y, A(g + g0))] dm(g). (3.4.4)

Equivalentemente, Aη(g0) es el baricentro del pushforward por A de la medida de Haarrestringida a g0 + Uη.

1

ζζ + Uη

Figura 3.5: Ejemplificacion de los mollifiers en espacios de Hadamard. Con naranja repre-sentamos un entorno de la identidad el cual trasladamos, y luego minimizamos la funcion enla nueva region naranja.

Esta definicion usa la idea de mollifier, reemplazando la media aritmetica por los prome-dios inducidos por los baricentros. Vamos a probar que, como en el caso usual de mollifiers,estas funciones continuas nos dan una buena aproximacion a funciones de L1 (Teorema3.4.10). Con este objetivo, primero probamos el siguiente lema.

Lema 3.4.7. Sea A ∈ Lp(G,M) donde 1 ≤ p <∞. Definimos la funcion ϕ : G→ [0,+∞)por

ϕ(h) =

∫G

δp(A(g), A(g + h)

)dm(g).

Luego, esta funcion es continua.

Demostracion. Fijado z0 ∈ M , definamos la medida ν en los conjuntos Borelianos de Gpor

ν(B) :=

∫B

δp(A(g), z0)dm(g).

Por definicion, ν es absolutamente continua con respecto a la medida de Haar m. En conse-cuencia, dado ε > 0, existe η > 0, tal que, siempre que el conjunto Boreliano B satisfaga∫

B

dm(g) < η,

se tiene que

ν(B) =

∫B

δp(A(g), z0)dm(g) <ε

2p+2, (3.4.5)

Departamento de Matematica - UNLP Hoja 52 de 105

Page 57: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Por el Teorema de Lusin ([26, Teorema 7.5.2] o Teorema 6.3.1 del apendice), existe un conjun-to compacto Cη ⊂ G tal que m(Cη) ≥ 1−η/2, y la restriccion de A a Cη es (uniformemente)continua.

Como m es una medida de Haar, es suficiente probar la continuidad de ϕ en la identidad.Con este objetivo, tomemos un entorno de la identidad U tal que, siempre que g1, g2 ∈ Cηsatisfaga g1 − g2 ∈ U , se tiene que

δp(A(g1), A(g2)) ≤ ε

2.

Dado h ∈ U , definimos Ω := Cη ∩ (Cη + h), y Ωc := G \ Ω. Entonces∫G

δp(A(g), A(g + h))dm(g) =

∫Ω

+

∫Ωcδp(A(g), A(g + h))dm(g)

≤ ε

2+

∫Ωcδp(A(g), A(g + h))dm(g)

≤ ε

2+

∫Ωc

[δ(A(g), z0) + δ(A(g + h), z0)]p dm(ω)

2+ 2p+1

∫Ωcδp(A(g), z0)dm(g),

donde en la ultima igualdad usamos que m es shift invariante (invariante a desplazamientos).Como |Ωc| < δ obtenemos que∫

G

δp(A(g), A(g + h))dm(g) ≤ ε

2+ε

2= ε.

Corolario 3.4.8. Para todo η > 0, las funciones Aη son continuas.

Demostracion. Por el Lema 3.4.2

δ(Aη(h1), Aη(h2)) ≤ 1

m(Uη)

∫Uη

δ(A(g + h1), A(g + h2)) dm(g)

≤ 1

m(Uη)

∫G

δ(A(g + h1), A(g + h2)) dm(g)

=1

m(Uη)

∫G

δ[A(g), A(g + (h2 − h1)) ] dm(g).

Luego, la continuidad de Aη es una consecuencia de la continuidad de ϕ en la identidad.

La funcion A 7→ Aε tiene la siguiente propiedad de continuidad que nos sera util.

Lema 3.4.9. Sea A,B ∈ L1(G,M), y η > 0. Para todo ε > 0, existe ρ > 0 tal que si∫G

δ(A(g), B(g))dm(g) ≤ ρ,

entonces las funciones continuas correspondientes Aη y Bη satisfacen que

maxg∈G

δ(Aη(g), Bη(g)) ≤ ε.

Departamento de Matematica - UNLP Hoja 53 de 105

Page 58: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Demostracion. Dado ε > 0, tomemos ρ = m(Uη)ε. Entonces, por el Lema 3.4.2

δ(Aη(g), Bη(g)) ≤ 1

|Uη|

∫Uη

δ(A(g + h), B(g + h))dm(h)

≤ 1

|Uη|

∫G

δ(A(h), B(h))dm(h) ≤ ε,

para todo g ∈ G.

Llegamos al resultado principal de la seccion.

Proposicion 3.4.10. Dada una funcion continua A ∈ L1(G,M), si Aη son las funcionescontinuas definidas por (3.4.4) entonces

lımη→0+

∫G

δ(A(g), Aη(g)) dm(g) = 0.

Demostracion. Primero, supongamos que A ∈ L2(G,M). En este caso, por la desigualdadde la varianza, se tiene que

δ2(A(g), Aη(g)) ≤ 1

|Uη|

∫Uη

δ2(A(g), A(g + h))dm(h).

Entonces, usando el Teorema de Fubini∫G

δ2(A(g), Aη(g)) dm(g) ≤ 1

|Uη|

∫Uη

∫G

δ2(A(g), A(g + h)) dm(g) dm(h)

=1

|Uη|

∫Uη

ϕ(h) dm(h).

Por el Lema 3.4.7, la funcion ϕ es continua. En consecuencia, si e denota la identidad de G,

lımη→0+

1

|Uη|

∫Uη

ϕ(h) dm(h) = ϕ(e) = 0.

Esto prueba el resultado para las funciones en L2(G,M) ya que por la desigualdad de Jensentenemos ∫

G

δ(A(g), Aη(g)) dm(g) ≤(∫

G

δ2(A(g), Aη(g)) dm(g)

)1/2

.

Ahora, consideremos una A ∈ L1(G,M). Fijado z0 ∈ M , para cada numero natural N ,definimos la truncacion

A(N)(g) :=

A(g) if δ(A(g), z0) < N

z0 if δ(A(g), z0) ≥ N.

Para todo N tenemos A(N) ∈ L1(G,M)∩L∞(G,M), y luego, tambien pertenece a L2(G,M).Por otro lado, como la funcion definida en G por g 7→ δ(A(g), z0) es integrable, tenemos∫

G

δ(A(g), A(N)(g)) dm(g) =

∫g: δ(A(g),z0)≥N

δ(A(g), z0) dm(g) −−−→N→∞

0. (3.4.6)

Departamento de Matematica - UNLP Hoja 54 de 105

Page 59: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Entonces, si Aη y A(N)η son las funciones continuas asociadas a A y A(N) respectivamente,∫

G

δ(A(g), Aη(g)) dm(g) ≤∫G

δ(A(g), A(N)(g)) dm(g)

+

∫G

δ(A(N)(g), A(N)η (g)) dm(g)

+

∫G

δ(A(N)η (g), Aη(g)) dm(g).

Notar que cada termino del lado derecho tiende a cero: el primero por (3.4.6), el segundopor el caso L2 hecho en la primer parte de la demostracion y el ultimo por el Lema 3.4.9.

3.4.3 Demostracion del caso L1

Ahora si podemos dar una demostracion del Teorema ergodico para funciones en L1.

Prueba del Teorema 3.4.1

Sea ε > 0. Para todo k ∈ N sea Ak una funcion continua tal que∫G

δ(A(g), Ak(g)) dm(g) ≤ 1

k.

Por el Lema 3.4.3, podemos tomar un conjunto de medida nula N ⊆ G, tal que si tomamosg ∈ G \N y k ∈ N, existe n0, que puede depender de g y k, tal que

δ(Sn(aτ (g)), Sn(aτ(k)(g))

)≤ ε

4+

∫G

δ(A(g), Ak(g))dm(g),

siempre que n ≥ n0. En esta expresion, aτ(k) es la sucesion definida en terminos de Ak y τ

como en (3.3.1). Sea g ∈ G \N fijo. Tomando k tal que 1/k < ε/4, tenemos que

δ(Sn(aτ (g)), Sn(aτ(k)(g))

)≤ ε

2,

para todo n ≥ n0. Por el Lema 3.4.2, se tiene que δ(βA, βAk) ≤ ε

4donde

βA = argminz∈M

∫G

[δ2(A(g), z)− δ2(A(g), y)] dm(g),

βAk= argmin

z∈M

∫G

[δ2(Ak(g), z)− δ2(Ak(g), y)] dm(g).

Finalmente, por el Teorema 3.3.1, existe n1 ≥ 1 tal que, para todo n ≥ n1,

δ(Sn(aτ(k)(g), βAk) ≤ ε

4.

Combinando estas desigualdades tenemos

δ(Sn(aτ (g)), βA

)≤ δ(Sn(aτ (g)), Sn(aτ(k)(g))

)+ δ(Sn(aτ(k)(g)), βAk

)+ δ(βAk

, βA) ≤ ε,

lo que completa la prueba.

Departamento de Matematica - UNLP Hoja 55 de 105

Page 60: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

3.5 Independencia del punto de comienzo

Como mencionamos en la motivacion, Holbrook prueba que la convergencia de la mediainductiva es independiente del punto de comienzo. Aquı vamos a presentar una prueba deeste fenomeno, que podrıa no ser mas que una simple observacion pues, este resultado seextiende a espacios de Hadamard, como consecuencia directa de la contractividad de la mediainductiva (Corolario 3.2.3). Sin embargo vamos a demostrar la independencia del punto decomienzo a falta de una referencia bibliografica.

Con el fin de no introducir notacion nueva notar que:

1. Dado x ∈M , entonces x#tx = x para todo t ∈ [0, 1].

2. Utilizando la notacion de las secciones anteriores, entendemos que la convergencia esindependiente del punto de comienzo si para todo x ∈M ,

x# 1maτm(g)# 1

m+1aτm+1(g)# 1

m+2aτm+2(g)# 1

m+3aτm+3(g) . . . −−−→

m→∞βA.

3. Si queremos comparar la sucesion del ıtem anterior con la que conocıamos, podemoscompletarla utilizando el ıtem uno, es decir, podemos comparar

x# 12x# 1

3. . . x︸ ︷︷ ︸

m - 2 veces

# 1maτm(g)# 1

m+1aτm+1(g)# 1

m+2aτm+2(g)# 1

m+3aτm+3(g),

con

aτ1(g)# 12aτ2(g)# 1

3aτ3(g)# 1

4. . .# 1

maτm(g)# 1

m+1aτm+1(g)# 1

m+2aτm+2(g)# 1

m+3aτm+3(g).

Cuya distancia esta acotado por,

1

n

m∑i=1

δ(x, aτi (g)) −−−→n→∞

0,

como consecuencia del Corolario 3.2.3.

3.6 Otra forma de convergencia

En las secciones anteriores trabajamos en la demostracion del siguiente teorema.

Teorema. Dada A ∈ L1(G,M), para casi todo g ∈ G

lımn→∞

Sn(aτ (g)) = βA.

Observar que este teorema nos da la convergencia en casi todo punto para funcionesA ∈ L1(G,M). El siguiente teorema nos dice que, ademas de la convergencia en casi todopunto, tenemos un tipo de convergencia en Lp para funciones en Lp(G,M). Mas precisamente,terminaremos este capıtulo demostrando el siguiente resultado.

Departamento de Matematica - UNLP Hoja 56 de 105

Page 61: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Teorema 3.6.1. Sean 1 ≤ p <∞ y A ∈ Lp(G,M). Entonces

lımn→∞

∫G

δp(Sn(aτ (g)), βA

)dm(g) = 0. (3.6.1)

Demostracion. Definamos la siguiente medida en los conjuntos Borelianos de G:

ν(B) :=

∫B

δp(A(g), βA)dm(g).

Por definicion, ν es absolutamente continua con respecto a la medida de Haar m. En conse-cuencia, dado ε > 0, existe η > 0, tal que, siempre que el conjunto de Borel B satisfaga∫

B

dm(g) < η,

se tiene que

ν(B) =

∫B

δp(A(g), βA)dm(g) <ε

2. (3.6.2)

Por el Teorema de Egoroff, como

δp(Sn(aτ (g)), βA) −−−→n→∞

0

en casi todo punto en un espacio de medida finita, entonces existe un conjunto Cη ⊂ G conm(Cη) < η, tal que

δp(Sn(aτ (g)), βA) −−−→n→∞

0 (3.6.3)

uniformemente en G \ Cη.Por otro lado,

δ(Sn(aτ (g)), βA)

)≤ 1

n

n−1∑k=0

δ(aτk(g), βA

)=

1

n

n−1∑k=0

δ(A(τ k(g)), βA

),

Luego, por la desigualdad de Jensen,

δp(Sn(aτ (g)), βA

)≤ 1

n

n−1∑k=0

δp(A(τ k(g)), βA

).

Tomando integral sobre Cη en la desigualdad anterior obtenemos∫G

δp(Sn(aτ (g)), βA

)dm(g) =

∫G\Cη

δp(Sn(aτ (g)), βA

)dm(g) +

∫Cη

δp(Sn(aτ (g)), βA

)dm(g)

≤∫G\Cη

δp(Sn(aτ (g)), βA

)dm(g) +

∫Cη

1

n

n−1∑k=0

δp(A(τ k(g)), βA

)dm(g)

=

∫G\Cη

δp(Sn(aτ (g)), βA

)dm(g) +

n−1∑k=0

1

n

∫Cη

δp(A(τ k(g)), βA

)dm(g).

Ahora,

Departamento de Matematica - UNLP Hoja 57 de 105

Page 62: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

1. Para el ε dado en un comienzo, existe n0 ∈ N, tal que para todo n ≥ n0,∫G\Cη

δp(Sn(aτ (g)), βA

)dm(g) <

ε

2,

como consecuencia de (3.6.3).2. Como ∫

dm(g) < η,

entonces por (3.6.2)

ν(Cη) =

∫Cη

δp(A(g), βA)dm(g) <ε

2.

Luego, para todo n ∈ N,

n−1∑k=0

1

n

∫Cη

δp(A(τ k(g)), βA

)dm(g) <

ε

2.

Finalmente, combinando estas dos cotas, dado ε, existe n0 ∈ N, tal que para todo n ≥ n0,∫G

δp(Sn(aτ (g)), βA

)dm(g) < ε,

lo que termina la prueba.

Departamento de Matematica - UNLP Hoja 58 de 105

Page 63: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

4 Estructura de las curvas minimalesen H(n),P(n) y U(n) con respecto ala metrica de Finsler bi-invariante in-ducida por la norma traza

4.1 Motivacion

El cono convexo abierto de matrices (estrictamente) positivas P(n) del espacio H(n) dematrices Hermitianas, tiene una rica estructura geometrica, heredada de las normas Gaugesimetricas (equivalentemente, normas unitariamente invariantes - ver capıtulo 6 apendice).Para una norma Gauge simetrica Φ en Rn, la norma en H(n) definida por

‖A‖Φ := Φ(λ1(A), λ2(A), . . . , λn(A)),

donde λj(A) son los autovalores (ordenados decrecientemente) de A ∈ H(n), induce unametrica de Finsler Gl(n)-invariante en P(n) y la distancia correspondiente entre dos matricesdefinidas positivas A y B es

dΦ(A,B) =∥∥log(A−1/2BA−1/2)

∥∥Φ.

Una de las propiedades comunes de esta geometrıa es que la curva t 7→ A#tB actua comouna geodesica minimal de A a B para dΦ, donde

A#tB = A1/2(A−1/2BA−1/2)tA1/2.

Una consecuencia inmediata es que, A#1/2B, es el punto medio entre A y B para dΦ. Verpor ejemplo [11], [12] para mas detalles.

La norma Frobenius ‖·‖2 da lugar a la estructura Riemanniana

〈X, Y 〉A = Tr(A−1XA−1Y ),

donde A ∈ P(n), X, Y ∈ TA(P(n)) = H(n). En otras palabras, P(n) se convierte en unavariedad de Cartan-Hadamard, simplemente conexa, con curvatura seccional no positiva (ver[11], [12], [32]). En este caso, hay una unica geodesica metrica minimal entre A y B, quecoincide con la media geometrica A#tB.

En general, el punto medio y la geodesica minimal entre dos puntos de P(n) no es unicabajo dΦ. Las normas Schatten p tiene esta propiedad de unicidad para 1 < p <∞, pero no

Page 64: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

para p = 1 o p =∞. Por ejemplo, hay infinitos (geodesicas mınimales) puntos medios entreun cierto par de matrices definidas positivas con respecto a la metrica de Finsler heredadapor la norma espectral ‖·‖sp, que coincide con la metrica de Thompson,

d∞(A,B) =∥∥log(A−1/2BA−1/2)

∥∥∞ = max

log λ1(A−1/2BA−1/2), log λ1(A−1/2B−1A−1/2)

.

Recordamos la construccion de Nussbaum para curvas minimales con respecto a la metricade Thompson.

Teorema 4.1.1 ([49]). Sean A,B ∈ P(n) y sea λk = λk(A−1B), k = 1, . . . , n.

i) Si λ−1n ≤ λ1, entonces para todo α ∈ [λ−1

1 , λn],

fα(t) =

λt1−αtλ1−α B +

λ1αt−αλt1λ1−α A λ1 6= λn

λt1A λ1 = λn

es una curva minimal de A a B con respecto a la metrica de Thompson.

ii) Si λ1 ≤ λ−1n , entonces para todo α ∈ [λ1, λ

−1n ],

fα(t) =

αt−λtnα−λn B + αλtn−λnαt

α−λn A λ1 6= λn

λt1A λ1 = λn

es una curva minimal de A a B con respecto a la metrica de Thompson.

Este problema tienen sus analogos cuando consideramos p = 1. En este capıtulo vamos aestudiar el caso p = 1. Es decir, nos preguntamos: Dadas A,B ∈ P(n) ¿Podemos caracterizarlas curvas minimales que los unen con respecto a la metrica heredada por la norma traza?Vamos a responder esta pregunta a lo largo del capıtulo en el Corolario 4.2.10 y el Teorema4.2.11.

4.2 Estructura de las curvas minimales parala norma traza

El objetivo de esta seccion es estudiar la estructura de las curvas minimales que unen dosmatrices medidas con la norma traza. Vamos a dar condiciones necesarias y suficientes paraque esto suceda. Los espacios que nos interesan son: el espacio de matrices positivas P(n),estudiado por Lim [40] para la norma espectral y el espacio de matrices unitarias U(n).

Para estudiar propiedades de las curvas minimales en estos espacios, nos enfocamos en elestudio del espacio de matrices Hermitianas H(n), porque toda matriz positiva P ∈ P(n)se puede escribir de la forma P = eA, donde A ∈ H(n) y toda matriz unitaria U ∈ U(n) sepuede escribir de la forma U = eiB donde B ∈ H(n).

Departamento de Matematica - UNLP Hoja 60 de 105

Page 65: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

4.2.1 Estudio de curvas minimales en el espacio de ma-

trices Hermitianas dotada de la norma traza

Convencion: En esta subseccion vamos a suponer lo siguiente:

1. Las curvas son suaves, es decir, curvas C1 a trozos.

2. Sea H(n) el conjunto de matrices Hermitianas n× n.

Dada una curva suave a trozos α : [a, b]→ H(n), podemos definir la longitud de curvadada por

L(α) =

∫ b

a

‖α(t)‖1 dt.

La norma que consideramos ‖·‖1 es la norma traza de estas matrices.

La distancia rectificable entre A,B ∈ H(n) esta dada por

d1(A,B) = ınf L(α) donde α : [a, b]→ H(n) une A con B en H(n) .

Una curva es minimal si su longitud es igual a la distancia de los puntos que une. Esdecir,

L(α) = d1(A,B).

En esta seccion vamos a dar una caracterizacion de las curvas minimales medidas conla norma traza en el espacio de matrices Hermitianas. Con este objetivo, nos va a ser utilrecordar un resultado que seguramente le es conocido: ¿Cuales son las curvas minimales enRn medidas con la norma traza?

Proposicion 4.2.1. Sea γ : [0, 1]→ Rn una curva minimal que une el vector O = (0, . . . , 0)con V = (v1, . . . , vn) en Rn. Son equivalentes:

1. La curva γ : [0, 1]→ Rn es minimal.

2. Las curvas γj : [0, 1]→ R que unen 0 con vj son minimales.

3. Las curvas γj : [0, 1]→ R que unen 0 con vj son tales que γj(t) > 0, si vj es estricta-mente positivo, o γj(t) < 0, si vj es estrictamente negativo, para todo t ∈ [0, 1]. Si lacurva γj : [0, 1]→ R une 0 con 0 debe ser la curva identicamente nula.

Ahora volvemos al espacio de matrices Hermitianas para acercarnos a nuestro resultado.El siguiente resultado tambien le debe ser conocido y nos dice que el segmento que unedos matrices Hermitianas tiene longitud menor o igual que la longitud de cualquier curvapoligonal que los une. En particular,

d1(A,B) = ‖A−B‖1 .

Vamos a dar una demostracion simple de este resultado.

Departamento de Matematica - UNLP Hoja 61 de 105

Page 66: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Lema 4.2.2. Los segmentos son curvas minimales en H(n) con respecto a la norma traza.

Demostracion. Como toda curva puede ser aproximada por poligonales, es suficiente probarque el segmento que une las matrices 0 con A ∈ H(n) es mas corto que toda curva poligonalque los une. Esto se deduce inductivamente y el argumento se puede ver en la siguienteimagen.

0 = α(t0)

A = α(tn)

α(t1)

α(t2)

α(t3)

α(tn−2)

α(tn−1)

αn(t)

γ(t)

γ1(t)

γ2(t)

Sea γ(t) = tA el segmento que une 0 con A y tomemos cualquier B ∈ H(n). Entonces lapoligonal

γ1(t) =

2tB t ∈ [ 0 , 1/2 ]

(2− 2t)B + (2t− 1)A t ∈ [ 1/2 , 1 ]

satisface que

L(γ1) =

∫ 1

0

‖γ1(t)‖1 dt = ‖B‖1 + ‖A−B‖1 ≥ ‖A‖1 = L(γ).

Ahora vamos a dar una condicion necesaria para que una curva en el espacio de matricesHermitianas sea minimal. Esta primera condicion nos dice que las entradas de la diagonal tie-nen que ser curvas minimales. Antes de demostrar este hecho, vamos a recordar la definiciondel operador Pinching.

Definicion. Sea P = (P1 , . . . , Pk) ∈ Mn(C)k un sistema de proyectores en Mn(C). Estosignifica que las entradas Pi son proyecciones mutuamente ortogonales tales que

k∑i=1

Pi = I.

El operador Pinching asociado, CP :Mn(C)→Mn(C), esta dado por

CP(A) =k∑j=1

Pj APj , para todo A ∈Mn(C) .

Una propiedad conocida de este operador es que, si |||·||| es una norma unitariamente inva-riante, entonces

|||C(A)||| ≤ |||A||| , para todo A ∈Mn(C) . (4.2.1)

En realidad, con respecto a la norma traza, vamos a probar un resultado mas general, quede algun modo nos dice que, el operador Pinching preserva la minimalidad de curvas.

Departamento de Matematica - UNLP Hoja 62 de 105

Page 67: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Observacion. Como la norma ‖·‖1 es unitariamente invariante, sin perdida de generalidady en busca de simplicidad, podemos suponer que una de las matrices es la nula y la otramatriz Hermitiana es diagonal. En efecto, como

d1(A,B) = d1(0, B − A),

y B − A ∈ H(n), existe una matriz unitaria U que la diagonaliza. N

Lema 4.2.3. Sea X : [0; 1]→ H(n) una curva minimal. Supongamos ademas que X(0) = 0.Sea D = X(1) ∈ H(n) y P un sistema de proyectores, todos ellos tales que conmutan conD. Entonces la curva “Pinchada” CP(X(t)) es tambien una curva minimal que une 0 conD ∈ H(n).

Demostracion. Es una consecuencia inmediata de (4.2.1) y el hecho que

d

dtCP(X(t)) = CP(X(t))

(4.2.1)=⇒

∥∥∥CP(X(t))∥∥∥

1≤∥∥∥X(t)

∥∥∥1

para t ∈ [0 , 1] . (4.2.2)

Luego L(CP(X(t)) ≤ L((X(t)) = ‖D‖1 . Por otro lado, CP(X(1)) = CP(D) = D por lahipotesis de conmutatividad.

Un caso particular es el siguiente: sea P0 un sistema de proyectores asociados a la basecanonica de Cn, tal que, la imagen de CP0 es el conjunto de matrices diagonales usual.

Corolario 4.2.4. Sea X : [0; 1]→ H(n) una curva como en el Lema 4.2.3. Supongamos queD = X(1) = diag ( d1 , . . . , dn ) es una matriz diagonal. Entonces para todo t ∈ [0 , 1],

CP0(X(t) ) = diag (x1(t)d1 , . . . , xn(t)dn ) ,

donde xi : [0, 1] → R son tales que xi(0) = 0, xi(1) = 1 y xi(t) > 0 si di es positivo, oxi(t) < 0 si di es negativo. En otras palabras, las curvas en la diagonal de la matriz, sonminimales tambien.

Ya casi estamos listos para caracterizar las curvas minimales en el espacio de matricesHermitianas, pero antes, vamos a probar como se caracterizan en el caso de matrices 2× 2.Las condiciones que obtuvimos son las generalizaciones naturales de las condiciones que setienen en la Proposicion 4.2.1 (inciso 3). Este resultado va a ser importante para generalizarloa matrices n× n.

Lema 4.2.5. Sea X : [0; 1]→ H(2) una curva minimal que une 0 con D ∈ H(2),

D =

(α 00 β

).

1. Si α, β ≥ 0, entonces X(t) ≥ 0.

2. Si α, β < 0, entonces X(t) ≤ 0.

3. Si α > 0, β < 0, entonces X(t) es una matriz diagonal.

Departamento de Matematica - UNLP Hoja 63 de 105

Page 68: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Demostracion.

1. Observar que, por el Lema 4.2.3, la curva diagonal

C(X(t)) =

(x11(t) 0

0 x22(t)

)es minimal. Usando la ecuacion (4.2.2), obtenemos que

tr |C(X(t))| = tr |X(t)|, (4.2.3)

ya que la curva es suave y L(C(X(t))) = L(X(t)). Por otro lado, por el Corolario 4.2.4sabemos que x11(t) ≥ 0 y x22(t) ≥ 0 =⇒ C(X(t)) ≥ 0. Si combinamos

tr |C(X(t))| = tr C(X(t)) = tr X(t) ≤ tr |X(t)|, (4.2.4)

con (4.2.3), tenemos tr X(t) = tr |X(t)|. Lo que implica que X(t) =∣∣∣X(t)

∣∣∣ ≥ 0.

2. Se deduce del caso anterior tomando Y (t) = −X(t).

3. Sea

X(t) =

(a(t) b(t)

b(t) c(t)

),

y sean λ1(t), λ2(t) los autovalores de X(t) ordenamos de manera decreciente. Como

(a(t), c(t)) ≺ (λ1(t), λ2(t)),

y a(t) ≥ 0, c(t) ≤ 0 (por el Corolario 4.2.4), entonces

λ2(t) ≤ c(t) ≤ 0 ≤ a(t) ≤ λ1(t) y |c(t)|+ |a(t)| ≤ |λ1(t)|+ |λ2(t)| (4.2.5)

para todo t ∈ [0 , 1]. Por otro lado, usando el Lema 4.2.3, tenemos que∫ 1

0

|c(t)|+ |a(t)| dt =

∫ 1

0

tr(|C(X(t))|)dt =

∫ 1

0

tr(|X(t)|)dt =

=

∫ 1

0

∥∥∥X(t)∥∥∥

1dt =

∫ 1

0

|λ1(t)|+ |λ2(t)| dt.

Como la curva es suave, por la ecuacion (4.2.5),

|c(t)|+ |a(t)| = |λ1(t)|+ |λ2(t)| =⇒ a(t) = λ1(t), c(t) = λ2(t).

Aplicando la norma Frobenius a la matriz X(t), concluimos que b(t) = 0 para todot ∈ [0 , 1]. Como b(1) = 0, concluimos que b(t) = 0 para todo t ∈ [0 , 1].

La implicacion recıproca, es decir, si vale alguna de las condiciones entonces la curva esminimal, se demuestra de la siguiente manera:

1. Supongamos que α, β ≥ 0 y X(t) ≥ 0. Luego tr X(t) = tr |X(t)|, por lo cual

L(X(t)) =

∫ 1

0

tr |X(t)| dt =

∫ 1

0

tr X(t) dt =

∫ 1

0

x11(t) + x22(t) dt

= x11(1)− x11(0) + x22(1)− x22(0) = α− 0 + β − 0 = ‖D‖1 .

Departamento de Matematica - UNLP Hoja 64 de 105

Page 69: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

2. Supongamos que α, β < 0 y X(t) ≤ 0. Nuevamente, se deduce del caso anterior to-mando Y (t) = −X(t).

3. Supongamos que α > 0, β < 0 y que X(t) es una matriz diagonal. Luego

L(X(t)) =

∫ 1

0

tr |X(t)| dt =

∫ 1

0

|x11(t)|+ |x22(t)| dt Cor 4,2,4=

∫ 1

0

x11(t)− x22(t) dt

= (x11(1)− x11(0))− (x22(1)− x22(0)) = (α− 0)− (β − 0) = |α|+ |β| = ‖D‖1 .

Observacion. La igualdadtr X(t) = tr |X(t)|,

es una de las claves en la caracterizacion, pues juega un papel fundamental, en ambas im-plicaciones de los dos primeros items. N

Todas las curvas minimales tienen que tener la siguiente estructura:

Teorema 4.2.6. Sea X : [0; 1] → H(n) una curva minimal. Supongamos tambien queX(0) = 0, y que D = X(1) = diag ( d1 , . . . , dn ), es una matriz diagonal tal que las entradasdj estan ordenadas de manera decreciente. Entonces la curva minimal que une 0 con D tienela siguiente estructura:

X(t) =

P (t) 0 00 0 00 0 N(t)

S1

S2

S3

,

donde

S1 = span ej : dj > 0 , S2 = span ej : dj = 0 y S3 = span ej : dj < 0 .

Mas aun, P : [0, 1] → H(S1) es una curva minimal que une 0S1 con DS1, tal que P (t) ≥ 0,para todo t ∈ [0, 1], y N : [0, 1]→ H(S3) es una curva minimal que une 0S3 con DS3, tal queN(t) ≤ 0, para todo t ∈ [0, 1].

Demostracion de un ejemplo 5×5: Antes de dar la demostracion de este teorema vamosdemostrar un ejemplo concreto, donde se van a ver las tecnicas ulitizadas, y facilitaran lalectura del caso general. Supongamos que X(t) es una curva minimal que une la matriz nulacon una matriz diagonal tal que d1 ≥ d2 > 0, d3 = 0, d5 ≤ d4 < 0. Entonces

x11(t) x12(t) x13(t) x14(t) x15(t)x21(t) x22(t) x23(t) x24(t) x25(t)x31(t) x32(t) x33(t) x34(t) x35(t)x41(t) x42(t) x43(t) x44(t) x45(t)x51(t) x52(t) x53(t) x54(t) x55(t)

Observar que podemos utilizar el operadorPinching para probar que los elementos de ladiagonal deben ser curvas minimales (Coro-lario 4.2.4).

x11(t) x12(t) x13(t) x14(t) x15(t)x21(t) x22(t) x23(t) x24(t) x25(t)x31(t) x32(t) 0 x34(t) x35(t)x41(t) x42(t) x43(t) x44(t) x45(t)x51(t) x52(t) x53(t) x54(t) x55(t)

Como la entrada x33(t) es una curva mini-mal que une 0 con 0 debe ser constantementeigual a 0. Este el primer paso, poner ceros enlas entradas que unen un bloque nulo con unbloque nulo.

Departamento de Matematica - UNLP Hoja 65 de 105

Page 70: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

x11(t) x12(t) x13(t) x14(t) x15(t)x21(t) x22(t) x23(t) x24(t) x25(t)x31(t) x32(t) 0 x34(t) x35(t)x41(t) x42(t) x43(t) x44(t) x45(t)x51(t) x52(t) x53(t) x54(t) x55(t)

Ahora queremos tener ceros en las entradasx13(t) y x31(t) para lo cual vamos a utilizarlas entradas marcadas en rojo.

x11(t) x12(t) x13(t) x14(t) x15(t)x21(t) x22(t) x23(t) x24(t) x25(t)x31(t) x32(t) 0 x34(t) x35(t)x41(t) x42(t) x43(t) x44(t) x45(t)x51(t) x52(t) x53(t) x54(t) x55(t)

Utilizando nuevamente el operador Pinching(el cual nos da una curva minimal por el Le-ma 4.2.3) en las entradas marcadas con color

x11(t) x13(t) 0 0 0x31(t) 0 0 0 0

0 0 x22(t) x24(t) x25(t)0 0 x42(t) x44(t) x45(t)0 0 x52(t) x54(t) x55(t)

y una matriz de permutacion, la cual no afec-ta la longitud de curva (por ser una matrizunitaria y la norma traza unitariamente in-variante), obtenemos una matriz con estaestructura.

x11(t) 0 0 0 00 0 0 0 00 0 x22(t) x24(t) x25(t)0 0 x42(t) x44(t) x45(t)0 0 x52(t) x54(t) x55(t)

Utilizando la caracterizacion para matrices2× 2 en el primer bloque, como la curva de-rivada de ese bloque debe ser mayor o igual acero para todo t, los elementos codiagonalesdeben ser nulos.

x11(t) x12(t) 0 x14(t) x15(t)x21(t) x22(t) x23(t) x24(t) x25(t)

0 x32(t) 0 x34(t) x35(t)x41(t) x42(t) x43(t) x44(t) x45(t)x51(t) x52(t) x53(t) x54(t) x55(t)

Como resultado obtenemos esta matriz.

x11(t) x12(t) 0 x14(t) x15(t)x21(t) x22(t) 0 x24(t) x25(t)

0 0 0 x34(t) x35(t)x41(t) x42(t) x43(t) x44(t) x45(t)x51(t) x52(t) x53(t) x54(t) x55(t)

Con un razonamiento analogo podemos po-ner ceros en las entradas x23(t) y x32(t). Deesta manera concluimos el segundo paso dela demostracion.

x11(t) x12(t) 0 x14(t) x15(t)x21(t) x22(t) 0 x24(t) x25(t)

0 0 0 0 x35(t)x41(t) x42(t) 0 x44(t) x45(t)x51(t) x52(t) x53(t) x54(t) x55(t)

Analogamente podemos poner ceros en lasentradas x34(t) y x43(t), esta vez utilizandola parte b) del Lema 2× 2.

x11(t) x12(t) 0 x14(t) x15(t)x21(t) x22(t) 0 x24(t) x25(t)

0 0 0 0 0x41(t) x42(t) 0 x44(t) x45(t)x51(t) x52(t) 0 x54(t) x55(t)

Como tambien podemos poner ceros en lasentradas x35(t) y x53(t). Finaliza de esta ma-nera el tercer paso de la demostracion.

Departamento de Matematica - UNLP Hoja 66 de 105

Page 71: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

x11(t) x12(t) 0 x14(t) 0x21(t) x22(t) 0 x24(t) x25(t)

0 0 0 0 0x41(t) x42(t) 0 x44(t) x45(t)

0 x52(t) 0 x54(t) x55(t)

Usando el operador Pinching y la parte c)del Lema 2 × 2 podemos poner ceros en lasentradas x15(t) y x51(t).

x11(t) x12(t) 0 0 0x21(t) x22(t) 0 x24(t) x25(t)

0 0 0 0 00 x42(t) 0 x44(t) x45(t)0 x52(t) 0 x54(t) x55(t)

Usando el mismo ıtem podemos poner cerosen las entradas x14(t) y x41(t).

x11(t) x12(t) 0 0 0x21(t) x22(t) 0 0 x25(t)

0 0 0 0 00 0 0 x44(t) x45(t)0 x52(t) 0 x54(t) x55(t)

Como en las entradas x24(t) y x42(t).

x11(t) x12(t) 0 0 0x21(t) x22(t) 0 0 0

0 0 0 0 00 0 0 x44(t) x45(t)0 0 0 x54(t) x55(t)

Por ultimo en las entradas x25(t) y x52(t).

x11(t) x12(t) 0 0 0x21(t) x22(t) 0 0 0

0 0 0 0 00 0 0 x44(t) x45(t)0 0 0 x54(t) x55(t)

Con este razonamiento podemos ver quela curva minimal tiene esta forma, dondeP (t) ≥ 0 y N(t) ≤ 0 como consecuencia delLema 2× 2.

Demostracion. (Teorema 4.2.6) Es facil probar que si X(t) tiene la forma dada en elenunciado, entonces

L(X(t)) =

∫ 1

0

∥∥∥X(t)∥∥∥

1dt =

∫ 1

0

∥∥∥N(t)∥∥∥

1dt+

∫ 1

0

∥∥∥P (t)∥∥∥

1dt =

n∑j=1

|dj| ,

por lo que es una curva minimal. Para probar la otra implicacion, la clave es el Lema 4.2.5.Sea

X(t) =

X11(t) X12(t) X13(t)X21(t) X22(t) X23(t)X31(t) X32(t) X33(t)

S1

S2

S3

,

entonces

1. Primer paso: X11(t) ≥ 0, X22(t) = 0 y X33(t) ≤ 0. En efecto, si

C(X(t)) =3∑j=1

PjX(t)Pj,

donde Pj es la proyeccion sobre Sj, por el Lema 4.2.3, el bloque X22(t) = 0 (porquetiene que ser una curva minimal que une 0 con 0). Una consecuencia del Lema 4.2.5(1)

Departamento de Matematica - UNLP Hoja 67 de 105

Page 72: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

es que X11(t) ≥ 0, porque es una curva minimal que une 0S1 con DS1 (las entradaspositivas). Es natural renombrarlo como X11(t) = P (t). Analogamente, X33(t) ≤ 0,por lo cual es natural renombrarlo como X33(t) = N(t).

2. Segundo paso: X12(t) = X21(t) = 0. Tomemos un operador Pinching apropiado dela siguiente manera: Elegimos una entrada diagonal del bloque matricial P (t), y lollamamos p11(t). Esta entrada esta asociada a un autovalor di > 0. Ahora elegimosuna entrada diagonal del bloque matricial 0. Esta entrada esta asociada a un autovalordj = 0. Sean Mi = span ei, Mj = span ej y P la proyeccion sobre Mi ⊕Mj.Esta proyeccion junto con la proyeccion ortogonal sobre (Mi ⊕Mj)

⊥, va a producirel operador Pinching deseado (el cual conmuta con D porque es una matriz diagonal).Usando una matriz de permutacion, podemos tener en el primer bloque, la siguientematriz:

Y (t) =

(p11(t) y12(t)y21(t) 0

)Mi

Mj,

la cual es minimal y une 0 con diag (di , 0) en H(2), por el Lema 4.2.3. Pero Y (t) ≥ 0por el Lema 4.2.5(1), entonces y12(t) = y21(t) = 0, y luego y12(t) = y21(t) = 0. Usandoeste truco podemos poner un cero en cada entrada de X12(t), y cada entrada de X21(t).

3. Tercer paso: X23(t) = X32(t) = 0. Se deduce del caso anterior como antes, tomar

Y (t) = −(

0 y23(t)y32(t) n22(t)

)Mi

Mj.

4. Cuarto paso: X13(t) = X31(t) = 0. Se deduce de una restriccion similar a la anterior,usando en este caso el Lema 4.2.5(3). Eligiendo ei ∈ S1, y ej ∈ S3, podemos obtenerun bloque matricial de la forma

Y (t) =

(p(t) y12(t)y21(t) n(t)

)Mi

Mj, con p(t) > 0 y n(t) < 0 ,

el cual es minimal por el Lema 4.2.3. En este caso y12(t) = y21(t) = 0, por el Lema4.2.5(3). De esta manera podemos poner en cero en cada entrada X13(t), y cada entradade X31(t).

Observacion. Usando las hipotesis y la notacion del Teorema 4.2.6, no solo P (t) ≥ 0 yN(t) ≤ 0, si no tambien P (t) ≥ 0 y N(t) ≤ 0: para t ∈ [0, 1] fijo, sea X(t) := Yt . Entonces

‖D‖1 − ‖Yt‖1 =n∑j=1

|dj| −∣∣∣λ↓j(Yt)∣∣∣ ≤ n∑

j=1

∣∣∣dj − λ↓j(Yt)∣∣∣ ≤≤

n∑j=1

|λj(D − Yt)| = ‖D − Yt‖1 ,

usando que (d1 , . . . , dn) = λ↓(D) y el Teorema de Lidskii, el cual asegura la formula demayorizacion,

λ↓(D)− λ↓(Yt) ≺ λ↓(D − Yt)

Departamento de Matematica - UNLP Hoja 68 de 105

Page 73: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

(como tambien la mayorizacion debil de sus modulos). Como la curva es minimal, la igualdadvale, y

|dj| −∣∣∣λ↓j(Yt)∣∣∣ =

∣∣∣dj − λ↓j(Yt)∣∣∣ ,es decir, λj(Yt) y dj, deben tener el mismo signo para todo t ∈ [0, 1]. N

Una consecuencia de esta caracterizacion, es la siguiente condicion necesaria, que diceque tambien las curvas que unen a los autovalores, tienen que ser minimales.

Corolario 4.2.7. Sea X : [0; 1] → H(n) una curva minimal que une 0 con A ∈ H(n).Entonces las curvas λj(X(t)), que unen 0 con λj(A), son curvas minimales (en R).

Demostracion. Por la conjugacion unitaria (que preserva todos los autovalores), podemossuponer que, A = D = diag ( d1 , . . . , dn ) es una matriz diagonal como en el Teorema 4.2.6.Como X(t) es una curva minimal, tiene que tener la estructura dada en el Teorema 4.2.6,por lo que los autovalores positivos corresponden a P (t), y los negativos a N(t). Supongamosque dim(S1) = k, y fijemos j ≤ k.

Notar que L(λj(P (t))) ≥ dj, porque la curva une 0 con dj, y L(t dj) = L(pjj(t)) = dj , lascuales son minimales por el Corolario 4.2.4. Por otro lado, como d(P (t)) ≺ λ(P (t)),

k∑j=1

pjj(t) =k∑j=1

λj(P (t)).

Si tomamos derivada y luego integramos, tenemos

k∑j=1

dj =k∑j=1

L(λj(P (t))),

es decir, L(λj(P (t))) = dj, por lo que son minimales. Con cambios menores, se puede probarque, L(λj(N(t))) = −dj si ej ∈ S3 .

4.2.2 El espacio de matrices positivas

Recordar que el espacio de matrices positivas es un espacio de curvatura no positiva porlo cual la funcion exponencial incrementa distancias en general. Es natural pensar que dadauna curva minimal en el espacio de matrices positivas, la curva que se obtiene en el espaciode matrices Hermitianas a partir de tomar logaritmo a dicha curva, es tambien minimal. Loque no es natural pensar es que si tomamos una curva minimal en el espacio de matricesHermitianas obtenemos una curva minimal en el espacio de matrices positivas. Esto ultimo lopodemos lograr gracias a la caracterizacion que tenemos para curvas minimales en el espaciode matrices Hermitianas.

Convencion: En esta subseccion vamos a suponer lo siguiente:

1. Las curvas son suaves, es decir, curvas C1 a trozos.

2. Sea P(n) el conjunto de matrices positivas n× n.

Departamento de Matematica - UNLP Hoja 69 de 105

Page 74: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Dada una curva suave α : [a, b]→ P(n), se define la longitud de curva dada por

L(α) =

∫ b

a

∥∥α−1/2(t)α(t)α−1/2(t)∥∥

1dt.

La norma que consideramos ‖·‖1 es la norma traza de estas matrices.

La distancia rectificable entre A,B ∈ P(n) esta dada por

d1(A,B) = ınf L(α) donde α : [a, b]→ P(n) une A con B en P(n) .

Una curva es minimal si su longitud es igual a la distancia de los puntos que une. Esdecir,

L(α) = d1(A,B).

La formula usada para definir la longitud de curva es natural en el siguiente sentido:Observar que el espacio P(n) es un espacio homogeneo, lo cual se deduce del hecho que,toda matriz P ∈ P(n), se puede descomponer como

P = GG∗ = (U |G|)(U |G|)∗ = U |G|2U∗ = |G∗|2 (4.2.6)

donde G ∈ Gl(n), |G|, |G∗| ∈ P(n), U ∈ SO(n). Las descomposiciones polares a izquierday derecha G = U |G| = |G∗|U son unicas. Las igualdades matriciales en (4.2.6) nos dan lageometrıa cociente del cono P(n). En otras palabras,

P(n) ∼= Gl(n)/SO(n), (4.2.7)

donde SO(n) = G ∈ P(n) : GG∗ = In, es decir, el espacio de matrices de rotacion n× n.En vista de (4.2.6), Gl(n) tiene una accion transitiva en P(n) vıa congruencias

P 7→ GPG∗,

donde G ∈ Gl(n). Toda matriz P ∈ P(n) es llevada a la matriz identidad eligiendo G =P−1/2 ∈ Gl(n). Analogamente, todo vector simetrico X tangente a la identidad I ∈ P(n),se puede llevar a un vector tangente A1/2XA1/2 ∈ TAP(n). En la identidad I, la metricaGl(n)-invariante en P(n) esta definida como el producto escalar usual

〈X1, X2〉I = Tr(X1X∗2 ) = Tr(X1X2).

La invariancia de las metricas entonces implica⟨A1/2X1A

1/2, A1/2X2A1/2⟩A

= Tr(X1X2),

la cual solo se puede satisfacer con la definicion

〈D1, D2〉A = Tr(D1A−1D2A

−1) (4.2.8)

para todo A ∈ P(n), D1, D2 ∈ H(n). Entonces existe una metrica Gl(n)-invariante en lavariedad

P(n) ∼= Gl(n)/SO(n).

Departamento de Matematica - UNLP Hoja 70 de 105

Page 75: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

La invariancia de la metrica (4.2.8) tiene implicaciones directas en la expresion de las geodesi-cas y la metrica Riemanniana. Luego, dado cualquier intervalo [a, b] ⊂ R y una curva suaveα : [a, b]→ P(n), la longitud de la curva esta definida como

L(α) =

∫ b

a

∥∥α−1/2(t)α(t)α−1/2(t)∥∥

1dt.

donde ‖·‖1 es la norma traza de estas matrices.

Recordemos la siguiente formula para la derivada (atribuida a varias personas Duhamel,Dyson, Feynman, y Schwingerof) de la funcion exponencial:

DeX(Y ) =

∫ 1

0

etXY e(1−t)X .

Tambien recordamos una demostracion simple de la generalizada infinitesimal exponentialmetric increasing property (IEMI). Para probar nuestro resultado vamos a usar el siguienteteorema.

Teorema 4.2.8. Para la norma traza tenemos∥∥A1/2XB1/2∥∥

1≤∥∥∥∥∫ 1

0

AtXB1−tdt

∥∥∥∥1

.

Idea de la demostracion. Supongamos que A = B y que A es diagonal con entradasλ1, . . . , λn en su diagonal. La matriz A1/2XA1/2 se obtiene de

∫ 1

0AtXB1−tdt de multiplicarla

entrada a entrada con la matriz Y cuyas entradas son

yij =λ

1/2i λ

1/2j (log(λi)− log(λj))

λi − λj.

Esta matriz es congruente con la matriz de entradas

zij =log(λi)− log(λj)

λi − λj.

Notar que esta matriz es positiva, por lo cual, obtenemos el resultado para A = B. Por otrolado, es suficiente probar este caso para obtener el caso general.

Proposicion 4.2.9. (IEMI generalizada) Para todo H y K en H(n) tenemos

‖e−H/2DeH(K)e−H/2‖1 ≥ ‖K‖1,

para toda norma unitariamente invariante.

Demostracion. Como K = eH/2(e−H/2Ke−H/2)eH/2,

‖K‖1 = ‖eH/2(e−H/2Ke−H/2)eH/2‖1 ≤∥∥∥∥∫ 1

0

etH(e−H/2Ke−H/2)e(1−t)Hdt

∥∥∥∥1

=

=

∥∥∥∥e−H/2(∫ 1

0

etHKe(1−t)Hdt

)e−H/2

∥∥∥∥1

= ‖e−H/2DeH(K)e−H/2‖1.

Departamento de Matematica - UNLP Hoja 71 de 105

Page 76: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Una consecuencia inmediata de la IEMI generalizada para el caso particular de la normatraza es:

Corolario 4.2.10. Sea α : [0; 1]→ P(n) una curva (suave) que une I con eX , donde X esuna matriz Hermitiana diagonal. En otras palabras, α(t) = eX(t) donde la curva X : [0, 1]→H(n) es tal que: X(0) = 0, X(1) = X y X es una matriz Hermitiana diagonal. Luego, siα(t) es una curva minimal entonces X(t) es una curva minimal.

Demostracion. Por regla de la cadena α(t) = DeX(t)(X(t)). Entonces la desigualdad

L(α) ≥∫ 1

0

∥∥∥X(t)∥∥∥

1dt,

se deduce de la definicion de

L(α) =

∫ 1

0

∥∥α−1/2(t)α(t)α−1/2(t)∥∥

1dt,

y la IEMI generalizada.

Lo que es interesante es que funciona de la otra manera tambien: si X(t) es una curvaminimal entonces α(t) es una curva minimal. La demostracion esta basada en la caracteri-zacion de la seccion previa pero primero necesitamos algunos resultados tecnicos.

Sea I ⊂ R un intervalo abierto y sea C1(I) el espacio de funciones reales continuamentediferenciables en I. Para todo A ∈ Hn(I) la derivada Df(A) en A es una funcion lineal deHn en sı mismo. Existe una formula para la derivada

Df(A)(B) = f [1](A) B, (4.2.9)

donde el producto es el de Hadamard (entrada a entrada) y f [1] es la funcion en I×I definidacomo

f [1](λ, µ) =f(λ)− f(µ)

λ− µ λ 6= µ

f [1](λ, λ) = f′(λ).

Esto se llama first divided difference de f . Para A ∈ Hn(I), f [1](A) es la matriz n× n

f [1](A) =f(λi)− f(λj)

λi − λj,

donde λ1, . . . , λn son los autovalores de A.

Teorema 4.2.11. Sea α : [0; 1]→ P(n) una curva (suave) que une I con eX , donde X es unamatriz Hermitiana diagonal. En otras palabras, α(t) = eX(t) donde la curva X : [0, 1]→ H(n)es tal que: X(0) = 0, X(1) = X y X es una matriz Hermitiana diagonal. Luego, si X(t) esuna curva minimal entonces α(t) es una curva minimal.

Departamento de Matematica - UNLP Hoja 72 de 105

Page 77: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Demostracion. Por regla de la cadena α(t) = DeX(t)(X(t)) = f [1](X(t)) X(t). Ahoraelegimos una base ortonormal en la cual X(t) = diag(λ1(t), ..., λn(t)). Por la formula (4.2.9)

DeX(t)(X(t)) = exp[1](X(t)) X(t) =eλi(t) − eλj(t)λi(t)− λj(t)

Xij(t).

En particular, las entradas diagonales son eλi(t)Xii(t). Luego las entradas diagonales de

L = α−1/2(t)α(t)α−1/2(t) = e−X(t)/2DeX(t)(X(t))e−X(t)/2,

sonLii = e−λi(t)/2(eλi(t)(Xii(t)))e

−λi(t)/2 = Xii(t).

Analogamente, si λi = λj, entonces Lij = Xij(t). Si λi 6= λj entonces,

Lij =sinh(λi(t)− λj(t))/2

(λi(t)− λj(t))/2Xij(t).

Notar que P (t), f [1](P (t)) ≥ 0 luego DeP (t)(P (t)) ≥ 0 por el Teorema de Hadamard. Final-mente

L(α) =

∫ 1

0

∥∥α−1/2(t)α(t)α−1/2(t)∥∥

1dt

=

∫ 1

0

∥∥∥e−X(t)/2DeX(t)(X(t))e−X(t)/2∥∥∥

1dt =

∫ 1

0

Tr∣∣∣e−X(t)/2DeX(t)(X(t))e−X(t)/2

∣∣∣ dt=

∫ 1

0

Tr∣∣∣e−P (t)/2DeP (t)(P (t))e−P (t)/2

∣∣∣ dt+ Tr∣∣∣e−N(t)/2DeN(t)(N(t))e−N(t)/2

∣∣∣ dt=

∫ 1

0

n∑j=1

∣∣∣Xjj(t)∣∣∣ dt =

n∑j=1

|dj| = ‖X‖1 .

Otra condicion necesaria para que una curva sea minimal en este espacio es que las curvasque unen los autovalores sean minimales tambien.

Corolario 4.2.12. Sea α : [0; 1]→ P(n) una curva minimal que une I con P = eX ∈ P(n),donde X ∈ H(n). Entonces las curvas que unen λj(I) con λj(P ), los autovalores respectivos,son curvas minimales (en R).

Demostracion. Notar que α(t) es una curva minimal si, y solo si,X(t) es una curva minimal.Ahora si X(t) es una curva minimal entonces las curvas que unen los autovalores λj(t) sonminimales por el Corolario 4.2.7. Luego las curvas eλj(t), que son las curvas que unen losautovalores de α(t), son minimales tambien.

4.2.3 El espacio de matrices unitarias

Ahora recordamos que el espacio de matrices unitarias es un espacio de curvatura nonegativa entonces la funcion exponencial decrece distancias en general. Es natural pensar quesi tomamos la exponencial de una curva minimal en el espacio de matrices antihermitianasvamos a obtener una curva minimal en el espacio de matrices unitarias. Podemos usar lacaracterizacion de curvas minimales en el espacio de matrices Hermitianas para construircurvas minimales en el espacio de matrices unitarias.

Departamento de Matematica - UNLP Hoja 73 de 105

Page 78: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Convencion: En esta subseccion vamos a suponer lo siguiente:

1. Las curvas son suaves, es decir, curvas C1 a trozos.

2. Sea U(n) el conjunto de matrices unitarias n× n.

Dada una curva suave α : [a, b]→ U(n), se define la longitud de curva dada por

L(α) =

∫ b

a

‖α(t)‖1 dt.

La norma que consideramos ‖·‖1 es la norma traza de estas matrices.

La distancia rectificable entre U, V ∈ U(n) esta dada por

d1(U, V ) = ınf L(α) donde α : [a, b]→ U(n) une U con V en U(n) .

Una curva es minimal si su longitud es igual a la distancia de los puntos que une. Esdecir,

L(α) = d1(U, V ).

En [33] Larotonda demostro un teorema de las caracterısticas del siguiente enunciado en uncontexto mucho mas general. Aquı presentamos una demostracion simple para nuestro casoparticular de matrices unitarias.

Teorema 4.2.13. Sea α : [0; 1] → U(n) una curva (suave) que une I con eiX , donde X esuna matriz Hermitiana diagonal tal que ‖X‖sp < π. En otras palabras, α(t) = eiX(t) dondeX : [0, 1]→ H(n) es tal que: X(0) = 0, X(1) = X y X es una matriz Hermitiana diagonaltal que ‖X‖sp < π. Luego, si X(t) es una curva minimal entonces α(t) es una curva minimal.

Demostracion. Si X(t) es una curva minimal, como

L(α) =

∫ 1

0

‖α(t)‖1 dt =

∫ 1

0

∥∥∥∥∫ 1

0

eisX(t)X(t)ei(1−s)X(t)ds

∥∥∥∥1

dt ≤

≤∫ 1

0

∫ 1

0

∥∥∥eisX(t)X(t)ei(1−s)X(t)∥∥∥

1dsdt =

∫ 1

0

∥∥∥X(t)∥∥∥

1dt = L(X(t)),

entonces α(t) es una curva minimal.

Otra condicion necesaria para que una curva sea minimal en este espacio es que las curvasque unen los autovalores sean minimales tambien.

Proposicion 4.2.14. Sea α : [0; 1] → U(n) una curva minimal (suave) que une I conU = eiX , donde ‖X‖sp < π. Entonces las curvas que unen λj(I) con λj(U), los autovaloresrespectivos, son curvas minimales.

Demostracion. Existen funciones continuas λ1(t), . . . , λn(t) que, para todo t ∈ [0, 1], sonlos autovalores de α(t), (ver apendice, Proposicion 6.1.7). Sea t ∈ [0, 1] fijo, como α(t) ∈ U(n)

Departamento de Matematica - UNLP Hoja 74 de 105

Page 79: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

entonces existe Y (t) ∈ H(n), que denotamos a partir de ahora por Yt, tal que α(t) = eiYt .Luego,

‖X‖1 = d(I, eiX) = d(I, eiYt) + d(eiYt , eiX) =

= ‖Yt‖1 + d(I, e−iYteiX) = ‖Yt‖1 + d(I, ei(UtXU∗t −VtYtV ∗t )) =

= ‖Yt‖1 + ‖UtXU∗t − VtYtV ∗t ‖1 = ‖Yt‖1 +n∑j=1

sj(UtXU∗t − VtYtV ∗t ) ≥

≥ ‖Yt‖1 +n∑j=1

|s(X)− s(Yt)|j .

Observar que la desigualdad anterior se deduce de la siguiente mayorizacion debil

|s(A)− s(B)| ≺w s(A−B),

valida para toda matriz A y B (ver apendice Teorema 6.1.5) y la igualdad

e−iYteiX = ei(UtXU∗t −VtYtV ∗t )

se deduce del Teorema de Thompson [60]. Por otro lado

|s(X)− s(Yt)|j ≥ (s(X)− s(Yt))j

para todo j = 1, . . . , n. Si |s(X)− s(Yt)|j > (s(X)−s(Yt))j para algun j = 1, . . . , n, entonces

‖X‖1 ≥ ‖Yt‖1 +n∑j=1

|s(X)− s(Yt)|j > ‖Yt‖1 +n∑j=1

(s(X)− s(Yt))j = ‖Yt‖1 + ‖X‖1 − ‖Yt‖1 .

Absurdo. En conclusion |s(X)− s(Yt)|j = (s(X) − s(Yt))j para todo j = 1, . . . , n. Estaigualdad significa que

sj(Yt) ≤ sj(X).

Ahora si usamos la desigualdad∣∣λ↓(A)− λ↓(B)∣∣ ≤ |λ(A−B)|

validad para toda matriz A y B (ver Teorema 6.1.6 del apendice) entonces

‖X‖1 = d(I, eiX) = d(I, eiYt) + d(eiYt , eiX) =

= ‖Yt‖1 + d(I, e−iYteiX) = ‖Yt‖1 + d(I, ei(UtXU∗t −VtYtV ∗t )) =

= ‖Yt‖1 + ‖UtXU∗t − VtYtV ∗t ‖1 = ‖Yt‖1 +n∑j=1

sj(UtXU∗t − VtYtV ∗t ) =

= ‖Yt‖1 +n∑j=1

|λj(UtXU∗t − VtYtV ∗t )| ≥ ‖Yt‖1 +n∑j=1

∣∣∣λ↓j(UtXU∗t )− λ↓j(VtYtV ∗t )∣∣∣ =

= ‖Yt‖1 +n∑j=1

∣∣∣λ↓j(X)− λ↓j(Yt)∣∣∣ ≥ ‖Yt‖1 +

n∑j=1

∣∣∣λ↓j(X)∣∣∣− ∣∣∣λ↓j(Yt)∣∣∣ = ‖X‖1 .

Departamento de Matematica - UNLP Hoja 75 de 105

Page 80: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

En conclusion, ∣∣∣λ↓j(X)− λ↓j(Yt)∣∣∣ =

∣∣∣λ↓j(X)∣∣∣− ∣∣∣λ↓j(Yt)∣∣∣ ,

es decir, λj(X) es positivo si, y solo si, λj(Yt) es positivo para todo t ∈ [0, 1]. Luego

λj(Yt)t→1 λj(X) o λj(Yt)t→1 λj(X).

4.3 Geometrıa de los puntos medios en P(n)y H(n)

Sean P ∈ P(n) y t ∈ (0, 1). En esta subseccion vamos a estudiar el conjunto de puntosmedios:

Mt(I, P ) = W ∈ P(n) : d|||·|||(I,W ) = t d|||·|||(I, P ) y d|||·|||(W,P ) = (1− t) d|||·|||(I, P ).

Recordamos que, para una norma unitariamente invariante, la longitud de curva se definepor medio de

L|||·|||(α) =

∫ b

a

∣∣∣∣∣∣α−1/2(t)α(t)α−1/2(t)∣∣∣∣∣∣ dt.

La distancia rectificable asociada se define como,

d|||·|||(A,B) = ınfL|||·|||(α) donde α : [a, b]→ P(n) une A con B en P(n)

, (4.3.1)

la cual es una metrica en P(n) invariante por congruencias. El conjunto de puntos me-dios correspondiente a la metrica de Thompson, es geodesicamente convexo (ver [40]). Acontinuacion probaremos que este conjunto es geodesicamente convexo para toda normaunitariamente invariante. La demostracion pasa por probar que la funcion

s 7→ d|||·|||(I, γ(s)),

donde γ(s) es la geodesica que une dos matrices positivas, es convexa. Luego, usaremos estapropiedad para probar el resultado que buscamos.

Teorema 4.3.1. Si γ(s) = A1/2(A−1/2BA−1/2)sA1/2 denota la geodesica que une A,B ∈P(n), entonces

s 7→ d|||·|||(I, γ(s))

es convexa.

Demostracion. En efecto,

d|||·|||(I, γ(s)) ≤ d|||·|||(I, A1−s) + d|||·|||(A

1−s, γ(s)) = d|||·|||(I, A1−s) + d|||·|||(A

−s, (A−1/2BA−1/2)s) ≤≤ (1− s)d|||·|||(I, A) + sd|||·|||(A

−1, A−1/2BA−1/2) = (1− s)d|||·|||(I, A) + sd|||·|||(I, B).

Departamento de Matematica - UNLP Hoja 76 de 105

Page 81: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Proposicion 4.3.2. Sean P ∈ P(n) y t ∈ (0, 1). Entonces el conjunto

Mt(I, P ) = W ∈ P(n) : d|||·|||(I,W ) = t d|||·|||(I, P ) y d|||·|||(W,P ) = (1− t) d|||·|||(I, P )es geodesicamente convexo.

Demostracion. Observar que si γ(s) es la geodesica que une Wo,W1 ∈ Mt(U, V ), es decir,

W0 = γ(0),W1 = γ(1) y γ(s) = W1/20 (W

−1/20 W1W

−1/20 )sW

1/20 , entonces

d|||·|||(I, γ(s)) ≤ (1− s)d|||·|||(I,W0) + sd|||·|||(I,W1)

= (1− s)td|||·|||(I, P ) + std|||·|||(I, P ) = td|||·|||(I, P );

d|||·|||(P, γ(s)) ≤ (1− s)d|||·|||(P,W0) + sd|||·|||(P,W1)

= (1− s)(1− t)d|||·|||(I, P ) + s(1− t)d|||·|||(I, P ) = (1− t)d|||·|||(I, P )

Por lo tantod|||·|||(I, P ) ≤ d|||·|||(I, γ(s)) + d|||·|||(P, γ(s)) ≤ d|||·|||(I, P ).

De lo cual deducimos que,

d|||·|||(I, γ(s)) = td|||·|||(I, P )

d|||·|||(P, γ(s)) = (1− t)d|||·|||(I, P ).

Luego γ(s) ∈Mt(I, P ) para todo s ∈ [0, 1].

Utilizando las mismas ideas vamos a probar por completitud que, en H(n),

Mt(0, X) = W ∈ H(n) : d|||·|||(0,W ) = t d|||·|||(0, X) and d|||·|||(W,X) = (1− t) d|||·|||(0, X),es geodesicamente convexo. Este caso puede ser menos interesante, o mas sencillo de probar,pues las geodesicas son segmentos.

Teorema 4.3.3. Si γ(s) = (1−s)A+sB denota la geodesica que une A,B ∈ H(n), entonces

s 7→ d|||·|||(0, γ(s))

es convexa.

Demostracion. En efecto,

d|||·|||(0, γ(s)) ≤ d|||·|||(0, (1− s)A) + d|||·|||((1− s)A, γ(s)) = (1− s)d|||·|||(0, A) + d|||·|||(0, sB) =

= (1− s)d|||·|||(0, A) + sd|||·|||(0, B).

Proposicion 4.3.4. Sean X ∈ H(n) y t ∈ (0, 1). Entonces el conjunto

Mt(0, X) = W ∈ H(n) : d|||·|||(0,W ) = t d|||·|||(0, X) and d|||·|||(W,X) = (1− t) d|||·|||(0, X)es geodesicamente convexo.

Demostracion. Haciendo los cambios necesarios, la prueba es igual a la dada en la Proposi-cion 4.3.2.

Observacion. Es importante notar que si la norma |||·||| es estrictamente convexa entoncesexiste una unica geodesica que une dos puntos dados. En consecuencia, el conjunto de puntosmedios consta de un solo elemento, razon por la cual no tiene sentido preguntarse sobre laconvexidad geodesica.

Departamento de Matematica - UNLP Hoja 77 de 105

Page 82: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

5 Estructura de las curvas minimalesen U(n) con respecto a la metrica deFinsler bi-invariante inducida por lanorma espectral

5.1 El grupo de un parametro

Si consideramos U(n) ⊂ L(H) como subvariedad, resulta natural, considerar la estructuraasociada a la norma de operadores. La metrica de Finsler bi-invariante dada por la normaespectral es la siguiente,

‖X‖U

= ‖U∗X‖sp = ‖X‖sp,para todo X tangente a un operador unitario U . Con respecto a esta metrica de Finsler, lalongitud de la curva α : [0, 1]→ U(n), se puede calcular de la siguiente manera

L(α) =

∫ 1

0

‖α(t)‖sp dt.

La distancia rectificable inducida, denotada por d∞(·, ·), se calcula como en el caso Rieman-niano, como el ınfimo de las longitudes de todas las curvas suaves a trozos que unen dospuntos dados.

d∞(U, V ) = ınf L(α) donde α : [a, b]→ U(n) une U con V en U(n) .

Sean U, V ∈ U(n) donde V = UeiX con X ∈ H(n) y ‖X‖ ≤ π. Entonces la curva δ(t) = UeitX

es mas corta que cualquier otra curva suave a trozos γ en U(n) que una U con V . Es decir

L(δ) = d∞(U, V ).

En efecto, la idea de la demostracion utilizada en [5], involucra los siguientes resultados.

Teorema. (Thompson [60]) Dados X, Y ∈ H(n), existen matrices unitarias U, V tales que

eiXeiY = ei(UXU∗+V Y V ∗).

Corolario. Sean X, Y, Z ∈ H(n) tales que ‖Z‖sp ≤ π y eIXeiY = eiZ. Entonces existenmatrices unitarias U, V tales que

|Z| ≤ |UXU∗ + V Y V ∗| .

Page 83: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Teorema. (Thompson [[58], [59]]). Dados X, Y ∈ Mn(C), existen matrices unitarias U, Vtales que

|X + Y | ≤ U |X|U∗ + V |Y |V ∗.

El teorema demostrado en [5] prueba la existencia de curvas cortas con respecto a la metri-ca de Finsler para toda norma unitariamente invariante en el espacio de matrices unitarias.Esta generalidad nos va a resultar conveniente en la motivacion del siguiente problema.

Teorema: Sean U, V ∈ U(n) y V = UeiX , con ‖X‖sp ≤ π, X ∈ H(n). Entonces, la curva

δ(t) = UeitX es mas corta o igual que cualquier otra curva suave a trozos γ que una U conV en U(n). En particular, d(U, V ) = |||X||| .

Idea de la demostracion: Sin perder generalidad podemos suponer que U = Id. Pri-mero se reduce a estudiar una curva poligonal vıa un argumento de aproximacion estandar.

1

V = e−iX

γ(t) = e−itX

α(t)Pε(t)

Luego, vıa un argumento inductivo, se reduce a estudiar la desigualdad triangular.

1

eiY

V = eiX = eiY eiZ

α(t) = eitYβ(t) = eiY eitZ

γ(t) = eitX

Sabemos que:

• eiX = eiY eiZ ;

• ‖X‖sp ≤ π;

y queremos probar que: |||X||| ≤ |||Y |||+ |||Z||| . Y esto se deduce de:

• Por el Teorema de Thompson eiX = eiY eiZ = ei(UY U∗+V ZV ∗), U, V ∈ U(n);

• Como ‖X‖sp ≤ π se tiene que |||X||| ≤ |||UY U∗ + V ZV ∗|||.

Sin embargo es facil construir ejemplos para probar que no es la unica.

Departamento de Matematica - UNLP Hoja 79 de 105

Page 84: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Ejemplo. Sean

U = eiX =

(eiπ2 0

0 eiπ4

), X =

(π2

00 π

4

).

Entonces la curva

α(t) =

(eit

π2 0

0 α(t)

), α(t) =

eiπ2t t ∈ [0, 1/4]

eiπ2 ( 1

2−t) t ∈ [1/4, 1/2]

eiπ2 (t− 1

2) t ∈ [1/2, 1]

une Id con U y es minimal.

Con este problema en vista y los resultados obtenidos en la seccion anterior nos pregun-tamos

a) Sean U, V ∈ U(n) ¿Podemos caracterizar las curvas minimales que los unen con res-pecto a la metrica heredada por la norma espectral?

b) Definiendo el conjunto de puntos medios entre U y V ¿Es posible probar que bajociertas condiciones este conjunto es geodesicamente convexo?

c) ¿ Se puede caracterizar la unicidad de curvas minimales en terminos del espectro de Uy V ?

Vamos a responder estas preguntas a lo largo del capıtulo en los siguientes resultados:Teorema 5.3.1, Corolario 5.3.2 y Proposicion 5.4.3, respectivamente.

5.2 El grupo de matrices unitarias

El grupo de matrices n × n complejas unitarias U(n), como todo grupo de Lie, tieneuna conexion canonica libre de torsion sobre campos vectoriales invariantes a izquierda X, Ydefinida como ∇XY = 1

2[X, Y ]. La geodesica asociada a esta conexion son los grupos de

un parametro t 7→ UetZ (donde U es una matriz unitaria y Z una matriz anti-Hermitiana).Podemos introducir una metrica Riemanniana en el grupo unitario de manera estandar

〈X, Y 〉g = Tr(U∗X(U∗Y )∗) = Tr(XY ∗),

para U∗X,U∗Y en el algebra de Lie del grupo, es decir, para U∗X,U∗Y matrices anti-Hermitianas. Es conocido que la conexion mencionada, es la conexion de Levi-Civita de lametrica g inducida por la traza, y que las geodesicas son curvas minimales siempre que elespectro de Z este contenido en (−π, π).

Ahora consideremos la metrica de Finsler bi-invariante dada por la norma espectral,

‖X‖U

= ‖U∗X‖sp = ‖X‖sp,

para todo X tangente a un operador unitario U . Con respecto a esta metrica de Finsler, lalongitud de la curva α : [0, 1]→ U(n), se puede calcular de la siguiente manera

L(α) =

∫ 1

0

‖α(t)‖sp dt.

Departamento de Matematica - UNLP Hoja 80 de 105

Page 85: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

La distancia rectificable inducida, denotada por d∞(·, ·), se calcula como en el caso Rieman-niano, como el ınfimo de las longitudes de todas las curvas suaves a trozos que unen dospuntos dados.

Con respecto a esta estructura metrica, las geodesicas de la conexion son curvas minimales(ver [4]). Sin embargo, como la norma espectral no es estrictamente convexa, en la mayorıade los casos los grupos de un parametro no son las unicas curvas minimales que conectandos puntos dados. Luego, una pregunta natural es: si es posible o no, caracterizar todas lascurvas minimales que unen dos puntos en U(n). El objetivo principal de este capıtulo esdar tal caracterizacion. Por otro lado, esto lleva a una caracterizacion de aquellos pares dematrices unitarias conectadas por una unica curva minimal. Mas precisamente, la geodesicaes la unica curva minimal que une U, V ∈ U(n) si, y solo si, el espectro de U∗V esta contenidoen eiθ, e−iθ para algun θ ∈ [0, π). Un resultado analogo, pero en el conjunto de matricesestrictamente positivas, lo obtuvo Yongdo Lim en [40]. A su vez, la descripcion de todas lascurvas minimales que unen dos puntos nos lleva a considerar el conjunto de puntos medios

M1/2(U, V ) =W ∈ U(n) : d∞(U,W ) = d∞(W,V ) = 1

2d∞(U, V )

,

o mas generalmente para t ∈ (0, 1)

Mt(U, V ) =W ∈ U(n) : d∞(U,W ) = t d∞(U, V ) and d∞(W,V ) = (1− t) d∞(U, V )

.

vamos a probar que este conjunto es geodesicamente convexo siempre que d∞(U, V ) < π/2.

5.3 Estructura de las curvas minimales en U(n)En esta seccion, vamos a estudiar la estructura de las curvas minimales que unen dos

matrices unitarias U y V dadas, donde la minimalidad es con respecto a la estructura metricade Finsler dada por la norma espectral.

Notacion: Por Mn(C) vamos a denotar al algebra de matrices complejas n × n, Gl (n)al grupo de todos los elementos invertibles de Mn(C), U(n) al grupo de matrices unitariasn×n, y H(n) la subalgebra real de matrices Hermitianas. A veces vamos a usar Gl(S) (resp.U(S), H(S)) para indicar que los operadores actuan en algun subespacio especıfico S. SiT ∈Mn(C), entonces ‖T‖sp denota la norma espectral usual, |T | indica el modulo de T , esdecir, |T | =

√T ∗T , y tr(T ) denota la traza de T . Por medio de σ (T ) denotamos al conjunto

de autovalores de T , mientras que ρ(T ) denota el radio espectral de T . Dada A ∈ H(n),λ1 (A) ≥ . . . ≥ λn (A) denota los autovalores de A ordenamos de manera no creciente ycontados con multiplicidad. Analogamente, dada una matriz arbitraria T ∈Mn(C), s1 (T ) ≥. . . ≥ sn (T ) denota los valores singulares de T (tambien contados con multiplicidad), es decir,los autovalores de |T |. Finalmente, dadas A,B ∈ H(n), por medio de A ≤ B denotamos queA es menor o igual que B con respecto al orden de Lowner.

Convencion: de ahora en adelante, vamos a suponer que las curvas estan parametrizadaspor el intervalo [0, 1], y de tal manera que t 7→ ‖α(t)‖ es constante. Esto nos va a evitarproblemas de notacion o perdida de unicidad por posibles reparametrizaciones.

Recordar que, en el caso de matrices Hermitianas, la norma espectral coincide con el radioespectral. Por lo tanto, hablando mal y pronto, podemos cambiar una matriz Hermitiana

Departamento de Matematica - UNLP Hoja 81 de 105

Page 86: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

dentro del autoespacio correspondiente a los “autovalores mas chicos” y la matriz todavıatendrıa la misma norma espectral. Esta simple observacion, nos da una estrategia facil paraconstruir curvas minimales, por perturbaciones del grupo de un parametro.

El siguiente resultado nos dice que precisamente estas son todas las curvas minimales. Enbusca de simplicidad, y sin perdida de generalidad (pues la norma espectral es unitariamenteinvariante), vamos a suponer que una de las matrices es la identidad.

Teorema 5.3.1. Dado U ∈ U(n), sea X ∈ H(n) tal que U = eiX y ‖X‖ ≤ π. Entonces:

a) Si σ (|X|) ⊆ [0, π) y tiene mas de un elemento, entonces una curva minimal que uneI con U tiene la siguiente estructura:

α(t) =

(eitXS 0

0 α1(t)

)SS⊥ ,

donde S = ker(‖X‖I − |X|), XS = X|S ∈ H(S), y α1 : [0, 1] → U(S⊥) es cualquiercurva que une IS⊥ con US⊥ = U |S⊥ tal que ‖α1‖sp ≤ ‖X‖sp.

b) Si π ∈ σ (|X|), entonces una curva minimal que une I con U tiene la siguiente estruc-tura:

α(t) =

(eitYS 0

0 α1(t)

)SS⊥ ,

donde S = ker(πI − |X|), YS ∈ H(S) y satisface que σ (YS) ⊆ π,−π, y α1 : [0, 1]→U(S⊥) es cualquier curva que une IS⊥ con US⊥ = U |S⊥ tal que ‖α1‖sp ≤ π.

Una consecuencia directa del primer ıtem de este resultado es el siguiente Corolario sobreunicidad de curvas minimales:

Corolario 5.3.2. Dados U, V ∈ U(n), existe una unica curva minimal que los une si, y solosi, σ (U∗V ) ⊆ eiθ, e−iθ para algun |θ| < π.

Otra consecuencia de este teorema es el siguiente resultado:

Corolario 5.3.3. Dada una curva minimal α : [0, 1]→ U(n), tambien es minimal entre dospuntos cualesquiera de su traza, y

d∞(U, α(r)) = rd∞(U, V ).

5.3.1 Demostracion del Teorema 5.3.1

Para comenzar, vamos a probar el siguiente lema, el cual es una pequena modificacionde un hermoso truco usado por Porta y Recht en [54] (ver tambien [5]):

Lema 5.3.4. Sea α : [0, 1] → U(n) una curva minimal (suave) que une I con U = eiX ,donde ‖X‖sp < π. Si ξ es un autovector unitario de X correspondiente a un autovalor λ talque ρ(X) = |λ|. Entonces

α(t) =

(eitλ 00 α1(t)

)SS⊥ ,

donde S = spanξ, y α1 : [0, 1] → U(S⊥) es cualquier curva que une IS⊥ con US⊥ = U |S⊥tal que ‖α1‖sp ≤ ‖X‖sp.

Departamento de Matematica - UNLP Hoja 82 de 105

Page 87: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Demostracion. Sea γ : [0, 1] → U(n) la curva definida por γ(t) = eitX , y sea S2n−1 laesfera:

S2n−1 = η ∈ Cn : ‖η‖2 = 1.Definimos las curvas γ : [0, 1]→ S2n−1 y α : [0, 1]→ S2n−1 de la siguiente manera:

γ(t) = γ(t)ξ y α(t) = α(t)ξ.

Un calculo sencillo nos prueba que L(γ) = L(α), donde la longitud aquı se computa conrespecto a la estructura Riemanniana de la esfera. Como ‖X‖sp < π, γ es la unica geodesicaen S2n−1 que une ξ con Uξ = eiXξ. Por lo tanto, γ = α. En particular, ξ es un autovectorde α(t) asociado a eiλ para todo t ∈ [0, 1]. El resto del enunciado es una consecuencia de ladescomposicion por bloques de α, inducida por la descomposicion del espacio Cn = S ⊕S⊥.

Iterando este lema obtenemos la primera parte del Teorema 5.3.1.

Corolario 5.3.5. Sea α : [0, 1]→ U(n) una curva minimal (suave) que une I con U = eiX ,donde ‖X‖sp < π. Entonces

α(t) =

(eitXS 0

0 α1(t)

)SS⊥ ,

donde S = ker(‖X‖I−|X|), XS = X|S , y α1 : [0, 1]→ U(S⊥) es una curva que une IS⊥ conUS⊥ = U |S⊥ tal que ‖α1‖sp ≤ ‖X‖sp.

Para la segunda parte, vamos a usar un argumento por aproximacion.

Lema 5.3.6. Sea α : [0, 1]→ U(n) una curva minimal (suave) que une I con U = eiX , donde‖X‖sp = π. Entonces existe Y ∈ H(n), con ‖Y ‖sp = π, tal que U = eiY y un autovectorunitario ξ de Y correspondiente a un autovalor λ con |λ| = π, tal que

α(t) =

(eitλ 00 α1(t)

)SS⊥ ,

donde S = spanξ, y α1 : [0, 1]→ U(S⊥) es cualquier curva que une IS⊥ y US⊥ = U |S⊥ talque ‖α1‖sp ≤ ‖X‖sp.

Demostracion. Para todo m ∈ N vamos a considerar la curva

αm(t) = α

((m

m+ 1

)t

), para todo t ∈ [0, 1] .

En otras palabras, αm(t) es la parte de la curva α(t), que une I con αm(1) = eiXm para algunXm ∈ H(n) con ‖Xm‖ < π. Como α(t) tiene velocidad constante, se tiene que

‖Xm‖ = d∞(I, eiXm) =m

m+ 1L(α) < π.

Luego, αm(t) es una curva minimal que une I con eiXm . Mas aun,

eiXm = α

(m

m+ 1

)−−−→m→∞

α(1) = eiX .

Departamento de Matematica - UNLP Hoja 83 de 105

Page 88: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Para Xmm∈N existe una subsucesion convergente, que denotamos por Xm con algun abusode notacion, es decir,

Xm −−−→m→∞

Y ∈ H(n) =⇒ U = eiX = eiY . (5.3.1)

Denotamos por Um = eiXm para m ∈ N, y

η := mın |λj(U)− λk(U)| : donde λj(U) 6= λk(U) > 0 .

Indexemos por j = 0, . . . , r a los distintos autovalores de U . Para todo j = 0, . . . , r, conside-ramos el disco Dj, con centro λj(U) y radio η/3. Por (5.3.1) y el hecho que σ(U) ⊆ ⋃j Dj ,existe un N1 ≥ 1 tal que

σ(Um) ⊆⋃j

Dj para todo m ≥ N1 .

Observar que como ‖X‖sp = π entonces −1 ∈ λ(U). Sea D0 = D(−1, η/3) y tomemos unafuncion continua f : T → [0, 1] tal que, f |D0 = 1, y f |Dk = 0 para k 6= 0, k = 1, . . . , r.Entonces f(Um) −−−→

m→∞f(U) por el Teorema espectral. En otras palabras,

PTm −−−→m→∞

PT , (5.3.2)

donde PT = f(U) es la proyeccion sobre el subespacio T = ker(U + I) y PTm = f(Um) es laproyeccion sobre el subespacio

Tm = span v ∈ Cn : Umv = λk(Um)v para algun λk(Um) ∈ D0 .

Para todo m ∈ N, sea λm ∈ σ(Xm), tal que |λm| = ‖Xm‖. Como λm ∈ [−π, π] existe unasubsucesion convergente, que denotamos por λm, con algun abuso de notacion nuevamente,es decir,

λm −−−→m→∞

λ,

donde |λ| = π. Como ‖Xm‖ < π podemos aplicar el Lema 5.3.4 a la curva αm(t). Para todom ∈ N, sea ξm ∈ ker(Xm − λm I) un vector unitario, y denotamos por Sm = spanξm.Entonces

αm(t) =

(eitλm 0

0 αm,1(t)

)SmS⊥m

,

donde αm,1 : [0, 1]→ U(S⊥m), es una curva que une IS⊥m

con Um,S⊥m

, tal que ‖αm,1‖sp ≤ ‖Xm‖sp .Como ξm ∈ Sm ⊆ Tm y PTm −−−→

m→∞PT , Concluimos que existe un vector unitario ξ ∈ T , y

una subsucesion convergente tal que

ξjm −−−→m→∞

ξ =⇒ PSjm −−−→m→∞PS ,

donde S = spanξ. Como Xjm −−−→m→∞

Y y λjm −−−→m→∞

λ, luego Y ξ = λ ξ. Entonces

⟨eitλjmξjm , ξjm

⟩−−−→m→∞

⟨eitλξ, ξ

⟩para todo t ∈ [0 , 1] .

Departamento de Matematica - UNLP Hoja 84 de 105

Page 89: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Como tambien αjm(t) −−−→m→∞

α(t) para todo t ∈ [0 , 1], deducimos que

αjm(t) =

(eitλjm 0

0 αjm,1(t)

)SjmS⊥jm

−−−→m→∞

α(t) =

(eitλ 00 α1(t)

)SS⊥ ,

donde α1 = PS⊥ αPS⊥∣∣S⊥ : [0, 1] → U(S⊥) es una curva que une IS⊥ con US⊥ = U |S⊥ tal

que ‖α1‖sp ≤ ‖α‖sp = ‖X‖sp.

Para completar la demostracion del Teorema 5.3.1 parte b) vamos a iterar este lema y,en cada iteracion, vamos a obtener una nueva Y que puede ser diferente de X. La razon deesto es que no hay unicidad en las geodesicas que unen puntos antipodales en la esfera.

Demostracion del Teorema 5.3.1. La primer parte ya fue probada en el Corolario5.3.5. La segunda parte es una consecuencia del Lema 5.3.6: Sea α : [0, 1]→ U(n) una curvaminimal (suave) que une I con U = eiX , donde ‖X‖sp = π. Por el Lema 5.3.6 existe Y1 con‖Y1‖sp = π, y un autovector unitario ξ1 de Y1 correspondiente a un autovalor λ1, tal que|λ1| = π, y

α(t) =

(eitλ1 0

0 α1(t)

)S1

S⊥1,

donde S1 = spanξ1, y α1 : [0, 1]→ U(S⊥1 ) es cualquier curva que une IS⊥1

con US⊥1

= U |S⊥1tal que ‖α1‖sp ≤ ‖X‖sp.

Si α1(1) = eiX1 es tal que ‖X1‖ = π, aplicamos el Lema 5.3.6 a la curva α1(t): existe Y2

con ‖Y2‖sp = π y un autovector unitario ξ2 de Y2 correspondiente a un autovalor λ2 tal que|λ2| = π, tal que,

α1(t) =

(eitλ2 0

0 α2(t)

)S2

S⊥2,

donde S2 = spanξ2, y α2 : [0, 1]→ U(S⊥2 ) es cualquier curva que une IS⊥2

con US⊥2

= U |S⊥2tal que ‖α2‖sp ≤ ‖X‖sp.

Si α2(1) = eiX2 es tal que ‖X2‖ = π, continuamos iterando el lema. En algun puntovamos a terminar porque estamos en dimension finita. De esta manera construimos YS .

Es claro que si una curva tiene la estructura dada en el enunciado, entonces es minimal,lo cual se prueba a partir de un calculo sencillo.

5.4 Geometrıa de los puntos medios

Dados U, V ∈ U(n) y t ∈ (0, 1), en esta seccion vamos a estudiar el conjunto de puntosintermedios:

Mt(U, V ) = W ∈ U(n) : d∞(U,W ) = t d∞(U, V ) y d∞(W,V ) = (1− t) d∞(U, V ).

En el caso de matrices positivas, el conjunto correspondiente de puntos intermedios, fueestudiado y se probo que es geodesicamente convexo (ver [40]). No podemos esperar que un

Departamento de Matematica - UNLP Hoja 85 de 105

Page 90: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

resultado similar con toda generalidad sea valido en nuestro contexto. De hecho, por ejemplo,en el caso unidimensional, el conjunto de puntos intermedios puede ser disconexo. En el casoque la dimension sea mayor a uno, hay tambien un caso particular, donde la convexidadgeodesica no es cierta:

Ejemplo. Sean U = I y V = −I, y consideremos el conjunto de puntos intermediosMt(I,−I) para algun t ∈ (0, 1/2) (para t ∈ (1/2, 1) es analogo). Entonces

W+ =

(eitπ 00 eitπ

)y W− =

(e−itπ 0

0 e−itπ

).

pertenece aMt(I,−I). Sin embargo, no es difıcil ver que I es el punto medio de la geodesica(y unica curva minimal por el Corolario 5.3.2) que une W+ con W−. N

Primero vamos a dar una demostracion de la siguiente caracterizacion del conjuntoMt(U, V ).

Lema 5.4.1. Dados U, V ∈ U(n) y t ∈ (0, 1), entonces Mt(U, V ) se puede caracterizar comoel siguiente conjunto

W ∈ U(n) : existe γ : [0, 1]→ U(n) una curva entre Uy V con L(γ) = d∞(U, V ) : γ(t) = W .

Demostracion. Si existe una curva minimal γ tal que γ(t) = W entonces, por el Corolario5.3.3,

d(U,W ) = d(γ(0), γ(t)) = td(U, V )

d(W,V ) = d(γ(t), γ(1)) = (1− t)d(U, V ).

Esto prueba una inclusion. Recıprocamente, si W ∈Mt(U, V ), tomemos una curva minimalβ1 que une U con W y β2 una curva minimal que une W con V . Entonces

L(γ) = L(β1) + L(β2)

= d(U,W ) + d(W,V )

= td(U,W ) + (1− t)d(W,V ) = d(U, V ).

Si γ = β1∗β2 es la concatenacion de estas dos curvas parametrizadas con velocidad constanteen [0, 1], entonces W = γ(t).

A continuacion vamos a probar que si W0,W1 ∈ Mt(U, V ) entonces β(s) ∈ Mt(U, V ),para todo s ∈ [0, 1], donde β(s) es una geodesica con la condicion que d(U, V ) < π/2. Laidea de la demostracion es principalmente la misma que aquella usada en la seccion 4.3. Coneste proposito vamos a usar el siguiente teorema.

Teorema 5.4.2 ([3]). Si d(W, γ(s)) < π/2 para todo s ∈ [0, 1], donde γ(s) es una geodesica,entonces la funcion

s 7→ d(W, γ(s))

es convexa.

Departamento de Matematica - UNLP Hoja 86 de 105

Page 91: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Si d(U, V ) < π/2, dados W0,W1 ∈Mt(U, V ),

d(U, β(s)) ≤ d(U,Wj) +d(W0,W1)

2

≤ d(U,Wj) +d(W0, V )

2+d(W1, V )

2

= td(U, V ) +(1− t)d(U, V )

2+

(1− t)d(U, V )

2= d(U, V ) <

π

2

tomando un j = 0, 1 conveniente.

W1

W0

U

d(U,W1) ≤ π/4

d(U,W0) ≤ π/4

β(s)

Proposicion 5.4.3. Dados U, V ∈ U(n) tal que d∞(U, V ) < π/2, y t ∈ (0, 1), el conjunto

Mt(U, V ) = W ∈ U(n) : d∞(U,W ) = t d∞(U, V ) y d∞(W,V ) = (1− t) d∞(U, V )

es geodesicamente convexo.

Demostracion. Notar que, si β(s) es la geodesica que une Wo,W1 ∈ Mt(U, V ), es decir,W0 = β(0),W1 = β(1), entonces

d(U, β(s)) ≤ sd(U,W1) + (1− s)d(U,W0)

= std(U, V ) + (1− s)td(U, V ) = td(U, V );

d(V, β(s)) ≤ sd(V,W1) + (1− s)d(V,W0)

= s(1− t)d(U, V ) + (1− s)(1− t)d(U, V ) = (1− t)d(U, V )

Luego

d(U, V ) ≤ d(U, β(s)) + d(V, β(s)) ≤ d(U, V ).

Es decir,

d(U, β(s)) = td(U, V )

d(V, β(s)) = (1− t)d(U, V ).

Entonces β(s) ∈Mt(U, V ).

Departamento de Matematica - UNLP Hoja 87 de 105

Page 92: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

5.5 La Grassmaniana

La Grassmaniana Gn es el conjunto de subespacios de Cn, que puede ser identificado conel conjunto de proyecciones ortogonales en Mn(C). Si consideramos en Mn(C) la topologıadefinida por cualquiera de sus normas equivalentes, el espacio Grassmaniano dotado conesta topologıa, es un conjunto compacto. Sin embargo, no es conexo. En efecto, es suficienteconsiderar la traza, la cual es una funcion continua definida en todo el espacio Mn(C), yrestringida a Gn toma solo valores naturales. En particular, esto prueba que las componentesconexas de Gn son subconjuntos Gm,n, definidos como:

Gm,n := P ∈ Gn : tr(P ) = m .

Cada una de estas componentes es una subvariedad deMn(C) [[61], p. 129], y las componentesconexas estan dadas, por la orbita unitaria de una proyeccion dada P , tal que tr(P ) = rkP =m:

Gm,n = UPU∗ : U ∈ U(n) .El espacio tangente en un punto P ∈ Gm,n se puede identificar con el subespacio de P -codiagonales matrices Hermitianas, es decir,

TPGn = X ∈ H(n) : X = PX +XP .

Denotamos por S = R(P ). Luego cada X ∈ TPGn tiene una descomposicion en bloques

X =

(0 AA∗ 0

)SS⊥ para algun A ∈ L(S⊥ , S) .

En particular notar que TPGn tiene un complemento natural NP , que es el espacio dematrices Hermitianas que conmutan con P , es decir, las matrices P -diagonales Hermitianas.La descomposicion en matrices diagonales y codiagonales definen a normal bundle, y noslleva a una derivada covariante

∇V Γ(P ) = ΠTP ||NPd

dtΓ(α(t))|t=0,

donde Γ es un campo vectorial a lo largo de la curva α : (−ε, ε) → Gm,n que satisfaceα(0) = P y α(0) = V . Luego, tenemos una nocion de paralelismo, y las geodesicas en estesentido, se describen en el siguiente teorema:

Teorema 5.5.1. (Ver Porta-Recht [54], tambien Davis-Kahan [25] o Halmos [28])

• La unica geodesica en P con direccion X ∈ TPGn es:

γ(t) = eitXPe−itX .

• Si P,Q ∈ Gn son tales que ‖P −Q‖sp < 1, entonces existe un unico X ∈ TPGn con‖X‖ < π/2 tal que

X = PX +XP ∈ TPGn y Q = eiXPe−iX . (5.5.1)

Por lo tanto, pueden ser unidos por la geodesica γ(t) = eitXPe−itX .

Departamento de Matematica - UNLP Hoja 88 de 105

Page 93: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

La metrica de Finsler en la Grassmanniana: Para una norma simetrica dada ‖ · ‖ enMn(C), el espacio Grassmanniano lleva la estructura de Finsler dada por

‖X‖P = ‖X‖ para X ∈ TPGn .

Con esta estructura, la componente Grassmanniana UPU∗ : U ∈ U(n) es isometrica (modu-lo un factor 2) a la orbita USPU∗ : U ∈ U(n) de la simetrıa SP = 2P − I. Una cuentasencilla muestra que, si X = XP + PX, entonces

eiXSP = SP e−iX .

Esta simple observacion nos permite usar los resultados previos obtenidos en el grupo unitarioy aplicarlos a la Grassmaniana.

Como el grupo unitario actua de manera transitiva en estas componentes vıa U ·P = UPU∗,ellas tambien son espacios homogeneos de U(n). Se las puede distinguir de otras subvarieda-des homogeneas de U(n), porque la funcion

P 7→ SP = 2P − 1

embeds a ellas en U(n), y la funcion S es dos veces una isometrıa. Las imagenes SP sonsimetrıas, es decir, matrices que satisfacen S∗P = SP = S−1

P .

Notacion 5.5.2. Sean P ∈ Gm,n, X ∈ TPGn y A ∈ L(S⊥ , S) tales que

X =

(0 AA∗ 0

)SS⊥ . Entonces |X| =

(|A∗| 0

0 |A|

)SS⊥ . (5.5.2)

1. Es conocido que, si σ(A) = (σ1 , . . . , σn) son los valores singulares de A, entonces

λ(X) = (σ1 , . . . , σn , −σn , . . . , −σ1) ∈ (R2n)↓ ,

y los valores singulares de X aparecen en pares.

2. Vamos a llamar PX ∈Mn(C) a la proyeccion ortogonal sobre el subespacio

SXdef= ker(‖X‖I − |X|) (5.5.2)

= Ω1 ⊕ Ω2 , (5.5.3)

donde

Ω1 = v ∈ S : |A∗| v = ‖A‖ v y Ω2 =w ∈ S⊥ : |A|w = ‖A‖ w

.

3. Vamos a llamar γX : R→ L(SX) a la curva dada por

γX(t) = PX(eitXPe−itX

)PX

∣∣∣SX

para t ∈ R .

Por la ecuacion (5.5.3), P PX = PX P y X PX = PX X. Entonces tambien

PX eitXPe−itX = eitXPe−itX PX ,

y γX(t) ∈ G(SX) para todo t ∈ R (como tambien la compresion a S⊥X). N

Departamento de Matematica - UNLP Hoja 89 de 105

Page 94: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

En el siguiente resultado vamos a usar la notacion 5.5.2 dada anteriormente.

Teorema 5.5.3. Sean P,Q ∈ Gn con ‖P −Q‖sp < 1. Sea X ∈ H(n) como en la ecuacion(5.5.1). Entonces ‖X‖sp < π/2 por lo cual σ (|X|) ⊆ [0, π/2). Si σ (|X|) tiene mas de unelemento, entonces una curva minimal que une P con Q tiene la siguiente estructura:

δ(t) =

(γX(t) 0

0 α1(t)

)SXS⊥X

,

donde α1 : [0, 1] → G(S⊥X) es cualquier curva que une, P∣∣S⊥X

con Q∣∣S⊥X

, tal que ‖α1‖sp ≤‖X‖sp.Demostracion. Tomemos δ(t) una curva minimal que une P con Q en Gn (en este casoL(δ) = ‖X‖sp). Notar que si γ(t) = eitXPe−itX entonces

Sγ(t) = 2γ(t)− 1 = eitXSP e−itX = e2itXSP = SP e

−2itX ,

y esta curva es la geodesica que une SP con SQ y tiene longitud 2 ‖X‖. Ahora consideremosla curva α(t) = Sδ(t) que une Sp con SQ en U(n) y, notar que esta es una curva minimal, yaque

L(α) =

∫ 1

0

‖α(t)‖ =

∫ 1

0

∥∥∥2δ(t)∥∥∥ = 2 ‖X‖sp .

Entonces por el Teorema 5.3.1, como σ (|X|) ⊆ [0, π/2) y tiene mas de un elemento, la curvaminimal que une SP con SQ tiene la siguiente estructura:

α(t) =

(SP e

−2itXS 00 α1(t)

)SS⊥ ,

donde S = ker(‖X‖I − |X|), XS = X|S , y α1 : [0, 1] → U(S⊥) es cualquier curva que uneSP∣∣S⊥ con SQ

∣∣S⊥ , tal que ‖α1‖sp ≤ 2‖X‖sp . Es facil ver que en realidad S = SX .

Como la funcion Φ : Gn → U(n) dada por Φ(P ) = SP = 2P − I es dos veces una isometrıay satisface que Φ(P )2 = I para todo P ∈ Gn , se obtiene la estructura dada.

Como antes, una consecuencia directa de este resultado, es el siguiente corolario sobre uni-cidad de curvas minimales:

Corolario 5.5.4. Dados P,Q ∈ Gn con ‖P −Q‖ < 1, existe una unica curva minimal quelos une si, y solo si, σ (SQSP ) ⊆ eiθ, e−iθ para algun |θ| < π/2.

Observacion. El corolario anterior nos dice que hay algunos casos donde la unicidades imposible. Como mencionamos antes, los valores singulares de X estan dados en pares,para todo autovalor real positivo hay un autovalor real negativo, ademas de los posiblesautovalores nulos. Si la dimension de n es impar entonces cero tambien es un autovalor y lacondicion σ (SQSP ) = eiθ, e−iθ no se puede satisfacer. Si la dimension de n es par, es unacondicion necesaria para la unicidad, que dim(R(p)) = dim(N(P )).

Proposicion 5.5.5. Dados P,Q ∈ Gn tales que ‖P −Q‖ < 1/√

2, y t ∈ (0, 1), el conjunto

Mt(P,Q) = R ∈ U(n) : d∞(P,R) = t d∞(P,Q) y d∞(R,Q) = (1− t) d∞(P,Q)

es geodesicamente convexo.

Departamento de Matematica - UNLP Hoja 90 de 105

Page 95: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Demostracion. Por la Proposicion 5.4.3, si d(SP , SQ) < π/2, entonces el conjuntoMt(SP , SQ)es geodesicamente convexo. Como d(SP , SQ) < π/2 es equivalente a ‖SP − SQ‖ <

√2, en-

tonces

‖P −Q‖ =1

2‖2P − 2Q‖ =

1

2‖(2P − 1)− (2Q− 1)‖ =

1

2‖SP − SQ‖ <

1

2

√2,

implica que Mt(P,Q) es geodesicamente convexo.

Departamento de Matematica - UNLP Hoja 91 de 105

Page 96: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

6 Apendice

6.1 Analisis matricial

En este capıtulo vamos a recordar algunas definiciones, resultados y demostraciones (oideas de demostracion) que utilizamos a lo largo del texto sobre matrices. El objetivo de estaseccion es hacer que la tesis sea de alguna manera autocontenida, o que el lector tenga lasherramientas para buscar en la bibliografıa, los trabajos pertinentes.

En esta seccion estudiaremos las relaciones de mayorizacion entre vectores reales asocia-dos a matrices. Particularmente a vectores de autovalores, de valores singulares y a diagonalesde matrices. A su vez estudiaremos la relacion entre funciones Gauge simetricas y normasunitariamente invariantes.

Si bien la mayorizacion aparece como una forma de comparar vectores de Rn, cuando sela piensa en vectores de autovalores o de valores singulares, se percibe rapidamente que esuna nocion intrınsecamente relacionada con la teorıa de matrices.

Definicion. Decimos que x esta mayorizada por y, y lo simbolizamos como x ≺ y, si

k∑j=1

x↓j ≤k∑j=1

y↓j ,

para todo 1 ≤ k ≤ n, yn∑j=1

x↓j =n∑j=1

y↓j .

Si solamente se cumple la primer condicion decimos que esta mayorizada debilmente y lonotamos x ≺w y.

El primer resultado que mencionamos es debido a Schur y relaciona la diagonal de unamatriz con sus autovalores.

Teorema 6.1.1. (Teorema de mayorizacion de Schur) Sea A ∈ H(n). Utilizando la notaciond(A) = (a11, . . . , ann) ∈ Rn, se tiene que

d(A) ≺ λ(A).

Idea de la demostracion. Para demostrar que d(A) ≺ λ(A) es suficiente probar qued(A) = Bλ(A), para cierta matriz B doble estocastica. Como A ∈ H(n), si D = diag(λ(A)),

Page 97: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

existe U ∈ U(n) tal que A = U∗DU . Mediante cuentas elementales de matrices, se puedeverificar que cada entrada de A tiene la expresion:

aij =n∑k=1

ukiλkukj,

donde i, j ∈ In. En particular

aii =n∑k=1

λk|uki|2.

Consideremos ahora la matriz B = (|uji|2)ij que, por ser U unitaria, es doble estocastica.Ademas, un calculo sencillo, muestra que d(A) = Bλ(A).

A continuacion recordamos la nocion de funcion Gauge simetrica.

Definicion. Una funcion Φ : Rn → R+ es una funcion Gauge simetrica si

1. Φ es una norma.

2. Φ(Px) = Φ(x) para todo x ∈ Rn y P permutacion.

3. Φ(ε1x1, . . . , εnxn) = (x1, . . . , xn) si εj = ±1.

4. Φ(1, 0, . . . , 0) = 1.

Ejemplo. Si las coordenadas de x estan ordenadas de manera que |x1| ≥ |x2| ≥ . . . ≥ |xn|,entonces para todo k = 1, . . . , n, la funcion

Φ(k)(x) =k∑j=1

|xj|,

es una funcion Gauge simetrica. Vamos a usar la notacion ‖x‖(k) para esta funcion.

Proposicion 6.1.2. Para todo k = 1, . . . , n,

Φ(k)(x) = mın

Φ(n)(u) + kΦ(1)(v) : x = u+ v.

Idea de la demostracion. Podemos suponer, sin perdida de generalidad, que x ∈ Rn+. Si

x = u+ v,Φ(k)(x) ≤ Φ(k)(u) + Φ(k)(v) ≤ Φ(n)(u) + kΦ(1)(v).

Si elegimos

u = (x↓1 − x↓k, x↓2 − x↓k, . . . , x↓k − x↓k, 0, . . . , 0);

v = (x↓k, . . . , x↓k, x

↓k+1, x

↓n),

entonces

u+ v = x↓;

Φ(k)(u) = Φ(k)(x) + kx↓k;

Φ(1)(v) = x↓k,

y obtenemos el resultado.

Departamento de Matematica - UNLP Hoja 93 de 105

Page 98: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Definicion. Una norma es unitariamente invariante en el espacio de matrices Mn(C),y la notamos por |||·|||, si para todo U, V ∈ U(n),

|||UAV ||| = |||A||| .

Estas normas son muy utiles en analisis. Vamos a normalizar tales normas de modo talque tomen el valor 1 en la matriz diag(1, 0, . . . , 0). Hay una conexion que proveen los valoressingulares entre estas normas y las funciones Gauge simetricas.

Teorema 6.1.3. Dada una funcion Gauge simetrica Φ en Rn, definimos una funcion enMn(C) dada por

|||A|||Φ = Φ(s(A)).

Entonces, esto define una norma unitariamente invariante en Mn(C). Recıprocamente, todanorma unitariamente invariante |||·||| en Mn(C), define una funcion en Rn por

Φ|||·|||(x) = |||diag(x)||| , (6.1.1)

donde diag(x) es la matriz diagonal con entradas x1, x2, . . . , xn en su diagonal. Esto defineuna funcion Gauge simetrica en Rn.

Idea de la demostracion. Como s(UAV ) = s(A) para todo U, V unitarios, |||·|||Φ esunitariamente invariante. Vamos a probar que obedece la desigualdad triangular, pues, lasotras condiciones que debe cumplir una norma son faciles de probar. Para esto, recordar lamayorizacion

s(A+B) ≺w s(A) + s(B),

para todo A,B ∈ Mn(C). Por ultimo usar el hecho que Φ es monotona. Recıprocamen-te, notar que (6.1.1) nos da una norma en Rn. Como las matrices diagonales de la formadiag(eiθ1 , . . . , eiθn) y las matrices de permutacion son todas unitarias, esta norma es abso-lutamente invariante e invariante por permutaciones, y por lo tanto es una funcion Gaugesimetrica.

Dos clases de normas unitariamente invariantes especialmente importantes son:

1. las normas Schatten p definidas como

‖A‖p = Φp(s(A)) =

(n∑j=1

(sj(A))p

)1/p

,

donde 1 ≤ p <∞, y

‖A‖∞ = Φ∞(s(A)) = s1(A) = ‖A‖sp .

2. Las normas Ky- Fan k, definidas como

‖A‖(k) =k∑j=1

sj(A),

donde 1 ≤ k ≤ n.

Departamento de Matematica - UNLP Hoja 94 de 105

Page 99: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Proposicion 6.1.4. Para todo k = 1, . . . , n,

‖A‖(k) = mın‖B‖(n) + k ‖C‖sp : A = B + C

.

Demostracion. Si A = B + C, entonces

‖A‖(k) ≤ ‖B‖(k) + ‖C‖(k) ≤ ‖B‖(k) + k ‖C‖sp .

Sea s(A) = (s1, . . . , sn) y elegimos matrices unitarias U, V tales que

A = U [diag(s1, . . . , sn)]V.

Sean

B = U [diag(s1 − sk, s2 − sk, . . . , sk − sk, 0 . . . , 0)]V ;

C = U [diag(sk, . . . , sk, sk+1, . . . , sn)].

LuegoA = B + C,

por lo tanto

‖B‖(n) =k∑j=1

sj − ksk = ‖A‖(k) − ksk.

Por otro lado‖C‖sp = sk.

En consecuencia‖A‖(k) = ‖B‖(n) + k ‖C‖sp .

Teorema 6.1.5. Para matrices A,B ∈Mn(C), tenemos la mayorizacion

|s(A)− s(B)| ≺w s(A−B).

Idea de la demostracion. Elegimos cualquier ındice k = 1, 2, . . . , n y lo fijamos. Por laProposicion 6.1.4, existen X, Y ∈Mn(C) tales que

A−B = X + Y,

y‖A−B‖(k) = ‖X‖(n) + k ‖Y ‖sp .

Definimos

α = s(X +B)− s(B);

β = s(A)− s(X +B).

Luegos(A)− s(B) = α + β.

Departamento de Matematica - UNLP Hoja 95 de 105

Page 100: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Por lo tanto, por la Proposicion 6.1.2, por

Φ(1)(s(A)− s(B)) ≤ Φ(1)(s(A−B)),

y porn∑j=1

∣∣∣λ↓j(A)− λ↓j(B)∣∣∣ ≤ ‖A−B‖(n) ,

tenemos

Φ(k)(s(A)− s(B)) ≤ Φ(n)(α) + kΦ(1)(β)

= Φ(n)(s(X +B)− s(B)) + kΦ(1)(s(A)− s(X +B))

≤ ‖X‖(n) + k ‖A− (X +B)‖sp= ‖X‖(n) + k ‖Y ‖sp= ‖A−B‖(k)

Teorema 6.1.6. Sean A,B matrices Hermitianas y sea Φ una funcion Gauge simetrica enRn. Entonces

Φ(λ↓(A)− λ↓(B)) ≤ Φ(λ(A−B)) ≤ Φ(λ↓(A)− λ↑(B)).

Demostracion. Ver, por ejemplo, Teorema III.4.4-Bhatia- Matrix Analysis [10].

Proposicion 6.1.7. Sea t 7→ A(t) una funcion continua de un intervalo I al espacio dematrices n× n. Entonces existen funciones continuas, λ1(t), . . . , λn(t) que, para todo t ∈ I,son los autovalores de A(t).

Demostracion. Ver, por ejemplo, Corolario VI.I.6-Bhatia- Matrix Analysis [10].

6.2 Geometrıa de las matrices positivas

Dado un intervalo [a, b] ⊂ R y una curva suave a trozos α : [a, b] → P(n), podemosdefinir la longitud de curva por

L(α) =

∫ b

a

∥∥α−1/2(t)α(t)α−1/2(t)∥∥

2dt. (6.2.1)

La norma que consideramos es la norma Frobenius de estas matrices, es decir, ‖A‖2 =(tr(A∗A))1/2. La distancia rectificable entre A,B ∈ P(n) esta dada por

δ2(A,B) = ınf L(α) donde α : [a, b]→ P(n) une A con B en P(n) . (6.2.2)

En esta seccion vamos a ver que el ınfimo se alcanza en una unica curva que une A con B.Esta curva se llama la geodesica de A a B.

Departamento de Matematica - UNLP Hoja 96 de 105

Page 101: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Proposicion 6.2.1. Sean A y B matrices conmutativas en P(n). Entonces la funcion ex-ponencial envıa el segmento que une log(A) con log(B) en H(n) en la geodesica que une Acon B en P(n). En este caso,

δ2(A,B) = ‖log(A)− log(B)‖2

Demostracion. Es suficiente probar que la curva,

γ(t) = exp((1− t)log(A) + tlog(B)),

donde t ∈ [0, 1], es la unica curva minimal que une A con B en el espacio (P(n), δ2). ComoA conmuta con B entonces γ(t) = A1−tBt y γ

′(t) = (log(A)− log(B))γ(t). Luego

L(γ) =

∫ 1

0

‖log(A)− log(B)‖2 dt = ‖log(A)− log(B)‖2 .

La EMI (Proposicion 6.2.5) nos dice que ninguna curva puede ser mas corta que esta. En-tonces la curva γ bajo esta consideracion es una curva minimal. Supongamos ahora queγ es otra curva que une A con B de igual longitud que γ. Entonces H(t) = log(γ(t)) esuna curva que une log(A) con log(B) en H(n), y nuevamente por la EMI, esta curva tie-ne longitud ‖log(A)− log(B)‖2. Pero en el espacio Euclıdeo los segmentos rectos son las

unicas curvas minimales que unen dos puntos. Entonces H(t) es una reparametrizacion de(1− t)log(A) + tlog(B).

Teorema 6.2.2. Sean A y B dos elementos de P(n). Entonces existe una unica geodesicaA#tB que une A con B. Esta geodesica tiene la parametrizacion

A#tB = A1/2(A−1/2BA−1/2)tA1/2, 0 ≤ t ≤ 1,

la cual es natural en el sentido que

δ2(A,A#tB) = tδ2(A,B),

para todo t ∈ [0, 1]. Mas aun, tenemos que

δ2(A,B) =∥∥log(A−1/2BA−1/2)

∥∥2.

Demostracion. Las matrices I y A−1/2BA−1/2 conmutan. Luego la geodesica que los unetiene la parametrizacion

I#tA−1/2BA−1/2 = (A−1/2BA−1/2)t.

Aplicando la isometrıa ΓA1/2 (donde ΓX(Y ) = X∗Y X) obtenemos la curva

ΓA1/2(I#tA−1/2BA−1/2) = A1/2(A−1/2BA−1/2)tA1/2.

Como ΓA1/2 es una isometrıa, la curva es una geodesica que une A con B. Usando la Propo-sicion 6.2.1 vemos que

δ2(A,B) = δ2(I, A−1/2BA−1/2)

=∥∥log(I)− log(A−1/2BA−1/2)

∥∥2

=∥∥log(A−1/2BA−1/2)

∥∥2.

Departamento de Matematica - UNLP Hoja 97 de 105

Page 102: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Por ultimo veamos una demostracion sencilla de este hecho que utilizamos en la motiva-cion del capıtulo 3.

Proposicion 6.2.3. Sean A y B dos elementos de P(n), y sea

f(X) = δ22(A,X) + δ2

2(B,X).

Entonces la funcion f es estrictamente convexa en P(n), y tiene un unico mınimo en elpunto X0 = A#1/2B.

Demostracion. La convexidad de la funcion f se prueba a partir de la convexidad de lafuncion

g(X) = δ22(A,X).

Es decir,g(X1#tX2) ≤ (1− t)g(X1) + tg(X2),

lo cual se prueba primero para t = 1/2, luego para los numeros diadicos y por ultimo secompleta al intervalo [0, 1]. Por la desigualdad del semiparalelogramo

δ2(A#1/2B,X) ≤ 1

2f(X)− 1

4δ2(A,B) =

1

2f(X)− 1

4f(A#1/2B).

Luegof(A#1/2B) ≤ f(X)− 2δ2(A#1/2B,X).

Esto prueba que f tiene un unico mınimo en X0 = A#1/2B.

Algunas de las demostraciones anteriores (Capitulo 4) se pueden generalizar de ‖ · ‖2 atodas las normas Schatten p, ‖ · ‖p e incluso a las normas unitariamente invariante |||·|||.Teorema 6.2.4. Para toda norma unitariamente invariante tenemos∣∣∣∣∣∣A1/2XB1/2

∣∣∣∣∣∣ ≤ ∣∣∣∣∣∣∣∣∣∣∣∣∫ 1

0

AtXB1−tdt

∣∣∣∣∣∣∣∣∣∣∣∣ .Idea de la demostracion. Supongamos que A = B y que A es diagonal con entradasλ1, . . . , λn en su diagonal. La matriz A1/2XA1/2 se obtiene de

∫ 1

0AtXB1−tdt de multiplicarla

entrada a entrada con la matriz Y cuyas entradas son

yij =λ

1/2i λ

1/2j (log(λi)− log(λj))

λi − λj.

Esta matriz es congruente con la matriz de entradas

zij =log(λi)− log(λj)

λi − λj.

Notar que esta matriz es positiva, por lo cual, obtenemos el resultado para A = B. Por otrolado, es suficiente probar este caso para obtener el caso general.

Proposicion 6.2.5. (IEMI generalizada) Para todo H y K en H(n) tenemos∣∣∣∣∣∣e−H/2DeH(K)e−H/2∣∣∣∣∣∣ ≥ |||K||| ,

para toda norma unitariamente invariante.

Departamento de Matematica - UNLP Hoja 98 de 105

Page 103: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Demostracion. Como K = eH/2(e−H/2Ke−H/2)eH/2,

|||K||| =∣∣∣∣∣∣eH/2(e−H/2Ke−H/2)eH/2

∣∣∣∣∣∣ ≤ ∣∣∣∣∣∣∣∣∣∣∣∣∫ 1

0

etH(e−H/2Ke−H/2)e(1−t)Hdt

∣∣∣∣∣∣∣∣∣∣∣∣ =

=

∣∣∣∣∣∣∣∣∣∣∣∣e−H/2(∫ 1

0

etHKe(1−t)Hdt

)e−H/2

∣∣∣∣∣∣∣∣∣∣∣∣ =∣∣∣∣∣∣e−H/2DeH(K)e−H/2

∣∣∣∣∣∣ .

Observar que como caso particular tenemos la Proposicion 4.2.9. En la definicion (6.2.1)podemos reemplazar la norma 2 por una norma unitariamente invariante, es decir,

L|||·|||(α) =

∫ b

a

∣∣∣∣∣∣α−1/2(t)α(t)α−1/2(t)∣∣∣∣∣∣ dt.

El analogo de (6.2.2),

δ|||·|||(A,B) = ınfL|||·|||(α) donde α : [a, b]→ P(n) une A con B en P(n)

, (6.2.3)

es una metrica en P(n) invariante por congruencias. La IEMI generalizada lleva a una EMIgeneralizada.

Proposicion 6.2.6. Para todo A,B ∈ P(n),

δ|||·|||(A,B) ≥ |||log(A)− log(B)||| .

Equivalentemente, para toda H,K ∈ H(n),

δ|||·|||(eH , eK) ≥ |||H −K||| .

Muchas normas unitariamente invariantes tiene la propiedad que, en la metrica inducidapor H(n), el segmento recto es la unica geodesica que une dos puntos dados. Si la norma|||·||| tiene esta propiedad, entonces la metrica δ|||·||| en P(n) lo hereda. Las normas Schattenp tiene esta propiedad para 1 < p <∞, pero no para p = 1 o p =∞ (como ya hemos vistoa lo largo del trabajo). Con esta observacion, las demostraciones de esta seccion se puedenprobar en un contexto mas general. En particular, tenemos que

δ|||·|||(A,B) =∣∣∣∣∣∣log(A−1/2BA−1/2)

∣∣∣∣∣∣ .La media geometrica A#B es equidistante de A a B en todas las metricas δ|||·|||. Para ciertasmetricas, tales como las correspondientes a las normas Schatten p para 1 < p < ∞, este esel unico punto medio entre A y B.

6.3 Teorema de Lusin

El proximo teorema es una extension a dominios mas generales del Teorema de Lusinpara funciones a valores reales de valores reales.

Departamento de Matematica - UNLP Hoja 99 de 105

Page 104: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Teorema 6.3.1. (Lusin) Sea (X, τ) un espacio topologico y µ una medida de Borel regular,cerrada y finita en X. Sea (S, d) un espacio metrico separable y sea f una funcion de Borelmedible de X a S. Entonces para todo ε > 0, existe un conjunto cerrado F ⊂ X tal queµ(X \ F ) < ε y la restriccion de f a F es continua.

Demostracion. Sea snn≥1 una conjunto denso contable de S. Para m = 1, 2, . . ., y todox ∈ X, sea fm(x) = sn para el menor n tal que

d(f(x), sn) <1

m.

Entonces fm es medible y esta definida para todo X. Para todo m, sea n(m) suficientementegrande tal que,

µx : d(f(x), sn) ≥ 1/m para todo n ≤ n(m) ≤ 1

2m.

Por regularidad cerrada, para n = 1, . . . , n(m), tomemos un conjunto cerrado Fmn ⊂ f−1m sn

con

µ(f−1m sn \ Fmn) <

1

2mn(m).

Para todo m fijo, los conjuntos Fmn son disjuntos para diferentes valores de n. Sea

Fm =

n(m)⋃n=1

Fmn.

Entonces fm es continua en Fm. Por la eleccion de n(m) y Fmn,

µ(X \ Fm) <2

2m.

Como

d(fm, f) <1

m,

en todo punto, claramente fm → f uniformemente. Para r = 1, 2, . . . , sea

Hr :=∞⋂m=r

Fm.

Entonces Hr es un conjunto cerrado y µ(X \ Hr) ≤ 4/2r. Tomemos un r suficientementegrande tal que 4/2r < ε. Entonces f restringido a Hr es continua, ya que es el lımite uniformede funciones continuas fm en Hr ⊂ Fm para m ≥ r, entonces podemos llamar F = Hr ycompletamos la prueba.

6.4 Centro de masa

Recordar que en el espacio Euclıdeo, el centro de masa de un conjunto finito xini=1, sedefine como

x =1

n(x1 + . . .+ xn).

Departamento de Matematica - UNLP Hoja 100 de 105

Page 105: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

Esta igualdad es equivalente a preguntarse cuando

−→xx1 + . . .+−−→xxn = 0.

Mas importante es la propiedad (descubierta por Appolonius) la cual nos dice que x, es dehecho, el (unico) minimizador de la funcion

f : y 7→n∑i=1

d(y, xi)2.

Esta igualdad se extiende sin problemas a variedades Riemannianas siempre que nos quede-mos dentro de bolas convexas. Dentro de dichas bolas, elegimos un subconjunto compactoA ⊂M , y una distribucion de masa da en A de masa total 1.

Proposicion 6.4.1. (Cartan) La funcion

f : m ∈M 7→ 1

2

∫A

d(m, a)2da,

es estrictamente convexa y alcanza un unico mınimo en un punto llamado centro de masade A para la distribucion da. Mas aun, este punto esta caracterizado por ser el unico cerodel campo vectorial gradiente1

∇f(x) =

∫A

exp−1x (a)da.

Demostracion. Ver por ejemplo [9], Proposicion 11, pag. 264.

1El campo vectorial gradiente ∇f se define como el campo vectorial dual al diferencial df (el cual es una1-forma) en el sentido que

g(∇f, v) = df(v),

para todo vector tangente v.

Departamento de Matematica - UNLP Hoja 101 de 105

Page 106: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Bibliografıa

[1] Alexandrov, A. D.: A theorem on triangles in a metric space and some applications,Trudy Math. Inst. Steklov 38 (1951), 5-23.

[2] Ando T., Li C. K., Mathias R.: Geometric means, Linear Algebra Appl. 385 (2004),305-334.

[3] Andruchow, E., Larotonda, G., The rectifiable distance in the unitary Fredholm group.Polish Acad. Sciences Inst. Mathematics. (2010) vol. 196 p. 151-181

[4] Andruchow, E., Larotonda, G., Recht, L.: Finsler geometry and actions of the p-Schatten unitary groups. Trans. Amer. Math. Soc. 62 (2010), 319-344.

[5] Antezana J., Larotonda G., Varela A., Optimal paths for symmetric actions in theunitary group, Comm. Math. Phys. 328 (2014), no. 2, 481–497.

[6] Austin T., A CAT(0) valued pointwise ergodic theorem, J. Topol. Anal. 3 (2011) 145-152.

[7] Ballmann W.: Lectures on spaces of nonpositive curvature. DMV Seminar Band 25,Birkhauser Verlag, Basel.

[8] Ballmann W., Gromov M., Schroeder V.: Manifolds of nonpositive curvature. Progressin Mathematics 61. Birkhauser Boston Inc., Boston, MA

[9] Berger M.: A Panoramic View of Riemannian Geometry, Springer, 2003.

[10] Bhatia R., Matrix analysis. Volume 169 of Graduate texts in mathematics. Springer,1997.

[11] Bhatia R., On the exponential metric increasing property, Linear Algebra Appl. 375(2003) 211–220.

[12] Bhatia R.: Positive Definite Matrices, Princeton Series in Applied Mathematics, Prin-ceton University Press, 2007.

[13] Bhatia R., Holbrook J., Noncommutative geometric means, Math. Intelligencer 28(2006), no. 1, 32–39. MR MR2202893 (2007g:47023)

[14] Bhatia R., Karandikar R.: Monotonicity of the matrix geometric mean. Math. Ann.353(4)(2012) 1453-1467.

Page 107: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

[15] Bini D., Iannazzo B.: Computing the Karcher mean of symmetric positive definitematrices, Linear Algebra Appl. 438 (2013) 1700-1710.

[16] Bini D., Meini B. and Poloni F, an effective matrix geometric mean satisfying theAndo-Li-Mathias properties, Math. Comp. 79 (2010), 437-452.

[17] Bochi J., Navas A.: A geometric path from zero Lyapunov exponents to rotation cocy-cles, Ergodic Theory Dynam. Systems 35 (2015) 374-402.

[18] Bridson M.R. , Haefliger A.: Metric spaces of non-positive curvature, Grundlehren derMathematischen Wissenschaften, 319. Springer-Verlag, Berlin.

[19] Barbaresco F.: Interactions between symmetric cone and information geometries:Bruhat-Tits and Siegel spaces models for higher resolution autoregressive Doppler ima-gery, Emerging Trends in Visual Computing, Lecture Notes in Computer Science 5416(2009) 124-163.

[20] Conde, C. Tesis doctoral: Desigualdades Geometricas e Interpolacion de Operadoresp-Schatten (2008).

[21] Corach, G.; Maestripieri, A. L. Differential and metrical structure of positive operators.Positivity 3 (1999), no. 4, 297–315.

[22] Corach, G.; Porta, H.; Recht, L. A geometric interpretation of Segal’s inequality‖eX+Y ‖ ≤ ‖eX/2eY eX/2‖. Proc. Amer. Math. Soc. 115 (1992), no. 1, 229–231.

[23] Corach G., Porta H. and Recht L., Geodesics and operator means in the space ofpositive operators, Int. J. Math., 4 (1993)

[24] Corach G., Porta H. and Recht L., The geometry of the space of selfadjoint invertibleelements in a C∗-algebra. Integral Equations Operator Theory 16 (1993), no. 3, 333–359.

[25] Davis, C.,Kahan,W.M.: The rotation of eigenvectors by a perturbation. III. SIAM J.Numer. Anal. 7, 1-46 (1970).

[26] Dudley R. M.: Real analysis and probability, Cambridge Studies in Advanced Mathe-matics, 74. Cambridge University Press, Cambridge.

[27] Es-Sahib A., Heinich H.: Barycentre canonique pour un espace metrique a courburenegative, in: Seminaire de Probabilites, in: Lecture Notes in Math., vol. 1709, Springer,Berlin, 1999.

[28] Halmos, P.R.: Two subspaces. Trans. Am. Math. Soc. 144, 381-389 (1969).

[29] Holbrook J.: No dice: a determinic approach to the Cartan centroid, J. RamanujanMath. Soc. 27 (2012) 509-521.

[30] Jost J.: Nonpositive Curvature: Geometric and Analytic Aspects, Lectures in Mathe-matics ETH Zurich, Birkhauser, 1997.

[31] Karcher H.: Riemannian center of mass and mollifier smoothing, Comm. Pure Appl.Math. 30 (1977) 509-541.

Departamento de Matematica - UNLP Hoja 103 de 105

Page 108: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

[32] Lang S., Fundamentals of Differential Geometry, Graduate Texts in Mathematics,Springer-Verlag, 1999.

[33] Larotonda G., The metric geometry of infinite dimensional Lie groups and their ho-mogeneous spaces preprint arXiv:1805.02631

[34] Lawson J., Lim Y.: A general framework for extending means to higher orders, Colloq.Math. 113 (2008) 191-221.

[35] Lawson J., Lim Y.: Monotonic properties of the least squares mean, Math. Ann. 351(2011) 267-279.

[36] Lawson J., Lim Y.: Weighted means and Karcher equations of positive operators, Proc.Natl. Acad. Sci. USA 110 (2013) 15626-15632.

[37] Lawson J., Lim Y.: Karcher means and Karcher equations of positive definite operators,Trans. Amer. Math. Soc. Ser. B1 (2014) 1-22.

[38] Lawson J., Lim Y.: Contractive barycentric maps, J. Operator Theory 77 (2017) 87-107.

[39] Lee J., Naor A.: Extending Lipschitz functions via random metric partitions, Invent.Math. 160 (2005) 59-95.

[40] Lim Y., Geometry of midpoint sets for Thompson’s metric, Linear Algebra Appl. 439(2013), 211-227.

[41] Lim Y.: Riemannian distances between Geometric means. SIAM J. Matrix Anal. Appl.34 (2013), 932-945.

[42] Lim Y., Palfia M.: Matrix power mean and the Karcher mean, J. Funct. Anal. 262(2012) 1498-1514.

[43] Lim Y., Palfia M.: Weighted deterministic walks and no dice approach for the leastsquares mean on Hadamard spaces, Bull. Lond. Math. Soc. 46 (2014) 561-570.

[44] Lim Y., Palfia M.: Approximations to the Karcher mean on Hadamard spaces viageometric power means, Forum Math. 27 (2015) 2609-2635.

[45] Mendel M., Naor A.: Spectral calculus and Lipschitz extension for barycentric metricspaces, Anal. Geom. Metr. Spaces 1 (2013) 163-199.

[46] Moakher M., Zerai M.: The Riemannian geometry of the space of positive-definitematrices and its application to the regularization of positive-definite matrix-valueddata, J. Math. Imaging Vision 40 (2011) 171-187.

[47] Montgomery D., Zippin L.: Topological transformation groups. Interscience Publishers(1955) Geometry, Algebraic - 282 hojas.

[48] Navas A.: An L1 ergodic theorem with values in a non-positively curved space via acanonical barycenter map, Ergodic Theory Dynam. Systems 33 (2013) 609-623.

Departamento de Matematica - UNLP Hoja 104 de 105

Page 109: UNIVERSIDAD NACIONAL DE LA PLATA - UNLPdemetrio/Monografias/Tesis... · UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS EXACTAS DEPARTAMENTO DE MATEMATICA Trabajo de tesis doctoral:

Trabajo de tesis doctoral Ghiglioni Eduardo

[49] Nussbaum R.D. , Finsler structures for the part metric and Hilbert’s projective me-tric and applications to ordinary differential equations, Differ. Integral Equ. 7 (1994)1649–1707.

[50] Ohta S.: Extending Lipschitz and Holder maps between metric spaces, Positivity 13(2009) 407-425.

[51] Palfia M.: Means in metric spaces and the center of mass, J. Math. Anal. Appl. 381(2011) 383-391.

[52] Pass B.: Uniqueness and Monge solutions in the multimarginal optimal transportationproblem, SIAM J. Math. Anal. 43 (2011) 2758-2775.

[53] Pass B.: Optimal transportation with infinitely many marginals, J. Funct. Anal. 264(2013) 947-963.

[54] H. Porta, L. Recht, Minimality of geodesics in Grassmann manifolds, Proc. Amer.Math. Soc. 100 (1987), 464-466.

[55] Reshetnyak Y. G.: (1968): Inextensible mappings in a space of curvature no greaterthan K. Sib. Math. Jour. 9, 683-689

[56] Sturm K.-T.: Probability measures on metric spaces of nonpositive curvature, in: P.Auscher, et al. (Eds.), Heat Kernels and Analysis on Manifolds, Graphs, and MetricSpaces, in: Contemp. Math., vol. 338, Amer. Math. Soc. (AMS), Providence, 2003.

[57] Tao T.: Poincare’s legacies: pages from year two of a mathematical blog (Volume I,Volume II) American Mathematical Society.

[58] Thompson, R.C.: Convex and concave functions of singular values of matrix sums.Pacific J.Math. 66(1), 285–290 (1976)

[59] Thompson, R.C.: Matrix type metric inequalities. Linear Multilinear Algebra 5(4),303–319 (1977/78)

[60] Thompson, R.C.: Proof of a conjectured exponential formula. Linear Multilinear Al-gebra 19(2), 187–197 (1986)

[61] Warner F. W. , Foundations of differentiable manifolds and Lie groups, Graduate Textsin Mathematics 94, Springer-Verlag, New York-Berlin, 1983.

Departamento de Matematica - UNLP Hoja 105 de 105