notas de clase: relatividad general

105
Fundamentos de Relatividad Gerneral Juan Manuel Tejeiro Sarmiento Profesor Titular Observatorio Astronómico Nacional Facultad de Ciencias Universidad Nacional de Colombia Agosto de 2004

Upload: pline116

Post on 02-Aug-2015

401 views

Category:

Documents


11 download

TRANSCRIPT

Page 1: Notas de clase: relatividad general

Fundamentos de Relatividad Gerneral

Juan Manuel Tejeiro Sarmiento Profesor TitularObservatorio Astronómico Nacional Facultad de Ciencias

Universidad Nacional de Colombia

Agosto de 2004

Page 2: Notas de clase: relatividad general

ii

Page 3: Notas de clase: relatividad general

Índice general

Introducción VII

I Geometría diferencial 1

1. Fundamentos matemáticos 31.1. Espacios topológicos . . . . . . . . . . . . . . . . . . . . . . . 31.2. Espacios métricos . . . . . . . . . . . . . . . . . . . . . . . . . 51.3. Espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . 7

2. Variedades 152.1. Variedades diferenciales . . . . . . . . . . . . . . . . . . . . . 152.2. Espacio tangente . . . . . . . . . . . . . . . . . . . . . . . . . 192.3. TENSORES . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.4. Transformaciones entre variedades . . . . . . . . . . . . . . . 332.5. Cálculo en variedades . . . . . . . . . . . . . . . . . . . . . . 36

2.5.1. Derivada de Lie . . . . . . . . . . . . . . . . . . . . . . 392.5.2. Conexión y derivada covariante . . . . . . . . . . . . . 412.5.3. Transporte paralelo . . . . . . . . . . . . . . . . . . . 442.5.4. Tensor de Riemann . . . . . . . . . . . . . . . . . . . . 482.5.5. Tensor métrico . . . . . . . . . . . . . . . . . . . . . . 502.5.6. Relación entre conexión y métrica . . . . . . . . . . . 532.5.7. Campos de Killing . . . . . . . . . . . . . . . . . . . . 55

II Relatividad General 59

3. Los postulados de la relatividad general 613.1. La ley de gravitación universal . . . . . . . . . . . . . . . . . 613.2. Postulados de la TGR . . . . . . . . . . . . . . . . . . . . . . 64

iii

Page 4: Notas de clase: relatividad general

iv ÍNDICE GENERAL

3.3. El tensor métrico y el postulado de causalidad . . . . . . . . . 663.4. Ecuaciones de campo de Einstein . . . . . . . . . . . . . . . . 73

4. La solución de Schwarzschild 774.1. Métrica para simetría esférica . . . . . . . . . . . . . . . . . . 77

4.1.1. Teorema de Birkhoff . . . . . . . . . . . . . . . . . . . 844.1.2. Características de la solución de Schwarzschild . . . . 86

4.2. Pruebas clásicas de la relatividad general . . . . . . . . . . . 884.2.1. Corrimiento del perihelio de Mercurio . . . . . . . . . 884.2.2. Desviación de la luz por el sol . . . . . . . . . . . . . . 95

Page 5: Notas de clase: relatividad general

Prefacio

Notas de clase para el curso de Galaxias y Cosmología.

v

Page 6: Notas de clase: relatividad general

vi PREFACE

Page 7: Notas de clase: relatividad general

Introducción

En este libro se presentarán los fundamentos de la teoría general de larelatividad. La primera parte está dedicada a la fundamentación matemáticanecesaria para la formulación rigurosa de la teoría general de la relatividad.En la segunda parte formularemos los postulados de la relatividad y suaplicación a los agujeros negros. La tercera parte está centrada en el modeloestandar de la cosmología.

vii

Page 8: Notas de clase: relatividad general

viii INTRODUCCIÓN

Page 9: Notas de clase: relatividad general

Parte I

Geometría diferencial

1

Page 10: Notas de clase: relatividad general
Page 11: Notas de clase: relatividad general

Capítulo 1

Fundamentos matemáticos

1.1. Espacios topológicos

En esta sección se darán algunas definiciones fundamentales sobre espa-cios topológicos y espacios métricos.

Definicion 1 Definición 1.1 Un espacio topológico T es una pareja (T,A),con T un conjunto y A una familia de subconjuntos de T , llamados los abier-tos, tales que:

T-1: φ, T ∈ A, es decir, el vacío φ y todo el conjunto T son abiertos.T-2: Dada cualquier colección de abiertos aα ∈ A,con α ∈ I, siendo I

un conjunto de índices, entonces ∪α∈Iaα ∈ A, es decir, unión arbitraria deabiertos es un abierto.

T-3: Dada cualquier colección finita de abiertos ai ∈ A, i = 1, 2, ..., n,entonces ∩ni=1ai ∈ A, es decir, intersección finita de abiertos es abierto.

A la familia de abiertos A se le llama la topología de T . Claramente atodo conjunto se le puede asociar una topología, pues basta con definir comolos abiertos de T a cualquier subconjunto de T . Esta topología es conocidaen la literatura como la topología discreta. Otra posibilidad para definiruna topología sobre cualquier conjunto es la llamada topología trivial, cuyosabiertos se reducen al conjunto vacío y a todo el espacio. Estos dos casosextremos de espacios topológicos no son de utilidad práctica, pero nos sirvenpara ilustrar situaciones y conceptos especiales que surgen en el estudio delos espacios topológicos. Un ejemplo no trivial de una topología lo constituyelos números reales R con la llamada topología usual, en donde los abiertosestán conformados por todos los intervalos abiertos de la forma (a, b) ⊂ R,con la identificación (a, a) = φ y (−∞,∞) = R.

3

Page 12: Notas de clase: relatividad general

4 CAPÍTULO 1. FUNDAMENTOS MATEMÁTICOS

Definicion 2 Sean T y R espacios topológicos. Una función

f : T −→ R (1.1)

se dice continua, si para cualquier abierto b de R, la imagen inversa f−1(b)es un abierto de T .

Más adelante relacionaremos esta definición de continuidad, con la defini-ción usualmente utilizada en espacios métricos, cuando relacionemos la es-tructura topológica de un espacio con su estructura métrica.

Definicion 3 Sean T y R espacios topológicos. Una función

ϕ : T −→ R (1.2)

se llama un homeomorfismo, si la función ϕ es continua con inversa

ϕ−1 : R −→ T (1.3)

continua.

Así, todo homeomorfismo ϕ entre espacios topológicos transforma abier-tos de un espacio topológico en abiertos del otro espacio, y en este caso dire-mos que los dos espacios topológicos son homeomorfos. Veamos dos ejemplosque ilustran porqué los espacios topológicos extremos, el discreto y el trivial,no son de interes práctico. Dada una función

ϕ : T −→ R (1.4)

con R un espacio topológico cualquiera y T el espacio topológico discreto,entonces toda función ϕ es trivialmente continua, pues dado cualquier abier-to de R su imagen inversa es un subconjunto de T , que por definición esun abierto, mientras que si T tiene la topología trivial, entonces ningunafunción ϕ es continua, dado que los únicos abiertos de T son el vacío y todoel espacio.

Definicion 4 Un espacio topológico T se llama de Hausdorf o separable, sipara todo par de puntos p, q ∈ T , con p 6= q, existen abiertos U y V de T ,con p ∈ U y q∈ V tal que U ∩V = φ.

Claramente el espacio topológico discreto es de Hausdorff, así como losnúmeros reales con la topología usual, mientras que un espacio topológicocon la topología trivial no es un espacio topológico de Hausdorff.

Page 13: Notas de clase: relatividad general

1.2. ESPACIOS MÉTRICOS 5

Definicion 5 Sea T un espacio topológico y C ⊂ T un subconjunto cualquierade T . Un recubrimiento abierto de C es una colección de abiertos aα de Tcon α ∈ I, siendo I un conjunto de índices, tal que C ⊂ ∪α∈Iaα.

Definicion 6 Un subconjunto C ⊂ T , de un espacio topológico T se llamacompacto, si dado cualquier recubrimiento abierto de C, existe un subre-cubrimiento finito ai, i = 1, 2, ..., n de C, esto es C ⊂ ∪ni=1aα.

Definicion 7 Un subconjunto A ⊂ T , de un espacio topológico T se llamacerrado, si su complemento, i.e., T \A, es abierto.

Claramente, dependiendo de la estructura topológica del espacio, hayconjuntos que son abiertos y cerrados a la vez, por ejemplo cualquier sub-conjunto de un espacio topológico discreto. También existen subconjuntosque no son ni abiertos ni cerrados, por ejemplo, en los reales con la topologíausual, cualquier intervalo semicerrado, es decir de la forma [a, b) o (a, b], noes abierto ni cerrado. Ahora, en todo espacio topológico el vacío y todo elespacio son subconjuntos abiertos y cerrados a la vez, pues ellos son mutua-mente complementarios. Se puede mostrar que en un espacio topológico deHausdorff los únicos conjuntos abiertos y cerrados simultáneamente son elvacío y todo el espacio.

En el espacio de los números reales R con la topología usual, cualquierintervalo cerrado de la forma [a, b] es compacto, mientras que cualquier in-tervalo abierto no lo es. Más generalmente, en R con la topología usual, todosubconjunto cerrado y acotado es compacto.

En la siguiente sección se darán las definiciones fundamentales de espa-cios métricos y su relación con la estructura topológica.

1.2. Espacios métricos

Definicion 8 Un espacio métrico M es un conjunto de puntos con unafunción, llamada métrica,

d : M×M −→ R(x, y) 7−→ d(x, y)

(1.5)

tal que:M-1: ∀x, y ∈M, se tiene que d(x, y) ≥ 0, y d(x, y) = 0⇐⇒ x = y.M-2: ∀x, y ∈M, se tiene que d(x, y) = d(y, x).M-3: ∀x, y, z ∈M, se satisface la desigualdad triangular, i.e.,

d(x, z) ≤ d(x, y) + d(y, z) (1.6)

Page 14: Notas de clase: relatividad general

6 CAPÍTULO 1. FUNDAMENTOS MATEMÁTICOS

Uno de los ejemplos más importantes de espacio métrico lo constituyeRn con la llamada métrica usual, o euclideana, definida como:

d(x, y) :=p(x1 − y1)2 + · · ·+ (xn − yn)2 (1.7)

en donde x = (x1, ..., xn), y = (y1, ..., yn). Sobre Rn también es posibledefinir otras métricas, de hecho infinitas métricas, pues la función

dp(x, y) =

ÃnXi=1

(xi − yi)p

!1/p(1.8)

para cada entero p satisface las propiedaesM−1 aM−3. El caso particularp = 2, corresponde a la métrica usual. Un caso particular de una métrica,definida como d(x, y) = 0 si x = y, y d(x, y) = 1, ∀x 6= y muestra que todoconjunto es metrizable. Esta métrica es trivial y se utiliza solamente paraconstruir contraejemplos.

Definicion 9 Sea M un espacio métrico. Una bola abierta B(x; r) de radior y centro x ∈ M es el conjunto de todos los puntos y ∈ M tales qued(x, y) < r.

Un subconjunto A ⊂ M se llama acotado si para todo par de puntosx, y ∈ A existe un número real positivo r tal que d(x, y) < r. Claramentepara todo conjunto acotado de un espacio métrico se puede construir unabola centrada en cualquiera de los puntos que contenga al conjunto.

Definicion 10 Sean M y N espacios métricos con métricas dM y dN re-spectivamente. Una función f :M → N se dice continua en un punto x ∈Msi dado cualquier real positivo > 0 simpre es posible encontrar un númeroreal δ > 0 tal que dM(y, x) < δ implica que dN (f(x), d(y)) < . Una funciónentre espacios métricos continua con inversa continua se llama un homeo-morfismo.

Para conectar la estructura de espacio métrico con la estructura de es-pacio topológico definamos:

Definicion 11 Sea A ⊂ M , con M un espacio métrico. Entonces A es unsubconjunto abierto deM si ∀x ∈ A existe una bola abierta B(x, r) contenidaen A.

Page 15: Notas de clase: relatividad general

1.3. ESPACIOS VECTORIALES 7

Es fácil probar, entonces, que los abiertos de un espacio métrico satis-facen las propiedades T − 1, T − 2 y T − 3 de la definición 1 y por lo tantodefinen una topología sobre M , llamada la topología inducida. Así, todamétrica induce una topología, pero no toda topología proviene de algunamétrica. Por ejemplo, la métrica trivial d(x, y) = 0 si x = y, y d(x, y) = 1,∀x 6= y induce la topología trivial, pero ninguna métrica induce la topologíadiscreta. Además, la topología usual sobre Rn es la inducida por la métricausual. De esta forma, cuando se trabaja con espacios métricos siempre seasume la topología inducida por la correspondiente métrica.

1.3. Espacios vectoriales

Definicion 12 Un grupo (G, ) es un conjunto de elementos G sobre el cualestá definida una operación interna , es decir, una función de la forma:

: G × G −→ G(g1, g2) 7−→ g = g1 g2

(1.9)

tal queG-1: Exista un elemento e ∈ G, llamado la identidad, con la propiedad

que para todo elemento g ∈ G, se cumpla que e g = g e = g.G-2: Para todo elemento g ∈ G, exista un elemento g−1 ∈ G, llamado el

elemento inverso, tal que: g g−1 = g−1 g = e.G-3: ∀g1, g2, g3 ∈ G se cumple la asociatividad:

g1 (g2 g3) = (g1 g2) g3

En general se tiene que g1 g2 6= g2 g1, y cuando la igualdad se cumplepara todos los elementos del grupo, este se llama un grupo conmutativo.Ejemplos de grupos, los números reales R con la suma, o los números enterosZ con la suma. Otro ejemplo de mucha importancia en física, lo constituye elconjunto de transformaciones de simetría sobre un sistema, con la operaciónde grupo como la composición de transformaciones. Por una operación desimetría sobre un sistema entendemos una transformación que deja invari-ante al sistema. Por ejemplo, consideremos una molécula de amoniaco NH3,constituida por tres átomos de hidrógeno y uno de nitrógeno. La configu-ración espacial de esta molécula es una pirámide cuya base es un triánguloequilátero determinado por los tres hidrógenos y el vértice lo determina elátomo de nitrógeno. Si rotamos esta molécula en un águlo de 120 o de 240

alrededor de un eje que pase por el átomo de nitrógeno y que sea perpendic-ular al plano determinado por los tres hidrógenos, entonces la configuración

Page 16: Notas de clase: relatividad general

8 CAPÍTULO 1. FUNDAMENTOS MATEMÁTICOS

espacial de la molécula no cambia, y se dice que la molécula posee el grupode simetría conformado por los elementos:

G = R(0), R(120), R(240) (1.10)

en donde R(θ) significa rotar la molécula θ alrededor de su eje de simetría.El elemento identidad es R(0) que significa no rotar, el producto de dosrotaciones es otra rotación, R(θ) R(ϕ) = R(θ + ϕ), e identificandoR(0) ≡ R(360), los elementos del grupo R(120) y R(240) son mutua-mente inversos. Este ejemplo lo podemos generalizar al caso de las simetríasde un polígono regular de n lados. En este caso el grupo de simetrías, rota-ciones del polígono alrededor de un eje que pasa por su centro, tiene nelementos:

G = R(0), R(360

n), R(2

360

n) · · ·R((n− 1)360

n) (1.11)

Consideremos ahora el caso límite de un polígono regular de infinitoslados, es decir el círculo. En este caso el grupo de simetrías contiene unnúmero infinito no numerable de elementos y cada uno de los elementosestá representado por una función R(θ) que representa una rotación en unángulo θ, en donde θ es un parámetro que toma valores en el intervalo[0, 360] y de nuevo se ha hecho la identificación R(0) ≡ R(360).

Estos ejemplos de grupos tratados, ilustran los tipos de grupos más co-munes que encontramos en diversas aplicaciones: Grupos con un númerofinito de elementos, como las rotaciones de un polígono regular de n la-dos, o grupos con un número infinito de elementos, pero numerable, comolos enteros con la suma, y grupos con un número infinito no numerable deelementos. Esta última clase de grupos, caracterizados por un parámetrocontinuo (o varios parámetros continuos, como el grupo de rotaciones tridi-mensional) constituyen una clase particular de grupos llamados de Lie, loscuales juegan un papel muy importante en la matemática, y en especial enla física. Volveremos sobre ellos más adelante.

Definicion 13 Un cuerpo o campo (G,+,×) es un conjunto de elementos Gsobre el cual están definidas dos operación internas +, y ×, llamadas sumay multiplicación respectivamente, tal que (G,+) forma un grupo abeliano, yla operación × satisface las siguientes propiedades:

C-1: Exista un elemento 1 ∈ G, llamado la identidad multiplicativa, conla propiedad que para todo elemento g ∈ G, se cumpla que 1×g = g×1 = g.

C-2: Para cualesquiera tres elementos g1, g2, g3 ∈ G, se cumple que lamultiplicación se distribuye sobre la suma, i.e., g1 × (g2 + g3) = g1 × g2 +g1 × g3.

Page 17: Notas de clase: relatividad general

1.3. ESPACIOS VECTORIALES 9

C-3: La multiplicación es asociativa y conmutativa, es decir, ∀g1, g2, g3 ∈G, se cumple que: g1 × g2 = g2 × g1, y g1 × (g2 × g3) = (g1 × g2) × g3 =g1 × g2 × g3.

El ejemplo más común, e importante de un campo lo constituyen losnúmeros reales con la suma y la multiplicación usuales. El concepto de campoes útil para nosotros en el contexto de la siguiente definición:

Definicion 14 Un espacio vectorial V, sobre un campo K, es un conjuntode elementos, llamados vectores, con una operación interna + (suma devectores) tal que:

V-1: La suma de vectores es conmutativa: ∀x, y ∈ V, se tiene que x+y =y + x.

V-2: La suma de vectores es asociativa: ∀x, y, z ∈ V, se tiene que x +(y + z) = (x+ y) + z.

V-3: Existe el vector nulo 0 ∈ V, tal que ∀x ∈ V se cumple 0 + x = x.V-4: ∀x ∈ V, existe el vector −x ∈ V, tal que x+ (−x) ≡ x− x = 0.Esto significa que el conjunto V con la suma de vectores forma un grupo

abeliano. Sobre V está definida una operación externa (multiplicación porun escalar) con el campo K, llamado los escalares, es decir una función dela forma

· : K × G −→ G(λ, g) 7−→ h = λ · g ≡ λg

(1.12)

tal que:V-5: λ(x+y) = λx+λy, para todo par de vectores x, y ∈ V y todo escalar

λ ∈ K.V-6: (α + β)x = αx + βy, para todo vector x, y todo par de escalares

α, β.V-6: α(βx) = (αβ)x, para todo vector x, y todo par de escalares α, β.V-7: 1x = x, 0x = 0 y (−1)x = −x, en donde 1 es la identidad multi-

plicativa de K, 0 ∈ K la identidad aditiva y −1 ∈ K el inverso aditivo de1.

El ejemplo más importante de espacio vectorial es Rn sobre los reales.Para construir otros ejemplos importantes por sus aplicaciones, considere-mos V yW dos espacios vectoriales sobre el cuerpo de los reales, y definamosuna transformación lineal T como una función

T : V −→ Wv 7−→ w = T (v)

(1.13)

Page 18: Notas de clase: relatividad general

10 CAPÍTULO 1. FUNDAMENTOS MATEMÁTICOS

tal que:

T (αv + βu) = αT (v) + βT (u); ∀v, u ∈ V y ∀α, β ∈ < (1.14)

Definamos sobre el conjunto de todas las transformaciones lineales de Ven W, i.e.,

L(V,W) := T : V →W | T es <− lineal (1.15)

una suma y el producto por un real como:

(T1 + T2)(v) := T1(v) + T2(v); ∀T1, T2 ∈ L(V,W) y ∀v ∈ V (1.16)

(αT )(v) := αT (v); ∀T ∈ L(V,W) , ∀v ∈ V y ∀α ∈ < (1.17)

entonces, claramente T1 + T2 y αT también son transformaciones lineales,i.e.,

T1 + T2, αT ∈ L(V,W) (1.18)

y por lo tanto el conjunto L(V,W) con estas operaciones es un espacio vec-torial real. Un caso de particular importancia es el espacio vectorial L(V,<),llamado el espacio vectorial dual de V, que se denota por V∗ y sobre el cualvolveremos más adelante.

Definicion 15 Un conjunto v1, v2,..., vr de r vectores de V, con vi 6= 0,∀i = 1, 2, ..., r, se llama linealmente independiente si dada cualquier combi-nación lineal

rXi=1

αivi = 0 (1.19)

implica que todos los αi = 0.

Definicion 16 Al número máximo de vectores linealmente independientesde V se le lllama la dimensión del espacio vectorial, y por lo tanto formanuna base, i.e., cualquier vector del espacio se puede escribir como una com-binación lineal de estos vectores. Así, si ei, i = 1, 2, ..., n forman una basedel espacio vectorial V entonces todo v ∈ V lo podemos escribir como

v = v1e1 + v2e2 + · · ·+ vnen (1.20)

y los números v1, i = 1, 2, ..., n se le llaman las componentes del vector v enla base ei.

Page 19: Notas de clase: relatividad general

1.3. ESPACIOS VECTORIALES 11

Definicion 17 Sea V un espacio vectorial real. Definamos una norma sobreV como una función

k · k V −→ Rv 7−→ kvk (1.21)

tal que:N-1: kvk > 0, si v 6= 0 y kvk = 0 si v = 0N-2: kλvk =| λ | kvkN-3: kv +wk ≤ kvk+ kwk

Toda norma sobre un espacio vectorial induce una métrica definida por:

d(v,w) := kv − wk (1.22)

La última estructura de gran importacia que se puede definir sobre unespacio vectorial es el producto punto, llamado también producto escalar ointerno:

Definicion 18 Sea V un espacio vectorial real. Definamos un producto in-terno sobre V como una función

h·, ·i V × V −→ Rv,w 7−→ hv,wi (1.23)

tal que:P-1: hv, vi > 0 si v 6= 0 y hv, vi = 0 si v = 0.P-2: hv, wi = hw, viP-3: hλv,wi = λ hv, wiP-4: hv +w, zi = hv, zi+ hw, zi

Las propiedades P-3 y P-4 significan que el producto punto es lineal ensu primera componente, y P-2 implica que también es lineal en la segun-da componente. Dado un producto punto sobre un espacio vectorial real,entonces sobre él se induce una norma definida por:

kvk :=phv, vi (1.24)

y así se induce también una métrica y por ende una topología.Con estas definiciones podemos introducir el concepto de base ortonor-

mal ei i = 1, 2, ..., n de un espacio vectorial, en donde los vectores de labase satisfacen la relación:

hei, eji = δij (1.25)

Page 20: Notas de clase: relatividad general

12 CAPÍTULO 1. FUNDAMENTOS MATEMÁTICOS

siendo δij el delta de Kronecker definido como 1 si i = j y cero en los demáscasos. De la desigualdad triangular, propiedad N-3 de la norma de obtienela desigualdad de Cauchy-Schwarz:

| hv, wi |≤ kvkkwk (1.26)

la cual, a su vez, nos permite definir el concepto de ángulo θ entre dosvectores v y w, a través de la relación:

cos θ :=hv, wikvkkwk (1.27)

lo cual justifica el nombre de base ortonormal, es decir vectores mutuamenteortogonales y de norma unitaria.

Para finalizar esta introducción veamos el concepto de espacio vectorialdual. Para este fin sea L(V,R) el conjunto de todas las transformacioneslineales del espacio vectorial sobre los reales, es decir:

L(V,<) := f : V →< | f es lineal (1.28)

y definamos sobre este conjunto la suma de fuciones y el producto de unnúmero real por una función como:

(f + g)(v) := f(v) + g(v) (1.29)

(λf)(v) := λf(v) (1.30)

∀f, g ∈ L(V,<),∀v ∈ V ∀λ ∈ <, entonces estas dos operaciones definen unaestructura de espacio vectorial real sobre el espacio de funciones L(V,R).Este espacio claramente no es vacío, pues hv, ·i ∈ L(V,R), ∀v ∈ V, en dondehv, ·i significa el producto punto manteniendo la primera componente fija.Para conocer una función f del espacio L(V,R), es necesario conocer lo quela función le hace a cada vector v ∈ V, pero dado que el producto punto eslineal en cada componente, entonces para conocer f es suficiente conocer loque la función le hace a los vectores de una base, pues sea ei i = 1, 2, ..., nuna base ortonormal de V, entonces si v ∈ V tenemos que

v =nXi=1

αiei (1.31)

en donde los coeficientes están dados por las proyecciones del vector v sobrelos vectores de la base, es decir αj = hej , vi, entonces

f(v) = f(nXi=1

αiei) =nXi=1

αif(ei) (1.32)

Page 21: Notas de clase: relatividad general

1.3. ESPACIOS VECTORIALES 13

de esta forma conocer f(v) ∀v ∈ V es equivalente a conocer f(ei) ∀i =1, 2, ..., n. Por otra parte, el teorema de representación de Ritz estableceque para cada función f ∈ L(V,R) existe un vector w ∈ V tal que f(v) =hw, vi, entonces dada una base ortonormal eide V las funciones hej , ·i := e∗idefinen una única base para el espacio L(V,<), llamada la base dual, pues

hw, vi =

*nX

k=1

βkek, v

+=

nXk=1

βk hek, vi (1.33)

=nX

k=1

βk

*ek,

nXi=1

αiei

+=

nXk=1

nXi=1

βkαi hek , ei i

=nX

k=1

nXi=1

βkαiδki =nXi=1

βiαi

En resumen, dado cualquier espacio vectorial real V, existe el espaciovectorial dual V∗, el espacio de las transformaciones lineales de V sobre losreales, con la misma dimensión y dada cualquier base eii=1,...,n de V existeuna única base e∗jj=1,...,n, la base dual, definida por la relación:

he∗k, eii = δki (1.34)

Se puede probar que el dual del dual V∗∗ de un espacio vectorial V esisomorfo al espacio vectorial original y por lo tanto se hace la identificaciónV ≡ V∗∗.

Page 22: Notas de clase: relatividad general

14 CAPÍTULO 1. FUNDAMENTOS MATEMÁTICOS

Page 23: Notas de clase: relatividad general

Capítulo 2

Variedades

2.1. Variedades diferenciales

Definicion 19 Denotemos por Rn el espacio vectorial euclideano, i.e. alconjunto de n-plas (x1, x2, · · ·, xn) con la métrica usual.

Definicion 20 Una función

ϕ : A ⊆ Rn −→ Rm

x 7−→ x0 = ϕ(x)(2.1)

con A abierto de Rn, se llama de clase Cr si las coordenadas x0 = (x01, x02, · ··, x0m) del punto imagen ϕ(x) son funciones r-veces continuamente diferen-ciables. Si la función ϕ es de clase Cr para todo r ≥ 0, entonces se dice queϕ es suave o de clase C∞.

Definicion 21 Sea M un espacio topológico. Definimos una carta coorde-nada Cα = (ϕα, Uα) sobreM como un homeomorfismo:

ϕα : Uα ⊆M −→ Rn

p 7−→ x = ϕα(p)(2.2)

en donde Uα es un abierto deM, x = (x1, · · ·, xn) se llaman las coordenadasdel punto p y n es la dimensión de la carta.

Definicion 22 Sea M un espacio topológico. Un atlas A de clase CrsobreM es una colección de cartas Cα = (ϕα, Uα)α∈I tal que:A-i- Los abiertos Uα cubrenM, i.e.:

M =[α∈I

Uα (2.3)

15

Page 24: Notas de clase: relatividad general

16 CAPÍTULO 2. VARIEDADES

A-ii- Si Uα ∩ Uβ 6= φ entonces

ϕβ ϕ−1α : ϕα(Uα ∩ Uβ) ⊆ Rn −→ ϕβ(Uα ∩ Uβ) ⊂ Rn

x = ϕα(p) 7−→ y = ϕβ(p)(2.4)

es un difeomorfismo de clase Cr.

Las funciones ϕβ ϕ−1α y su inversa ϕα ϕ−1β nos dan las ecuaciones detransformación entre las diferentes coordenadas.

Dos atlas A y B de clase Cr sobre un espacio topológico M se llamancompatibles si la unión de los atlas es de nuevo un atlas de clase Cr, así launión de todos los atlas compatibles sobre un espacio topológico forma una clase de equivalencia de atlas, o un atlas maximal.

Definicion 23 Una Cr−variedad diferenciableM es un espacio topológicode Hausdorff con un atlas maximal.

NOTA 1: Cada Uα es una vecindad coordenada local, es decir, si p ∈Uα ⊂ M, entonces las coordenadas de p son las coordenadas del puntoimagen φα(p) ∈ Rn, asi notaremos φα(p) = (x

1, x2, ..., xn) con xi = xi(p).La condición A-ii exige que las vecindades coordenadas sean compati-

bles, es decir: si p ∈ Uα ∩ Uβ , entonces φα(p) = (x1, x2, ..., xn) y φβ(p) =(x01, x02, ..., x0n) son dos coordenadas diferentes para el mismo punto, y quelas cartas (φα, Uα) y (φα, Uα) estén relacionadas por:

(φα φ−1β )(x01, x02, ..., x0n) = (x1, x2, ..., xn)

(φβ φ−1α )(x1, x2, ..., xn) = (x01, x02, ..., x0n)

Es decir, las coordenadas xi = xi(x0 j) son funciones de clase Cr de lascoordenadas x0 j y viceversa x0 j = x0 j(xi).

NOTA 2: Otro atlas ∆0 sobreM se dice Cr-compatible con ∆, Cr-atlas,sobreM si ∆ ∪∆0 es de nuevo un Cr-atlas sobreM . El atlas consistentede la unión de todos los atlas compatibles con un atlas dado se llama elatlas maximal deM. Así un atlas maximal sobreM es el conjunto de todoslos posibles sistemas coordenados que cubren a M. La compatibilidad deatlas es una relación de equivalencia. Una de estas clases de equivalencia esllamada una estructura diferenciable. Dada una variedadM es interesantepreguntarse si ésta admite una única estructura diferenciable. Milnor en1956 demostró que S7 posee 28 estructuras diferenciales diferentes. En 1984se demostro que Rn admite un número infinito de estructuras diferenciables.

Page 25: Notas de clase: relatividad general

2.1. VARIEDADES DIFERENCIALES 17

NOTA 3: Una Cr-variedad con frontera se define de la misma maneracambiando Rn por 12R

n := x ∈ Rn | xn ≥ 0. El contorno deM, denotadopor ∂M se define como el conjunto de todos los puntos deM cuya imagenbajo φα están sobre el contorno de

12R

n. ∂M es una Cr-variedad sin fronterade dimensión n− 1.

Consideremos algunos ejemplos de variedades diferenciables:

R2 es una variedad bidimensional. Las coordenadas rectangulares (x, y :−∞ < x, y < ∞) cubren todo R2 . Las coordenadas polares (r, θ) cubrensolo la vecindad cordenada (r > 0; 0 < θ < 2π). Así se necesitan por lomenos dos de tales cartas para para cubrir R2..

El cilindro bidimensional C2 es una variedad obtenida a partir de R2identificando los puntos (x, y) con (x + 2π, y). Entonces (x, y) son coorde-nadas en la vecindad (0 < x < 2π,−∞ < y < ∞), así se necesitan por losmenos dos de tales vecindades coordenadas para cubrir C2.. Similarmentela cinta de Möbius es obtenida identificando (x, y) con (x+ 2π,−y)

La 2-esfera unidad S2 : (x1, x2, x3) ∈ R3/ (x1)2 + (x2)2 + (x3)2 = 1es una variedad. Las coordenadas en cada punto de las regiones x1 > 0 yx1 < 0 son:

(x2, x3);−1 < x2 < 1;−1 < x3 < 1

Así se necesitan seis de tales cartas para cubrir S2.Problema:Mostrar que no se puede cubrir S2 con un simple sistema de coordenadas.

Otro ejemplo que generaliza a S2 es la n-esfera definida por

Sn := x ∈ Rn+1 | (x0)2 + (x1)2 + · · ·+ (xn)2 = 1 (2.5)

Para definir una estructura de variedad diferenciable, consideremos el hiper-plano H de Rn+1 definido por x0 = 0, consideremos el atlas definido porlas dos cartas (ϕ1, U1) y (ϕ2, U2), las dos proyecciones estereográficas de lan−esfera sobre este plano H, definidas por:

ϕ1 : U1 = Sn\e0 −→ H ≡ Rn

x 7−→ ϕ1(x) =x−x0e01−xo

(2.6)

ϕ2 : U2 = Sn\−e0 −→ H ≡ Rn

x 7−→ ϕ2(x) =x−x0e01+xo

(2.7)

en donde e0 = (1, 0, ..., 0) ∈ Sn el ”polo norte ”de la n-esfera y −e0 el polosur. Es decir U1 cubre la esfera menos el polo norte y U2 cubre la esfera

Page 26: Notas de clase: relatividad general

18 CAPÍTULO 2. VARIEDADES

menos el polo sur. Estas dos cartas son C∞ compatibles pues

ϕ2 ϕ−11 (y) =y

kyk ; y ∈ Rn y y 6= 0 (2.8)

No es difícil probar que la variedad Sn, a diferencia de Rn requiere porlo menos dos cartas coordenadas para cubrir la variedad.

Definicion 24 Una variedadM se dice orientable si existe un atlas

∆ = φα, Uαα∈Λ

tal que en toda intersección no vacia Uα∩Uβ de abiertos, el determinante dela matriz (∂xi/∂x0 j) es positivo, en donde (x1, x2, ..., xn) y (x01, x02, ..., x0n)son coordenadas en Uα y Uβ respectivamente.

Definicion 25 Un atlas ∆ = φα, Uαα∈Λ se dice localmente finito si todopunto p de la variedadM tiene una vecindad abierta la cual intersecta soloun número finito de vecindades Uβ.Una variedadM se llama paracompactasi para todo atlas ∆ = φα, Uαα∈Λ existe un atlas localmente finito Γ =ψβ, Vββ∈Λ con cada Vβ contenido en algún Uα.

En lo sucesivo por variedad entenderemos una Cr-variedad de Hausdorffparacompacta.

A partir de variedades dadas es posible construir nuevas variedades di-ferenciables tomando el producto cartesianos entre ellas, pues dadas M yN variedades suaves de dimensiones m y n respectivamente, y sean A =(Uα, ϕα) y B = (Vβ, ψβ) sus atlas maximales, entonces

M×N := (p, q) | p ∈M, q ∈ N (2.9)

el producto cartesiano es una variedad n+m dimensional, con el atlas max-imal definido como:

C := (Uα × Vβ, ϕα × ψβ) (2.10)

en donde

ϕα × ψβ : Uα × Vβ ⊂M×N −→ Rm ×Rn

(p, q) 7−→ (ϕα(p), ψβ(q))(2.11)

Con esta definición podemos construir otras variedades de interés enfísica, como por ejemplo el cilindro bidimensional R×S1, o el toro S1×S1.

Page 27: Notas de clase: relatividad general

2.2. ESPACIO TANGENTE 19

2.2. Espacio tangente

El concepto de variedad surgió como una generalización de la teoría desuperficies en R3. Así, por una parte se hace necesario generalizar el con-cepto de plano tangente a una superficie, y por otra parte, la noción devector tangente a una variedad nos permitirá generalizar también los con-ceptos de derivadas direccionales en Rn. Existen varios caminos equivalentespara definir el concepto de vector tangente a una variedad. En estas notasseguiremos un camino, que si bien puede parecer abstracto en un comienzo,nos permitirá construir los conceptos necesarios para introducir la nociónde derivada direccional sobre una variedad y de tensor, en una forma másdirecta.

Definicion 26 SeaM una variedad suave n−dimensional y

f : M −→ Rp 7−→ f(p)

(2.12)

una función de valor real definida sobre la variedad. Entonces la función fse dice de clase Ck en un punto p ∈ M si para toda vecindad coordenada(Uα, ϕα) de p la función

fα := f ϕ−1α : ϕα(Uα) ⊂ Rn −→ Rx = ϕα(q) 7−→ fα(x) = f(q)

(2.13)

es de clase Ck en el punto p ∈ Uα ⊂M.

LlamemosF(M,R) := f :M −→ R (2.14)

al conjunto de todas las funciones de valor real definidas sobre la variedad.Sobre este conjunto podemos construir una estructura de espacio vectorialdefiniendo la suma de funciones y el producto de un real por una función enla forma:

(f + g)(p) := f(p) + g(p), ∀f, g ∈ F(M,R),∀p ∈M (2.15)

(λf)(p) := λf(p), ∀f ∈ F(M,R),∀p ∈M,∀λ ∈ R (2.16)

La noción de diferenciabilidad de una función solo tiene sentido parafunciones definidas sobre los reales (más generalmente sobre espacios deBanach) y por esta razón, la definición dada de diferenciabilidad se hacea través de las cartas coordenadas. Por lo tanto, para que esta definición

Page 28: Notas de clase: relatividad general

20 CAPÍTULO 2. VARIEDADES

de diferenciabilidad tenga sentido es necesario mostrar que ella no dependede la carta coordenada utilizada. Así, sea (Uβ, ϕβ) otra carta con p ∈ Uβ,entonces

fβ = f ϕ−1β = f ϕ−1α (ϕα ϕ−1β ) = fα (ϕα ϕ−1β ) (2.17)

dado que las cartas son compatibles, esta relación implica que si la funciónf es diferenciable con respecto a la carta (Uα, ϕα) entonces también lo esrespecto a la carta (Uβ, ϕβ), y viceversa. Esta demostración de la indepen-dencia de las cartas es el ingrediente fundamental para todas las definicionesu operaciones que se realicen sobre una variedad, en las cuales se involucrenlas cartas coordenadas.

Definicion 27 SeaM una variedad suave y p ∈M. Un vector tangente vpa la variedadM en el punto p es una función

vp : F(M,R) −→ Rf 7−→ vp(f)

(2.18)

tal que:T-1: vp es R−lineal, i.e., vp(f +λg) = vp(f)+λvp(g), ∀f, g ∈ F(M,R),

y ∀λ ∈ RT-2: vp es Leibnitziana, i.e., vp(fg) = f(p)vp(g) + vp(f)g(p).

Definamos por TpM al conjunto de todos los vectores tangentes a unpunto p ∈M como el espacio tangente a la variedad en el punto p.

Lemma 28 El espacio tangente TpM es un espacio vectorial real.

Para ver esto basta con definir la suma de vectores y el producto deun escalar (real) por un vector, y mostrar que estas operaciones están biendefinidas, es decir satisfacen las propiedades T-1 y T-2. Sean vp, wp ∈ TpM,entonces definamos la suma y el producto por:

(vp + wp)(f) := vp(f) + wp(f), ∀f ∈ F(M,R) (2.19)

(λvp)(f) := λvp(f), ∀f ∈ F(M,<),∀λ ∈ R (2.20)

La linealidad, propiedad T-1, es directa de probar pues

(vp + λwp)(f + µg) = (vp)(f + µg) + λ(wp)(f + µg) (2.21)

por definición, luego vp+λwp ∈ TpM. Para probar T-2, apliquemos vp+λwp

al producto fg, entonces, por definición de suma de vectores tenemos

(vp + λwp)(fg) = vp(fg) + λwp(fg) (2.22)

Page 29: Notas de clase: relatividad general

2.2. ESPACIO TANGENTE 21

puesto que vp y wp son vectores para los cuales vale T-2, y por lo tanto

(vp + λwp)(fg) = f(p)vp(g) + vp(f)g(p) + λg(p)wp(g) + λwp(f)g(p)(2.23)

= f(p)(vp + λwp)(g) + (vp + λwp)(f)g(p)

como se quería probar.Para mostrar que el espacio tangente tiene la misma dimensión que la

variedad, veamos algunas definiciones y resultados importantes.

Definicion 29 Sea M una variedad suave y (Uα, ϕα) una vecindad coor-denada de p ∈ M, y sea (x1, ..., xn) = ϕα(p) las coordenadas del punto p.Sea f ∈ F(M,R) y definamos la ”derivada parcial ” de la función f conrespecto a las coordenadas xi, i = 1, ..., n en el punto p por

∂if(p) ≡∂f

∂xi(p) :=

∂(fα)

∂xi(ϕα(p)) (2.24)

entonces

Lemma 30 Las funciones

∂xi

¯p

: F(M,R) −→ R (2.25)

son vectores tangentes de TpM.

Para demostrar este lema veamos que las funciones ∂i |psatisfacen T-1 yT-2. Para este fin basta con recordar que las derivadas parciales son linealesy satisfacen la regla del producto. Sean f, g ∈ F(M,R) y λ ∈ R, entoncesde la definición 29 tenemos

∂(f + λg)

∂xi(p) =

∂(fα + λgα)

∂xi(ϕα(p)) (2.26)

=∂(fα)

∂xi(ϕα(p)) + λ

∂(gα)

∂xi(ϕα(p))

=∂f

∂xi(p) +

∂g

∂xi(p)

lo cual prueba la linealidad, en donde en el segundo paso se ha hecho uso dela linealidad de las derivadas parciales. Para la propiedad T-2

∂(fg)

∂xi(p) =

∂(fαgα)

∂xi(ϕα(p)) (2.27)

= fα(ϕα(p))(∂(gα)

∂xi(ϕα(p)) +

∂(fαgα)

∂xi(ϕα(p))gα(ϕα(p))

= f(p)∂(g)

∂xi(p) +

∂(f)

∂xi(p)g(p)

Page 30: Notas de clase: relatividad general

22 CAPÍTULO 2. VARIEDADES

en donde para el tercer paso se ha utilizado la regla de la derivada de unproducto de funciones.

El siguiente resultado muestra que las derivadas parciales ∂f∂xi(p) definidas

en 29 son objetos locales, es decir solo dependen del comportamiento de lasfuciones f en una vecindad del punto p ∈M.

Lemma 31 Sea vp ∈ TpM un vector tangente y f, g ∈ F(M,R), entonces:i.- Si f = g en alguna vecindad del punto p ∈M, entonces vp(f) = vp(g)ii.- Si la función f es constante en una vecindad del punto p entonces

vp(f) = 0.

La prueba de este lema es sencilla pues toda transformación lineal trans-forma el cero en cero, y así

0 = vp(0) = vp(f − g) = vp(f)− vp(g) (2.28)

además, si f = c = cons. entonces como

vp(1) = vp(1 · 1) = 1 · vp(1) + vp(1) · 1 = 2vp(1) (2.29)

se tiene que vp(1) = 0, y por lo tanto

vp(f) = vp(c) = cvp(1) = 0 (2.30)

El siguiente teorema constituye el resultado central de esta sección.

Teorema 32 Sea (Uα, ϕα) una vecindad coordenada de un punto p ∈ M,entonces los vectores coordenados ∂i |p i = 1, 2, ..., n conforman una basepara el espacio tangente TpM.

Así, TpM es un espacio vectorial real de la misma dimensión que la var-iedad. Para probar este resultado veamos primero el concepto de funcionescoordenadas. Las funciones

πi : Rn −→ Rx 7−→ xi

(2.31)

para i = 1, 2, ..., n que a un punto de Rn le asocia su i−ésima coordenada sellaman funciones proyección o funciones coordenadas, las cuales son suaves.Entonces dada una carta (Uα, ϕα) de una variedadM definimos las funcionescoordenadas por

xi : M −→ Rp 7−→ xi(p)

(2.32)

Page 31: Notas de clase: relatividad general

2.2. ESPACIO TANGENTE 23

las cuales asocian a cada punto p de la variedad la coordenada i−ésima bajola carta (Uα, ϕα) pertenecen al espacio de las funciones reales definidas sobrela variedad, i.e., xi ∈ F(M,R). Con esta definición podemos probar que losvectores tangente ∂i |p i = 1, 2, ..., n son linealmente independientes, pues

∂ixj |p=

∂(xjα)

∂xi(ϕα(p)) =

∂xj

∂xi= δji (2.33)

y por lo tanto cualquier combinación lineal nula de los vectores ∂i |pnXi=1

αi∂i |p= 0 (2.34)

al aplicarlas a las funciones coordenadas implican que αi = 0,∀i = 1, 2, ..., n.Falta, entonces, probar que cualquier vector vp ∈ TpM se puede escribircomo una combinación lineal de los vectores coordenados ∂i |p i = 1, 2, ..., n,esto es

vp =nXi=1

vip(xi) ∂i |p≡ vip

∂xi

¯p

(2.35)

en donde en la última igualdad hemos utilizado la convención de suma deEinstein, es decir, toda expresión con dos índices iguales, uno como su-períndice y otro como subíndice implican una suma sobre los valores quetoma el índice. Las cantidades reales vip(x

i) ≡ vip son las componentes delvector tangente en la base coordenada. Para probar esto último haremos usodel siguiente resultado del cálculo. Si F : Rn → R es una función suave en elpunto a, entonces existen n funciones suaves Hk tales que para todo x ∈ Rn

se tiene que

F (x) = F (a) +nX

k=1

(xk − ak)Hk(x) (2.36)

con

Hk(a) =∂F

∂xk

¯x=a

(2.37)

Sea f ∈ F(M,R), entonces, aplicando este resultado a la función fα = f ϕαcon a = ϕα(p) tenemos que para todo q ∈ Uα

f(q) = f(p) +nX

k=1

(xk ϕα(q)− xk ϕα(p))Hk(ϕα(q)) (2.38)

Sea vp ∈ TpM entonces, aplicando el vector tangente vp a la funciónf , usando el último resultado, la linealidad, la propiedad Leibnitziana y la

Page 32: Notas de clase: relatividad general

24 CAPÍTULO 2. VARIEDADES

propiedad ii del Lema 5.3, obtenemos

vp(f) = vp(f(p)) +nX

k=1

[(xk ϕα(q)− xk ϕα(p))¯q=p

vp(Hk ϕα)

+ Hk ϕα|p vp(xk ϕα(q)− xk ϕα(p))]

=nX

k=1

[Hk ϕα(p)]vp(xk ϕα) (2.39)

de la ecuación (2.37) Hk ϕα es justamente ∂if |p y por lo tanto para todafunción f ∈ F(M,R) tenemos que

vp(f) = vip∂f

∂xi

¯p

(2.40)

como se quería probar. Los coeficientes de la expansión vip son los valores dela función vp aplicada a las funciones coordenadas xi.

Otra forma equivalente de introducir los vectores tangente es a travésdel concepto de derivada direccional. Para este fin definamos, primero, elconcepto de curva sobre una variedad.

Definicion 33 Sea M una variedad suave. Una curva suave sobre la var-iedad es una función

λ : I ⊂ R −→ Mt 7−→ λ(t)

(2.41)

en donde I es un intervalo de los reales que contiene al cero y λ(0) = p, ysi (Uα, ϕα) es una vecindad coordenada del punto p, entonces la curva

λα : I ⊂ R −→ Rn

t 7−→ λα(t) = ϕα λ(t)(2.42)

sobre Rn es suave.

Sea un vector tangente vp ∈ TpM con componentes vip = vp(xi) en la

base coordenada (Uα, ϕα), i.e.,

vp = vip∂i |p (2.43)

y definamos una curva λ por la curva en Rn definida como

xi(λ(t)) = xi(p) + tvip (2.44)

Page 33: Notas de clase: relatividad general

2.2. ESPACIO TANGENTE 25

entonces esta curva pasa por el punto p ∈M (i.e., pasa por el punto xi(p) =ϕα(p) ∈ Rn) para t = 0 y en este punto las componentes del vector tangenteson

vip =dxi

dt

¯t=0

(2.45)

así sobre la variedad M la curva pasa por p y tiene vector tangente vp ∈TpM. Sea f ∈ F(M,R) una función de valor real sobre la variedad, entonces

vp(f) = vip∂if |p=dxi

dt

¯t=o

∂f

∂xi

¯p

(2.46)

=dxi(λ(t))

dt

¯t=o

∂f

∂xi

¯p

=∂f

∂t

¯λ

es decir (∂/∂t)λ ∈ TpM y representa la derivada direccional de la función fa lo largo de la curva λ.

De las ecuaciones diferenciales ordinarias se sigue que, dado un vectortangente vp ∈ TpM existe una única curva λ que pasa por el punto p ∈My cuyo vector tangente en el punto p es vp. Así se puede visualizar a unvector tangente vp ∈ TpM como una ”flecha ” en el punto p apuntando enla dirección de una curva λ(t) con vector tangente vp en el punto p = λ(0).En particular, dada una base coordenada para el espacio tangente ∂i |p lascorrespondientes curvas son las curvas coordenadas.

Sea Eαα=1,2,...,n una base para el espacio tangente TpM, entoncescualquier vector v ∈ TpM (en lo sucesivo escribiremos en negrilla los vec-tores) se puede escribir como

v = vαEα (2.47)

en donde vα son las componentes del vector el la base Eα. En particularsi uno escoge los vectores base coordenados ∂i |p entonces las componentesvi = v(xi) son las derivadas de las funciones coordenadas xi en la direccióndel vector v. Definamos, ahora, el espacio vectorial dual de TpM.

Definicion 34 5.4 Sea M una variedad suave y TpM el espacio tangenteen un punto p. Una 1-forma ω (vector covariante cuyo nombre se justificarámás adelante) en el punto p es una función lineal de valor real sobre TpM,i.e.,

ω : TpM −→ Rv 7−→ ω(v) ≡ hω,vi (2.48)

tal que:

Page 34: Notas de clase: relatividad general

26 CAPÍTULO 2. VARIEDADES

i.- hω,x+ zi = hω,xi+ hω, zi ; ∀x, z ∈ TpMii.- hω, αxi = α hω,xi ; ∀x ∈ TpM y ∀α ∈ R.

Esto significa que las 1-formas sobre TpM pertenecen al conjunto deL(V,R), es decir al conjunto de las transformaciones lineales de TpM sobrelos reales, y por tanto las 1-formas ω pertenecen al espacio vectorial dualT ∗pM del espacio tangente. Así, dada una base Eαα=1,2,...,n del espacioTpM existe una única base (dual) Eββ=1,2,...,n del espacio T ∗pM, el cuallo llamaremos espacio cotangente, definida por:D

Eβ,Eα

E= δβα (2.49)

Así, si ω ∈T ∗pM es una 1-forma y x ∈TpM es un vector, entonces

ω = ωβEβ (2.50)

x = xαEα (2.51)

y por lo tanto, aplicando linealidad y la relación 1-2.49, tenemos

hω,xi =DωβE

β, xαEα

E(2.52)

= ωβxαDEβ,Eα

E= ωβx

αδβα

= ωαxα

Definicion 35 Cada función f ∈ F(M) define una 1-forma df en p dadapor:

< df ,X >= Xf , ∀X ∈ TpM. (2.53)

A la 1-forma df la denominaremos la diferencial de f en p.

Si φα(p) = (x1, x2, ..., xn) son las coordenadas locales entonces las difer-

enciales dx1, dx2, ..., dxn en p forman la base de 1-formas dual a la basecoordenada ∂

∂x1|p, ∂

∂x2|p, ..., ∂

∂xn |p de TpM, pués se cumple que:

< dxi,∂

∂xj>= δij (2.54)

En terminos de esta base dxi de T ∗pM la diferencial de una función f ∈F(M) se puede escribir de la siguiente forma:

Page 35: Notas de clase: relatividad general

2.3. TENSORES 27

df =∂f

∂xidxi (2.55)

Observación:Si df 6= 0, entonces las superficies f = cte son variedades de dimensión

n-1. El subespacio de TpM consistente en todos los vectores X tales que< df ,X >=0 está formado por todos los vectores tangentes a las curvas queestán en la superficie f = cte en el punto p. Así df se puede pensar comoperpendicular o normal a la superficie f = cte en p.

2.3. TENSORES

Definicion 36 Definimos el producto cartesiano Πsr de la siguiente forma:

Πsr := T ∗p × T ∗p × T ∗p × · · · × T ∗p| z r−veces

× Tp × Tp × Tp × · · · × Tp| z s−veces

(2.56)

Donde intervienen r factores T ∗p y s factores Tp, es decir:

Πsr = (η1, ...,ηr,Y1, ...,Ys) | ηi ∈ T ∗p , Yj ∈ Tp (2.57)

Definicion 37 Un tensor T del tipo (r, s) en p ∈ M es una funcionalmultilineal sobre Πsr, es decir:

T : Πsr −→ R

(η1, ...,ηr,Y1, ...,Ys) −→ T (η1, ...,ηr,Y1, ...,Ys)

lineal en cada componente.

El espacio de todos los tensores es llamado el producto tensorial T rs :

T rs := T ∗p ⊗ T ∗p ⊗ T ∗p ⊗ · · ·⊗ T ∗p ⊗ Tp ⊗ Tp ⊗ Tp ⊗ · · ·⊗ Tp (2.58)

T rs = f : Πsr → R | f es lineal en todas sus componentes

Donde intervienen r factores T ∗p y s factores Tp.Tenemos que en particularT 10 = Tp y T 01 = T ∗p .

Page 36: Notas de clase: relatividad general

28 CAPÍTULO 2. VARIEDADES

Definicion 38 Sean T y T0 ∈ T rs (p) dos tensores del mismo tipo y defini-

mos la suma por:

(T+T0)(η1, ...,ηr,Y1, ...,Ys) : = T(η1, ...,ηr,Y1, ...,Ys) (2.59)

+T0(η1, ...,ηr,Y1, ...,Ys)

y el producto por un escalar α ∈ R como:

(αT)(η1, ...,ηr,Y1, ...,Ys) := αT(η1, ...,ηr,Y1, ...,Ys) (2.60)

Con estas reglas T rs (p) forma un espacio vectorial real de dimensión r+s.

Sean Xi ∈ Tp (i = 1, ..., r) y ωj ∈ T ∗p (j = 1, ..., s). Denotemos por

X1 ⊗X1 ⊗ · · ·⊗Xr ⊗ ω1 ⊗ ω2 ⊗ · · ·⊗ ωs

al elemento de T rs (p) el cual transforma al elemento (η

1, ...,ηr,Y1, ...,Ys) ∈Πrs en el número

(X1⊗X1⊗ · · ·⊗Xr⊗ω1⊗ω2⊗ · · ·⊗ωs)(η1, ...,ηr,Y1, ...,Ys)(2.61)

: =< η1,X1> · · ·< ηr,Xr>< ω1,Y1> · · ·< ωs,Ys>

Similarmente, si R ∈ T rs (p) y S ∈ T p

q (p), entonces denotaremos porR⊗ S alelemento de T r+p

s+q (p) el cual transforma al elemento (η1, ...,ηs+q,Y1, ...,Yr+p)

en el número real

(R⊗ S)(η1, ...,ηs+q,Y1, ...,Yr+p) (2.62)

: = R(η1, ...,ηs,Y1, ...,Yr)S(ηs+r, ...,ηs+q,Yr+1, ...,Yr+p

Con este producto ⊗ el espacio de los tensores en p forma un álgebra sobreR.

Lemma 39 Sean Eα y Eα bases duales de Tp y T ∗p respectivamente.Entonces

Eα1⊗Eα2⊗ · · ·⊗Eαr⊗Eβ1⊗Eβ2⊗ · · ·⊗Eβs (2.63)

con αi, βi = 1, 2, ...n es una base de Trs (p). De esta forma, dado T ∈ T r

s (p)escribimos:

T = Tα1····αrβ1···βsEα1⊗Eα2⊗ · · ·⊗Eαr⊗Eβ1⊗Eβ2⊗ · · ·⊗Eβs (2.64)

Donde Tα1····αrβ1β2···βs son las componentes de T en esta base.

Page 37: Notas de clase: relatividad general

2.3. TENSORES 29

Usualmente T se llama un tensor r veces contravariante y s veces covari-ante, y las componentes están dadas por:

Tα1····αrβ1···βs = T(E

α1 , ...,Eαr ,Eβ1, ...,Eβs

) (2.65)

El álgebra del espacio vectorial T rs (p) se puede escribir en términos de las

componentes de los tensores en una base dada de la siguiente forma:

(T+ S)α1····αrβ1···βs = Tα1····αrβ1···βs + Sα1····αr

β1···βs (2.66)

(αT)α1····αrβ1···βs = αTα1····αrβ1···βs

y el álgebra del producto ⊗ como:

(T⊗ S)α1····αr+pβ1···βs+q = Tα1····αrβ1···βsS

αr+1····αr+pβs+1···βs+q (2.67)

Si E0α y E0α son otro par de bases duales de Tp y T ∗p , ellas puedenser expandidas en términos de las bases Eα y Eα en la forma:

Eα0 = φ αα0 Eα (2.68)

Eα0 = φα0αE

α (2.69)

Donde φ αα0 y φα

0α son matrices n × n no singulares. Puesto que las bases

E0α y E0α son duales, entonces:

δβ0α0 = < Eβ0 ,Eα0 >=< φβ

0βE

β, φ αα0 Eα > (2.70)

= φβ0βφ

αα0 < Eβ,Eα >= φβ

0βφ

αα0 δ

βα

= φβ0αφ

αα0

Es decir φ αα0 y φ

α0α son matrices mutuamente inversas.

Las componentes de un tensor T ∈ T rs (p) con respecto a las bases E0α

y E0α son:

Tα01····α0r

β01···β0s = T(Eα01 , ...,Eα0r ,Eβ01 , ...,Eβ0s) (2.71)

y están relacionadas con las componentes de T en las bases duales Eα y Eα por:

Tα01····α0r

β01···β0s = φα01α1 · · ·φα

0rαrφ

β1β01

· · ·φ βsβ0s

Tα1····αrβ1···βs (2.72)

Page 38: Notas de clase: relatividad general

30 CAPÍTULO 2. VARIEDADES

Definicion 40 La contracción de un tensor T del tipo (r, s) con compo-nentes Tα1····αr

β1···βs con respecto a las bases duales Eα y Eα sobre elprimer índice contravariante y el primer índice covariante es definido comoel tensor C11(T) del tipo (r− 1, s− 1) cuyas componentes en las bases dadassonTα1····αr

α1β2···βs , es decir:

C11(T) := Tα1····αrα1β2···βsEα2 ⊗ · · ·⊗Eαr⊗Eβ2⊗ · · ·⊗Eβs (2.73)

Veamos que esta operación de contracción es independiente de las basesusadas. Sean E0α y E0α otras bases duales, entonces:

C011 (T) : = Tα01····α0r

α01···β0sEα02 ⊗ · · ·⊗Eα0r⊗Eβ02⊗ · · ·⊗Eβ0s

= Tα01α2····αr

α01β2···βsφα02α2 · · ·φα

0rαrφ

β2β02

· · ·φ βsβ0s

Tα01α2····αr

α01β2···βs ×

×φ γ2α02

· · ·φ γrα0r

φβ02η2 · · ·φ

β0sηsEγ2 ⊗ · · ·⊗Eγr⊗E

η2⊗ · · ·⊗Eηs

= φα02α2φ

γ2α02

· · · φα0rαrφγr

α0rφ

β2β02

φβ02η2φ

βsβ0s

φβ0sηsT

α01α2····αrα01β2···βs ×

×Eγ2 ⊗ · · ·⊗Eγr⊗Eη2⊗ · · ·⊗Eηs

= δγ2

α2 · · · δ γrαr δ

β2η2φ

βsηsT

α01α2····αrα01β2···βsEγ2⊗ · · ·⊗Eγr⊗E

η2⊗ · · ·⊗Eηs

= Tα01α2····αr

α01β2···βsEα2 ⊗ · · ·⊗Eαr⊗Eβ2⊗ · · ·⊗Eβs = C11(T )

Similarmente se define la contracción sobre cualquier par de índices n y m,es decir Cn

m(T ).

Definicion 41 La parte simétrica de un tensor T del tipo (2, 0) es el tensorS(T) ∈ T 20 (p) definido por:

S(T)(η1,η2) : = (2.74)1

2!T(η1,η2) +T(η2,η1);∀η1,η2 ∈ T ∗p

Si denotamos las componentes de S(T)αβ por Tαβ, entonces:

S(T)αβ ≡ T (αβ) = S(T)(Eα,Eβ) (2.75)

=1

2!T(Eα,Eβ) +T(Eβ,Eα)

=1

2!

nTαβ + T βα

o

Page 39: Notas de clase: relatividad general

2.3. TENSORES 31

En general, se pueden definir las componentes simétricas de un tensorT ∈T r

s (p) sobre cualquier número de índices covariantes o contravariantes,de la siguiente manera:

Tα1····αr(β1···βs) :=

1

s!

X(β1···βs)

T α1····αrβ1···βs (2.76)

en donde la suma es sobre todas las permutaciones de los índices β1 · · · βs,por ejemplo:

Tα(βγη) =

1

3!

©Tα

βγη + Tαβηγ + Tα

γ βη + Tαβγη + Tα

η βγ + Tαηγβ

ª(2.77)

Un tensor se llama simétrico con respecto a ciertos índices si él coincidecon su correspondiente parte simétrica, por ejemplo:

Tαβ = T(αβ) ⇐⇒ Tβα = Tαβ (2.78)

Definicion 42 Similarmente a como se define la parte simétrica, definimosla parte antisimétrica A(T) de un tensor T ∈ T 20 (p) por:

A(T)αβ ≡ T [αβ] :=1

2!

nTαβ − T βα

o(2.79)

y más generalmente de cualquier tensor T ∈ T rs (p) como:

T[α1····αr]

β1···βs :=1

r!

X(α1····αr)

(−1)pTα1····αrβ1···βs (2.80)

donde p es el orden de la permutación.

Por ejemplo:

T [βγη] =1

3!T βγη − T βηγ + T γ βη − T βγη + T η βγ − T ηγβ (2.81)

Un tensor se llama antisimétrico en ciertos índices, si éste es igual a suparte antisimétrica. Si Tαβ = T [αβ] es antisimétrico, entonces T (αβ) = 0.Además, dado T ∈ T 20 (p), se cumple siempre que;

Tαβ = T (αβ) + T [αβ] (2.82)

Un subconjunto particularmente importante de tensores son los del tipo(0, q) los cuales son antisimétricos en todas sus q posiciones: Aq(p) ⊂ T 0q (p).Claramente q ≤ n, con n la dimensión de la variedad. Al conjunto Aq(p) se

Page 40: Notas de clase: relatividad general

32 CAPÍTULO 2. VARIEDADES

le llama el espacio de las q-formas sobre M en p. Si A y B son dos p- y q-formas, podemos definir la (p+ q)-forma A ∧Q, en donde ∧ es el productotensorial antisimetrizado,

A ∧B :=A(A⊗B) (2.83)

es decir, A ∧B es el tensor de tipo (0, p+q) cuyas componentes están dadaspor:

(A ∧B) α1····αpβ1···βq := A[α1····αpBβ1···βq ] (2.84)

Por ejemplo, dados A,B ∈ A1(p), entonces:

(A ∧B)αβ = A[αBβ] (2.85)

=1

2!AαBβ −AβBα

Por otro lado:

(B ∧A)αβ = B[αAβ] (2.86)

=1

2!BαAβ −BβAα

= (−1)1·1(A ∧B)αβEn general :

(A ∧B) = (−1)p·q(B ∧A) (2.87)

donde A es una p-forma y B es una q-forma.Si consideramos los escalares como 0-formas, el producto ∧ llamado pro-

ducto exterior, define un álgebra sobre el espacio de las formas, Λ(p) =n∪p=0

A(p), llamada el álgebra de Grassmann de las formas. Además, si Eαes una base de las 1-formas, entonces Eα1∧ · · · ∧Eαp es una base de lasp-formas, es decir, si A es una p-forma entoces podemos expresar A como

A = Aα1...αpEα1∧ · · · ∧Eαp (2.88)

donde Aα1...αp = A [α1...αp]

Definicion 43 Un Ck-campo tensorial T del tipo (r, s) sobre un subconjun-to U ⊂M es una función que asigna un elemento de T r

s (p) para cada p ∈ U,tal que las componentes de T con repecto a alguna base cordenada definidasobre algun subconjunto abierto de U son funciones de clase Ck.

Denotaremos, como caso particular, por Ξ(M) al campo vectorial deltipo T 10 (p).

Page 41: Notas de clase: relatividad general

2.4. TRANSFORMACIONES ENTRE VARIEDADES 33

2.4. Transformaciones entre variedades

Definicion 44 SeanM y N variedades m y n dimensionales. Una funciónφ :M −→ N se llama de clase Ck si dados sistemas de coordenados (ψα, Uα)y (ϕβ, Vβ) enM y N respectivamente, las coordenadas de φ(p) son funcionesde clase Ck de las coordenadas de p:

ϕβ φ ψ−1α : ψα(Uα) ⊆ Rm −→ Rn

ψα(p) 7−→ ϕβ(φ(p))(2.89)

Notemos que si m > n, entonces la funcion ϕβ φ ψ−1α no es uno auno. Así, en general, esta función no tiene inversa, y en caso de que existieraésta no será de clase Cr. Por ejemplo, sean M = N = R y sea φ(x) = x3,entonces φ(x) ∈ C∞, y sin embargo φ−1(x) no es diferenciable en x = 0.

Definicion 45 Sea f ∈ F(N ) y φ : M −→ N . Entonces la función φinduce una función φ

φ : F(N ) −→ F(M)

f 7−→ φf(2.90)

definida por: φf(p) := f(φ(p)).

De esta manera, φ transforma puntos deM en N y φ convierte funcionesde F(N ) en funciones de F(M) linealmente, pues:

φ(αf + g)(p) = (αf + g)φ(p) (2.91)

= αf(φ(p)) + g(φ(p))

= αφf(p) + φg(p)

Si λ(t) es una curva sobreM que pasa por p ∈M, entonces la imagenφ(λ(t)) sobre N es una curva que pasa por φ(p).

Definicion 46 Dada φ :M −→ N definamos la transformación

φ∗ : TpM −→ Tφ(p)N

X −→ φ∗X

de la siguiente manera: para cada f ∈ F(N ) definida en el punto en φ(p)y cada X ∈ TpM definimos φ∗X ∈ Tφ(p)N así:

φ∗X(f) |φ(p):= X(φf) |p= X(f φ) |p (2.92)

Page 42: Notas de clase: relatividad general

34 CAPÍTULO 2. VARIEDADES

Claramente φ es lineal, pues:

φ∗(αX+Y)(f) | φ(p) = (αX+Y)(φf) |p (2.93)

= αX(φf) |p +Y(φf) |p= αφ∗X(f) |φ(p) +φ∗Y(f) |φ(p)

Así, si ( ∂∂t)λ |pes el vector tangente a la curva λ en p ∈ M , entoncesφ∗( ∂∂t)λ |φ(p)es el vector tangente a la curva φ λ en φ(p) ∈ N . φ∗ recibe elnombre de diferencial de φ en p y en algunos textos se nota como dφ.

Definicion 47 Dada φ :M→ N y usando la definición de φ∗ definimos lafunción φ∗:

φ∗ : T ∗φ(p)N −→ T ∗pMDe tal manera que la contracción de un vector y una 1-forma sea preserva-da bajo transformaciones. Es decir, dado Y ∈ T ∗φ(p)N , entonces definimosφ∗Y ∈ T ∗pM de manera que:

< φ∗Y,X >|p=< Y, φ∗X >|φ(p) (2.94)

Ahora, si consideramos las funciones F(M) como cero formas, identifi-caremos φ ≡ φ∗.

Teorema 48 Una consecuencia de la definición de φ∗ es que:

φ∗(df) = d(φ∗f) (2.95)

Demostracion:Sean X ∈TpM y f ∈ F(N), entonces:

< φ∗(df),X >|p=< df, φ∗X >|φ(p) (2.96)

= φ∗Xf |φ(p)= X(φf) |p≡ X(φ∗f) |p=< d(φ∗f),X >|p

Como esto vale para todo X ∈ TpM se sigue que:

φ∗(df) = d(φ∗f) (2.97)

La transformacion φ∗ puede ser extendida naturalmente a tensores con-travariantes deM a N por las reglas:

φ∗ : Tr0 (p) −→ T r

0 (φ(p)) (2.98)

Page 43: Notas de clase: relatividad general

2.4. TRANSFORMACIONES ENTRE VARIEDADES 35

T −→ φ∗T

definida por:

φ∗T (η1...ηr) := T (φ∗η1...φ∗ηr) |p;∀ηi ∈ T ∗φ(p)N (2.99)

De la misma manera φ∗ se generaliza a tensores covariantes de N aM así:

φ∗ : T 0s (φ(p)) −→ T 0s (p) (2.100)

T −→ φ∗T

definida por:

φ∗T (X1...Xs) |p= T (φ∗X1...φ∗Xs) |φ(p) (2.101)

Definicion 49 La transformación φ :M −→ N se dice de rango s en p sila dimensión de φ∗(TpM) es s. Así, si en p, s = m, entonces φ se llamainyectiva y en este caso se debe cumplir que m ≤ n. Si en p, s = n, φ sellama sobreyectiva y se tiene que m ≥ n.

Definicion 50 Una Cr−transformación φ :M −→ N se llama una inmer-sión si ∀p ∈M, existe una vecindad U alrededor de p, tal que:

φ−1 : φ(U) ⊂ N −→M (2.102)

es de clase Cr.

Por lo tanto si φ es una inmersión deM en N , entonces m ≤ n. Además,por el teorema de la función implícita φ es una inmersión si, y solo si, φ esinyectiva en todo punto p ∈M, por lo tanto

φ∗ : TpM→φ∗(TpM) ⊂ Tφ(p)N (2.103)

es un isomorfismo. La imagen φ(M) es una subvariedead inmersa en N .Por ejemplo, toda curva λ : I ⊂ R −→M es una inmersión si dxi(λ(t))

dt6= 0. Así una subvariedad inmersa en N puede intersectarse a si misma.Esto significa que φ :M −→ N no necesariamente es una función 1-1 deMsobre N , aún cuando φ si es uno a uno cuando se restringe a una vencidadsuficientemente pequeña deM.

Definicion 51 Una inmersión φ : M → N se llama una inclusión si φ :M → φ(M) ⊂ N es un homeomorfismo. De esta manera una inclusion esuna inmersión que además es 1-1. Pero no toda inmersión uno a uno es unainclusión.

Page 44: Notas de clase: relatividad general

36 CAPÍTULO 2. VARIEDADES

Definicion 52 Una transformación φ :M→ N se llama un Cr-difeomorfismosi φ es una Cr-transformación, uno a uno, y φ−1 : N → M es una Cr-transformación.

En este caso m = n y φ es inyectiva y sobre.Por el teorema de la función implícita se ve que si φ∗ es biyectiva en p,

entonces φ es un difeomorfismo en una vecindad U de p.Si φ :M→ N es un difeomorfismo, entonces

φ∗ : TpM→ Tφ(p)N (2.104)

y(φ−1)∗ : T ∗pM→ T ∗φ(p)N (2.105)

son isomorfismos, y entonces podemos definir una transformación :

φ∗ : Trs (p) −→ T r

s (φ(p)) (2.106)

por:

T (η1...ηs,X1...Xr) | p =: φ∗T ((φ−1)∗η1...(φ−1)∗ηs, φ∗X1...φ∗Xr)(2.107)

∀ηi ∈ T ∗pM y Xi ∈ TpM

Esta transformación envía tensores del tipo (r, s) sobreM a tensores del tipo(r, s) sobre N y preserva las relaciones de simetría y el álgebra tensorial. Porejemplo c(φ∗T) = φ∗(cT).

2.5. Cálculo en variedades

Definicion 53 El operador diferenciación exterior d es un operador lineal

d : Λr −→ Λr+1 (2.108)

definido por la forma en que el actúa sobre una 0-forma f ∈F(M)

< df ,X >:= Xf ;∀X ∈ TpM (2.109)

y actuando sobre un campo de r-formas A = Aα1···αrdxα1∧ · · ·dxα r da el

campo de (r+1)-formas

dA := dAα1···αr∧dxα1∧ · · ·dxα r (2.110)

Page 45: Notas de clase: relatividad general

2.5. CÁLCULO EN VARIEDADES 37

Veamos que esta definición de dA es independiente de la base escogida.Consideremos otra base x0α:

A = A0α1···αrdx0α1∧ · · ·dx0α r (2.111)

Donde las componentes A0α1···αrestán dadas por:

A0α1···αr =∂xα1

∂x0α1· · · ∂x

αr

∂x0αrAα1···αr (2.112)

Así dA en la coordenada primada está dada por:

dA = dA0α1···αr∧dx0α1∧ · · ·dx0α r =

= d(∂xα1

∂x0α1· · · ∂x

αr

∂x0αrAα1···αr) ∧ dx0α1∧ · · ·dx0α r

=∂xα1

∂x0α1· · · ∂x

αr

∂x0αrdAα1···αr∧dx0α1∧ · · ·dx0α r

=∂2xα1

∂x0β1∂x0α1∂xα2

∂x0α2· · · ∂x

αr

∂x0αrAα1···αrdx

0β1∧dx0α1∧ · · ·dx0α r

=∂xα1

∂x0α1· · · ∂2xαr

∂x0β1∂x0αrAα1···αrdx

0β1∧dx0α1∧ · · ·dx0α r (2.113)

Analicemos ahora un término que contenga segundas derivadas:

∂2xαr

∂x0β1∂x0αrdx0β1∧dx0α1 (2.114)

∂2xαr

∂x0β1∂x0αr es simétrico en β1 y α1, mientras dx0β1∧dx0α1 es antisimétrico,por lo tanto:

∂2xαr

∂x0β1∂x0αrdx0β1∧dx0α1 = 0 (2.115)

Entonces:

dA =∂xα1

∂x0α1· · · ∂x

αr

∂x0αrdAα1···αr∧dx0α1∧ · · · ∧ dx0α r

=∂xα1

∂x0α1· · · ∂x

αr

∂x0αrdAα1···αr ∧

∂x0α1

∂xα1dxα1 ∧ · · · ∧ ∂x0αr

∂xαrdxαr

=∂xα1

∂x0α1∂x0α1

∂xα1· · · ∂x

αr

∂x0αr∂x0αr

∂xαrdAα1···αr∧dxα1∧ · · · ∧ dxαr

= dAα1···αr∧dxα1∧ · · · ∧ dxαr (2.116)

Notemos que esta definición no sería independiente de las coordenadassi en vez de usar el producto exterior ∧ se hiciera para el producto tensorial.

Page 46: Notas de clase: relatividad general

38 CAPÍTULO 2. VARIEDADES

De la definición se sigue que:

d(A ∧B) = dA ∧B+ (−1)rA ∧ dB;∀A ∈ Λr;∀B ∈ Λs (2.117)

Dada una 0-forma f , tenemos que en una base coordenada:

df =∂f

∂xidxi (2.118)

entonces:

d(df) =∂2f

∂xj∂xi| z simetrico

dxj∧dxi| z antisimetrico

(2.119)

Teorema 54 Para toda p-forma:

d(dA) = 0 (2.120)

La demostración se deja como problema.

Lemma 55 Dado un campo vectorial X sobre M, existe una única curvamaximal λ(t) sobre M que pasa a través de cada p ∈M tal que λ(0) = p ycuyo vector tangente en el punto λ(t) es el vector X |λ(t) .

Demostración:Si xi son coordenadas locales, tal que la curva λ(t) tiene coordenadas

xi(t), y el vector X tiene componentes Xi en esta base, entonces la curva λes solución del sistema de ecuaciones diferenciales:

dxi

dt= Xi(xi(t) · · ·xn(t)) (2.121)

Cuya solución está garantizada por el teorema general de las ecuacionesdiferenciales ordinarias

Definicion 56 El flujo de un campo vectorial X sobreM es una transfor-macion:

φ :M×R −→M

(p, t) −→ φ(p, t) := λp(t)

donde λp(t) es la curva integral maximal del campo X que en t = 0 pasa porp ∈M .

Page 47: Notas de clase: relatividad general

2.5. CÁLCULO EN VARIEDADES 39

Si en φ(p, t), p es mantenido fijo, entonces φ(p, t) es justamente la cur-va integral λp(t). Por otro lado, si mantenemos t = cte, φ(p, t) define undifeomorfismo:

φt :M −→Mp −→ φt(p)

el cual envía un punto p de la variedad al punto φt(p), el cual está localizadouna distancia paramétrica t sobre la curva integral λp(t).

Lemma 57 φt es un grupo local uniparamétrico de difeomorfismos, es decirφt satisface:

i.- φ0 es la identidad:

φ0 = id :M −→M (2.122)

ii.- La ley de composición:

φt φs = φt+s (2.123)

iii.- Existe un inverso:φ−1t = φ−t (2.124)

De la definición de un Cr−difeomorfismo se sigue que si φt es un difeo-morfismo, entonces:

(φt)∗ : Trs (p) −→ T r

s (φt(p))

T −→ (φt)∗T |φt(p)

2.5.1. Derivada de Lie

Definicion 58 La derivada de Lie, LXT, de un campo tensorial T conrespecto al campo vectorial X es definida por:

LXT |p:= lımt→0

1

tT |p −(φt)∗T |φt(p) (2.125)

Lemma 59 Dados T1,T2 ∈ T rs (M), X,Y campos vectoriales sobre M y

f ∈ F(M), la derivada de Lie cumple las siguientes propiedades:1.- LX es R-lineal:

LX(T1 + λT2) = LXT1 + λLXT2

2.- LX es una derivación, es decir, satisface la regla de Leibniz:

LX(T1 ⊗T2) = LX(T1)⊗T2 +T1 ⊗ (LXT2)

Page 48: Notas de clase: relatividad general

40 CAPÍTULO 2. VARIEDADES

1. Lemma 60 3.- LX(T rs (M)) ⊆ T r

s (M)

4.- LX conmuta con la operación de contracción.

5.- LXf = Xf =< df ,X >

6.- Definiendo el conmutador de dos campos vectoriales por

[X,Y](f) := X(Yf)−Y(Xf)

entonces el conmutador [X,Y] satisface la identidad de Jacobi:

[[X,Y],Z] + [[Y,Z],X] + [[Z,X],Y]

Esta operacion de conmutación forma la llamada álgebra de Lie delespacio ℵ(M)

7.- Es fácil comprobar esta álgebra si trabajamos en una base coorde-nada xi, donde X=Xi∂i y Y=Y i∂i, entonces:

[X,Y]f = (Xi∂Yj

∂xi− Y i∂X

j

∂xi)∂f

∂xj(2.126)

Así, el vector [X,Y] tiene como componentes en la base coordenadaxi:

[X,Y] = (Xi∂Yj

∂xi− Y i∂X

j

∂xi)∂

∂xj(2.127)

entonces:

LXY = [X,Y] (2.128)

8.- LX+λYT =LXT+ λLXT+ λLYT

9.- L[X,Y] = [LX, LY] = LX LY − LY LX10.- Las siguientes tres proposiciones son equivalentes:

i.- [X,Y] = 0

Lemma 61 ii.- LX LY = LY LXiii.- Si φs y ψt son los difeomorfismos generados por los camposX y Y respectivamente, entonces:

φs ψt = ψt φs (2.129)

Page 49: Notas de clase: relatividad general

2.5. CÁLCULO EN VARIEDADES 41

Lemma 62 11.- Dado T ∈ T rs (M) y una base coordenada xi, en-

tonces:

(LXT)α1····αr

β1···βs =∂Tα1····αr

β1···βs∂xi

Xi − T iα2····αrβ1···βs

∂Xαi

∂xi− · · ·

· · ·− Tα1····αr−1

β1···βs∂Xαr

∂xi+ Tα1····αr

iβ2···βs∂Xi

∂xβ1

+ · · ·Tα1····αrβ1···βs−1 i

∂Xi

∂xβs(2.130)

Para una prueba de estas propiedades ver por ejemplo ”Foundations ofDifferential Geometry ”, S. Kobayashi y K. Nomizu. Interscience Publishers.John Wiley & Sons.New York

Veamos la interpretación geométrica de LXT.De la propiedad 10 se sigue que si la derivada de Lie de dos campos

vectoriales se anula, o equivalentemente, los campos conmutan, entonces siun vector v ∈ TpM se desplaza una distancia paramétrica t a lo largo de lacurva integral de X y luego una distancia s a lo largo de la curva integraldel campo Y se llega a un punto q, el cual también se obtiene, si primero sedesplaza s a lo largo de la curva integral de Y y luego una distancia t a lolargo de X

La derivada de Lie de un campo tensorial LXT depende, no solamentede la dirección del campo vectorial X en p, sino también de la dirección deX en puntos vecinos, y en este sentido es un objeto no local , por lo tantono es la generalización adecuada del concepto de derivada sobre Rn paraescribir las ecuaciones de campo para la física.

2.5.2. Conexión y derivada covariante

La generalización adecuada de derivada parcial sobre una variedad es laderivada covariante, la cual requiere para su definición de una estructuraadicional definida sobre la variedad llamada la conexión.

Definicion 63 Una conexión ∇ en un punto p ∈M es una función la cualasigna a cada campo vectorial X en p un operador diferencial ∇X definidopor

∇X : Ξ(M) −→ Ξ(M)Y 7−→ ∇XY

tal que:

Page 50: Notas de clase: relatividad general

42 CAPÍTULO 2. VARIEDADES

c-1. ∇XYT es un tensor en el argumento X, i.e.

∇fX+gYZ = f∇XZ+ g∇YZ (2.131)

∀f, g ∈ F(M), ∀X,Y,Z ∈ Ξ(M)

esto quiere decir que el opreador ∇X (derivada) en p depende solamente dela dirección de X en el punto p.

c-2. ∇XY es lineal en Y, es decir

∇X(αY + Z) = α∇XY +∇XZ (2.132)

∀α ∈ R, ∀X,Y,Z ∈ Ξ(M)

c-3.∇XfY = X(f)Y +∇XY (2.133)

∀f ∈ F(M), ∀X,Y ∈ Ξ(M)

Entonces decimos que ∇XY es la derivada covariante del campo vectorialY con respecto a la conexión ∇ en la dirección del vector X en el punto p.

De la propiedad c-1∇Y es un campo tensorial del tipo (1, 1), la derivadacovariante de Y, el cual cuando se contrae con el campo vectorial X produceel vector ∇XY, así la propiedad c-3 se puede escribir como

∇(fY) = df ⊗Y + f∇Y (2.134)

Dadas las bases duales Eα y Eα en alguna vecindad U ⊂M, deno-taremos a las componentes de ∇Y en estas bases como Y α

;β , así

∇Y = Y α;βEα ⊗Eβ (2.135)

Si n es la dimensión de la variedad, la conexión está determinada por lasn3 funciones Γαβγ sobre U ⊂M:

Γαβγ =­Eα,∇EβEγ

®(2.136)

o equivalentemente∇Eγ = Γ

αβγE

β ⊗Eα (2.137)

Así, para un campo vectorial Y su derivada covariante está dada por:

∇Y = ∇(Y αEα)

= dY α ⊗Eα + Y αΓβγαEγ ⊗Eβ (2.138)

Page 51: Notas de clase: relatividad general

2.5. CÁLCULO EN VARIEDADES 43

Si tomamos una base dual coordenada ∂α y dxα las componentes de∇Y están dadas por:

Y α;β =

∂Y α

∂xβ+ ΓαβγY

γ (2.139)

Bajo un cambio de base Eα,Eα −→ E0α,E

0α la ley de transfor-mación de las componentes de la conexión se pueden encontrar con la ayudade las propiedes c-1, c-2 y c-3 en la definición de conexión:

Γ0αβγ =

DE0α,∇

E0βE0γ

E=

DΦασE

σ,∇Φ ρβ Eρ

¡Φ τγ Eτ

¢E=

DΦασE

σ,Φ ρβ ∇Eρ

¡Φ τγ Eτ

¢E=

DΦασE

σ,Φ ρβ

¡Eρ

¡Φ τγ

¢Eτ +Φ

τγ ∇EρEτ

¢E= ΦασΦ

ρβ

©­Eσ,Eρ

¡Φ τγ

¢Eτ

®+Φ τ

γ

­Eσ,∇EρEτ

®ª= ΦασΦ

ρβ Eρ

¡Φ τγ

¢hEσ,Eτ i+ΦασΦ

ρβ Φ

τγ Γ

σρτ

= ΦασΦρ

β Eρ

¡Φ τγ

¢δστ +Φ

ασΦ

ρβ Φ

τγ Γ

σρτ

= ΦασΦρ

β Eρ

¡Φ σγ

¢+ΦασΦ

ρβ Φ

τγ Γ

σρτ (2.140)

Si se utilizan bases coordenadas, ∂α,dxα y ∂0α,dx0α, entoncesΦασ = ∂x0α/∂xσ y Φ τ

γ = ∂xτ/∂x0γ , y tenemos que la ley de transformaciónde las componentes de la conexión toma la forma:

Γ0αβγ =

∂x0α

∂xσ∂xρ

∂x0β∂2xσ

∂x0ρ∂x0γ+

∂x0α

∂xσ∂xρ

∂x0β∂xτ

∂x0γΓσρτ (2.141)

Debido al primer término en la anterior ecuación las componentes de laconexión no se transforman como las componentes de un tensor.

La derivada covariante puede ser extendida a tensores arbitrarios por lassiguientes reglas:

i.- Si T ∈ T qr entonces ∇T ∈ T q

r+1

ii.- ∇ es lineal y conmuta con las contracciones.iii.- ∇ es Leipniziana, es decir ∀T,S campos tensoriales cualesquiera se

cumple que:∇(T⊗ S) =∇T⊗ S+T⊗∇S (2.142)

iv.- ∀f ∈ F(M) entonces∇f = df (2.143)

Page 52: Notas de clase: relatividad general

44 CAPÍTULO 2. VARIEDADES

Para encontrar las componentes de la derivada covariante de un tensorarbitrario consideremos las bases duales Eα y Eβ, entonces teniendo encuenta las propiedades ii y iii anteriores, se puede probar que (problema)

∇EβEγ = −ΓγβαEα (2.144)

y de esta relación, se obtienen las componentes en una base coordenada dela derivada covariante de un tensor:

Tα1···αrβ1···βs;γ =

∂Tα1···αrβ1···βs∂xγ

+ Γα1γσTσα2···αrβ1···βs + ...+ (2.145)

ΓαrγσTα1···αr−1σβ1···βs − Γσγβ1T

α1···αrσβ2···βs −

...− ΓσγβsTα1···αrβ1···βs−1σ

2.5.3. Transporte paralelo

Sea T un campo vectorial y λ una curva sobre la variedadM, entoncesdefinimos

DT

∂t=∇∂tT (2.146)

como la derivada covariante del campo T a lo largo de la curva λ, así si Xes el vector tangente a la curva λ(t) entonces

DTα1····αrβ1···βs

∂t= Tα1····αr

β1···βs;γXγ (2.147)

Consideremos el caso particular de un campo vectorial Y y escojamosuna base coordenada, en donde la curva λ tiene coordenadas xα(t) y Xα =dxα/dt, entonces

DY

∂t=

∂Y α

∂t+ ΓαβγY

γ dxβ

dt(2.148)

Definicion 64 Un tensor T se dice transportado paralelamente a lo largode la curva λ si

DT

∂t= 0 (2.149)

Dada la curva λ(t) con puntos extremos p y q, se sigue de la teoríade las ecuaciones diferenciales que si la conexión ∇ es por lo menos declase C1, entonces se obtiene un único tensor en el punto q transportandoparalelamente al tensor dado en el punto p a lo largo de la curva λ. Así eltransporte paralelo a lo largo de la curva λ es una transformación lineal del

Page 53: Notas de clase: relatividad general

2.5. CÁLCULO EN VARIEDADES 45

espacio T rs (p) a T

rs (q), la cual preserva el álgebra tensorial y la operación de

contracción y así, en particular, si transportamos paralelamente una basede Tp al punto q obtenemos un isomorfismo entre Tpy Tq. Si la curva escerrada los puntos p y q pueden coincidir. El caso particular de transportarparalelamente el vector tangente a la curva a lo largo de ella misma nosconduce a la siguiente definición:

Definicion 65 Sea X el vector tangente a la curva λ, entonces la curva esuna geodésica si su vector tangente es transportado paralelamente a lo largode la curva, i.e.

D

∂t

µ∂

∂t

¶λ

=∇XX = 0 (2.150)

La condición que el vector tangente a la curva no cambie cuando setransporta paralelamente se puede reemplazar por una condición más débil,pues lo que se exige es que el vector tangente permanezca paralelo a si mismocuando se transporta a lo largo de la curva, es decir

∇XX = fX (2.151)

con f una función arbitraria sobre la curva. Sin embargo, no es difícil probarque por una reparametrización de la curva siempre se puede encontrar unf = 0.

Consideremos una base coordenada ∂/∂xα y dxα, entonces la ecuaciónde las geodésicas, teniendo en cuenta las ecuaciones 2.148 y 2.150, toma laforma

d2xα

dt2+ Γαβγ

dxβ

dt

dxγ

dt= 0 (2.152)

Dados el punto y la velocidad inicial de la curva geodésica λ(0) y λ(0)existe una única geodésica maximal λ(t) como una consecuencia de los teo-remas de existencia y unicidad de las ecuaciones diferenciales ordinarias, enotras palabras, dado el punto p ∈M y Xp ∈ TpM existe una única curvamaximal λ(t) tal que λ(0) = 0 y (∂/∂t)λ |t=0= Xp y la cual depende con-tinuamente de los valores iniciales. Este resultado nos permite definir unabase coordenada especial, llamadas coordenadas normales de Riemann, lascuales son de gran utilidad cuando se trabaja localmente, es decir, en unavecindad de un punto de la variedad. Para construir estas coordenadas esnecesario definir la transformación exponencial:

Definicion 66 Definimos la transformación exponencial

exp : TpM −→ MX 7−→ q = exp(X)

Page 54: Notas de clase: relatividad general

46 CAPÍTULO 2. VARIEDADES

por la relaciónexp(X) := λ(1) (2.153)

en donde λ(t) es la única geodésica que pasa por el punto p y tiene vectortangente X.

Como se puede demostrar, la transformación exponencial siempre existey es 1-a-1en alguna vecindad del punto p. Puesto que TpM es un espaciovectorial real n-dimensional, este es isomorfo a Rn, y lo podemos identificarcon él, y así usar la transformación exponencial para definir una carta coor-denada en la vecindad del punto p ∈M, llamada coordenadas normales deRiemann. Asociándole el origen de Rn al punto p, estas coordenadas tienenla propiedad que las geodésicas a través del punto p son transformadas enlíneas rectas que pasan a través del origen de Rn. De la ecuación de lasgeodésicas en coordenadas de Riemann (ver ecuación 2.152) se deduce quelas componentes de la conexión se anulan, y es por esta razón que las coor-denadas normales de Riemann tienen una especial utilidad para efectos decálculo, además, como veremos más adelante también tienen un significadofísico.

Definicion 67 Dada una conexión ∇ sobre la variedad M definimos latorsión como una transformación

T : Ξ(M)× Ξ(M) −→ Ξ(M)(X,Y) 7−→ T (X,Y)

definida porT (X,Y) :=∇XY −∇YX− [X,Y] (2.154)

Dos primeras propiedades que se pueden deducir de la definición de latorsión son:

T (X,Y) = −T (Y,X) (2.155)

T (fX, gY) = fgT (X,Y) ; ∀f, g ∈ F(M) (2.156)

Problema: demostrar estas propiedades.Ayuda:

∇fXgY = f∇XgY = fX(g)Y + fg∇XY (2.157)

[fX, gY] = LfXgY

= fX(g)Y + gLfXY

= fX(g)Y − gLYfX (2.158)

Page 55: Notas de clase: relatividad general

2.5. CÁLCULO EN VARIEDADES 47

Definicion 68 Definamos el tensor torsión T ∈ T 12 por:

T(ω,X,Y) := hω,T(X,Y)i (2.159)

A partir de esta definición, y tomando una base coordenada, veamos quelas componentes del tensor torsión están dadas por:

Tαβγ = Γ

αβγ − Γαγβ (2.160)

Para demostrar esta relación consideremos las bases duales coordenadas∂/∂xα y dxα. De la definición del tensor torsión tenemos

hω,T(X,Y)i = hω,∇XY −∇YX− [X,Y]i (2.161)

entonces, de las expresiones para las derivadas covariante y de Lie de untensor en componentes

∇XY =∂Y α

∂xβXβ + ΓαβγY

βXγ (2.162)

∇YX =

µ∂Xα

∂xβY β + ΓαβγX

βY γ

¶∂

∂xα(2.163)

[X,Y] = LXY =

µ∂Y α

∂xβXβ − Y β ∂X

α

∂xβ

¶∂

∂xα(2.164)

entonces

∇XY −∇YX− [X,Y] =³¡Γαβγ − Γαγβ

¢Xβ´ ∂

∂xα(2.165)

a partir de la cual se llega a la ecuación 2.160. Si tomamos una base cualquieraEα y Eβ el tensor torsión toma la forma

T =¡Γαβγ − Γαγβ

¢Eα ⊗Eβ ⊗Eγ (2.166)

Definicion 69 Una conexión ∇ se llama libre de torsión si T ≡ 0, o equiv-alentemente las componentes son simétricas en sus índices inferiores, i.e.si

Γαβγ = Γαγβ (2.167)

En lo sucesivo trabajaremos con conecciones libres de torsión, y por lotanto en este caso se tiene la siguiente relación entre la derivada de Lie y laderivada covariante:

LXY =∇XY −∇YX (2.168)

Page 56: Notas de clase: relatividad general

48 CAPÍTULO 2. VARIEDADES

que para el caso de un tensor cualquiera, en componentes coordenadas, tomala forma (problema):

(LXT)α1···αrβ1···βs = Tα1···αr

β1···βs;σXσ − T σα2···αr

β1···βs Xα1;σ − · · ·

−Tα2···αr−1σβ1···βs Xαr

;σ + Tα1···αrσβ2···βsX

σ;β1+

· · ·+ Tα1···αrβ1···βs−1σX

σ;βs

(2.169)

También podemos encontrar la relación entre la derivada covariante y laexterior:

(dA)αβ···γδ = (−1)pA[αβ···γ;δ] (2.170)

o equivalentemente

dA = Aαβ···γ;δdxδ∧dxα∧dxβ∧ · · · ∧dxγ (2.171)

en donde A es una p-forma. Problema: Demostrar esta relación por induc-ción. A pesar de estas relaciones entre las derivadas exterior y de Lie con laderivada covariante, las primeras son independientes de la conexión definidasobre la variedad.

2.5.4. Tensor de Riemann

Volvamos al concepto de transporte a lo largo de una curva. Consid-eremos una curva cerrada λ y supongamos que partimos de un punto p ytransportamos paralelamente al vector Xp a lo largo de la curva, regresan-do al punto inicial, entonces obtendremos el vector X0p que en general serádiferente al vector inicial. Si consideramos, ahora, otra curva δ(t) cerradaque pase también por el punto p y transportamos de nuevo al vector Xp a lolargo de esta nueva curva, obtendremos un vector X00p, que, en general, serádiferente a Xp y X0p. Esta no integrabilidad del transporte paralelo corre-sponde al hecho que, en general, las derivadas covariantes no conmutan. Eltensor curvatura de Riemann nos da una ”medida” de esta no conmutativi-dad.

Definicion 70 Definamos la función curvatura por la relación:

R : Ξ(M)× Ξ(M)× Ξ(M) −→ Ξ(M)(X,Y,Z) 7−→ R(X,Y,Z)

definida por

R(X,Y,Z) :=∇X (∇YZ)−∇Y (∇XZ)−∇[X,Y]Z (2.172)

Page 57: Notas de clase: relatividad general

2.5. CÁLCULO EN VARIEDADES 49

Problema: A partir de esta definición mostrar que la función curvaturaes lineal en las tres entradas X,Y y Z.

Definicion 71 Definamos el tensor de Riemann R ∈ T13 por la relación:

R : Ξ∗(M)× Ξ(M)× Ξ(M)× Ξ(M) −→ R(ω,X,Y,Z) 7−→ R(ω,X,Y,Z)

definido por

R(ω,X,Y,Z) = hω, R(X,Y,Z)i (2.173)

Problema: Eligiendo una base coordenada mostrar que las componentesdel tensor de Riemann están dadas por

Rαβγδ =

∂Γαδβ∂xγ

−∂Γαγβ∂xδ

+ ΓαγσΓσδβ − ΓασδΓσγβ (2.174)

Problema: A partir de la definición mostrar que el tensor de Riemanntiene las siguiente propiedades de simetría:

Rαβγδ = −Rα

βδγ ⇐⇒ Rαβ(γδ) = 0 (2.175)

Rα[βγδ] = 0⇐⇒ Rα

βγδ +Rαγδβ +Rα

δβγ = 0 (2.176)

Además la derivada covariante del tensor de Riemann satisface las iden-tidades de Bianchi:

Rαβ[γδ;η] = 0 (2.177)

Una contracción del tensor de Riemann nos conduce a otro tensor, elcual juega un papel importante, no solo en la geometría, sino también el lafísica.

Definicion 72 Definimos el tensor de Ricci por:

Rβδ := Rσβσδ (2.178)

Nota: Se puede probar que el transporte paralelo de un vector cualquieraa lo largo de toda curva cerrada sobre la variedad es localmente integrable,es decir si Xp = X

0p para cada p ∈M, sí y solamente sí Rα

βγδ = 0, ∀p ∈M;en este caso se dice que la conexión es plana.

Page 58: Notas de clase: relatividad general

50 CAPÍTULO 2. VARIEDADES

2.5.5. Tensor métrico

Definicion 73 Un tensor métrico g en un punto p ∈ M es un tensorsimétrico del tipo T 02 (p).

Así, una métrica sobreM es un campo tensorial simétrico g.Ahora, dada una métrica podemos definir la función ”norma” de un

vector X ∈ TpM, como

|·|g : TpM −→ RX 7−→ |X|g :=

p|g(X,X)| (2.179)

A partir de esta definición podemos introducir el concepto de ánguloentre vectores por la relación (si no se presenta inconsistencia no escribiremosel subíndice g para referirse a la norma inducida por la métrica):

cos] (X,Y) :=g(X,Y)

[|g(X,X)| |g(Y,Y)|]1/2(2.180)

la cual es válida ∀X,Y ∈TpM, y |X| 6= 0 y |Y| 6= 0. Con estemos llamaremosvectores ortogonales aquellos que cumplan la condición g(X,Y) = 0.

Dadas las bases duales Eα y Eβ, el tensor métrico g en componentestoma la forma

g = gαβEα ⊗Eβ (2.181)

gαβ = g(Eα,Eβ) (2.182)

Las magnitudes definidas por la métrica en el espacio tangente estánrelacionadas con las magnitudes sobre la variedad por la siguiente definición:

Definicion 74 La longitud del camino estre los puntos de la variedad p =λ(a) y q = λ(b) situados sobre la curva λ(t), con vevtor tangente ∂/∂t, y talque g(∂/∂t, ∂/∂t) tiene el mismo signo sobre todos los puntos a lo largo dela curva λ(t), está definida por la integral

Lab =

Z b

a|g(∂/∂t, ∂/∂t)|1/2 dt (2.183)

En una base coordenada la ecuación anterior toma la forma explícita

Lab =

Z b

a

·gαβ

dxα

dt

dxβ

dt

¸dt (2.184)

Page 59: Notas de clase: relatividad general

2.5. CÁLCULO EN VARIEDADES 51

y por esta razón escribiremos, simbólicamente, la distancia a lo largo de unacurva entre dos puntos infinitesimalmente cercanos en la forma

ds2 = gαβdxαdxβ (2.185)

Definicion 75 Una métrica g se llama no degenerada en un punto p de lavariedad si no existe un vector no nulo X ∈TpM tal que g(X,Y) = 0 paratodo vector Y ∈TpM.

En términos de componentes coordenadas de g la métrica es no degen-erada si

det |gαβ| 6= 0 (2.186)

En estas condiciones podemos definir un tensor del tipo T 20 tal que suscomponentes gαβ, en la base coordenada dada, están determinadas por larelación

gαβgβγ = δαγ (2.187)

es decir, la matriz¡gαβ

¢formada con las componentes del tensor es la inversa

de la matriz (gαβ) formada con las componentes de g. A las componentes gαβ

se le llaman las componentes contravariantes del tensor métrico, y esta de-nominación queda justificada, pues la definición 2.187 implica que podemosestablecer un isomorfismo entre las componentes covariantes y contravari-antes de tensores de la siguiente forma:

Lemma 76 Sea g una métrica no degenerada en el punto p∈TpM, entoncesla transformación

TpM −→ T ∗pMX 7−→ C11(g ⊗X)

define un isomorfismo.

Si gαβ y Xα son las componentes del tensor métrico g y del vector X,entonces las componentes de la 1-forma C11(g⊗X), que las denotaremos porXα están dadas por

Xα = gαβXβ (2.188)

y puesto que la métrica es no degenerada, utilizando la ecuación 2.187 ten-emos que podemos despejar las componentes del vector X en términos delas componentes de C11(g ⊗X), pues

gµαXα = gµαgαβXβ (2.189)

= δµβXβ

= Xµ

Page 60: Notas de clase: relatividad general

52 CAPÍTULO 2. VARIEDADES

A esta transformación y su inversa, se le conoce en la literatura como”subir” y ”bajar” índices. Así, dada una métrica no degenerada podemoshablar de las componentes covariantes Xα y contravariantes Xα de un ”vec-tor”X las cuales están relacionadas biunívocamente por las ecuaciones 2.188y ??. Esta operación se puede extender para subir o bajar cualquier índicetensorial (o índices por aplicación sucesiva de la misma operación). Por ejem-plo, consideremos un tensor de rango 3 del tipo T 21 , con componentes T

αβγ ,

entonces aplicando las ecuaciones 2.188 y ?? podemos obtener los siguientestensores:

Tαβγ = gσγTαβσ (2.190)

Tαβγ = gβσT

ασγ (2.191)

Tαβγ = gασgβεTσεγ (2.192)

Tα γβ = gβεg

σγTαεσ (2.193)

T βα γ = gασT

σβγ (2.194)

T γαβ = gασgβδg

γηTσβη (2.195)

T βγα = gασg

γηT σβη (2.196)

El isomorfismo inducido por el tensor métrico significa, entonces, quepodemos considerar a todos los tensores de tercer rango cuyas componentesestán relacionadas por las ecuaciones anteriores, como diferentes representa-ciones del mismo objeto abstracto T. En lo sucesivo se asumirá ésto paratodos los tensores. Es de anotar que en este caso se hace necesario respetar elorden de los índices en las componentes de tensores tanto covariantes comocontravariantes. Un caso particular de importancia lo constituye el tensormétrico g, en donde las componentes covariantes gαβ, contravariantes gαβ,y mixtas δαβ , relacionadas por la ecuación 2.187 constituyen diferentes rep-resentaciones del mismo objeto geométrico, el tensor T.

Definicion 77 Definimos la signatura del tensor métrico g por:

sig.(g) = #de valores propios positivos menos

#de valores propios negativos

Si el campo tensorial g es no degenerado y continuo, entonces la signaturadel tensor métrico g es constante sobre toda la variedad. Siempre es posibleelegir una base adecuada Eα para el espacio tangente TpM, de tal forma

Page 61: Notas de clase: relatividad general

2.5. CÁLCULO EN VARIEDADES 53

que las componentes covariantes del tensor métrico tomen los valores ±1,i.e.

gαβ = g(Eα,Eβ) = ηαβ (2.197)

en donde los elementos ηαβ están definidos por

ηαβ = diag.(+1,+1, · · ·,+1| z ,−1,−1, · · ·,−1| z )1

2(n+ s)

1

2(n+ s)

en donde s = sig.(g), y n la dimensión de la variedad. Para el caso particularde sig.(g) = n la métrica es definida positiva, y en este único caso el tensormétrico define una métrica en sentido estricto. Otro caso de importancia enfísica en la métrica con sig.(g) = 2− n, es decir

gµν = diag.(+1,−1,−1, · · ·,−1) (2.198)

la cual se conoce con el nombre de métrica Lorentziana o Minkowskiana.Esta métria, para efectos de la física es equivalente a otra con signaturan− 2, pues el único valor propio positivo, en el primer caso y negativo en elsegundo, se interpreta como la coordenada temporal.

En las presentes notas asumiremos la métrica con signatura 2 − n, ydefiniremos la estructura de conos de luz del espacio-tiempo de la siguienteforma:

Definicion 78 Una métrica Lorentziana g sobre la variedadM divide a losvectores no nulos de TpM en tres clases disjuntas:

1- X ∈ TpM se llama ”de tiempo” si g(X,X) > 02- X ∈ TpM se llama ”de espacio” si g(X,X) < 03- X ∈ TpM se llama ”de luz o nulo ” si g(X,X) = 0

Si la métrica es no degenerada y continua, los vectores nulos de TpMforman un doble cono (el cono de luz) el cual separa a los vectores de tiempode los vectores de espacio.

2.5.6. Relación entre conexión y métrica

Hasta en momento la conexión y la métrica son dos objetos definidossobre la variedad de manera independiente. Pero existe una relación entreellos si consideramos la conexión que deje invariante el producto punto en-tre vectores, es decir, dada una métrica existe una única conexión libre deteorsión, definida por la condición

∇g = 0 ⇐⇒ gαβ;γ = 0 (2.199)

Page 62: Notas de clase: relatividad general

54 CAPÍTULO 2. VARIEDADES

y así, con esta condición el transporte paralelo de vectores preserva el pro-ducto escalar definido por g. Para encontrar la forma explícita de la conex-ión consideremos la foema explícita de la derivada covariante de un tensor,ecuación 2.145, entonces

0 =∂gαβ∂xγ

− Γσγαgσβ − Γσγβgασ (2.200)

entonces, si definimosΓσγαgσβ = Γβγα (2.201)

y rotamos siclícamente los índices βγα, y sumamos las dos primeras ecua-ciones y substraemos la tercera, y asumiendo que Γσγα = Γ

σαγ, obtenemos

∂gαβ∂xγ

+∂gαγ∂xβ

− ∂gβγ∂xα

= Γβγα + Γαγβ + Γγβα + Γαβγ − Γγαβ − Γβαγ= 2Γαβγ

= 2gασΓσβγ (2.202)

y despejando los elementos de la conexión, llamados los símbolos de Christof-fer de segunda clase, obtenemos

Γαβγ =1

2gασ

½∂gγσ∂xβ

+∂gβσ∂xγ

− ∂gβγ∂xα

¾(2.203)

Con esta conexión métrica el tensor de Riemann tiene las propiedadesde simetría adicionales

R(αβ)γδ = 0 ⇐⇒ Rαβγδ = −Rβαγδ (2.204)

Rαβγδ = Rγδαβ (2.205)

Estas relaciones implican que el tensor de Ricci es simétrico:

Rαβ = Rβα (2.206)

Problema: probar estas relaciones de simetría, y además, mostrar que elnúmero de componentes independientes del tensor de Riemann es n2(n2 −1)/12, con n la dimensión de la variedad, y por tanto n(n + 1)/2 de estascomponentes pueden estar dadas en términos de las componentes indepen-dientes del tensor de Ricci.

Para los siguientes casos particulares tenemos:si n = 1 entonces Rαβγδ = 0si n = 2 entonces Rαβγδ solo tiene una componente independiente, la

cual es proporcional al escalar curvatura R.si n = 3 el tensor de Ricci determina completamente al tensor de Rie-

mann.

Page 63: Notas de clase: relatividad general

2.5. CÁLCULO EN VARIEDADES 55

2.5.7. Campos de Killing

Definicion 79 Un difeomorfismo φ :M −→M se llama una isometría sieste deja la métrica invariante, i.e., si la métrica transformada φ∗g = g entodo punto deM.

Esto implica, entonces, que la transformación

φ∗ : TpM −→ Tφ(p)M

preserva el producto escalar:

g(X,Y) | p = φ∗g(φ∗X, φ∗Y) |φ(p)= g(φ∗X, φ∗Y) |φ(p) (2.207)

Ahora, si el grupo uniparamétrico de isomorfismos φt generado por uncampo vectorial K es un grupo de isometrias (es decir, si para cada TtTla transformación φt es una isometría), entonces el campo vectorial K sedenomina un campo vectorial de Killing. Así, la derivada de Lie de la métricacon respecto al campo vectorial K se anula,

LKg = lımt−→0

1

t(g − φt∗g) = 0 (2.208)

pues, g =φt∗g por definición de isometría. Ahora, de la definición de derivadade Lie

(LKg)αβ = 2K(α;β) (2.209)

Problema: demostrar esta relación. Por lo tanto, un campo vectorial deKilling satisface la ecuación diferencial:

Kα;β +Kβ;α = 0 (2.210)

llamada ecuación diferencial de Killing.Inversamente, si K es un campo vectorial que satisface la ecuación difer-

encial de Killing, entonces

φt∗g |p= g |p +Z t

0

d

dt0(φt∗g |p) dt0

por el teorema fundamental del cálculo integral,

= g |p +Z t

0

d

ds(φt0∗ φs∗g)s=0 |p dt0

Page 64: Notas de clase: relatividad general

56 CAPÍTULO 2. VARIEDADES

puesto que φt es un grupo uniparámetrico de isomorfismos y así φt∗ φs∗ =φs∗ φt∗ = φt+s∗,

= g |p +Z t

0

µφt0∗

d

dsφs∗g

¶s=0

|p dt0

= g |p −Z t

0φt0∗

³LKg |φ−t

´|p dt0

= g |ppues de la definición de derivada de Lie se obtiene que

(LXY)α = − d

dt(φt∗Y)

α (2.211)

por lo tanto

Teorema 80 K es un campo vectorial de Killing si y solo si satisface laecuación diferencial de Killing.

Una variedad, en general, no tiene simetrias y así no admite camposvectoriales de Killing. Sin embargo, una variedad especial puede admitir rcampos vectoriales de Killing linealmente independientes Ki i = 1, 2, ..., r.Ahora se puede mostrar que el conmutadoe de dos campos de Killing es denuevo un campo de Killing, i.e.,

[Ki,Kj ] = clijKl (2.212)

Esto significa que el conjunto de campos vectoriales de Killing sobreuna variedad dada, forman un álgebra cerrada bajo el producto definidopor el conmutador , la cual recibe el nombre del álgebra de Lie asociadaa las simetrias de la variedad. Las constantes clij se llaman constantes deestructura del correspondiente grupo de Lie. Además, si n es la dimensiónde la variedad, entonces el número r de campos de Killing está acotado,i.e., 0 ≤ r ≤ 1

2n(n + 1), así, el grupo local de difeomorfismos generado porestos campos vectoriales de Killing es un grupo de Lie de r parámetros,llamado el grupo de simetrias de la variedad. Una variedad puede poseerotras simetrias, tales como la inversión en un punto, o la reflexión en unplano, pero estas simetrias no están generadas por un campo vectorial deKilling. La conexión de estas simetrias con la física está en el teorema deNoether que establece que para cada simetría de la variedad, generada porun campo vectorial de Killing existe una cantidad dinámica del sistema quese conserva.

Una variedad que admite r = 12n(n + 1) campos vectoriales de Killing,

se llama de simetría maximal.

Page 65: Notas de clase: relatividad general

2.5. CÁLCULO EN VARIEDADES 57

Lemma 81 La variedad Lorentziana n-dimensional plana es de simetríamaximal. Por variedad plana se quiere decir una variedad para la cual lasconecciones son nulas globalmente o equivalentemente el escalar de curvaturase anula en toda la variedad R = 0.

Para demostrar este lema veamos en primer lugar que cada campo deKilling dadoK (si este existe) está determinado unívocamente por los valoresde Kα |p y Kα;β |p en cualquier punto p ∈M. Para este fin, notemos que elconmutador de las segundas derivadas covariantes del campo K están dadaspor:

Kα;β;γ −Kα;γ;β = −RσαβγKσ (2.213)

Ahora, de la relación Rα[βγδ] = 0 para el tensor de Riemann se tiene que,

como K satisface la ecuación de Killing, entonces

Kα;β;γ = −RσαβγKσ (2.214)

Por lo tanto, dados Kα y Kα;β para algún punto p ∈M, entonces porla teoría de las ecuaciones diferenciales, conocemos K sobre la variedad.Entonces, para el caso de una variedad plana, esta ecuación se reduce a

∂2Kα

∂xβ∂xγ= 0 (2.215)

cuya solución general es de la forma

Kα(x) = aα + bαβxβ (2.216)

con aα y bαβ son constantes de integración, con la condición bαβ = −bβα, locual se sigue de la ecuación de Killing.

Así, tenemos 12n(n− 1) constantes independientes bαβ más n constantesaα, lo cual conduce a un total de 1

2n(n + 1) campos vectoriales de Killingindependientes, los cuales pueden ser escogidos de la siguiente manera: (µíndice de componentes de vectores y j índice que numera los diferentes vec-tores)

K(j)µ (x) = δjµ ; µ, j = 1, 2, ..., n (2.217)

K(ij)µ (x) = δiµx

j − δjµxi ; µ, i, j = 1, 2, ..., n (2.218)

Los n vectores K(i) representan las translaciones y los 12n(n−1) vectoresK(ij) representan rotaciones, lo cual dada la signatura Lorentziana de lamétrica contiene tanto transformaciones de Lorentz puras, como rotacionesespaciales de los ejes.

Page 66: Notas de clase: relatividad general

58 CAPÍTULO 2. VARIEDADES

Page 67: Notas de clase: relatividad general

Parte II

Relatividad General

59

Page 68: Notas de clase: relatividad general
Page 69: Notas de clase: relatividad general

Capítulo 3

Los postulados de larelatividad general

En este captulo daremos los postulados fundamentales sobre los cuales es-tábasada la teoria general de la relatividad. En la primera parte mostraremoscomo, el principio de equivalencia, conduce a una ”geometrización” de lafuerza de gravedad, lo cual nos conducirá a la formulación de los postula-dos.

3.1. La ley de gravitación universal

La ley de gravitación universal establece que entre todo par de cuerposen el universo existe una interacción (fuerza atractiva), la cual solo dependede la posición relativa de los cuerpos y de una propiedad intrínseca, llamadacarga o masa gravitacional, la cual satisface la tercera ley de Newton:

F1←2 =GmG

1mG2

r2r = −F2←1 (3.1)

en dondemG1 ym

G2 son las masas gravitacionales, r1 y r2 los vectores posición

de los cuerpos, r = r2 − r1, G una constante (la constante de gravitaciónuniversal G = 6,67259×10−11m3 kg−1 s−2) y F1←2 es la fuerza que el cuerpo2 ejerce sobre el 1. A partir de esta expresión, es claro que ésta no está enacuerdo con los principios de la teoría especial de la relatividad, pues la leyde fuerza es independiente del tiempo, y por lo tanto describe una interaccióninstantanea. Esta situación motivó a Einstein a buscar la forma relativistade la ley de gravitación universal.

61

Page 70: Notas de clase: relatividad general

62CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDADGENERAL

Esta ley de gravitación universal de Newton contiene dos postuladosfundamentales, los cuales se constituirán en el punto de partida para laformulación de la teoría general de la relatividad:

En primer lugar, esta interacción gravitacional es universal, es decir,todos los objetos del universo tienen ”carga gravitacional” (compare lasituación con la carga eléctrica).

En segundo lugar, si consideramos la fuerza que un cuerpo dado, e.g. latierra con masa gravitacional MG

T , sobre otros, con masa gravitacional mG,

y aplicamos la segunda ley de Newton para estudiar el movimiento de estasmasas en presencia de la primera, tenemos que

GMGT m

G

r2r = mIa (3.2)

en donde mI denota la masa inercial del cuerpo con gravitacional mG, en-tonces la aceleración del curpo debido a MG

T está dada por

a =GMG

T mG

r2mG

mIr (3.3)

Si fijamos la masa de la tierra, la aceleración de cualquier otro cuer-po depende solamente de la relación entre su masa gravitacional e inercial.Galileo fue el primero en mostrar que la aceleración de un cuerpo cualquieraen un punto dado sobre la superficie terrestre era independiente de su masainercial, este hecho, conocido como la ley de caida de los cuerpos de Galileo,muestra, por la ecuación anterior, que para todos los cuerpos la relaciónentre su masa gravitacional y su masa inercial es independiente de la nat-uraleza (composición, forma, etc) del cuerpo. Este principio, adoptado porNewton, lo que explica la introducción de la constante de gravitación uni-versal, condujo a medir la masa gravitacional en las mismas unidades quela inercial, auncuando los dos conceptos de masa son completamente inde-pendientes. Este principio, hoy conocido como el ”Principio de EquivalenciaDébil” (PED) implica, entonces, que el movimiento de cualquier cuerpo, in-dependiente de su masa, es el mismo, dadas las mismas condiciones iniciales,posición y velocidad.

Otra forma de formular el PED es a través del famoso experimento imag-inario (gedanken Experiment) del ascensor. Consideremos un ascensor y unobservador en su interior, y supongamos las siguientes dos situaciones: elascensor está en el espacio libre y es acelerado por alguna fuerza (motores)a 9,8m/s, y el ascensor está en reposo sobre la superficie de la tierra. En-tonces, debido a la equivalencia entre masa inercial y gravitacional, dejando

Page 71: Notas de clase: relatividad general

3.1. LA LEY DE GRAVITACIÓN UNIVERSAL 63

caer partículas en el interior del ascensor no se puede determinar si éste seencuentra en reposo en el campo gravitacional, o si está acelerado por unafuerza externa, asumiendo que el escensor es lo suficientemente pequeño paraque el campo gravitacional en su interior sea uniforme.

Por otra parte, de acuerdo con la teoría especial de la relatividad, y enparticular, teniendo en cuenta la equivalencia entre masa y energía, Einsteingeneralizó el PED y postuló que ningún experimento realizado dentro de lacaja podía determinar la diferencia entre un sistema uniformente acelerado yun campo gravitacional uniforme. Este principio se conoce como el ”principiode Equivalencia de Einstein” (PEE). Por ejemplo, consideremos un átomode hidrógeno, cuya masa es menor que la suma de las masas del electrón yel protón que lo constituyen, pues este es un sistema ligado al cual hay quedarle energía para separar a las partículas que lo conforman y la relaciónentre su masa inercial y gravitacional sigue siendo una constante. Así, deacuerdo con el PEE el campo gravitacional, esto significa que el campogravitacional se acopla de la misma manera con todas las formas de energíay materia.

El PEE tiene consecuencias profundas sobre la estructura del espacio-tiempo. En relatividad especial, al igual que en cualquier teoría física queno involucre al campo gravitacional, se parte de la definición de sistema dereferencia inercial, considerando una partícula libre, la cual por definición,se encuentra no acelerada. Entonces, con respecto a ella podemos definir elconcepto de la clase de sistemas de referencia inerciales, como aquellos paralos cuales esta partícula se encuentra en reposo o movimiento uniforme. Ladescripción matemática de estos sistemas se hace a través de un sistemade reglas y relojes, calibrados adecuadamente, los cuales se extiende a todoel espacio, y conducen a describir el espacio-tiempo como una variedad 4-dimensional plana, es decir libre de connección, y para la cual podemos elegirlas coordenadas naturales, definidas por las curvas integrales de los camposde Killing K(j)

µ (x) = δjµ; µ, j = 1, 2, ..., n.

El punto de partida básico para la anterior construcción está en la suposi-ción de considerar la existencia de una partícula libre de fuerzas, con respectoa la cual podemos definir el movimiento acelerado. Dado el caracter universalde la gravedad, todas las formas de materia interactuan gravitacionalmente,no es posible disponer de una partcula ”gravitacionalmente neutra” con re-specto a la cual podamos definir la aceleración debida a la gravedad. Así, la”aceleración de la gravedad” no es un concepto que pueda ser definido, y porlo tanto carece de significado experimental, y reemplazaremos el conceptode movimiento libre (no acelerado) por el de sistema en ”caida libre”.

Page 72: Notas de clase: relatividad general

64CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDADGENERAL

Así, siguiendo los pasos para construir un sistema de referencia inercialen física no gravitacional, partimos de una partícula en caida libre, es decir,sobre la cual no actuan fuerzas (electromagnéticas, débil, etc). Notemos eneste punto de la discusión, que estamos trabajando en el espíritu de Mach,en cuanto a que ya no estamos haciendo referencia a una partícula libre defuerzas (incluyendo la gravitacional). Si asociamos a esta partícula en caidalibre un sistema de reglas rígidas y relojes calibrados de la manera usual,nos encontramos con el problema, debido a la inhomogeneidad del campogravitacional, que otra partícula en caida libre no seguiría las lineas ”rec-tas” definidas por el sistema de coordenadas canónicas asociadas al sistemade referencia de la primera partícula, es decir partículas en caide libre enotras regiones del espacio aparecerian como ”aceleradas” con respecto a laprimera.

El concepto de sistema de referencia inercial asociado a una partícula encaida libre, solo tiene sentido para una región lo suficientemente pequeñaen la vecindad de la partícula. Notemos que este hecho corresponde, en elcontexto de las variedades, a la existencia en todo punto de la variedad, deun sistema de coordenadas normales de Riemann, con respecto a las cualesse anulan las componentes de la conexión en ese punto. Además que ya no esposible comparar velocidades, aceleraciones, etc. entre partículas localizadasen otras regiones, pues los sistemas de referencia inerciales asociados a lasdiferentes partículas, son independientes. Este hecho de no poder comparavectores en diferentes puntos de la variedad, significa la dependencia deltransporte paralelo de vectores, y por lo tanto la dependencia de la curvaturade la variedad.

Aún cuando los argumentos anteriores, sobre el comportamiento de lafuerza de la gravedad (PEE) y su relación intuitiva con las variedades, no esuna demostración de la necesidad de describir la gravitación a través de lageometría del espacio-tiempo, estas consideraciones fueron suficientes paraque Einstein postulara la idea que la gravitación es una manifestación de lacurvatura del espacio-tiempo, y que esta curvatura sería determinada portodas las formas de materia-energía.

3.2. Postulados de la TGR

Habiendo motivado la geometrización de la fuerza de la gravedad, pasare-mos a establecer los cuatro postulados fundamentales de la teoría generalde la relatividad.

Axiom 82 La variedad espacio-tiempo:

Page 73: Notas de clase: relatividad general

3.2. POSTULADOS DE LA TGR 65

El espacio-tiempo lo constituyen todos los eventos físicos el cual será de-scrito por el par (M,g), dondeM es una variedad suave (C∞) 4-dimensionalconectada de Hausdorf y g es una métrica Lorentziana sobreM.

Sobre la variedadM están definidos todos los campos de materia que seconsideren, por ejemplo, el campo electromagnético, el campo de neutrinos,etc., los cuales describen el contenido de materia en el espacio-tiempo.

Los campos de materia obedecen ecuaciones que se expresan como rela-ciones entre tensores sobreM, en las cuales las derivadas con respecto a lascoordenadas son derivadas covariantes, con respecto a la conexión simétricadefinida por la métrica g.

Si denotamos los campos de materia incluidos en la teoría porΨα...β(i) γ...δ(x),

donde el sibíndice i denota los diferentes campos de materia, entonces, lossiguientes dos postulados sobre la naturaleza de los campos Ψα...β

(i) γ...δ soncomunes a la teoría especial y a la teoría general de la relatividad:

Axiom 83 Causalidad local:Las ecuaciones que obedecen los campos de materia deben ser tales que,

si U ⊂M es una vecindad convexa y p, q ∈ U , entonces, una señal puede serenviada en U entre p y q si y solamente si p y q pueden ser unidos por unac1−curva contenida en U , cuyo vector tangente en todas partes es diferentede cero y es como de tiempo o como de luz (esta curva se llama no como deespacio).

Otra forma equivalente de establecer espe postulado, y físicamente mássignificativo, se puede dar en términos del problema de Cauchy para loscampos de materia: Sea p ∈ U tal que toda curva no como de espacio através de p intersepta la superficie como de espacio x0 = cte. dentro de U .Sea F el conjunto de puntos en la hipersuperficie x0 = cte. los cuales puedenser alcanzados por curvas no como de espacio en U a través de p. Entonces, seexige que los valores de los campos de materie en p deben estar unívocamentedeterminados por los valores del campo y sus derivadas a un orden finitosobreF . Es decir, las ecuaciones de movimiento (ecuaciones diferenciales) quedeterminan los campos (leyes de la física) involucran derivadas hasta unorden n finito (usualmente hasta orden 2) tienen solución única, la cual estádetermina por las condiciones de frontera, es decir, el valor de los campos ysus primeras n − 1 derivadas, dadas sobre hipersuperficie interseptada porel cono de luz pasado del punto p.

Axiom 84 Conservación local de la energía:

Page 74: Notas de clase: relatividad general

66CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDADGENERAL

Existe un tensor simétrico Tµν = Tµν(,∇Ψi, ...) = Tνµ que es funciónde los campos de materia y sus derivadas, hasta un orden finito, tal que:

i.- Tµν = 0 sobre U ⊂ M abierto, si y solo si Ψi = 0 para todo i sobreU .

ii.- Tµν;ν = 0

La primera condición expresa que todos los campos de materia con-tribuyen a la energía. A partir de la segunda condición, si la variedad espacio-tiempo admite un campo vectorial de Killing K entonces, obtenemos unaley de conservación, pues sea

pα = TαβKβ (3.4)

las componentes del vectorP obtenido por contracción del tensor momentun-energía con el campo de Killing, entonces

pα;α = Tαβ;αKβ + TαβKβ;α = 0 (3.5)

pues Tαβ, Tµν;ν = 0 y K satisface la ecuación de Killing, i.e., K(α;β) = 0. Así,

si D es una región compacta y orientable, por el teorema de Gauss se tieneque Z

∂Dpαdσα

ZDpα;αdv = 0 (3.6)

por lo tanto, este resultado se puede interpretar físicamente, pues el flujode la componente del tensor momentun-energía enla dirección del campo deKilling sobre una superficie cerrada se anula, lo cual es la generalización delteorema de Noether, el cual establece que a toda simetría le correspondeuna ley de conservación. En el caso particular de la variedad Lorentzianaplana, asociado a los diez vectores de Killing linealmente independientesestán las diez leyes de conservación usuales, para la energía, el momentun yel momentun angular total.

3.3. El tensor métrico y el postulado de causalidad

Consideremos la ecuación de las geodésicas en alguna base coordenada

d2xα

ds2+ Γαβγ

dxβ

ds

dxγ

ds= 0 (3.7)

en donde s es un parámetro afín. El paránetro afín de una curva geodésicaestá determinado salvo un factor aditivo y uno multiplicativo constantes, es

Page 75: Notas de clase: relatividad general

3.3. EL TENSOR MÉTRICO Y EL POSTULADO DE CAUSALIDAD 67

decir, salvo una transformación de la forma s0 = as+ b, con a, b constantes.La libertad de escoger b corresponde a la libertad para elegir el punto inicialde la curva λ(0), y el parámetro a corresponde a la libertad de normalizarel vector tangente a la curva X por un factor de escala constante, X0 = 1

aX.Por otra parte, dada una cr−conexión, los teoremas de existencia y uni-

cidad de las ecuaciones diferenciales ordinarias aplicados a la ecaución geo-désica muestran que para cualquier punto p ∈M y Xp ∈ TpM existe unageodésica maximal λX(s) enM, con p = λ(0) y

¡∂∂s

¢λ

¯s=0

= Xp. Si r ≥ 1la geodésica es única y depende continuamente de los valores iniciales. Estasituación nos permite definir la transformación exponencial

exp : TpM −→ MX 7−→ exp(X) := λX(1)

siendo λX(0) = p. Es decir, a cada vector X ∈TpM se le asocia el puntoq ∈ M que está a una distancia paramétrica unidad del punto inicial a lolargo de la única geodésica que se inicia en p y cuyo vector tangente es X.Esta transformación exponencial no necesariamente está definida para todoslos vectoresX ∈TpM pues la geodésica no necesariamente está definida paratodo s. Entonces

Definicion 85 Una geodésica λX(s) se llama completa si está definida paratodo s.

Definicion 86 Una variedad se llama geodésicamente completa si todas lasgeodésicas sobreM son completas.

En este caso la transformación exp está definida para todo X ∈TpM.Séan X ∈TpM y a ∈ R fijos con

¡∂∂s

¢λ

¯s=0

= X, entonces

λX [a, b] ⊆ R −→ Ms 7−→ λX(as)

tiene velocidad inicialµ∂

∂t

¶λ

¯t=0

=

µd(as)

ds

∂as

¶λ

¯s=0

= aX (3.8)

así, λX(as) = λaX(s) y por lo tanto la transformación

exp(aX) = λaX(1) = λX(a) (3.9)

Page 76: Notas de clase: relatividad general

68CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDADGENERAL

es decir, la transformación exp transforma rectas aX de TpM en geodésicassobreM.

SiM es geodésicamente completo o no la transformación exp es de rangon en p (n = dimM). Así, por el teorema de la función implícita existe unavecindad abierta V0 del origen de TpM y una vecindad abierta Vp del puntop ∈M tal que

exp : V0 ⊂ TpM −→ Vp ⊂Mes un Cr − difeomorfismo de V0 sobre Vp. La vecindad Vp se llama unavecindad normal de p. Además, podemos escoger Vp convexa, esto es, talque todo punto q ∈ Vp puede ser unido a cualquier otro punto r ∈ Vp poruna única geodésica que parte del punto q y que está totalmente contenidaen Vp. En el interior de una vecindad normal convexa V es posible escogercoordenadas (x1, x2, ..., xn) con origen en cualquier punto p ∈ V y toman-do una base Eα de TpM definimos las coordenadas de un punto r ∈ Vpor la relación r = exp(xαEα), es decir, se asigna al punto r las coorde-nadas del punto exp−1 r con respecto a la base Eα de TpM. Entonces, si

Eα = ∂/∂xα|p de la ecuación de las geodésicas se obtiene que Γαβγ¯p= 0.

Estas coordenadas se llaman coordenadas normales centradas en el puntop. Este comportamiento de las geodésicas en una vecindad normal no se da,en general, sobre toda la variedad, pues es posible que dados dos puntoscualesquiera de M no se puedan unir por una geodésica, y por otra parte,algunas de las geodésicas a través de un punto p ∈M pueden converger a un”foco” en otro punto de M, por ejemplo las geodésicas sobre una 2-esferason círculos máximos los cuales convergen siempre al punto antípoda delcual partieron.

Consideremos de nuevo el postulado de causalidad. Este postulado sitúaa la métrica g a parte de los otros campos de materia sobreM, dado su carác-ter geométrico especial. Si xα son coordenadas normales en una vecindaddel punto p ∈ U ⊂M y con origen en p, entonces, los puntos en U quepueden ser alcanzados a partir del punto p por curvas no como de espacioen U , son aquellos cuyas coordenadas satisfacen

(x0)2 − (x1)2 − (x2)2 − (x3)2 ≥ 0 (3.10)

El contorno de la región determinada por estos puntos está formado porla imagen del cono de luz de p bajo la transformación exponencial, i.e., elconjunto de geodésicas nulas a través de p. Así, observando cuales puntosde U ⊂M pueden comunicarse con p, se puede determinar el cono nulo Np

en TpM. Conocido Np, la métrica en p se puede determinar salvo un factorconforme, en donde

Page 77: Notas de clase: relatividad general

3.3. EL TENSOR MÉTRICO Y EL POSTULADO DE CAUSALIDAD 69

Definicion 87 Dos métricas g y g0 sobreM se llaman conformes, si

g0 = Ω2(x)g (3.11)

en donde Ω2(x) es una función suave y no nula, y por lo tanto

g(X,Y)

g(Z,W)=g0(X,Y)

g0(Z,W)(3.12)

Para determinar la métrica a partir del cono nulo Np, sean X,Y ∈TpMvectores como de tiempo y como de espacio, respectivamente. Entonces, laecuación

g(X+ λY,X+ λY) = g(X,X) + 2λg(Y,Y) + λ2g(X,Y) (3.13)

tiene dos raices reales λ1 y λ2, pues el discriminante es positivo,

(g(X,X))2 − 4g(X,X)g(Y,Y) > 0 (3.14)

pues g(X,X) > 0 y g(Y,Y) < 0. Por lo tanto, si Np es conocido entoncesλ1 y λ2 pueden ser determinados, y de estos valores podemos obtener larelación

λ1λ2 =g(X,X)

g(Y,Y)(3.15)

i.e., la razón de las magnitudes de un vector como de tiempo y uno como deespacio pueden ser determinadas. Ahora siW,Z son dos vectores no nulosen p, entonces

g(W,Z) =1

2(g(W+ Z,W+ Z)− g(W,W)g(Z,Z)) (3.16)

y por lo tanto, cada una de las magnitudes del lado derecho de la ecuación an-terior pueden ser comparadas con las magnitudes deX o deY y así podemosdeterminar, por ejemplo, la razón g(W,Z)/g(X,X). Esto significa que lacausalidad local permite determinar la métrica, salvo un factor conforme.En la práctica estas medidas se realizan usando el hecho que las señales elec-tromagnéticas viajan sobre geodésicas nulas, un hecho que es consecuenciade las ecuaciones de Maxwell y no de la teoría de la relatividad.

Para determinar el factor conforme se hace uso del segundo postulado,dejando así, todos los elementos de la teoría físicamente observables, pues

Page 78: Notas de clase: relatividad general

70CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDADGENERAL

podemos comparar los factores conformes en diferentes puntos de la var-iedad espacio-tiempo M. Esto se obtiene por el hecho que las ecuacionesde conservación Tαβ

;β = 0 pueden no cumplirse para una conexión derivadade otra métrica g0 = Ω2g. Una forma práctica de determinar el factor con-forme es observando pequeñas partículas de prueba libres y determinandosus geodésicas como de tiempo. Por ejemplo, consideremos un conjunto desistemas idénticos (e.g. los estados electrónicos internos de los átomos) cuyoscambios internos definen el conjunto de eventos a lo largo de las lineas deuniverso de cada sistema. Si se aisla cada sistema de los campos externos,entonces ellos siguen geodésicas como de tiempo. Si γ(t) es una de las geo-désicas con vector tangente (∂/∂t)γ entonces podemos medir la longitud dearco entre eventos vecinos para cualquiera de estos sistemas, y determinarg³(∂/∂t)γ , (∂/∂t)γ

´en cada punto del espacio-tiempo y determinar así, el

factor conforme, salvo un factor multiplicatico constante, el cual lo define laescala.

Los postulados de causalidad y conservación no nos dicen como construirTαβ para un conjunto de campos de materia dados. Sin embargo existe unamanera única y bien definida de calcular el tensor momentun-energía, si lasecuaciones de movimiento para los campos se derivan de una Lagrangiana,como es el caso para los campos de materia usuales y de interés físico.

Sea L la densidad Lagrangiana, la cual es función de los campos demateria Ψi, sus derivadas covariantes, hasta un orden finito y de la métrica.Entonces, las ecuaciones de movimiento de los campos se obtienen a partirde la acción

S =

ZLdv (3.17)

exigiendo que S sea estacionaria bajo variación de los campos en el interiorde una región compacta 4-dimensional D, i.e.,

δS = 0 (3.18)

Esta condición conduce a las ecuaciones de Euler-Lagrange

∂L∂Ψ(i)

−Ã

∂L∂¡∇Ψ(i)¢

!= 0 (3.19)

El tensor momentun-energía se obtiene a partir de la densidad lagrangianaL considerando las variaciones de la acción bajo cambios en la métrica:

Tαβ =2p|g(x)|

δS

δgαβ(3.20)

Page 79: Notas de clase: relatividad general

3.3. EL TENSOR MÉTRICO Y EL POSTULADO DE CAUSALIDAD 71

Por ejemplo, un campo escalar φ(x), el cual representa partículas deescalares de masa m, sin carga y espín cero, está descrito por la densidadLagrangiana

L = 1

2

p|g(x)|

ngαβφ;αφ;β −m2φ2

o(3.21)

en donde se han utilizado unidades de /h = 1 y c = 1. Las ecuaciones deEuler-Lagrange para este sistema, conducen a la ecuación de Klein-Gordon¡

¤+m2¢φ = 0 (3.22)

en donde el D’alembertiano está dado por:

¤φ = gαβφ;αβ (3.23)

y el tensor momentun-energía es:

Tαβ = φ;αφ;β −1

2gαβ

³gγδφ;γφ;δ +m2φ2

´(3.24)

Otro ejemplo, de importancia en cosmología, es el de fluido perfecto. Unfluido describe un sistema físico de muchas partículas (1023 que en este límitese puede considerar como un sistema continuo) a través de las cantidadesque determinan el sistema, tales como la densidad, presión, temperatura,viscosidad, etc. Aún cuando no hay una definición única de fluido perfecto,este se puede definir como un sistema en el cual no hay conducción térmicani viscosidad, o como lo describe equivalentemente Wienberg, como un fluidotal que en sus sistema en reposo es isotrópico. En estas condiciones un fluidoperfecto es descrito por la función densidad de energía y la densidad depresión.

Consideremos, en primer lugar, un gas de partículas en reposo relativo(polvo), así este sistema es descrito como un gas ideal con presión cero.Para un observador inercial todas las partículas se mueven con la mismavelocidad, y así con la misma cuadrivelocidad Uα. Definamos, entonces, elcuadri-vector flujo

Nα = nUα (3.25)

en donde n es la densidad propia de partículas, i.e., la densidad de partículasmedida en el sistema en reposo. Ahora, si todas las partículas tienen la mismamasa en reposo m, la densidad de energía propia está dada por:

ρ = nmc2 (3.26)

La densidad de energía caracteriza completamente al fluido, pero la an-terior ecuación es solamente válida en el sistema en reposo del fluido, así

Page 80: Notas de clase: relatividad general

72CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDADGENERAL

para encontrar la expresión covariante de la densidad de energía (válidapara cualquier observador inercial), recordemos que mc2 es la componentetemporal del cuadri-vector momentun de una partícula en sus sistema enreposo, pα = (mc, 0, 0, 0) y para este sistema Nα = nUα = (nc, 0, 0, 0).Por lo tanto la densidad de energía propia corresponde a la componente 00del tensor p ⊗N medida en su sistema en reposo, así definimos el tensormomentun-energía para el gas de polvo como:

Tαβ = pαNβ = nmUαUβ =ρ

c2UαUβ (3.27)

donde ρ es definida como la densidad de energía en el sistema en reposo.Para el caso más general de un fluido perfecto con presión, asumiremos ladefinición de Weinberg, como aquel que es isotrópico en su sistema en reposo.Esto significa que Tαβ es diagonal, es decir no hay flujo neto de momentun enla dirección ortogonal. Además, sus componentes espaciales deben ser todasiguales, por isotropía: T 11 = T 22 = T 33. Si llamamos T 00 = ρ la densidadde energía, T ii = p la densidad de presión, tenemos, que las componentesdel tensor momentun-energía, en el sistema en reposo están dadas por:

Tαβ =

ρ 0 0 00 p 0 00 0 p 00 0 0 p

(3.28)

la cual, para un sistema de referencia inercial cualquiera, se puede escribiren la forma (con c = 1):

Tαβ = (p+ ρ)UαUβ + pηαβ (3.29)

en donde ηαβ es el tensor métrico de Minkowski.La generalización para una variedad con métrica g es directa,

Tαβ = (p+ ρ)UαUβ + pgαβ (3.30)

El tipo de materia específico que se considere, está determinado porla ecuación de estado del sistema, es decir f(p, ρ) = 0, una función querelaciona la densidad de energía y materia, por ejemplo, para un gas depolvo la ecuación de estado es p = 0.

Este tensor momentun-energía se puede encontrar a partir de una den-sidad Lagrangiana. Siguiendo la definición de Weinberg, sea U el campode cuadrivelocidades y definamos la cuadri-corriente por J = µU, con µ la

Page 81: Notas de clase: relatividad general

3.4. ECUACIONES DE CAMPO DE EINSTEIN 73

densidad de partículas. La ecuación de continuidad exige que Jα;α = 0, y ladensidad Lagrangiana está dada por:

L = −2µ(1 + ε) (3.31)

donde ε = ε(µ) es el potencial elástico. La acción S es estacionaria cuandolas lineas de flujo se varían, ajustando J para mantener la corriente conser-vada. Entonces la ecuaciones de Euler-Lagrange conducen a las ecuacionesde movimiento para el fluido:

ρ;αUα + (ρ+ p)Uα

;α = 0

(ρ+ p)Uα = −p;β(gαβ + UβUα (3.32)

donde ρ = µ(1 + ε) es la densidad de energía, y p = µ2dε/dµ la densidadde presión, y Uα = Uα

;βUβ. Así, la aceleración de las lineas de flujo Uα es

proporcional al gradiente de presión ortogonal a las lineas de flujo. A partirde la densidad Lagrangiana obtenemos el tensor momentun-energía.

3.4. Ecuaciones de campo de Einstein

Hasta el presente la métrica g no ha sido especificada. En la teoría espe-cial de la relatividad, la cual no incluye los efectos gravitacionales, la métricaes plana, i.e., g = η. En la discusión al comienzo del capítulo, vimos comola fuerza de la gravedad, por su caracter universal, debe ser excluida comoun campo de fuerzas en un espacio plano, si queremos mantener la idea queuna partícula libre sigue ”lineas rectas” o que la luz en el vacío es constante.Para mantener el principio de relatividad, es decir, la física es la misma paratodos los observadores, o equivalentemente, las leyes de la física deben serindependientes del sistema de coordenadas, las ecuaciones de campo paradeterminar la métrica deben ser relaciones tensoriales, que involucran a lamateria a través del tensor momentun-energía, si queremos que mantenerel principio de equivalencia, es decir, si dos campos de materia contribuyencon la misma densidad de energía a un sistema entonces las ecuaciones decampo para la métrica deben conducir al mismo resultado. Por el lado de lageometría, como Hilbert se lo sugirió a Einstein, el único obgeto geométrico,salvo identidades o multiplos, el cual está determinado por el tensor métricoy primeras derivadas de sus componentes, es el tensor de Riemann, o tensoresderivados de ellos, y por lo tanto la única posibilidad, es una combinaciónlineal del tensor de Ricci, el escalar curvatura y una constante, proporcionalal tensor momentun-energía, dads las condiciones que sobre el se imponen,que sea simétrico y que satisfaga el principio de conservación local, asi

Page 82: Notas de clase: relatividad general

74CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDADGENERAL

Axiom 88 La métrica sobre la variedad espacio-tiempo (M,g) está deter-minada por las ecuaciones de campo de Einstein

Rαβ −1

2Rgαβ + Λgαβ =

8πG

c2Tαβ (3.33)

G =constante de gravitación universal.Λ = constante cosmológica

Este es un sistema de 10 ecuaciones diferenciales acopladas no linealespara la métrica y sus primeras derivadas. Sin embargo, dado que la divergen-cia covariante de cada lado de las ecuaciones se satisface independientementeµ

Rαβ − 12Rgαβ + Λgαβ

¶;α

= 0 =8πG

c2Tαβ;α (3.34)

entonces el número de ecuaciones independientes se reduce a seis. Este esel número correcto de ecuaciones, pues de las diez componentes independi-entes del tensor métrico, cuatro de ellas se pueden elegir arbitrariamente,pues corresponde al hecho que las componentes del tensor métrico son úni-cas, salvo una transformación de coordenadas. Así, las ecuaciones de campode Einstein determinan el tensor métrico, salvo la clase de equivalencia dedifeomorfismos

Θ : (M,g1) −→ (M,g2)

en donde dos métricas definen el mismo espacio-tiempo si entre las var-iedades (M,g1) y (M,g2) existe un difeomorfismo.

Para establecer la relación entre las ecuaciones de campo de Einstein yla teoría de la gravitación universal de Newton, consideremos una partículade prueba que se mueve lentamente (comparado con la velocidad de la luz)en un campo gravitacional débil. Si el campo es débil la métrica se puedeescribir en la forma (c = 1)

gαβ = ηαβ + hαβ; |hαβ| << 1 (3.35)

Si Uα son las componentes de la cuadri-velocidad de la partícula, en-tonces

dx0

dτ≈ 1;

dxi

dτ<< 1 (3.36)

y de la ecuación de las geodésicas tenemos

d2xi

dt2≈

d2xi

d2τ= −Γiαβ

dxα

dxβ

dτ≈ −Γi00 (3.37)

Page 83: Notas de clase: relatividad general

3.4. ECUACIONES DE CAMPO DE EINSTEIN 75

Ahora, el coeficiente de la conexión estádado por

Γi00 =1

2h00,i − h0i,0 (3.38)

en donde la coma significa la derivada usual. Si el campo gravitacional esestacionario h0i,0 = 0, y con la notación x = (x1, x2, x3), se obtiene

d2x

dt2= −1

2∇h00 (3.39)

que al compararla con la ecuación de Newton

d2x

dt2= −∇φ (3.40)

tenemos queh00 = 2φ+ cte. (3.41)

Puesto que el potencial gravitacional φ y h00 se anulan para grandes distan-cias, y reintroduciendo la velocidad de la luz, obtenemos

g00 = 1 +2φ

c2(3.42)

El término 2φ/c2 determina cuando una región del espacio-tiempo esfuertemente curvada, por ejemplo

2φ/c2 Sobre la superficie10−9 tierra10−6 sol10−4 enana blanca10−1 estrella neutronica10−39 proton

Page 84: Notas de clase: relatividad general

76CAPÍTULO 3. LOS POSTULADOS DE LA RELATIVIDADGENERAL

Page 85: Notas de clase: relatividad general

Capítulo 4

La solución de Schwarzschild

Karl Scharzschild, tan solo dos meses después de haberse publicado lasecuaciones de campo, encontró la primera solución analítica de las ecua-ciones de campo, para el exterior de una distribución de materia estáticay esféricamente simétrica. A partir de esta solución calculó el corrimientodel perihelio de mercurio y la desviación de un rayo de luz que pasa cer-ca al sol, confirmando los resultados previos obtenidos por Einstein en laaproximación post-Newtoniana (aproximación de campo débil).

4.1. Métrica para simetría esférica

Consideremos una distridución esférica de masa m y busquemos unasolución de las ecuaciones de campo de Einstein que describa la métrica enel exterior de la distribución, es decir, estamos buscando las componentesdel tensor métrico

g = gµνdxµ ⊗ dxν (4.1)

tal que g satisfaga las ecuaciones de Einstein en el vacío

Rαβ −1

2Rgαβ = 0 (4.2)

en donde los índices griegos recorren de 0 a 3, esto es xµ = (x0, x1, x2, x3),y x0 = ct.

La solución a este problema debe satisfacer las siguientes condiciones:

1. Estática

2. Esféricamente simétrica

77

Page 86: Notas de clase: relatividad general

78 CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD

3. Asintóticamente (lejos de la distribución) se debe reducir a la métricaMinkowskiana

Dada la simetría esférica del problema es útil trabajar en coordenadas es-paciales esféricas (r, θ, ϕ), eligiendo el origen de las coordenadas en el centrode la distribución de masa. La primera condición, métrica estática, significaque si g es independiente del tiempo, entonces las componentes del tensormétrico deben ser invariantes si hacemos la transformació x0 → −x0, lo queimplica que las componentes del tensor métrico de la forma g0i con i = 1, 2, 3no deben aparecer. Así el tensor métrico que estamos buscando debe ser dela forma

g = g00dx0 ⊗ dx0 + gijdx

i ⊗ dxj i, j = 1, 2, 3 (4.3)

Introduciendo en forma explícita las coordenadas esféricas y la coorde-nada temporal x0 = ct, y debido a la simetría esférica del problema, en eltensor métrico no deben aparecer términos espaciales de la forma dr ⊗ dθ,dr ⊗ dϕ y dθ ⊗ dϕ, y por lo tanto el tensor métrico toma la forma

g = g00c2dt⊗ dt+ grrdr ⊗ dr + gθθr

2dθ ⊗ dθ + gϕϕr2 sin2 θdϕ⊗ dϕ (4.4)

en donde los coeficientes métricos g00, grr, gθθ y gϕϕ son funciones solamentede la coordenada radial r. Veamos que las componentes métricas gθθ y gϕϕdeben ser iguales. Pues supongamos que hacemos un desplazamiento infini-tesimal δθ con = rδθ a partir del polo norte (θ = 0) con t, r y ϕ constantes,entonces

ds2 = gθθ2 (4.5)

Si realizamos ahora el mismo desplazamiento pero en el plano ecuatorial(θ = π/2) con idéntico r, = rdϕ entonces

ds2 = gϕϕ2 (4.6)

y por lo tanto, dada la simetría esférica de la distribución de materia se debetener que gθθ = gϕϕ. Sea

dΩ2 = dθ ⊗ dθ + sin2 θdϕ⊗ dϕ (4.7)

entonces el tensor métrico toma la forma

g = g00c2dt⊗ dt+ grrdr ⊗ dr + gθθr

2dΩ2

= g00c2dt2 + grrdr

2 + gθθr2dΩ2 (4.8)

lo cual significa que nos queda por determinar solamente tres funciones de r:g00(r), grr(r) y gθθ(r). Esta expresión se puede simplificar aún más y reducir

Page 87: Notas de clase: relatividad general

4.1. MÉTRICA PARA SIMETRÍA ESFÉRICA 79

el problema solamente a dos funciones desconocidas, pues si realizamos elcambio de variable

r −→ r =p−gθθ(r)r (4.9)

entonces

−gθθr2 = r2 =⇒

2rdr = −r2dgθθdr

dr − 2gθθrdr =⇒

dr = − r

gθθr

µ1 +

r

2gθθ

dgθθdr

¶−1dr (4.10)

Así

grrdr2 = −grr

gθθ

µ1 +

r

2gθθ

dgθθdr

¶−2dr2

= grr (r) dr2 (4.11)

Remmplazando las ecuaciones de transformación anteriores en el tensormétrico 4.8 tenemos

g = g00c2dt2 + grr (r) dr

2 − r2dΩ2

= g00c2dt2 + grrdr

2 − r2dΩ2 (4.12)

en donde hemos redefinido r −→ r y grr → grr en la última igualdad, pararegresar a la notación usual de la variable radial. De esta forma el problemase ha redusido a solo dos funciones, las cuales se determinan a partir de lasecuaciones de campo de Einstein y las condiciones de frontera adecuadas.Dada la signatura de la métrica, g00 > 0 y grr < 0, podemos reescribir eltensor métrico en la siguiente forma

g = eh(r)c2dt2 − eg(r)dr2 − r2dΩ2 (4.13)

Las nuevas funciones a determinar, h(r) y g(r) deben satisfacer la condi-ción asintótica

lımr→∞h(r) = 0

lımr→∞ g(r) = 0 (4.14)

para obtener el límite Minkowskiano de la condición 3. Las componentes deltensor métrico deben satisfacer las ecuaciones de campo de Einstein en elvacío 4.2. Antes de reemplazar los coeficientes métricos en este sistema deecuaciones, veamos un teorema que nos permite simplicar los cálculos:

Page 88: Notas de clase: relatividad general

80 CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD

Teorema 89 Las ecuaciones de campo de Einstein en el vacío sin constantecosmológica son equivalentes a la anulación de de las componentes del tensorde Ricci, i.e.

Rαβ −1

2Rgαβ = 0 ⇐⇒ Rαβ = 0 (4.15)

Proof. (⇐=) Si Rαβ = 0 entonces R = 0(=⇒) Si Rαβ − 1

2Rgαβ = 0 subiendo el primer índice covariante y con-trayendo tenemos 0 = Rα

α − 12g

ααR = R − 2R = 0 entonces R = 0 y por lo

tanto Rαβ = 0

A partir de las condiciones de simetría del problema pudimos determinarla forma general y más simple del tensor métrico, antes de entrar en elproblema de resolver las ecuaciones de campo, lo cual constituye un métodousual de trabajo en física. Sin embargo, aun con esta métrica simplificada esnecesario calcular 40 símbolos de Christoffel que aparecen en las ecuacionesde campo. Un método ágil que nos permite calcular las componentes no nulasde los símbolos de Christoffel, lo constituye el método variacional (ecuacionesde Euler-Lagrange) para la ecuación de las geodésicas:

d2xα

dt2+ Γαβγ

dxβ

dt

dxγ

dt= 0 (4.16)

las cuales contienen todos los símbolos de Christoffel y pueden ser obtenidasa partir del principio variacional

0 = δ

ZFds

= δ

Zgαβ

dxα

ds

dxβ

dsds (4.17)

con las ecuaciones de Euler-Lagrange

d

ds

µ∂F

∂xµ

¶=

∂F

∂xµ; xµ =

dxµ

ds(4.18)

Así, para la métrica de Schwarzschild el elemento de distancia espacio-tiempo está dado por

F = eh(r)¡x0¢2 − eg(r)

¡x1¢2 − r2

¡x2¢2 − r2 sin2 θ

¡x3¢2

(4.19)

en donde x0 = ct, x1 = r, x2 = θ y x3 = ϕ.

Page 89: Notas de clase: relatividad general

4.1. MÉTRICA PARA SIMETRÍA ESFÉRICA 81

Consideremos en primer lugar la ecuación de Euler-Lagrange para lacoordenada temporal x0, y denotemos las derivadas con respecto a la coor-denada radial por primas, así

d

ds

³2eh(r)x0

´= 0 =⇒

x0 + h(r)x1x0 = 0 (4.20)

La ecuación de las geodésicas correpondiente la obtenemos a partir de laecuación 4.16 para α = 0,

0 =d2x0

dt2+ Γ0βγ

dxβ

dt

dxγ

dt= x0 + Γ000x

0x0 + Γ001x0x1 + · · ·+ Γ033x3x3 (4.21)

Entonces, comparando las dos últimas ecuaciones, tenemos que los únicossímbolos de Christoffel no nulos son:

Γ010 = Γ001 =

1

2h(r) (4.22)

Para la coordenada r la ecuación de Euler-lagrange está dada por:

d

ds

³−2eg(r)x1

´= −2g(r)eg(r)

¡x1¢2 − 2eg(r)x1

= h(r)eh(r)¡x0¢2 − g(r)eg(r)

¡x1¢2 − 2r ¡x2¢2 − 2r sin2 θ ¡x3¢2(4.23)

mientras que la ecuación geodésica, para α = 1 es

0 =d2x1

dt2+ Γ1βγ

dxβ

dt

dxγ

dt= x1 + Γ100x

0x0 + Γ101x0x1 + · · ·+ Γ133x3x3 (4.24)

y comparándolas, los símbolos de Christoffel no nulos están dados por:

Γ100 =1

2h(r)eh(r)−g(r)

Γ111 = −12g(r)

Γ122 = −re−g(r)

Γ133 = −re−g(r) sin2 θ (4.25)

Page 90: Notas de clase: relatividad general

82 CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD

Procediendo de forma similar para las coordenadas θ y ϕ los símbolosno nulos que se obtienen son:

Γ212 = Γ221 =1

rΓ233 = − sin θ cosϕ

Γ313 = Γ331 =1

rΓ323 = Γ332 = cot θ (4.26)

Reemplazando los simbolos de Chritoffel obtenidos en las ecuaciones decampo en el vacío:

0 = Rβδ = Rσβσδ

=∂Γσδβ∂xσ

−∂Γσσβ∂xδ

+ ΓσσµΓµδβ − Γ

σµδΓ

µσβ (4.27)

obtenemosRβδ ≡ 0 si β 6= δ (4.28)

y de los términos diagonales Rββ = 0, se llega al siguiente sistema de ecua-ciones diferenciales acopladas:

h+1

2h2 − 1

2hg +

2

rh = 0 (4.29)

h+1

2h2 − 1

2hg − 2

rg = 0 (4.30)

¡re−g

¢− 2e−g − 1 + re−g

µh+ g

2+2

r

¶= 0 (4.31)

sin2 θ¡¡re−g

¢− 1¢= 0 (4.32)

Restando las ecuaciones 4.29 y 4.30 obtenemos

h+ g = 0 (4.33)

entoncesh+ g = cte. (4.34)

y de la condición asintótica tenemos

h+ g = 0 (4.35)

Page 91: Notas de clase: relatividad general

4.1. MÉTRICA PARA SIMETRÍA ESFÉRICA 83

Con esta condición la ecuación 4.30 toma la forma

g − g2 +2

rg = 0 (4.36)

Esta ecuación diferencial de segundo orden se puede escribir como:¡re−g

¢= 0 (4.37)

la cual admite una primera integral¡re−g

¢= K1 (4.38)

Antes de integrar esta ecuación, veamos que las otras dos ecuacionesdiferenciales 4.31 y 4.32 son consistentes con lo encontrado hasta ahora. Dela ecuación 4.31 tenemos¡

re−g¢− 2e−g − 1 + re−g

µ0

2+2

r

¶= 0 =⇒¡

re−g¢− 2e−g − 1 + 2e−g = 0 =⇒¡

re−g¢

= 1 (4.39)

lo que implica que la constante de integración K1 = 1. La ecuación 4.32 noda información adicional pues se satisface idénticamente debido a la últimarelación encontrada, ecuación 4.39. Integrando la ecuación 4.39 obtenemos

e−g(r) = eh(r) = 1− K2

r(4.40)

en dondeK2 es una constante de integración. Así la métrica de Schwarzschildtoma la forma

g =

µ1− K2

r

¶¡dx0

¢2 −µ1− K2

r

¶−1dr2 − r2dΩ2 (4.41)

Notemos que hasta el presente, en la deducción de la métrica de Schwarz-schild solo se ha utilizado la simetría de la distribución de materia y el car-acter asintótico, pero no la masa total de la distribución ni su radio. Esde esperar que la constante de integración K2 involucre, de alguna manera,esta información que caracteriza a la distribución de materia que produceel campo gravitacional en su exterior. Para calcular esta constante podemosutilizar el siguiente razonamiento: La solución de Schwarzschild es válidapara el exterior de cualquier distribución esférica de materia, y por lo tan-to debe describir el campo gravitacional de cualquier cuerpo celeste usual

Page 92: Notas de clase: relatividad general

84 CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD

conocido, tal como el sol o la tierra, y se espera que esta métrica repre-sente los fenómenos que conocemos, y en particular esperamos que en ellímite de bajas velocidades y campos gravitacionales débiles los resultadosobtenidos se aproximen a los encontrados por la ley de gravitación universalde Newton. Así podemos trabajar la aproximación postnewtoniana, vista enel capítulo anterior, y utilizar la ecuación 3.42 que nos relaciona el potencialgravitacional Newtoniano con la componente g00 del tensor métrico. Por lotanto, dado que el potencial gravitacional Newtoniano en el esterior de unadistribución esférica de masa m está dado por

φ(r) = −Gmr

(4.42)

y la componente para la métrica de Schwarzschild, ecuación 4.41, es

g00 = 1−K2

r(4.43)

entonces

g00 = 1 +2φ

c2=⇒

1− K2

r= 1− 2Gm

rc2=⇒

K2 =2Gm

c2(4.44)

De esta manera la métrica de Schwarzschild está dada por

g =

µ1− 2Gm

c2r

¶¡dx0

¢2 −µ1− 2Gmc2r

¶−1dr2 − r2dΩ2 (4.45)

El método que utilizamos para calcular la constante de integración K2,aun cuando conduce al resultado correcto, deja la pregunta abierta de lainterpretación física de la masa como fuente del campo, a través del tensormomentun-energía. Para este fin es necesario desarrollar el concepto de lasleyes de conservación para el campo gravitacional. Este campo de traba-jo está abierto a investigación y dejaremos para un capítulo posterior suformulación.

4.1.1. Teorema de Birkhoff

En este punto es importante enfatizar que el radio de la distribución nodebe aparecer en forma explícita en la solución, debido a la simetría esférica

Page 93: Notas de clase: relatividad general

4.1. MÉTRICA PARA SIMETRÍA ESFÉRICA 85

del problema. Es decir, la solución de Schwarzschild obtenida es válida solopara r > R, donde R es el radio de la distribución, y de manera similar a lasituación que se presenta en electrostática, el campo eléctrico en el exteriorde una distribución esférica de carga, para puntos exteriores, se comportacomo el campo de una carga puntual, es decir como si toda la carga estu-viera concentrada en el centro y la solución no involucra, en forma explícita,el radio de la distribución. Esta situación la podemos ver mejor en el sigu-iente resultado debido a Birkhoff, el cual establece que la solución para elexterior de una distribución de masa esférica es la de Schwarzschilod, inde-pendientemente que esta distribución esté variando radialmente, es decir sila distribución esta colapsando o expandiéndose. Para ver esto, considere-mos una situación en la cual la distribución esférica de masa total m estávariando su radio en el tiempo, i.e., R = R(t), y busquemos una soluciónde las ecuaciones de campo de Einstein para el exterior de esta distribu-ción, es decir en en vacío. Dado que los elementos de simetría utilizadospara construir la forma general de la solución buscada, ecuación 4.13, no seven afectados por el comportamiento del radio de la distribución, podemosasumir que la métrica buscada tiene la forma general

g = eh(r,t)c2dt2 − eg(r,t)dr2 − r2dΩ2 (4.46)

pero ahora las funciones h(r, t) y g(r, t), deben depender del tiempo. Si pro-cedemos como antes, es decir, si introducimos esta métrica en las ecuacionesde campo, obtenemos una relación similar a la ecuación 4.33

h+ g = 0 (4.47)

en donde la prima significa derivada respecto a la coordenada r, entoncesintegrando

h+ g = cte(t) = λ (t) . (4.48)

en donde ahora la constante de integración puede depender del tiempo. Así,continuando con este procedimiento obtenemos finalmente

g = eλ(t)µ1− 2Gm

c2r

¶¡dx0

¢2 −µ1− 2Gmc2r

¶−1dr2 − r2dΩ2 (4.49)

Si redefinimos la coordenada temporal como

t =

Zeλ(t)dt (4.50)

Page 94: Notas de clase: relatividad general

86 CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD

entonces la métrica toma la forma de Schwarzschlid, es decir la métrica enel exterior de la distribución solo depende de la masa total, y no del radiode la distribución, así este radio sea o no una función del tiempo.

Este importante resultado significa que la solución de Schwarzschildobtenida, es la única solución que representa la métrica en el vacío pro-ducida por cualquier distribución de materia con simetría esférica.

4.1.2. Características de la solución de Schwarzschild

La métrica de Schwarzschild representa la solución a las ecuaciones decampo de Einstein para el exterior de una distribución esférica de materia, ypor esta razón es válida para r > R, en donde R es el radio de la distribución.Sin embargo en la expresión para la métrica, ecuación 4.45, aparece unasingularidad coordenada, en el sentido que el coeficiente de

¡dx0

¢2 se anulay el coeficiente de dr2 diverge a +∞, cuando r −→ 2Gm/c2 por la derecha.A este valor de la coordenada radial, denotado por rs, se le conoce como elradio de Schwarzschild de la distribución

rs =2Gm

c2(4.51)

el cual solo depende de la masa total y por lo tanto es un parámetro quecaracteriza la distribución, independientemente del radio R. Si calculamosel valor de este parámetro para un cuerpo como la tierra tenemos

rs =2× 6,67259× 10−11m3 kg−1 s−2 × 5,9742× 1024 kg

(2,99792458× 108ms−1)2

= 8. 870 8× 10−3m (4.52)

es decir, del orden de 9 milímetros, que en comparación con el radio de latierra RT = 6,5×106m es despreciable. Esto muestra por qué esta singulari-dad no es relevante para los objetos celestes usuales. De hecho Schwarzschildnotó este problema que surgía en su solución y calculó de nuevo la métricapara una distribución de masa con una densidad de energía constante y ob-tuvo que el radio de la distribución debería ser mayor a 9rs/8, resultado quelo dejó satisfecho pues aún en este caso la singularidad no jugaba papel al-guno. En 1923 Birkhoff mostró que una solución esféricamente simétrica delas ecuaciones de campo en el vacío era necesariamente estática para r > rs,y por lo tanto la solución para cualquier distribución esférica de masa noestática era la de Schwarzschild si r > rs, y por lo tanto el argumento deutilizó Schwarzschild no es válido. Sin embargo dado que rs es muy pequeño

Page 95: Notas de clase: relatividad general

4.1. MÉTRICA PARA SIMETRÍA ESFÉRICA 87

no se esperaba encontrar una distribución de materia en donde el radio dela distribución R fuera mayor que rs. Pues, por ejemplo esto implicaba queun cuerpo como la tierra tuviera una densidad del orden de

ρ =3× 5,9742× 1024 kg4π (8. 870 8× 10−3m)3

=2. 0× 1030

m3kg (4.53)

lo cual no se veía factible para la materia ordinaria que se conocía.Un resultado conocido de la ley de gravitación universal de Newton, de-

bido al comportamiento de la fuerza gravitacional con el inverso del cuadradode la distancia, es el hecho de que la fuerza sobre una masa en el interiorde un cascarón esférico de materia se anula. Para ver que sucede en el casode la relatividad general, consideremos una distribución esférica de mate-ria de radio R, con un hueco interior concéntrico de radio a < R, entoncesbusquemos una solución de las ecuaciones de campo en el interior de estacavidad. Es claro que por simetría, podemos seguir el mismo procedimientoque vimos para encontrar la solución de Schwarzschild, y podemos proponerllevar los mismos argumentos hasta plantear la forma general de la solucióncomo

g = eh(r)c2dt2 − eg(r)dr2 − r2dΩ2 (4.54)

La primera diferencia que surge con respecto a la solución de Schwarz-schild es en la condición asintótica, la cual ya no es más aplicable en elpresente caso y por lo tanto en la ecuación 4.34,

h+ g = k = cte. (4.55)

la constante k ya no es cero. Así, continuando con el procedimiento encon-tramos (ecuación 4.40)

e−g(r) = e−keh(r) = 1− K2

r(4.56)

Para encontrar la solución en el interior del cascarón esférico podemoscomparar la solución encontrada en la aproximación post-Newtoniana conel potencial clásico, teniendo en cuenta que el potencial gravitacional New-toniano en el interior del cascarón es constante (i.e., la fuerza es cero sobrela partícula de prueba), entonces

g00 = 1 +2φ

c2=⇒

g00 = ekµ1− K2

r

¶(4.57)

Page 96: Notas de clase: relatividad general

88 CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD

lo que implica que K2 = 0, y por lo tanto la métrica toma la forma

g = ekc2dt2 − dr2 − r2dΩ2 (4.58)

la cual, salvo un factor de escala temporal que depende del potencial con-stante en el interior del cascarón, se reduce a la métrica Minkowskiana,lo cual representa la versión relativista de la anulación de la fuerza grav-itacional en el interior de un cascarón esférico de materia, lo cual es unaconsecuencia del comportamiento con el inverso al cuadrado de la distanciade la fuerza de gravitación universal. Este resultado justifica ciertas consid-eraciones Newtonianas que se hacen en cosmología.

4.2. Pruebas clásicas de la relatividad general

En esta sección analizaremos el movimiento de partículas materiales deprueba y de rayos de luz (fotones) en el campo de una distribución esféri-ca de masa, concentrándonos en dos efctos particulares: el corrimiento delperihelio del planeta Mercurio y la desviación de un rayo de luz que pasamuy cerca de la superficie solar. Estos resultados se han constituido comolos paradigmas históricos de las pruebas observacionales de la teoría generalde la relatividad.

4.2.1. Corrimiento del perihelio de Mercurio

Consideremos en primer lugar el cálculo de las geodésicas como de tiem-po para la métrica de Schwarzschild, las cuales describen las trayectoriasseguidas por partículas materiales (i.e., de masa propia diferente de cero).Estas geodésicas se pueden deducir a partir del elemento de línea por elprincipio variacional 4.17, en donde

F =³1− rs

r

´ ¡x0¢2 − ³1− rs

r

´−1 ¡x1¢2 − r2

¡x2¢2 − r2 sin2 θ

¡x3¢2(4.59)

en donde¡x0, x1, x2, x3

¢= (ct, r, θ, ϕ), y xµ = dxµ/ds. Entonces la ecua-

ciones de Euler-Lagrange están dadas por (µ = 0, 1, 2, 3):

d

ds

µ∂F

∂xµ

¶=

∂F

∂xµ(4.60)

Consideremos primero la ecuación para la coordenada x2 = θ, entonces

d

ds

³r2θ´= r2 sin θ cos θϕ2 (4.61)

Page 97: Notas de clase: relatividad general

4.2. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL 89

y por lo tanto, si las condiciones iniciales del movimiento son tales queθ (0) = π/2 y θ (0) = 0 entonces θ (t) = π/2, es decir, si el cuerpo seestá moviendo inicialmente en el plano ecuatorial θ = π/2 con θ (0) = 0entoces el movimiento continua siempre en este plano. Por esta razón siemprepodemos elegir los ejes coordenados espaciales con el eje z normal al planodel movimiento. De esta forma asumiremos que θ = π/2 y por lo tanto lafuncional F se reduce a

F =³1− rs

r

´c2t2 −

³1− rs

r

´−1r2 − r2ϕ2 (4.62)

A partir de esta funcional, las ecuaciones de Euler-lagrange para lascoordenadas t y ϕ toman la forma

d

ds

¡r2ϕ

¢= 0 (4.63)

d

ds

³c2³1− rs

r

´t´= 0 (4.64)

Estas ecuaciones implican entonces que

r2ϕ = L = cte. (4.65)³1− rs

r

´t = E = cte. (4.66)

Para encontrar la ecuación para la coordenada radial, dividamos (for-malmente) el elemento de arco (distancia espacio-tiempo) por ds, entonces

1 =³1− rs

r

´t2 −

³1− rs

r

´−1r2 − r2ϕ2 (4.67)

y reemplacemos las ecuaciones 4.65 y 4.66 en la ecuación anterior obtenemos

1 =³1− rs

r

´−1E2 −

³1− rs

r

´−1r2 − L

2

r2(4.68)

o equivalentemente

r2 +³1− rs

r

´µ1 +

L2r2

¶= E2 (4.69)

Esta ecuación la podemos escribir en la forma

r2 + V (r) = E2 (4.70)

Page 98: Notas de clase: relatividad general

90 CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD

en donde el potencial efectivo V (r) está dado por

V (r) =³1− rs

r

´µ1 +

L2r2

¶(4.71)

Las ecuaciones 4.65 y 4.66 representan leyes de conservación pues parala métrica de Schwarzschild ∂/∂t y ∂/∂ϕ son campos vectoriales de Killing.Este resultado se puede ver del siguiente teorema:

Teorema 90 Sea γ (s) una geodésica con vector tangente u = (∂/∂s) |γ yζ un campo vectorial de Killing, entonces

g (u, ζ) = cte.

a lo largo de la geodésica γ (s).Proof. Calculemos la derivada covariante del tensor métrico a lo largo dela curva γ (s), entoncesµ

D

∂sg (u, ζ)

¶| γ =∇ug (u, ζ)= (gµνu

µζν);σ uσ

= gµνuµ;σζ

νuσ + gµνuµζν;σu

σ

g (∇uu, ζ) + g (u,∇uζ)como la curva γ es una geodésica con vector tangente u, por definición∇uu = 0, y por lo tanto

∇ug (u, ζ) = gµνuµζν;σu

σ

= uµuσζν;σ

=1

2

¡uµuσζµ;σ + uσuµζσ;µ

¢en donde la última igualdad se obtiene del hecho que los índices µ y σ sonmudos. Dado que ζ es un campo vectorial de Killing satisface la ecuación

ζµ;σ + ζσ;µ = 0

y por lo tanto

∇ug (u, ζ) =1

2

¡uµuσζµ;σ + uµuσζσ;µ

¢=

1

2uµuσ

¡ζµ;σ + ζσ;µ

¢= 0

lo cual demuestra el teorema.

Page 99: Notas de clase: relatividad general

4.2. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL 91

Así, para el caso de la métrica de Schwarzschild tenemos que los vectoresde Killing ∂/∂t y ∂/∂ϕ tienen componentes (1, 0, 0, 0) y (0, 0, 0, 1) respecti-vamente y por lo tanto

g (u, ∂/∂t) = g00u0

=³1− rs

r

´ dx0

ds

=³1− rs

r

´t

= cte. (4.72)

g (u, ∂/∂ϕ) = g44u4

= −r2dx4

ds= −r2ϕ= cte. (4.73)

Aquí estamos interesados en la órbita de la partícula de prueba r = r (ϕ),entonces

r =dr

dϕ=

r

ϕ(4.74)

y de las ecuaciones 4.65 y 4.70 tenemos

L2r4

r = E2 − V (r) (4.75)

Para integrar esta ecuación realicemos el siguiente cambio de variable

u =1

r=⇒ r = − u

u2(4.76)

entonces

u2 + u2 =E2 − 1L2 +

rsL2u+ rsu

3 (4.77)

diferenciando con respecto a ϕ tenemos

2uu+ 2uu− rsL2 u− 3rsu

2u = 0 =⇒

2u

µu+ u− rs

2L2 −3

2rsu

2

¶= 0 (4.78)

Page 100: Notas de clase: relatividad general

92 CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD

Una solución de esta ecuación corresponde a movimiento circular, i.e.,u = 0 implica r = cte.o

u+ u− rs2L2 −

3

2rsu

2 = 0 (4.79)

Si comparamos esta ecuación con la obtenida en mecánica Newtoniana

u+ u− Gm

L2= 0 (4.80)

en donde

L = r2dϕ

dt(4.81)

y notando que r2ϕ = L la relación entre las dos ecuaciones es

rs2L2 =

Gm

c2L2

=Gm

c2 (r2ϕ)2

=Gm

c2³r2 dϕds

´2=

Gm

c2³r2 dϕcdt

´2=

Gm³r2 dϕdt

´2=

Gm

L2(4.82)

en donde se ha utilizado la aproximación ds ' cdt válida para velocidadespequeñas en comparación con la velocidad de la luz. Así, teniendo en cuentala definición del radio de Schwarzschild rs = 2Gm/c2 tenemos que cL = L.Vemos entonces que la ecuación relativista contiene el término adicional3/2rsu

2, el cual, para el caso de la órbita de Mercurio es pequeño comparado

Page 101: Notas de clase: relatividad general

4.2. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL 93

con el témino rs/2L2, pues teniendo en cuenta que ds ' cdt, tenemos

3/2rsu2

rs/2L2= 3L2u2

= 31

r2¡r2ϕ

¢2' 3

c2

µrdϕ

dt

¶2' 3

v2⊥c2

∼ 7, 7× 10−8 (4.83)

en donde v⊥ es la velocidad de Mercurio perpendicular al radio vector. Poresta razón podemos resolver la ecuación de movimiento relativista para laórbita de Mercurio, tratando al término 3/2rsu2 como una perturbación. Laaproximación de orden cero (Newtoniana) está dada por

u(0) =rs2L2 (1 + e cosϕ) (4.84)

en donde la excentricidad e está definida como

a¡1− e2

¢=2L2rs

(4.85)

siendo a el semi-eje mayor de la órbita. Introduciendo esta solución de ordencero en la ecuación diferencial para la órbita (ecuación 4.79) tenemos32rsu

2

u+ u =rs2L2 +

3r3s8L4 (1 + e cosϕ)2 (4.86)

Para encontrar la solución a esta ecuación diferencial no homogénea,notemos que las siguientes tres ecuaciones diferenciales

u+ u =

K

K cosϕK cos2 ϕ

(4.87)

poseen las siguientes soluciones particulares

K12Kϕ sinϕ

12K −

16K cos (2ϕ)

(4.88)

Page 102: Notas de clase: relatividad general

94 CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD

Puesto que la solución perturbativa u que estamos buscando es de laforma u = u(0)+u(1), donde u(1) es la solución de la ecuación 4.86, entoncesde las tres soluciones particulares la primera K = cte no es de interés, puessolamente cambia los parámetros de la órbita no perturbada y la tercerasolución 1

2K −16K cos (2ϕ) tampoco nos interesa pues en periódica y por

lo tanto no es observable. Así, la solución que presenta una perturbacióninteresante a la órbita no perturbada es la segunda, pues lleva a un cam-bio secular de la órbita. De esta forma la solución que estamos interesadoscorresponde a la ecuación diferencial

u+ u =rs2L2 +

3r3s4L4 e cosϕ (4.89)

la cual se obteniene a partir de la ecuación 4.86 manteniendo solamente eltérmino en cosϕ. La solución a esta ecuación diferencial está dada por

u =rs2L2

µ1 + e cosϕ+

3r2s4L2 eϕ sinϕ

¶(4.90)

Teniendo en cuenta que el término 3r2s/4L2 es pequeño para órbitasplanetarias, pues e.g.

3r2s4L2 =

3r2s

4 (r2ϕ)2

=3r2s

4 (r2ϕ)2

' 3r2sc2

4r2³r dϕdt

´2∼ 7× 10−8 (4.91)

para Mercurio, entonces podemos reescribir la ecuación 4.90 3n la forma

u =rs2L2

µ1 + e cos

µϕ− 3r2s

4L2ϕ¶¶

(4.92)

El término 3r2sϕ/4L2 introduce un aperiodicidad el la órbita del planeta,la cual tiene como consecuencia un corrimiento en el perihelio de la órbita.El perihelio de una órbita sucede cuando r es un mínimo, o equivalentementeu es un máximo, así u es máximo cuando

ϕ

µ1− 3r2s

4L2¶= 2πn; n ∈ N (4.93)

Page 103: Notas de clase: relatividad general

4.2. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL 95

entonces

ϕ 'µ1 +

3r2s4L2

¶2πn (4.94)

y por lo tanto perihelios sucesivos ocurren a intervalos de

∆ϕ = 2π

µ1 +

3r2s4L2

¶(4.95)

y así el corrimiento del perielio por revolución para la órbita de Mercurio es

δϕ = 2π3r2s4L2

= 42,89/siglo (4.96)

El valor medido para Mercurio es de 42,6± 1,0/siglo.

4.2.2. Desviación de la luz por el sol

Para describir las geodésicas nulas el parámetro s no es apropiado puestoque ds = 0. Sea q un parámetro cualquiera, entonces la ecuación de lasgeodésicas se puede obtener a partir del principio variacional

δ

Zgµν

dxµ

dq

dxν

dqdq = 0 (4.97)

De igual forma como procedimos en la sección anterior para obtener lastrayectorias de partículas, podemos restringir, sin pérdida de generalidad,el movimiento de los rayos de luz al plano θ = π/2. Entonces las ecuacionespara las coordenadas t y ϕ están dadas por

r2ϕ = cte. = h (4.98)³1− rs

r

´t = cte. = L (4.99)

La ecuación para la coordenada r la obtenemos a partir de la condiciónds = 0 válida para geodésicas nulas, así³

1− rsr

´−1c2L2 −

³1− rs

r

´−1r2 − h2

r2= 0 (4.100)

Eliminando el parámetro q, y haciendo el cambio u (ϕ) = 1/r (ϕ), laecuación anterior se transforma en

c2L2 − h2u2 − h2u2 (1− rsu) = 0 (4.101)

Page 104: Notas de clase: relatividad general

96 CAPÍTULO 4. LA SOLUCIÓN DE SCHWARZSCHILD

y diferenciando esta ecuación con respecto a ϕ, tenemos

u

µu+ u− 3rs

2u2¶= 0 (4.102)

Descartando la solución u = cte. obtenemos finalmente

u+ u =3rs2u2 (4.103)

Puesto que estamos interesados en la trayectoria de rayos de luz en elcampo del sol, y en particular para rayos de luz que pasan cerca a la superficiesolar, el término 3rsu/2 es pequeño

3rs2u ' 10−6 (4.104)

y por lo tanto podemos considerar el término 3rsu2/2 como una pertur-bación, así la solución a la ecuación no perturbada

u+ u = 0 (4.105)

está dada poru(0) = A cos (ϕ+ δ) (4.106)

con A y δ constantes de integración. Esta solución representa una línea recta(no hay desviación) y si escogemos el origen de los ejes en el centro del sol,y consideramos un rayo proveniente de y → −∞, y llamamos xmın = r0 elpunto de máximo acercamiento (que coincide con el parámetro de impacto)entonces la solución no perturbada se puede escribir en la forma

u(0) =1

r0cosϕ ⇐⇒

r cosϕ = r0 (4.107)

Entonces la solución a primer orden en teoría de perturbaciones de laecuación 4.103 la podemos ecribir como

u = u(0) +3rs2v (4.108)

en donde v satisface la ecuación

v + v =³u(0)

´2⇐⇒

v + v =1

2r0(1 + cos 2ϕ) (4.109)

Page 105: Notas de clase: relatividad general

4.2. PRUEBAS CLÁSICAS DE LA RELATIVIDAD GENERAL 97

cuya solución es

v =2

3r20− 1

3r20cos2 ϕ (4.110)

y por lo tanto la solución hasta términos de orden 3rs/2 toma la forma

u =1

r0cosϕ− rs

2r20cos2 ϕ+

rsr20

(4.111)