eduardo menendez 19 de junio de 2006 - universidad de chile · 2007-11-26 · reactores nucleares...

129
Fenomenolog´ ıa Eduardo Menendez 19 de junio de 2006

Upload: others

Post on 12-May-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Fenomenologıa

Eduardo Menendez

19 de junio de 2006

2

Indice general

1. Elementos de fısica de solidos 71.1. Elementos de cristalografıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.1.1. Ejemplos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.1.2. Simetrıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.2. Fuerzas interatomicas y tipos de solidos . . . . . . . . . . . . . . . . . . . . . . 171.2.1. “Gases nobles” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.2.2. Cristales ionicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.2.3. Cristales covalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.2.4. Metales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1.3. Elasticidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.3.1. Simetrıas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.3.2. Deformaciones homogeneas . . . . . . . . . . . . . . . . . . . . . . . . . 281.3.3. Ondas elasticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1.4. Densidad de Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321.4.1. Particula libre en una caja unidimensional . . . . . . . . . . . . . . . . 321.4.2. Partıcula libre con condiciones de frontera periodicas en una dimension 331.4.3. Particula libre en dos dimensiones . . . . . . . . . . . . . . . . . . . . . 341.4.4. Particula libre en tres dimensiones . . . . . . . . . . . . . . . . . . . . 341.4.5. Ondas elasticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

1.5. Modelos del calor especifico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2. Mapas discretos 392.1. El mapa logıstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.2. Grupo de renormalizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3. Caos en ecuaciones diferenciales ordinarias 473.1. Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.1.1. Corte de Poincare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493.1.2. Mapa de los maximos sucesivos . . . . . . . . . . . . . . . . . . . . . . 493.1.3. Mapa estroboscopico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3.2. Escaleras del diablo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4. Elementos de optica no lineal 554.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554.2. Fenomenos de segundo orden en medios cuadraticos . . . . . . . . . . . . . . . 58

3

4 INDICE GENERAL

4.2.1. Efecto electrooptico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594.2.2. Mezcla de dos ondas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604.2.3. Phase matching en problemas unidimensionales . . . . . . . . . . . . . 604.2.4. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.3. Fenomenos de tercer orden en medios cubicos . . . . . . . . . . . . . . . . . . 614.3.1. Efecto electrooptico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614.3.2. Tercer armonico y efecto Kerr optico . . . . . . . . . . . . . . . . . . . 614.3.3. Autoenfoque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.4. Solitones opticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5. Elementos de biofısica 675.1. Biomecanica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.1.1. Fuerzas que actuan sobre el femur y la cadera . . . . . . . . . . . . . . 675.1.2. Fuerzas en equlibrio sobre un pie . . . . . . . . . . . . . . . . . . . . . 685.1.3. Efecto de un baston . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705.1.4. Fuerzas que actuan sobre las vertebras lumbares . . . . . . . . . . . . . 72

5.2. Conduccion del impulso nervioso . . . . . . . . . . . . . . . . . . . . . . . . . 765.2.1. Descripcion de las neuronas . . . . . . . . . . . . . . . . . . . . . . . . 765.2.2. Electromagnetismo del axon . . . . . . . . . . . . . . . . . . . . . . . . 795.2.3. Electrotono . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 855.2.4. Modelo de Hodgkin y Huxley . . . . . . . . . . . . . . . . . . . . . . . 87

6. Fısica nuclear 936.1. Hechos fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 936.2. Modelo estandar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

6.2.1. Leptones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 946.2.2. Quarks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 966.2.3. Interaccion electromagnetica . . . . . . . . . . . . . . . . . . . . . . . . 976.2.4. Interaccion debil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 986.2.5. Interaccion gravitatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . 1016.2.6. Interaccion fuerte o de color . . . . . . . . . . . . . . . . . . . . . . . . 1016.2.7. Ejemplos de decaimiento de partıculas . . . . . . . . . . . . . . . . . . 102

6.3. Interaccion entre nucleones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1026.3.1. Nivel 1: Potenciales empıricos . . . . . . . . . . . . . . . . . . . . . . . 1036.3.2. Nivel 2: Meson de Yukawa . . . . . . . . . . . . . . . . . . . . . . . . . 1056.3.3. Nivel 3: Interaccion de color residual . . . . . . . . . . . . . . . . . . . 105

6.4. Dimensiones y masas nucleares . . . . . . . . . . . . . . . . . . . . . . . . . . 1066.4.1. Distribucion de masa y carga . . . . . . . . . . . . . . . . . . . . . . . 1066.4.2. Energıa de enlace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

6.5. Decaimiento beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1106.5.1. Decaimiento beta directo (β−) . . . . . . . . . . . . . . . . . . . . . . . 1106.5.2. Decaimiento beta inverso (β+) . . . . . . . . . . . . . . . . . . . . . . . 1126.5.3. Captura electronica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

6.6. Decaimiento alfa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1136.7. Fision nuclear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

INDICE GENERAL 5

6.8. Reaccion en cadena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1176.9. Reactores nucleares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

6.9.1. Reactores termicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1216.9.2. Reactores rapidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1216.9.3. Otros problemas de la energetica nuclear . . . . . . . . . . . . . . . . . 122

6.10. Modelo nuclear de capas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1226.10.1. Numeros magicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

6.11. Bibliografıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1276.12. Erratas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

7. Fısica de suelos 129

6 INDICE GENERAL

Capıtulo 1

Elementos de fısica de solidos

1.1. Elementos de cristalografıa

Los materiales solidos se clasifican de diversas formas, segun determinados parametros, porejemplo: conductores y aislantes, tranasparentes y opacos, ionicos o metalicos o covalentes,cristalinos o amorfos. Comenzaremos con esta clasificacion, que responde a la forma en quese ordenan los atomos.

Un cristal consiste en atomos dispuestos segun un patron que se repite periodicamente.La mayoria de los materiales son cristales. Se pueden subdividir en monocristalinos y

policristalino. En un monocristal el patron que se repite periodicamente es unico y se extiendea lo largo de dimensiones macroscopicas. Ejemplo son los diamantes y otras piedras preciosas,los cristales de sal, los osciladores de un reloj de cuarzo. Un material policristalino se componede una multitud de monocristales microscopicos (llamados granos) que estan orientados entodas las direcciones posibles. Tanto monocristales como policristales tienen la caracteristicade presentar un orden casi perfecto en volumenes grandes comparados con las dimensionesatomicas.

Un material amorfo es aquel que no es cristalino.Ejemplo de los materiales amorfos son los vidrios. En estos no existe un patron que se

repita periodicamente.La periodicidad tiene consecuencias importantes. En los materiales cristalinos ocurren

una serie de fenomenos que no se dan en los amorfos, por ejemplo, transiciones de fases biendefinidas, conductividad electrica, bandas de energia y difraccion de rayos X con maximos enangulos bien determinados. La difraccion de rayos X constituye la tecnica experimental maspoderosa para determinar si un material es cristalino o amorfo.

Veamos como describir un cristal de forma precisa.Red de Bravais. Rs una coleccion de puntos que llena el espacio, tales que cada punto

tiene exactamente el mismo entorno.Vectores de traslacion. Es cualquier vector que conecta dos puntos de una red de

Bravais.Por definicion, una red de Bravais es infinita. Si no lo fuese, los puntos de la superficie

no tendrian el mismo entorno que los del interior. Si a una red de Bravais se traslada segunun vector de traslacion, la red queda invariante. Esto tiene consecuencias profundas, que seestudian mediante la teoria de grupos.

7

8 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

Figura 1.1: Dos posibilidades de escoger los vectores primitivos en una red de Bravais bidi-mensional. Los dos conjuntos de vectores primitivos se obtienen uno del otro. t1 = 2t1 − t2

y t2 = t2 − t1.

Vectores primitivos Vectores de traslacion ~a1, ~a2, ~a3, tales que todos los puntos de lared de Bravais se pueden conectar por vectores de traslacion ~R = n1~a1 + n2~a2 + n3~a3, donden1, n2, n3 son numeros enteros.

Celda unitaria es el paralelepipedo generado por tres vectores de la red no coplanares.Si estos tres vectores son primitivos, entonces se denomina celda primitiva. En una redbidimensional, las celdas unitarias son paralelogramos generado por dos vectores de la redno colineales.

Las celdas primitiva cumple que, trasladada segun todos los vectores de la red de Bravais,llena todo el espacio sin traslaparse ni dejar vacio.

Los vectores primitivos no son unicos. Considere la siguiente red bidimensional de laFigura 1.1. Hay infinitas formas de escoger los vectores pimitivos, aunque unas son mascomodas que otras. La caracteristica que los une es que todas las celda primitivas generadapor ellos tiene la misma area. En una red tridimensional, todas las celdas primitivas tienenel mismo volumen. El volumen de una celda definita por vectores ~a1, ~a2, ~a3 es igual a

Ω = ~a1 · ~a2 × ~a3. (1.1)

Toda celda primitiva es una celda unitaria. Una celda unitaria de volumen minimo, esuna celda primitiva.

Notemos que a una celda primitiva le corresponde exactamente un punto de la red. En laFig. 1.1 podemos notar que cada celda tiene puntos en los vertices. Cada uno de estos puntosesta compartido por cuatro celdas (la celda central y tres vecinas), de modo que cada unocontribuye un cuarto a la celda central. Sumando se obtiene un punto. Una celda unitaria noprimitiva contiene mas de un punto de la red.

En ocasiones la celda primitiva no tiene toda la simetria de la red. En estos casos seacostumbra utilizar celdas que tiene todas las propiedades de simetria de la red. Generalmenteesta celda tiene mayor volumen y se le llama celda convencional.

1.1. ELEMENTOS DE CRISTALOGRAFIA 9

Segun hemos visto, especificando tres vectores primitivos se define completamente unared de Bravais, y a su vez se define la celda primitiva. Es usual en cristalografia describirla celda primitiva mediante 6 paramtros: a, b, c, α, β, γ, donde a, b y c son los lados de lacelda primitiva, α es el angulo formado por los lados b y c, β por los lados a y c, y γpor los lados a y b. Esto se ilustra en la Fig. 1.2. Notese que definir tres vectores requiere 9

Figura 1.2:

numeros, mientras que solo se necesitan 6 para definir la celda unitaria. Los 3 parametros quesobran en la definicion de los vectores definen la orientacion de la celda respecto al sistemade coordenadas. En la practica, se escoge el sistema de coordenadas mas comodo posible.Muchos programas de cristalografia o de calculos atomisticos definen el vector ~a1 = (a, 0, 0)paralelo al eje OX (1 parametro), ~a2 = (b cos γ, b sin γ, 0) (2 parametros) y el vector ~a3 enuna direccion general (3 parametros).Ejercicio. Encuentre una formula para las componentes de este vector!.

Figura 1.3: Red hexagonal que no corresponde a una red de Bravais, pues los puntos blancosno tienen el mismo entorno que los puntos negros. Tambien se muestra la red de Bravaisasociada.

Notemos que no toda red es de Bravais, lo cual se ilustra el la Fig. 1.3. Sin embargo, sele puede asociar una “red asociada” a los puntos negros o a los puntos blancos. La figuraanterior se corresponde al ordenamiento de los atomos de carbono en ciertos planos del grafito.

10 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

La estructura tridimensional del grafito se obtiene superponiendo estos planos en direccionperpendicular a la figura. La estructura bidimensional ideal ilustrada en la figura se denominagrafeno, termino muy utilizado en la literatura de nanotubos de carbono.

Este caso demuestra que no hay cristales (la mayoria) que no se pueden describir solamenecon una red de Bravais. Esto hace necesario el concepto de base.

Base Conjunto de atomos que se asocia identicamente a cada punto de la red.

Generalmente la base se especifica mediante las coordenadas de los atomos respecto aun punto de la red, que se toma como origen de coordenadas, y respecto a ciertos ejes decoordenadas. Si los vectores primitivos se especifican mediante sus componentes, entonces lasposiciones atomicas se especifican mediante sus coordenadas cartesianas, respecto al mismosistema de ejes usado para definir los vectores. Por otra parte, si la celda (primitiva o con-vencional) se define mediante los parametros a, b, c, α, β, γ, entonces las posiciones atomicasse especifican en coordenadas fraccionarias x, y, z, de modo que la posicion de un atomoes

~r = x~a1 + y~a2 + z~a3, (0 ≤ x, y, z < 1). (1.2)

La red del grafeno es un claro ejemplo de red con base, siendo la red, por ejemplo, lospuntos negros en la Fig. 1.3, y la base el conjunto de dos atomos ubicados en un punto negroy en el punto blanco superior.

Para aclarar el concepto de base, veamos la simpatica Figura 1.4. Las cruces × son puntosde una red, mientras que la flor constituye la base asociada a cada punto de la red. Noteseque los puntos de la red son puntos matematicos, no es necesario que esten ocupados poratomos o por ninguna parte de la base.

Figura 1.4: Ejemplo de una red en la cual el los simbolos × indican los puntos de la red, y laflor es la base.

1.1. ELEMENTOS DE CRISTALOGRAFIA 11

1.1.1. Ejemplos.

Red cubica simple Los vectores primitivos

~a1 = ax

~a2 = ay

~a3 = az

(1.3)

donde a es el parametro de red. La celda primitiva es un cubo. El Polonio presenta estaestructura.

Red cubica de cara centrada (fcc).

Figura 1.5: Red cubica de cara centrada (fcc) con parametro de red a. Derecha: Celda con-vencional y celda primitiva.

Los vectores primitivos son

~a1 =a

2(y + z)

~a2 =a

2(z + x)

~a3 =a

2(x+ y)

(1.4)

donde a es el parametro de red. El Cobre y el Argon presentan esta estructura con parametrosde red aCu = 3,61 [A] y aAr = 5,26 [A] a (4.2 [K]) respectivamente.

La Fig. 1.5 muestra la celda convencional de la red fcc. Contemos el numero de puntos dela red que contiene esta celda. Hay 6 puntos en el centro de las caras, que se comparten entredos celdas adyacentes, por tanto, contamos 3 puntos. En los vertices del cubo hay 8 puntos,cada uno de los cuales se comparten en 8 celdas, por tanto, suman 1 punto. Asi en totalcorresponden 4 puntos de la red. Esto indica que el volumen de la celda convencional a3 es 4veces el volumen de la celda primitiva, definida por los vectores (1.4). La Figura 1.5 muestrala relacion entre la celda convencional y la celda primitiva. Notese que la celda convencionaltiene la simetria cubica de la red, pero no asiı la celda primitiva.Ejercicio Demuestre usando la formula (1.1) que el volumen de la celda primitiva es a3/4.

Definimos el numero de coordinacion como el numero de vecinos mas cercanos. Paralos ejemplo tenemos:

12 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

Figura 1.6: Ilustracion de la simetria de un cubo.

Cubica simple seis vecinos.

Cubica de cuerpo centrado (bcc) ocho vecinos.

Cubica centrada en las caras (fcc) doce vecinos.

1.1.2. Simetrıa

Una operacion de simetrıa es aquella que que aplicada a un sistema lo deja invariante.Como ejemplo, ya hemos visto que las traslaciones ~R = n1~a1 +n2~a2 +n3~a3 (n1, n2, n3 enteros)dejan invariantes a una red de Bravais.

El estudio de la simetria de los cristales facilita la clasificacion de estos y el calculo demuchas magnitudes. Toda red de Bravais presenta simetria de traslacion. Adicionalmentepuede presentar otras operaciones. Consideremos la red fcc, que hemos visto en los ejemplos.La celda convencional tiene todas las propiedades de simetria de un cubo. Vease la Figura1.6

1. Reflexion respecto a un planos paralelos a las caras (σ).

2. Reflexion respecto a planos que pasan por las diagonales de las caras.

3. Rotaciones en multiplos de 90 alrededor de los ejes C4.

4. Rotaciones en multiplos de 120 alrededor de los ejes S6, que pasan por las diagonales.

5. Roto-reflexiones en el eje S6. Esto es una rotacion de 60, seguida de una reflexion enel plano perpendicular al eje S6 y que pasa por el centro del cubo.

6. Rotaciones en multiplos de 180 alrededor de los ejes C2.

7. Inversion respecto al centro del cubo.

8. Combinaciones de todas las operaciones anteriores.

No pretendemos hacer un estudio detallado de las propiedades de simetria, sino informarde su existencias y de los conceptos basicos. El conjunto de propiedades de simetria de unsistema forma una estructura matematica llamada grupo, que cumple unos pocos axiomas

1.1. ELEMENTOS DE CRISTALOGRAFIA 13

1. La combinacion de dos operaciones de simetria es una operacion de simetria

2. Existe la operacion identidad (no hacer nada).

3. Para toda operacion de simetria existe la operacion inversa (ejemplo, rotaciones de 90

y -90.)

A partir de las propiedades anteriores y estableciendo una relacion con el algebra de matricesse ha desarrollado la llamada teoria de grupos, que es la teoria matematica de la simetria.De los postulados anteriores puede razonarse que el conjunto de traslaciones de una red deBravais forma un grupo, el Grupo de Traslaciones de la Red de Bravais. El conjunto detransformaciones de simetria de un sistema (por ejemplo, un cubo, una red), que incluyerotaciones, reflexiones y roto-reflexiones respecto a ejes que pasan por un punto comun,ademas de la inversion respeto al mismo punto, se denomina grupo puntual. La red fcctiene el mismo grupo puntual de simetria que el cubo, que en este caso particular se llamaOh. La celda convencional de una red, por su definicion, tiene el mismo grupo puntual quela red de Bravais correspondiente. Si se combina una traslacion con una operacion del grupopuntual, tambien se deja invariante la red de Bravais. Al conjunto de operaciones de simetriaque incluyen traslaciones y operaciones puntuales, se le llama grupo espacial de la red deBravais.

Para las redes de Bravais tridimensionales existen solamente siete grupos puntuales posi-bles y 14 grupos espaciales. Obviamente, varios grupos espaciales comportan el mismo grupopuntual. Esto permite clasificar todos los cristales en siete sistemas cristalinos (segun elgrupo puntual) y en 14 redes de Bravais (segun el grupo espacial). La Figura 1.7 ilustra lossiete sistemas cristalinos

1. Cubico. a = b = c, α = β = γ = 90. Tiene tres posibles redes, que se denotan conletras mayusculas segun el tipo de celda convencional y los puntos de la red que estacontiene: la cubica simple (P, de Primitive), cubica centraba en el cuerpo (I, de Inner),cubica centrada en las caras (F, de Faces). Tambien se conocen por sus siglas en ingles:sc (simple cubic), bcc (body centered cubic) y fcc (face centered cubic).

2. Tetragonal a = b 6= c, α = β = γ = 90. Tiene dos posibles redes, simple (P) y centrada(I).

3. Ortorrombico a 6= b 6= c, α = β = γ = 90. Tiene cuatro posibles redes: simple (P),centrada en el cuerpo (I), centrada en las bases (C, de Center), centrada en las caras(F).

4. Monoclinico. a 6= b 6= c, β o γ 6= 90. Tiene dos posibles redes: simple (P) y centradaen las bases (C).

5. Triclinico. Solo tiene redes simples y celdas primitivas (P).

6. Hexagonal. a = b, α = β = 90, γ = 120. Solo hay un tipo de red (P). La celdaconvencional no es un hexagono, aunque se ilustre asi en la figura. Recuerde que siemprela celda convencional es un paralelepipedo.

14 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

7. Trigonal. a = b = c, α = β = γ < 120. Para este sistema siempre es posible escogeralternativamente una celda del tipo hexagonal. Si esta es primitiva, entonces es equi-valente al sistema hexagonal. Si la celda hexagonal no es primitiva, entonces la celdaprimitiva es romboedrica y se designa R.

Figura 1.7: Las 14 redes de Bravais, representadas por sus celdas convencionales.

En 1842, M. L. Frankenheim, determino erroneamente que existen 15 tipos de redes. A.

1.1. ELEMENTOS DE CRISTALOGRAFIA 15

Figura 1.8: Ilustracion de la simetria de la molecula de agua.

Bravais corrigio el error en 1845 y por eso las redes llevan su apellido.1

La Figura 1.8 representa la molecula de agua. Las propiedades de simetria que esta tieneson: identidad, rotacion de 180 alrededor del eje central, reflexion respecto al plano de lamolecula y respecto al plano perpendicular, y todas las combinaciones de estas. El conjuntode estas propiedades forma el grupo de simetria denominado C2v.

¿Que ocurre si en cada punto de la red de Bravais fcc se pone una molecula de agua?¿Que simetria tiene ese hipotetico cristal? Evidentemente, las operaciones de simetria sonlas combinaciones de las traslaciones de la red mas aquellas operaciones puntuales que soncomunes a la red fcc y a la molecula de agua. en algunos casos. La simetria de este cristal esmas baja que la simetria de la red de Bravais, y el conjunto de operaciones de simetria quedejan invariante el cristal, se llama grupo espacial del cristal o grupo espacial cristalo-grafico. Esto implica que los subgrupos2 de los 14 grupos espaciales de las redes de Bravais,tambien son posibles para las estructuras cristalinas. Estos son todos los grupos de simetriaque puede tener una red de Bravais con base y se denominan grupos espaciales crista-lograficos. Existe un total de 230 grupos espaciales cristalograficos (comparese con los 14grupos espaciales de las redes sin base). El subconjunto de operaciones de simetria puntuales(o sea, las operaciones que no involucran traslacion) de un grupo espacial cristalografico sellama grupo puntual cristalografico, de los cuales existen 32 (comparese con los 7 grupospuntuales de las redes de Bravais).

No nos detendremos a explicar la notacion utilizada para designar los grupos espaciales.Basta conocer que existen 230 y que estos especifican totalmente la simetria de un cristal.En las bases de datos de cristalografia, y en muchos programas de simulacion, la informaciondel grupo espacial es esencial. Existen tres formas de designarlos

1. Numerica. Simplemente un numero entre 1 y 230, segun un orden establecido en unlibro llamado Tablas Internacionales de Cristalografia.

2. Notacion de Schoenflies. Ejemplo, el grupo 14 es C52h

1Con justicia, deberian llamarse redes de Frankenheim-Bravais. En el siglo XX, A. A. Abrikosov (premioNobel 2003) predijo las redes de vortices en los superconductores de alta temperatura. Por errores numericosde calculo, predijo que las redes deberian ser cuadradas, cuando en realidad son hexagonales. Sin embargo seconocen como redes de Abrikosov (y desconozco quien enmendo el error).

2Un subgrupo es un subconjunto de un grupo que tambien es un grupo, o sea, que cumple los tres axiomasde grupo.

16 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

3. Notacion de Herman-Maughin. Ejemplo, el grupo 14 es P 1 1 21/b 1, o abreviadamenteP21/b.

El trabajo de deducir las propiedades de todos los grupos es monumental y se encuentra com-pilado en las Tablas Internacionales de Cristalografia, las que constituyen una herramientafundamental para el trabajo de los cristalografos. Un fragmento de esta tabla se muestra enla Figura 1.9

Figura 1.9: Fragmento de las Tablas Internacionales de Cristalografia

Una nota respecto a la informacion contenida en estas tablas. En la parte izquierda puedeverse una columna con el encabezamiento “Number of positions, Wyckoff notation, and point

1.2. FUERZAS INTERATOMICAS Y TIPOS DE SOLIDOS 17

symmetry”. Estos datos indican las posiciones en que pueden encontrarse atomos dentro de lacelda convencional (en este caso es primitiva, indicado por la letra P del nombre del grupo). Asu derecha se indican las coordenadas de estas posiciones. Todas las coordenadas asociadas aun tipo de posicion son equivalentes por simetria. En una estructura cristalina, una posicionpuede estar ocupada por un atomo o vacia, pero si esta ocupada, estan ocupadas todas lasposiciones equivalentes. Los programas que se usan en cristalgrafia y en simulaciones, suelenaceptar como entrada solo una de las posiciones equivalentes, siendo generadas las demas porel programa. En las bases de datos de cristalografia, y en la revista Acta Crystallographica,solo se reporta una de las posiciones equivalentes, siendo responsabilidad del usuario generarlas demas.

1.2. Fuerzas interatomicas y tipos de solidos

El problema del calculo de los estados estacionarios en una porcion de un material solidoinvolucra, en principio, la resolucion de la ecuacion de Schrodinger del cristal, en la que debentenerse en cuenta todas las interacciones presentes y las coordenadas de todos los electronesri y todos los nucleos Rα.

HΨ(Rα, ri) = EΨ(Rα, ri). (1.5)

El Hamiltoniano del sistema contiene la energıa cinetica de los iones, la de los electronesde valencia y las energıas de interaccion ion-ion, ion-electron y electron-electron.

H = Telec + Tion + Vion−elec + Vion−ion + Velec−elec

=∑

i

− ~2

2m∇2

i +∑

α

− ~2

2Mα

∇2α −

∑i,α

Zαe2

4πε0 |ri −Rα|

+1

2

α,β 6=α

ZαZβe2

4πε0 |Rβ −Rα| +1

2

i,j 6=i

e2

4πε0 |ri − rj| . (1.6)

donde los terminos son, por orden, los operadores de energıa cinetica de los electrones, energıacinetica de los nucleos, energıa de interaccion electron-nucleo, energıa de repulsion de losnucleos, y energıa de interaccion entre los electones.

El enorme numero de partıculas que contienen los cristales hace imposible la resoluciondirecta de dicha ecuacion. Por esto se hace necesario aplicar la estrategia de divide et impera,por medio de aproximaciones.

Una primera aproximacion es sugerida por el hecho de que la masa del electron es 1800veces menor que la del proton, por lo cual la dinamica del movimiento se pude separar envariables rapidas (electrones) y variables lentas (nucleos). En esto consiste la llamada apro-ximacion adiabatica o aproximacion de Born-Oppenheimer. Como los electrones semueven mucho mas rapido, puede considerarse que en cada posicion de los nucleos Rα, loselectrones se encuentran en un estado estacionario (casi siempre el estado basico) correspon-diente al operador hamiltoniano

Helec = Telec + Vion−elec + Velec−elec, (1.7)

18 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

donde las posiciones de los nucles aparecen solamente como parametros y las variables de laecuacion de Schrodinger son las coordenadas electronicas.

HelecΨn(ri, Rα) = En(Rα)Ψn(ri, Rα). (1.8)

Las energıas En(Rα) actuan como un campo de fuerzas para los nucleos, obedecen alHamiltoniano

Hion = Tion + Vion−ion + En(Rα). (1.9)

Ası el efecto de los electrones sobre el conjunto de iones se manifiesta a traves de unaenergıa potencial efectiva. Ası, el movimiento de los electrones se desacopla del de los iones.Si bien el caracter cuantico de los electrones es fundamental para describir su comporta-miento, los nucleos, por ser mas pesados y tener una longitud de onda mucho menor (h/p),pueden considerarse clasicos en la mayoria de los casos practicos (efectos cuanticos finos sonobservables en el hidrogeno y en los demas elementos a temperaturas cercanas al cero abso-luto, notablemente el He superfluido). Clasicamente, los nucleos obedecen las ecuaciones deNewton

MαRα = −∇α [En(Rα) + Vion−ion(Rα)] = Fα. (1.10)

El calculo de las energıas electronicas En(Rα) y sus derivadas las fuerzas Fα puede sercomputado a partir de la ecuacion cuantica (1.8) o su equivalente en la llamada Teoria delFuncional de la Densidad (DFT, siglas en ingles), las cuales pueden ser resueltas numerica-mente en sistemas de pocos atomos3. Dado el largo tiempo de calculo y los pocos atomosque se pueden tratar, es conveniente usar expresiones analıticas que aproximen las verdade-ras fuerzas. Con el trabajo de medio siglo se han determinado expresiones adaptadas parametales, solidos covalentes, gases nobles, lıquidos, etc.

1.2.1. “Gases nobles”

A este grupo corresponden los solidos formados al enfriar los llamados gases nobles (Ne,Ar, Kr, Xe). En estado atomico estos elementos tienen capas electronicas totalmente llenasy por eso tienen muy poca posibilidad de formar enlaces. Los atomos de estos elementos ine-ractuan mediante fuerzas de van der Waals, tambien llamadas fuerzas de dipolos fluctuantes.Considerense dos atomos (1 y 2) separados una distancia r. El dipolo instantaneo en el atomo1 ~p1, crea un campo electrico proporcional a E ∼ p1/r

3, que induce dipole en 2 proporcionalal campo, p2 = αE ∼ αp1/r

3. La energia de interaccion electrostatica entre los dos dipolodses del orden de

Vdip−dip ∼ −p2p1

r3∼ −αp

21

r6. (1.11)

Aunque promediado en el tiempo 〈~p1〉 = 0, la energia de interaccion es proporcional a 〈p21〉 6=

0. La mecanica cuantica es necesaria para calcular las constantes de proporcionalidad de formaprecisa, pero el razonamiento anterior predice correctamente las dependencia proporcional a1/r6 de la energia de interaccion.

3El record hace unos pocos annos era de 64000 atomos, con muchas aproximaciones y un poderoso compu-tador. Rutinariamente se calculan sistemas de menos de 100 atomos con la DFT y menos de 10 en metodosmas exactos.

1.2. FUERZAS INTERATOMICAS Y TIPOS DE SOLIDOS 19

Cuadro 1.1: Valores de los parametros de Lennard-Jones para los gases nobles.Ne Ar Kr Xe

ε (meV) 3.1 10.4 14.0 20.0σ (A) 2.74 3.40 3.65 3.98

Cuando los atomos estan muy proximos, de modo que las nubes electronicas entran encontacto y se interpenetran, aparecen fuerzas de repulsion que sobrepasan a las fuerzas devan der Waals e impiden que los atomos se junten. Las fuerzas de repulsion se explican solodesde la mecanica cuantica, calulando En(Rα) en la Ec. (1.8). Hay varias formas de ajustareste potencial de repulsion, por ejemplo, B/r12.

Con esto, el potencial de interaccion queda escrito en la forma

φ(r) =B

r12− A

r6= 4ε

[(σr

)12

−(σr

)6],

σ = (B/A)1/6

ε = A2/4B. (1.12)

La expresion (1.12) es conocida como potencial de Lennard-Jonnes. La potencia 12 en eltermino repulsivo es no se deduce, sino que se usa por simplicidad analitica. Este potencialpermite reproducir las propiedades estructurales y termodinamicas de los gases nobles tantoen estado gaseoso como solido. Consideremos algunas de estas propiedades.

Los solidos de gases nobles forman una red fcc con bases monoatomicas. Sean ~R los sitiosde la red, entonces la energıa de interaccion de un atomo con el resto de la red es

V1 =∑

~R 6=0

φ(R). (1.13)

Si multiplicamos por N , el numero de atomos del cristal4, obtenemos el doble de la energıapotencial del cristal, pues se ha contado doblemente la interaccion. ası, la energıa por atomose obtiene dividiendo por N/2

u =1

2

~R 6=0

φ(R). (1.14)

Es conveniente escribir la longitud del vector de la red ~R como un numero adimensional α~Rmultiplicado por la distancia a los primeros vecinos r. Con esto, la ecuacion (1.14) se expresaen la forma

u = 2ε

[A12(

(σr

)12

− A6

(σr

)6], (1.15)

donde

An =∑

~R 6=0

1

α(~R)n. (1.16)

4en un red infinita, N es infinito, pero para obtener la energia de enlace por atomos, dividimos por N yse cancelan los infinitos. En realidad aqui los que se esta haciendo es despreciar los efectos de superficie. Uncristal real siempre tendra N finito. El numero de atomos en la superficie es proporcional a N2/3 y para estosla energia potencial es distinta. Como lımN2/3/N → 0, cuando N representa una cantidad macroscopica deatomos la energia por atomo tiende a la energia de los atomos interiores.

20 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

Cuadro 1.2: Distancia a primeros vecinos y energıa de cohesion de los solidos de gases nobles.Ref. Ashcroft-Mermin, Cap. 20, pag 401.

Ne Ar Kr Xe

r0 (A)Experimento 3.13 3.75 3.99 4.331,09σ 2.99 3.71 3.98 4.34u0 (eV/atomo)Experimento -0.02 -0.08 -0.11 -0.17−8,6ε -0.027 -0.089 -0.120 -0.172B (1010 dina/cm2)Experimento 1.1 2.7 3.5 3.675ε/σ3 1.81 3.18 3.46 3.81

Un aproximacion grosera se obtiene despreciando las energıas de interaccion entre los atomosmas alejados que la distancia de primeros vecinos r. en el caso de la red fcc, el numero deprimeros vecinos es 12 y por tanto, dada la definicion de α~R, An = 12. Si usamos los vectoresprimitivos dados por la ecuacion (1.4) y hacemos la suma numerica sobre toda la red, seobtiene A6 = 14,45 y A12 = 12,13.Ejercicio Evalue las constantes A6 y A12 para las redes fcc, bcc, y sc.

La constante de la red y la densidad de equilibrio se obtienen facilmente minimizando(1.15) respecto a r. Se encuentra que ∂u/∂r = 0 en

r0 =

(2A12

A6

)1/6

σ, Red fcc → 1,09σ. (1.17)

La constante de la red fcc es a =√

2r, el volumen de la celda primitiva es Ω = a3/4 y ladensidad es

ρ =masa atomica

Ω(1.18)

Evaluando la energia potencial en r0 y en r → ∞ se obtiene la energıa de cohesion delsolido

u0 = − εA26

2A12

, Red fcc → −8,6ε. (1.19)

El modulo de volumen (magnitud inversa de la compresibilidad) B = −V (∂P/∂V )T

puede calcularse en terminos de los parametros de Lennard-Jones. A temperatura 0 K, P =−dU/dV = −du/dΩ, luego

B = Ω∂2u

∂Ω2. (1.20)

Procediendo de forma directa se obtiene

B =4ε

σ3A12

(A6

A12

)5/2

, Red fcc → 75ε

σ3. (1.21)

La estructura de los cristales que existe, es aquella que maximiza la energia de cohesion.Se deja como ejercicio calcular la energia de cohesion las estructuras bcc y sc, y ver que danmenores energias de cohesion que la fcc.

1.2. FUERZAS INTERATOMICAS Y TIPOS DE SOLIDOS 21

1.2.2. Cristales ionicos

El ejemplo clasico de estos es el NaCl. El rasgo caracteristico es que estan compuestospor un metal y un nometal situados en las columnas extremas a ambos lados de de la tablaperiodica. El elemento metalico tiene una baja energia de ionizacion, mientras que el elementono metalico tiene alta energia de afinidad, de modo que el sistema pierde energia cuando setrasnfiere un electron del metal hacia el nometal. De este modo, los atomos quedan cargadosy entre ellos se establecen fuerzas de tipo Coulomb, mucho mas intensas que en los solidosde gases nobles.

φCoulomb(rij) =QiQj

rij

(1.22)

Las fuerzas de atraccion y repulsion Coulombian tienen un efecto neto de hacer colapsar losatomos negativos hacia los positivos, y deben ser contrarestadas por una fuerza repulsiva (deorigen cuantico). El modelo mas simple es asociarle un potencial de esfera rigida, o sea

φrepulsion(rij) =

0, si rij > Ri +Rj,∞, si rij < Ri +Rj,

(1.23)

donde Ri son los “radios atomicos”. Estos radios han sido determinados mediante un procedi-miento empirico de forma tal que las distancias de enlace en un gran numero de compuestosionicos sea aproximada (por el metodo de mınimos cuadrados) por la suma de los radiosasignados a los atomos en contacto5.

Para simular propiedades dinamicas y termodinamicas a temperaturas no nulas. se usanpotenciales suves. Entre los mas utilizados se encuentran el potencial de Buckinham

φBuckingham(r) = A exp(−r/ρ)− C

r6. (1.24)

La energıa de cohesion de los cristales ionicos se calcula mediante el mismo metodo quepara los cristales de gases nobles. Un problema aparece en el calculo de la energı a de Coulomb.La serie que define esta energıa es condicionalmente convergente, debido a que la potencia1/r decrese muy lentamente con r. Las series condicionalmente convergentes pueden serreordenadas de forma que su suma de igual a cualquier numero real (esto es un teorema delanalisis matematico) y ademas su convergencia suele ser lenta. Por lo tanto, obtener de unaforma fisicamente correcta y eficiente requiere tecnicas especiales, como el metodo de Ewald6.

1.2.3. Cristales covalentes

El paradigma de los cristales covalentes es el diamante. Los cristales compuestos porelementos de la grupo IV y de las columnas vecinas pertenecen a este grupo. Si se examinala estructura de diamante, se observa que el numero de coordinacion es 4 y los cuatro enlacesse disponen formando angulos de 109 grados entre si. Estas estructuras dejan mucho espaciovacio si se consideran los atomos como esferas rigidas, por lo que se llaman estructurasabiertas. Los potenciales de interaccion en los cristales covalentes no pueden ser aproximados

5R. D. Shannon, Revised effective ionic radii and systematic studies of interatomic distances in halidesand chalcogenides, Acta Cryst. A 32, 751 (1976).

6P. P. Ewald, Ann. Physik 64, 253 (1921).

22 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

mediante ideas de la fisica clasica. La situacion fisica es la misma que en los enlaces covalentesque determinan la estructura de las moleculas en fase gaseosa. Una vez obtenidos de formanumerica los potenciales de interaccion, estos se pueden aproximar por una variedad de formasanaliticas. Entre ellos mencionemos el potencial de Morse

φMorse = D[(

1− e−a(r−r0))2 − 1

]. (1.25)

Este potencial es sugerido por la fisica molecular. Para una molecula diatomica r0 es laenergia de enlace y D es la energıa de enlace. Para describir los angulos de enlace covelentees necesario tener encuentra potenciales que involucran 3 o mas atomos, por ejemplo

φ3(~r1, ~r2, ~r3) =1

2k2(θ213 − θ0)

2 exp(−r12/ρ) exp(−r13/ρ), (1.26)

donde θ213 es el angulo de enlace covalente centrado en el atomo 1. k2, ρ son parametrosempıricos que se obtienen mediante ajustes por el metodo de mınimos cuadrados.

1.2.4. Metales

Al igual que los cristales covalentes, los metales no pueden ser descritos por potentialde pares. las propiedades dinamicas resultan mal predichas, ademas no reproducen la thela llamada discrepancia de Cauchy para las constantes elasticas (C11 6= C44). El solo uso dpotenciales de pares tambien conduce a estimados incorrectos de las energias de formacionde vacancias, cuyos valores dan muy proximos a las energias de cohesion, mientra que losexperimentos indican que deben ser aproximadamente 1/3 de estas. Existen varios tiposde estos potential, todos de muchos cuerpos. Estos potenciales han sido desarrollados paraajustar los calores de constantes de red, energias de cohesion, y constantes elasticas. Comoejemplo, se da la forma de los potenciales de Sutton-Chen

E = ε

[1

2

∑i

j 6=i

V (rij)− c∑

i

√ρi

], (1.27)

donde

V (rij) =

(a

rij

)n

y ρi =∑

j 6=i

(a

rij

)m

. (1.28)

Aqui, rij es la distancia entre los atomos i y j, ε es un parametro con dimensiones de energia,a es un parametro con dimensiones de longitud que normalmentes la constante de la red, ces adimensional, mientras que n y m are positive integers with n > m.

Para un cluster diatomico, la distancia de enlace es is dada por

rmin = a(mnc)1/k

, k =m

2− n. (1.29)

Tambien existen cristales que presentan caracterısticas mixtas. Un ejemplo clasico es elgrafito (figura 1.10), que presenta enlaces covalentes muy fuertes en cirtos planos, mientrasque la ligazon entre los planos se efectua mediante fuerzas del tipo van der Waals.

1.3. ELASTICIDAD 23

Figura 1.10: Estructura del grafito. Los atomos de un mismo plano se cohesionan medianteenlaces covalentes. Atomos de distintos planos interactuan debilmente por fuerzas de tipovan der Waals. Al escribir con un lapiz de grafito, se exfolian planos enteros.

1.3. Elasticidad

Consideremos los iones de una red cristalina desplazados ~u(~R′) de sus posiciones de equ-librio. Si los deslazamientos son pequenos, la energıa potencial del cristal se puede expandiren serie de Taylor hasta los terminos de segundo orden

Uarm = U0 +1

2

~R,~R′,µν

uµ(~R)Dµν(~R, ~R′)uν(~R

′) , (1.30)

donde

Dµν(~R, ~R′) = Dµν(~R− ~R′) =

∂2U

∂uµ(~R)∂uν(~R′)(1.31)

La dependencia de D(~R − ~R′) se debe a la simetrıa de traslacion. Otras propiedades muyimportantes que son

Dµν(~R− ~R′) = Dνµ(~R′ − ~R) (1.32)

Dµν(~R) = Dµν(−~R) (1.33)∑

~R

Dµν(~R) = 0. (1.34)

24 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

Si las interacciones interatomicas que se describen para un potencial de pares (ver Ashcroft-Mermin, ec. (22.2-22.11)):

U =1

2

~R,~R′

φ(~R− ~R′) =N

2

~R 6=0

φ(~R) , (1.35)

entonces

Dµν(~R− ~R′) = δ~R,~R′

~R′′

φµν(~R− ~R′′)

− φµν(~R− ~R′) , (1.36)

donde

φµν =∂2φ(r)

∂rµ∂rν

, (1.37)

ver demostracion en Ashcroft-Mermin capıtulo 22. No obstante, notemos que la ec. (1.30) esutil aunque haya potenciales mas generales que los potenciales de pares. Usando las propie-dades de simetria de la matriz de constantes de fuerzas Dµν(~R− ~R′) se puede llevar la energiadel cristal a la forma

Uarm − U0 = −1

4

~R,~R′,µν

uµ(~R′)− uµ(~R)Dµν(~R, ~R′)uν(~R

′)− uν(~R). (1.38)

A partir de ahora considerarmos la energia del cristal relativa a la energia de equilibrio U0.En una deformacion macroscopica que ocurre cuando un solido es sometido a deforma-

cion, los desplazamientos uν(~R) varıan suavemente de una celda a la celda vecina. Entonces

podemos considerar una funcion continua ~u(~r) que es igual a ~u(~R) cuando ~r es un vector de

la red de Bravais. Si ~u(~r) varıa poco en el rango de D(~R− ~R′) se puede hacer la aproximacion

~u(~R′) = ~u(~R) + (~R′ − ~R) · ∇~u|~r=~R. (1.39)

Sustituyendo en la ec. (1.38) si obtiene

Uarm =1

2

~R,µ,ν,σ,τ

(∂

∂xσ

uµ(~R)

)(∂

∂xτ

uν(~R)

)Eσµτν , (1.40)

donde

Eσµτν = −1

2

~R

RσDµν(~R)Rτ . (1.41)

Como las funciones ~u(~r) varian lentamente, se puede escribir (1.40) como una integral

Uarm =1

2

∑µ,ν,σ,τ

∫d3~r

(∂

∂xσ

uµ(~r)

)(∂

∂xτ

uν(~r)

)Eσµτν , (1.42)

donde Eσµτν = Eσµτν/Ω, siendo Ω el volumen de la celda primitiva. La ecuacion (1.42) esel punto de partida de la teorıa macroscopica de la elasticidad. El conjunto de 34 = 81magnitudes Eσµτν es una propiedad de cada material y forma un tensor, transformandose

1.3. ELASTICIDAD 25

como tal ante rotaciones de los ejes de coordenadas. En el algebra de tensores se utiliza elconvenio, debido a Albert Einstein, de omitir los simbolos de sumatioria

∑, entendiendose

la suma cada vez que en una formula aparecen dos indices repetidos. Ası, la ecuacion (1.42)se escribe

Uarm =1

2

∫d3~r

(∂

∂xσ

uµ(~r)

)(∂

∂xτ

uν(~r)

)Eσµτν .

En lo adelante utilizaremos el arriba mencionado convenio de suma.

1.3.1. Simetrıas

De la definicion (1.41) podemos notar que Eσµτν no cambia si se intercambian µ↔ ν y oτ ↔ σ. Por tanto, es suficiente especificar Eσµτν para los siguientes valores de los pares µν yστ

xx, yy, zz, yz, zx, xy. (1.43)

Esto indica que de las 34 = 81 componentes del tensor Eσµτν solo hay 6×6 = 36 componentesindependientes. Este numero se reduce mas, si se considera que ante una rotacion rıgida delcristal la enerıa del cristal no se afecta. En una rotacion infinitesimal de angulo dω alrededorde un eje de direccion ~n, todos los vectores de la red sufren la transformacion

~R −→ ~R + ~u(~R), ~u(~R) = δω~n× ~R. (1.44)

Sustituyendo ~u(~R) de la ecuacion anterior en (1.40) y exigiendo la que Uarm = 0 para δωarbitrario, se encuentra que Uarm solo depende de las combinaciones simetricas

εσµ =1

2

(∂

∂xσ

uµ +∂

∂xµ

). (1.45)

Cuadro 1.3: Nmero de constantes elasticas independientes.Sistema Grupo puntual Constantes elasticas

Triclinico todos 21Monoclinico todos 13Ortorrombico todos 9Tetragonal C4,C4h,4 7

C4v, D4, D4h, D2d 6Romboedrico C3, S6 7

C3v, D3, D3d 6Hexagonal todos 5

Cubico todos 3Amorfo 2

El tensor simetrico εσµ se denomina tensor de deformacion. Consecuentemente, sepuede rescribir (1.42) como

Uarm =1

2

∫d3~rεσµcσµτνετν , (1.46)

26 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

donde

cσµτν = − 1

~R

[RσDµνRτ +RµDσνRτ +RσDµτRν +RµDστRν ] . (1.47)

De (1.47) se deduce que cσµτν es invariante ante las permutaciones σµ↔ τν, σ ↔ µ y τ ↔ ν.Como resultado, el numero de componentes independientes de reduce a 21.

Las propiedades anteriores son generales y validas para cualquier sistema cristalino. Sepuede reducir mas el numero de constantes elasticas independientes en dependencia del grupopuntual de simetria del cristal y el tipo de red de Bravais. La tabla 1.3 resume el numero deconstantes elasticas para todos los sistemas cristalinos y para los amorfos. Por ejemplo, en elcaso cubico, las unicas tres componentes independientes son

C11 = cxxxx = cyyyy = czzzz (1.48)

C12 = cxxyy = cyyzz = czzxx (1.49)

C44 = cxyxy = cyzyz = czxzx. (1.50)

Todas las demas componentes, en las cuales x, y o z aparece un numero impar de veces, son0. En las ecuaciones anteriores se usa el convenio

xx ≡ 1, yy ≡ 2, zz ≡ 3, yz ≡ 4, zx ≡ 5, xy ≡ 6. (1.51)

Convencionalmente, en teoria de la elasticidad se utiliza una notacion ligeramente mo-dificada. El campo de desplazamiento se describe por la magnitud llamada deformacion,relacionada con el tensor de deformacion segun

eµν = εµν , si µ = ν (1.52)

= 2εµν , si µ 6= ν, (1.53)

cuya notacion se simplifica a ei = eµν de acuerdo a (1.51). En lugar de (1.46) se escribe

U =1

2

6∑i,j=1

∫d3~reiCijej, (1.54)

donde Cij = cσµτν , acorde a (1.51). Las cantidades Cij forman una matriz de dimension 6× 6(no es un tensor) y se denominan modulos elasticos (elastic moduli o stiffness constants).Los elementos de la matriz S que es inversa a C se denominan constantes elasticas (elasticconstants o elastic compliance constants).

Una aplicacion de la teorıa de la elasticidad es la ecuacion de las ondas elasticas. Laenergıa cinetica asociada a un campo de deformacion es

T =

∫1

2ρ~u(~r, t)2d3~r, (1.55)

donde ρ es la densidad. El Lagrangiano del medio es

L = T − V =

∫ [1

2ρ~u2 − 1

2εσµcσµτνετν

]d3~r. (1.56)

1.3. ELASTICIDAD 27

El principio variacional de Hamilton

δ

∫Ldt = δ

∫L d3~rdt = 0 (1.57)

conduce a las ecuaciones de Lagrange

∂L∂uµ

− ∂

∂t

(∂L∂uµ

)− ∂

∂xν

(∂L∂uµ,ν

)= 0

(uµ =

∂uµ

∂t, uµ,ν =

∂uµ

∂xν

). (1.58)

Haciendo aproximadamente unas 3 paginas de algebra las ecuaciones de Lagrange se reducena la forma

ρuµ = cµσντ∂uτ

∂xσ∂xν

=∂

∂xσ

(cµσντεντ ) . (1.59)

Tarea. Demuestre la ecuacion (1.59).El tensor

σµσ = cµσντεντ (1.60)

se denomina tensor de esfuerzos y la ecuacion (1.60) es la Ley de Hooke. ρuµ es la fuerzapor unidad de volumen y segun la ecuacion (1.59), es igual a la divergencia del tensor deesfuerzos. Esto es plenamente consistente con el teorema de Gauss para tensores∫

fµdV =

∫∂σµσ

∂xσ

dV =

∮σµσdSσ. (1.61)

La ecuacion anterior expresa el hecho fisico de que las fuerzas internas se anulan y la fuerzatotal es igual a la suma de las fuerzas aplicadas en la superficie. El elemento

σµσdSσ (1.62)

es la componente µ de la fuerza que actua sobre el elemento de superficie d~S (area dSy direccion perpendicular dada por el vector). Tomando elementos de superficie en los planosxy,yz,zx, encontramos que la componente σµσ es la componente µ de la fuerza que actua sobrela unidad de area perpendicular al eje xσ. Por ejemplo, para un area dS paralela al plano yz,tenemos que el vector d~S debe ser perpendicular al plano yz: dS1 = dS, ds2 = dS3 = 0. Lafuerza total ejercida en el area dS es la suma de la fuerza normal y la fuerza tangencial: σ11 esla fuerza normal al plano (como una presion hidrostatica), σ21 y σ31 son las componentes dela fuerza tangencial (como la fuerza de roce). Con esto se describen todas las formas posiblesde fuerzas actuantes en una superficie. La forma σµσdSσ (sumado sobre σ segun convenio deEinstein) es la expresion general cuando el plano no es paralelo a uno de los ejes coordenados(o cuando el sistema de referencia no tiene un eje paralelo al plano).

Debido a las propiedades de simetrıa del los tensores εµν y cµσντ , el tensor de esfuerzoses un tensor simetrico y por tanto tiene 6 magnitudes independientes. Estas se reunen enuna matriz columna de dimension 6, ti = σµν , siguiendo el convenio dado por la formula(1.51), (note que (1.52) y (1.53) no se aplican a la tension). A este vector columna se le llamatension (note que no es un tensor, el tensor es σµσ). Con esta notacion, la Ley de Hooke(1.60) se rescribe

ti =6∑

j=1

Cij ej. (1.63)

Notese los las matrices ti, Cij y ej no son tensores, pues no transforman como tales antetransformaciones cartesianas. Por eso se ha escrito explicitamente el signo de suma.

28 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

1.3.2. Deformaciones homogeneas

Consideremos un ortoedro microscopico de lados x1, x2, x3 en un cuerpo sin deformar. Enun sistema de coordenadas adecuado con origen en un vertice del ortoedro, los demas verticesse definen en funcion de los vectores x = (x1, 0, 0), y = (0, y2, 0) y z = (0, 0, z3). Consideremosahora una deformacion homogenea descrita por el tensor εµν . Los vectores cambian a

x′ = (x1 + u1, u2, u3), (1.64)

y′ = (v1, y2 + v2, v3), (1.65)

z′ = (w1, w2, z3 + w3). (1.66)

Si la deformacion es pequena entonces u1, u2, u3 son proporcionales a x1, v1, v2, v3 sonproporcionales a y2 y w1, w2, w3 a z3. Los factores de proporcionalidad son las componentesdel tensor de deformaciones

u1 =∂u1

∂x1

x1 = ε11x1, u2 =∂u2

∂x1

x1 = ε12x1 u3 =∂u3

∂x1

x1 = ε13x1 (1.67)

v2 =∂v2

∂y2

y2 = ε22y2, v1 =∂v1

∂y2

y2 = ε21y2, etc, (1.68)

w3 =∂w3

∂z3

z3 = ε33z3, etc. (1.69)

El volumen inicial del ortoedro es V = x1y2z3. Al ser deformado es

V ′ =

∣∣∣∣∣∣

x1 + u1 u2 u3

v1 y2 + v2 v3

w1 w2 z3 + w3

∣∣∣∣∣∣= x1x2x3 + u1y2z3 + v2x1z3 + w3x1y2 + ... (1.70)

Los terminos de orden cuadratico o cubico en los productos uvw son despreciables si lascomponentes del tensor de deformacion son pequenas y

∆V

V=

(u1

x1

+v2

y2

+w3

z3

)= ε11 + ε22 + ε33 = Trε = e1 + e2 + e3. (1.71)

La ecuacion anterior dice que el cambio relativo de volumen es igual a la traza del tensor dedeformacion, o equivalentemente, la suma de las tres primeras componentes de la deforma-cion. Ademas, las componentes ε11, ε22, ε33 indican la contraccion o dilatacion relativa a lolargo de cada eje coordenado.

Los terminos no diagonales tambien tienen interpretacion. Consideremos el angulo entrelos vectores deformados, por ejemplo,

cos(x′, y′) =x′ · y′|x′||y′| '

x1v1 + y2u2

x1y2

= ε12 + ε21 = 2ε12. (1.72)

En la secuencia anterior se despreciaron los productos de dos o mas componentes de lasdeformaciones u, v, w. Ası escribimos

εxy =1

2cos(x′, y′), εyz =

1

2cos(y′, z′), εzx =

1

2cos(z′, x′). (1.73)

1.3. ELASTICIDAD 29

De la ecuacion anterior se observa que si los angulos del ortoedro se conservan en 90, eltensor de deformacion (referido a esos mismos ejes) es diagonal.

Una deformacion en la cual el cambio de volumen es nulo, se llama deformacion decorte. En este caso el tensor de deformacion tiene la forma general

εcorteµν = τµν − 1

3(Trτ)δµν . (1.74)

Una deformacion que cambia el volumen pero no la forma del cuerpo, se llama deformacionhidrostatica y su tensor de deformacion tiene la forma

εhidroµν = constante× δµν . (1.75)

Cualquier deformacion se puede representar como la suma de una deformacion hidrostaticay una de corte, gracias a la identidad

εµν =

(εµν − 1

3(Trε)δµν

)+

1

3(Trε)δµν = εcorte

ν + εhidroν . (1.76)

Examinemos como cambia la energia de la red ante una deformacion hidrostatica en elcaso particular de un cristal cubico. La deformacion es e1 = e2 = e3 = ε, e4 = e5 = e6 = 0.Usando la ec. (1.54) para una deformacion homogenea obtenemos

δU

V=

1

2

∑i,j

eiCijej

=(ε ε ε 0 0 0

)

C11 C12 C12 0 0 0C12 C11 C12 0 0 0C12 C12 C11 0 0 00 0 0 C44 0 00 0 0 0 C44 00 0 0 0 0 C44

εεε000

(1.77)

=1

6(C11 + 2C12)(3ε)

2 =1

6(C11 + 2C12)

(∆V

V

)2

. (1.78)

Comparando con la definicion del modulo de volumen (1.20) se obtiene que

B =1

3(C11 + 2C12). (1.79)

Un caso importante en ingenieria civil cuando sobre un cuerpo actua un esfuerzo unidirec-cional. Considerese una viga de acero sometido a una presion vertical (eje Z). Debido a esteesfuerzo la viga se deforma, expandiendose un poco en las direcciones laterales. Apliquemosla ley de Hooke. La tension es t3 = σzz = P , t1 = t2 = t4 = t5 = t6 = 0.

00P000

=

C11 C12 C12 0 0 0C12 C11 C12 0 0 0C12 C12 C11 0 0 00 0 0 C44 0 00 0 0 0 C44 00 0 0 0 0 C44

e1e2e3e4e5e6

. (1.80)

30 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

Resolviendo la ecuacion anterior se obtiene

e1 = e2 = − c12P

(C11 − C12)(C11 + 2C12), (1.81)

e3 =(C11 + C12)P

(C11 − C12)(C11 + 2C12), (1.82)

e4 = e5 = e6 = 0. (1.83)

La relacion (1.82) sirve de base para definir el Modulo de Young

E =P

e3=

(C11 − C12)(C11 + 2C12)

(C11 + C12). (1.84)

Las relaciones (1.81) y (1.82) justifican la definicion del Coeficiente de Poisson

σ = −e1e3

= −εxx

εzz

=C12

C11 + C12

. (1.85)

El modulo de Young E y el coeficiente de Poisson σ son magnitudes comodas para los calculosde resistencia de materiales habituales el ingenierıa. Ademas, en medios isotropos solamentehay dos constantes elasticas independientes Cij

7, las cuales se expresan en funcion de E yσ. Las formulas pertinentes pueden verse en Landau y Lifshitz, Teoria de la Elasticidad. Enparticular, el modulo de volumen es en un medio cubico o isotropo es igual a

B =E

3(1− σ). (1.86)

1.3.3. Ondas elasticas

Consideremos las soluciones de la ecuacion (1.59) que dependen del tiempo. En un medioinfinito y homogeneo se puede proponer la solucion en forma de onda plana

~u(~r, t) = ~ε exp[i(~k · ~r − ωt)], (1.87)

se obtiene la ecuacion de autovalores

ρω2εµ =∑

τ

(∑στ

cµσντkσkν

)ετ . (1.88)

Para mayor claridad hemos mantenido el signo de suma en la ecuacion anterior. Esta es laecuacion que describe la propagacion del sonido en un cristal anisotropo. Consideremos laecuacion anterior para el caso de un cristal cubico. Utilizando las relaciones (1.50) se obtienenlas siguientes ecuaciones para el vector ~ε

ρω2

ε1ε2ε3

=

C11k

21 + C44(k

22 + k2

3) (C12 + C44)k1k2 (C12 + C44)k1k3

(C12 + C44)k1k2 C11k22 + C44(k

21 + k2

3) (C12 + C44)k2k3

(C12 + C44)k1k3 (C12 + C44)k2k3 C11k23 + C44(k

21 + k2

2)

ε1ε2ε3

(1.89)

7En la proxima seccion obtendremos una formula para C44 en funcion de C11 y C12 en un medio isotropo.

1.3. ELASTICIDAD 31

La ecuacion anterior es un problema de autovalores para cada valor especificado del vectorde onda ~k = (k1, k2, k3). En algunos casos es simple obtener soluciones analiticas.

a) ~k = (k1, 0, 0). El sistema de ecuaciones queda completamente desacoplado

(C11k21 − ρω2)ε1 = 0, (1.90)

(C44k21 − ρω2)ε2 = 0, (1.91)

(C44k21 − ρω2)ε3 = 0. (1.92)

Las soluciones son

a.1) ε1 6= 0, ε2 = ε3 = 0 (modo longitudinal), ω =√C11/ρk1, vL =

√C11/ρ.

a.2) ε2 6= 0, ε1 = ε3 = 0 (modo transversal), ω =√C44/ρk1, vT =

√C44/ρ.

a.3) ε3 6= 0, ε1 = ε2 = 0 (modo transversal), ω =√C44/ρk1, vT =

√C44/ρ.

Las ondas elasticas son las ondas sonoras, entendiendo que la frecuencia ω/2π este enel rango audible 5 − 20000 Hz. Midiendo las velocidades de las ondas transversales y longi-tudinales a lo largo de uno de los ejes principales del cristal, se determinan las constanteselasticas C11 y C44.b) ~k = (k/

√2, k/

√2, 0). En este caso el sistema no se desacopla totalmente, quedando

ρω2

ε1ε2ε3

=

(C11 + C44)k2

2(C12 + C44)

k2

20

(C12 + C44)k2

2(C11 + C44)

k2

20

0 0 C44k2

ε1ε2ε3

. (1.93)

Las soluciones son

b.1) ε1 = ε2 6= 0, ε3 = 0 (modo longitudinal), ω =√

(C11 + C12 + 2C44)/2ρ k = vLk.

b.2) ε2 = −ε1 6= 0, ε3 = 0 (modo transversal), ω =√

(C11 − C12)/2ρ k = vT‖k.

b.3) ε3 6= 0, ε1 = ε2 = 0 (modo transversal), ω =√C44/ρ k, vT⊥ =

√C44/ρ.

Las relaciones anteriores permiten determinar la otra constante elastica. Notese que lavelocidad de la onda depende de la direccion de propagacion. Esto es una manifestacion dela anisotropıa de los cristales.

En un medio elastico isotropo la velocidad de propagacion no puede depender de ladireccion de propagacion. Si uno iguala las velocidades transversales de la solucion b) entresi y con las de la solucion (a), se llega a la relacion

2C44 = C11 − C12 en un medio isotropo. (1.94)

Si se igualan las velocidades longitudinales de las soluciones (a) y (b), se obtiene el mismoresultado.

Los medios elasticamente isotropos son materiales amorfos, policristales (por ejemplo, elacero), o algunos cristales muy especiales. Las constantes elasticas de un policristal no son

32 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

exactamente el promedio de las constantes del monocristales, como podria pensarse ingenua-mente. Para determinarlas teoricamente serıa necesario resolver el sistema de ecuaciones dela Ley de Hooke para el conjunto de todos los granos que forman el policristal.8

1.4. Densidad de Estados

Para un sistema cualquiera con un espectro de energıas En, la densidad de estados sedefine

ρ(E) =∑

n

δ(E − En), (1.95)

siendo n el conjunto de numeros que definen un estado del sistema. Si se integra

∫ E2

E1

ρ(E)dE =∑

n

∫ E2

E1

δ(E − En)dE =∑

nE1<E<E2

1 (1.96)

es el numero de estados con energıas entre E1 y E2. El concepto de densidad de estadosresulta muy util en sistemas cuyo espectro de energias es continuo o cuasicontinuo.

Alternativamente se utiliza la densidad de estados por unidad de frecuencias, llamadasimplemente densidad de estados. Esta se basa en la relacion E = ~ω

D(ω) =∑

n

δ(ω − ωn) =∑

n

δ

(E − En

~

)=

∑n

~δ(E − En) = ~ρ(E). (1.97)

1.4.1. Particula libre en una caja unidimensional

Los estados cuanticos son son soluciones de la ecuacion de Schrodinger

− ~2

2m

d2φ

dx2= Eφ (1.98)

con las condiciones de borde

φ(0) = φ(L) = 0, (1.99)

donde L es la longitud de la caja. Las soluciones y energıas son

φ(x) =

√2

Lsin

(nπxL

), En =

~2π2n2

2mL2. (1.100)

Consideremos el numero de estados con energıas entre 0 y E

N(E) =

∫ E

0

ρ(E ′)dE ′. (1.101)

8Si alguien encuentra una referencia en que se reporte haber hecho este calculo, agradecere que me lamuestre.

1.4. DENSIDAD DE ESTADOS 33

De la igualdad anterior se deduce que

ρ(E) =d

dEN(E). (1.102)

Si la longitud de la caja L tiende a infinito, entonces la separacion de los niveles En tiende a0 y el espectro es cuasicontinuo. Basado en esto, podemos invertir la relacion entre n y E

n(E) =

√2mEL

~π. (1.103)

El numero de estados con energıa menor o igual a E es

N(E) =

n(E)∑n=1

1 = n(E), (1.104)

ρ(E) =dn(E)

dE=

√2mL

~π√E

(1.105)

Si la partıcula confinada es un eletron, entonces cada nivel de energia puede ocuparse por dosestados con numero cuantico de spin igual a 1 y -1. Esto implica un factor 2 en la densidadde estados.

ρelectron(E) = 2

√2mL

~π√E

(1.106)

1.4.2. Partıcula libre con condiciones de frontera periodicas en unadimension

En este caso las condiciones de borde cambian por

φ(0) = φ(L) (1.107)

y las soluciones de la ecuacion de Schrodinger son

φ(x) =1√Leikx, E =

~2k2

2m. (1.108)

La condicion de frontera periodica implica que

k =2πn

L, n = 0,±1,±2, .... (1.109)

El numero cuantico n satisface

n(E) =

√2mEL

2π~(1.110)

El numero de estados con energia menor o igual a E es (sin considerar la degeneracion despin)

N(E) =∑

n=−n(E)n(E)

1 = 2n(E) + 1 ' 2n(E) =

√2mEL

π~. (1.111)

34 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

Derivando respecto a E se obtiene nuevamente (1.105). Considerando la degeneracion de spinse obtiene (1.106)

Este resultado ilustra que en un sistema grande la densidad de estados no depende de lascondiciones de frontera.

Consideremos la formula (1.109) que es resultado de la aplicacion de la condicion defrontera periodica. En base a ella, se puede decir que cada estado ocupa una longitud 2π/Len el espacio k. Asi, podemos establecer la relacion

∑n

=∑

k

=L

∫dk. (1.112)

Esta formula nos sera muy util.

1.4.3. Particula libre en dos dimensiones

Considerando condiciones de frontera periodicas, las funciones de onda y energias son

φ(x, y) =ei~k·~r

√LxLy

, kx =2πnx

Lx

, ky =2πny

Ly

, E =~2k2

2m. (1.113)

La formula (1.112) se generaliza en dos dimensiones a

∑nx,ny

=∑

kx,ky

=LxLy

(2π)2

∫d2k . (1.114)

El numero de estados con energıa menor que E se obtiene sumando sobre nx y ny con la

condicion de que E(k) = ~2k2

2m< E o equivalentemente, k < k(E) =

√2mE/~. Utilizando

(1.114) se obtiene

N(E) =∑kx,ky

E(k)<E

g = gLxLy

(2π)2

∫ k(E)

0

kdk

∫ 2π

0

dθ = gLxLy

(2π)2πk(E)2 =

gAmE

2π~, (1.115)

donde A = LxLy es el area y g = 2 si se considera la degeneracion de spin. Derivando N(E)respecto a E se obtiene

ρ(E) =gAm

2π~. (1.116)

1.4.4. Particula libre en tres dimensiones

Siguiendo el mismo metodo se obtiene

ρ(E) =gV m

√2mE

2π2~3g = 2 si hay spin. (1.117)

Notese que existe una dependencia marcada de la forma funcional con el numero dedimensiones del problema. Los problemas uni- y bi-dimensionales no son casos meramenteacademicos, sino que se realizan en sistemas nanoestructurados.

1.4. DENSIDAD DE ESTADOS 35

1.4.5. Ondas elasticas

Consideremos la densidad de estados vibracional en esta aproximacion en un medio elasti-camente isotropo. La elongacion toma la forma dada por (1.87) y la ley de dispersion

ω1,2 = vTk (2 modos transversales) (1.118)

ω3 = vLk (1 modo longitudinal) (1.119)

Para obtener la densidad de estados en un volumen cubico de lado L, V = L3, necesitamosimponer condiciones de borde periodicas a los modos de vibracion descritos por (1.87), locual arroja

kx =2πnx

L, kx =

2πny

L, kx =

2πnz

L. (1.120)

La densidad de estados es

D(ω) =∑

nx,ny ,nz

3∑

λ=1

δ(ω − ωλ(knx,ny ,nz)) =V

(2π)3

∫d3k

3∑

λ=1

δ(ω − ωλ(k)). (1.121)

Sustituyendo las expresiones de ωλ(k) para medio isotropo obtenemos

D(ω) =V

(2π)3

∫d3k [2δ(ω − vTk) + δ(ω − vLk)] . (1.122)

Aplicando las propiedades de la funcion delta se obtiene el resultado

D(ω) =V

2π2

3ω2

v3, donde

1

v3=

1

2

(2

v3T

+1

v3L

)(1.123)

En el problema de la cadena lineal vimos que para enumerar todas las soluciones lineal-mente independientes basta con acotar el numero de onda k en un intervalo de longitud 2π/a,con lo cual el numero de vectores de onda posibles es igual al numero de sitios de la red.En la red tridimensional9 vale este analisis para cada una de las tres dimensiones. Luego, elnumero de vectores ~k posibles es igual al numero de sitios de la red N = NxNyNz. Como

a cada ~k le corresponden tres modos de vibracion (dos transversales y uno longitudinal), elnumero total de modos es 3N . Luego, la densidad de estados tiene una frecuencia de corteωmax tal que

3N =

∫ ωmax

0

D(ω) dω =V ω3

max

2π2v3. (1.124)

Luego, la frecuencia de corte es

ωmax =

(6π2v3N

V

)1/3

. (1.125)

Esta frecuencia de corte es aproximada debido a la crudeza del modelo, pero es suficientepara describir propiedades importantes como el calor especifico a bajas temperaturas.

9La aproximacion elastica da resultados independientes de la red cristalina, de modo que en podemosasumir una red cubica simple.

36 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

1.5. Modelos del calor especifico

Con la densidad de estados vibracional D(ω) se pueden calcular magnitudes termodinami-cas como la energıa interna

U(T ) = U0 +

∫ ωmax

0

dω D(ω)E(ω), n(ω) =1

e~ω/kBT − 1, (1.126)

donde U0 denota la energia potencial de los atomos en sus posiciones de equilibrio y E(ω)denota la energia promedio de cada modo normal de frecuencia ω.

La capacidad calorica a volumen constante se define como

CV (T ) =

(∂U

∂T

). (1.127)

Uno de los problemas historicos ligado a la teoria del cristal armonico y de la fisica cuanticaes el comportamiento del calor especifico a diferentes temperaturas. La fisica estadisticaclasica predice que a cada oscilador tridimensional le corresponde una energia promedioE(ω) = 3kBT . De aqui se deduce que la energia interna es igual a 3NkBT y por consiguienteel calor especifico es independiente de la temperatura (ley de Dulong y Petit). La capacidadcalorica de un mole de atomos es igual a

Cclasico = 3R, (1.128)

siendo R = NakB la constante universal de los gases, Na el numero de Avogadro y kB laconstante de Boltzmann. Este resultado contradice la evidencia de que el calor especificotiende a cero cuando la temperatura tiende a 0K.

Einstein dio un gran paso de avance a partir de la hipotesis de considerar que cada modode vibracion tiene una energia discreta igual a En = ~ω(n+1/2) (n = 0, 1, 2, ...) 10 y propusouna densidad de estados (para N atomos)

DEinstein(ω) = 3Nδ(ω − ω0). (1.129)

Aplicando los metodos de la fisica estadistica se obtiene que la energia promedio de cadaoscilador es igual a

E(ω) =

∑nEne

−En/kBT

∑n e

−En/kBT= ~ω

(1

e~ω/kBT − 1+

1

2

). (1.130)

Con este resultado se obtiene la capacidad calorica por mole (N = Na)

CEinstein = 3R(~ω0/kBT )2e~ω0/kBT

(e~ω0/kBT − 1)2. (1.131)

La expresion de Einstein obtiene la disminucion del calor especifico al bajar la temperaturay obtiene el valor clasico (1.128) para alta temperatura. Sin embargo, predice C ∼ e−~ω0/kBT

cuando T → 0. En cristales no metalicos la dependencia experimental es C ∼ T 3.

10Originalmente el factor 1/2 no se considero, pero esto no afecta al calor especifico.

1.5. MODELOS DEL CALOR ESPECIFICO 37

Paul Debye perfecciono el modelo de Einstein, considerando que los modos de vibracioncumplen la ley de dispersion de las ondas acusticas en todo el espectro. La densidad deestados correspondiente fue examinada en la seccion 1.4.5. Usando la densidad de estadosalli obtenida se deriva la capacidad calorica molar de Debye

CDebye = 9R

(T

TD

)3 ∫ TD/T

0

x4ex

(ex − 1)2, TD =

~ωmax

kB

=~v(6π2(N/V ))1/3

kB

. (1.132)

Esta formula reproduce correctamente que a baja temperatura c ∼ T 3. El parametro TD esllamado temperatura de Debye. A temperaturas mayores que TD el calor especifico tiendeal valor clasico dado por (1.128). Ası, la temperatura de Debye da la medida de cuando seesta en el regimen clasico o cuantico.

En realidad, las ondas elasticas solo describen parte de la dinamica de las redes cristalinas.En particular, cuando la longitud de onda es del orden de los periodos de la red, la ley dedispersion ω(k) se aparta considerablemente de la relacion lineal. Un resultado general esque todos los cristales tienen 3 ramas acusticas, que corresponden a las ondas acusticas quehemos visto y cumplen que ω(k) = vk cuando k tiende a cero. Si la base tiene nb atomos,entonces existen p = 3nb − 3 ramas llamadas opticas, en las cuales ω(k = 0) 6= 0. Estosmodos se describen mejor mediante el modelo de Einstein. Esto permite formular un modelohibrido Einstein-Debye

CEinstein−Debye = 9R

nb

(T

T ′D

)3 ∫ T ′D/T

0

x4ex

(ex − 1)2+

3nb∑s=4

R

nb

(~ωs/kBT )2e~ωs/kBT

(e~ωs/kBT − 1)2, (1.133)

donde ωs son las frequencias centrales de las ramas opticas s, y T ′D = TD/n3b . Notese que para

bajas temperaturas CEinstein−Debye = CDebye.Notese que la energia de un cristal a la temperatura del cero absoluto contiene, ademas

de la energıa potencial interatomica U0, el termino

EZPE =

∫ ωmax

0

dω D(ω)1

2~ω. (1.134)

Este termino se llama energıa del punto cero (Zero Point Energy en la literatura cientıficaanglofona), y es una manifestacion del principio de incertidumbre de Heisenberg, que prohibela localizacion de los atomos exactamente en los puntos de equilibrio.

Finalmente, notemos que en los metales, el gas de electrones libres aporta una contribucionadicional a la capacidad calorica

Cel =π2

2

(kBT

EF

)NvR, (1.135)

siendo Nv el numero de electrones de valencia de cada atomo y EF es la energıa de Fermi.EF es la energıa cinetica del ultimo nivel ocupado a temperatura 0 K. La contribucionelectronica al solo es importante a temperaturas de unos pocos Kelvin, cuando la capacidadcalorica ionica tiende a 0.

38 CAPITULO 1. ELEMENTOS DE FISICA DE SOLIDOS

Capıtulo 2

Mapas discretos

En esta parte estudiaremos la evolucion de las relaciones de recurrencia del tipo

xn+1 = M(xn) (2.1)

A este tipo de relacion se le llama mapa. Un ejemplo clasico, que utilizaremos para ilustrarlos conceptos, es el mapa logıstico, definido por

M(x) = rx(1− x), r > 0. (2.2)

El mapa logıstico permite modelar simplificadamente la evolucion de la poblacion de unaespecie cuyo suministro alimentario presenta un tope. Como veremos, este mapa presentacaos y orden, en dependencia del valor del parametro r. El mapa logistico es unidimensional,pero en general xn puede representar un punto en un espacio de mas dimensiones.

Muchos problemas de la fısica son gobernados por ecuaciones diferenciales ordinarias,cuya solucion numerica implica discretizar el tiempo segun tn = n∆t. Si como resultado seobtienen relaciones del tipo x(tn+1) = f [x(tn)], entonces estamos nuevamente en presenciade un mapa.

2.1. El mapa logıstico

Estudiemos graficamente la evolucion del mapa logıstico. La Fig. 2.1 muestra la secuenciade valores que toma xn a partir de una condicion inicial dada.

En la parte izquierda la condicion inicial es x0 = 0,5. La linea vertical que parte de (0.5,0)hasta (0.5,M(0.5)) [es decir, (x0, x1)] indica la evaluacion del mapa por primera vez. Luegose traza una linea horizantal que intersecta la recta y = x, en el punto (x1, x1). Trazandola vertical hasta la funcion M(x) se obriene el punto (x1,M(x1) = (x1, x2)]. Continuando elproceso obtenemos la secuencia de puntos xn, xn+1. De la figura se deduce que la sucesion devalores xn converge hacia el valor 0 si x0 = 0,1 y r = 0,9, y converge hacia un cierto valorde x > 0,5 en el caso de que r = 2,5. En ambos casos, se obtiene siempre el mismo puntode convergencia si se cumple que la condicion inicial es 0 < x0 < 1. El conjunto de puntosx1, x2, x3, .... se denomina trayectoria. El conjunto al que convergen asintoticamentes lastrayectorias es llamado atractor. En el caso r = 0,9 el atractor es el punto x = 0, para

39

40 CAPITULO 2. MAPAS DISCRETOS

0.2 0.4 0.6 0.8 1x

0.05

0.1

0.15

0.2

0.25

M(x) r=0.9

0.2 0.4 0.6 0.8 1x

0.2

0.4

0.6

0.8

1M(x) r=2.5

Figura 2.1: Evolucion del mapa logıstico a partir de una condicion inicial. Derecha: r = 0,9,x0 = 0,5. Izquierda: r = 2,5, x0 = 0,1.

1 2 3 4r

0.2

0.4

0.6

0.8

1

x

3.5 3.6 3.7 3.8 3.9r

0.2

0.4

0.6

0.8

1x

Figura 2.2: Diagrama de bifurcaciones para el mapa logıstico, si se cumple que la condicioninicial es x0 ∈ (0, 1).

2.1. EL MAPA LOGISTICO 41

r = 2,5 el atractor es el punto x que se ve en la figura. Se puede tener una idea global de losatractores en funcion del valor del parametro si se hace un diagrama de bifurcaciones.

La Fig. 2.2 muestra el atractor para cada valor del parametro r, siempre que 0 < x0 < 1.El atractor es x = 0 si 0 < r < 1, es un punto 0 < x < 0,8 si 1 < r < 3, dos puntos si3 < r < 3,45, luego 4, etc, hasta llegar a formar una banda continua en cierto rango de r. Enesta banda estamos en presencia de caos. Como indica la trayectoria, se puede ir a cualquierparte. El grafico es realmente rico, en la parte de abajo se ve una ampliacion en el rango3,5 < r < 4, en la que se nota que las bifurcaciones van en aumento al acercarse al regimende caos, y la aparicion de ventanas de orden dentro del caos. La Fig. 2.2 se genera aplicandoel siguiente algoritmo para cada valor del parametro r

Condicion inicial x0 = 0,1.

Se aplico el mapa 200 veces, o sea, se genera la trayectoria hasta x200.

Se aplico el mapa 200 veces mas y se graficaron los puntos (r, xn).

El segundo paso del algoritmo consiste en eliminar el transiente, de modo que lo puntosgraficados, generados en el tercer paso, ya corresponden a la tendencia asintotica de las tra-yectorias, o sea, el atractor. La figura generada no depende del valor preciso de x0, siempreque x0 ∈ (0, 1). El intervalo (0, 1) es en este caso la cuenca1 de atraccion. Puede compro-barse siguiendo las trayectorias graficamente que si x0 < 0 o x0 > 1, entonces el atractor es−∞.

Veamos como puede entenderse el resultado anterior usando procedimientos analıticos.Si la trayectoria converge hasta cierto punto

x∗ = lımnxn (2.3)

se cumple quex∗ = M(x∗). (2.4)

Los puntos que satisfacen la ecuacion anterior se denominan puntos fijos del mapa M . Parael mapa logıstico las soluciones de la ecuacion 2.4 son

x(1) = 0, x(2) = 1− 1

r. (2.5)

Los puntos fijos no son necesariamente atractores. Examinemos como evoluciona una trayec-toria cerca de un punto fijo. Sea xn = x∗ + δn

x∗ + δn+1 = xn+1 'M(x∗ + δn) = M(x∗) +dM

dx

∣∣∣∣x=x∗

δn. (2.6)

Utilizando 2.4 obtenemos la relacion∣∣∣∣δn+1

δn

∣∣∣∣ =

∣∣∣∣dM

dx(x∗)

∣∣∣∣ (2.7)

1En ingles, basin, que significa lavamanos.

42 CAPITULO 2. MAPAS DISCRETOS

0.2 0.4 0.6 0.8 1x

0.2

0.4

0.6

0.8

1M(x) r=3.2

0.2 0.4 0.6 0.8 1x

0.2

0.4

0.6

0.8

1M2 (x) r=3.2

Figura 2.3: Orbita estable de periodo 2 n el mapa logistico.

De aqui se deduce que δn (y por tanto xn −→ x∗) tiende a cero solamente si

|M ′(x∗)| < 1. (2.8)

En este caso se dice que el punto fijo es estable y es un atractor del mapa. Evaluando estacondicion en los puntos fijos obtenidos arriba, obtenemos

M ′(x(1)) = r, M ′(x(2)) = 2− r. (2.9)

De aqui se deduce que el punto fijo x(1) es estable en el rango r ∈ (0, 1) y x(2) es estable enr ∈ (1, 3). Estos son los valores que se observan en el diagrama de bifurcacion de la Fig. 2.2.

Otro asunto ocurre para r > 3. La Fig. 2.3 ilustra una trayectoria para r = 3,2. Se apreciaque despues de un transiente la trayectoria se estabiliza en los valores alternantes 0.513 y0.799. Este tipo de atractor de llama orbita de perıodo 2, y se generaliza a periodo Nde manera directa. Los dos valores de esta orbita son los que se aprecian en el diagrama debifurcaciones. A partir de cierto valor de r ∼ 3,44 las orbitas son de periodo 4 y al aumentarr se siguen multiplicando hasta llegar al caos.

Entendamos una orbita de perıodo 2. La alternancia de la trayectoria entre dos puntos x(1)

y x(2) significa que ellos son puntos fijos estables del mapa compuesto M2(x) = M(M(x)).Es decir

M2(x∗) = x∗. (2.10)

La Fig. 2.3 muestra una trayectoria del mapa M2 que converge a uno de los puntos fijosestables. Notese que la ecuacion 2.10 incluye las soluciones de 2.4. Esto se comprueba facil-mente sustituyendo 2.4 en 2.10. Comparando las partes izquierda y derecha de la Fig. 2.3 queefectivamente las soluciones de la parte izquierda (dadas por la interseccion del mapa con larecta y = x) estan presentes en la figura derecha, aunque son inestables.

La condicion de estabilidad para una orbita de periodo 2 que alterna entre los puntos x(1)

y x(2) esta dada por |dM2/dx| < 1. Aplicando la regla de la cadena se obtiene

d

dxM(M(x))

∣∣∣∣x=x(1)

=dM

dx

∣∣∣∣x(2)=M(x(1))

dM

dx

∣∣∣∣x(1)

. (2.11)

La generalizacion para orbitas de periodo m es obvia

d

dxMm(x)

∣∣∣∣x=x(1)

=m∏

k=1

dM

dx

∣∣∣∣x=x(k)

. (2.12)

2.1. EL MAPA LOGISTICO 43

0.5 1 1.5 2 2.5 3 3.5 4r

-4

-3

-2

-1

3.4 3.5 3.6 3.7 3.8 3.9r

-2

-1.5

-1

-0.5

0.5

Figura 2.4: Exponente de Lyapunov del mapa logıstico, calculado mediante la ecuacion 2.16,aproximando m = 200.

Esto implica que la desviacion δn = xn − x(1) cumple

|δn+m| =∣∣∣∣∣

m∏

k=1

dM

dx

∣∣∣∣x=x(k)

∣∣∣∣∣ |δn| . (2.13)

Los valores |δn| admiten la solucion|δn| = eλn, (2.14)

que sustituida en la condicion 2.13 implica que

λ =1

m

m∑

k=1

ln

∣∣∣∣dM

dx(x(k))

∣∣∣∣ . (2.15)

En la practica, los x(k) se pueden remplazar por los puntos consecutivos de la trayectoriauna vez eliminado el transiente. El numero λ se llama exponente de Lyapunov. Si λ > 0hay caos, en caso contrario hay orbitas m-periodicas estables. El caso de las trayectoriascaoticas se puede considerar como orbitas de periodo infinito, con un exponente de Lyapunovigual a

λ = lımm→∞

1

m

m∑

k=1

ln

∣∣∣∣dM

dx(x(k))

∣∣∣∣ . (2.16)

44 CAPITULO 2. MAPAS DISCRETOS

La ecuacion anterior (2.16) incluye a 2.15. El exponente de Lyapunov del mapa logısticose muestra en la Fig. 2.4. Cuando λ < 0 estamos en presencia de puntos fijos o orbitasde perıodo n. Cuando λ = 0 tenemos una bifurcacion y generalmente se acompana de uncambio de pendiente producto de que cambia el atractor. λ → −∞ corresponde puntossuperestables, o sea, que M ′(x∗) = 0, y λ > 0 indica caos. Este grafico revela limpiamentela existencia de caos o orden. En la ampliacion para r ∈ (3,4, 4,0) (comparese con Fig. 2.2)se observa la existencia de muchas ventanas de orden dentro del caos.2

El exponente de Lyapunov nos da otra informacion. Si tenemos dos trayectorias que partendesde cerca del atractor, tales que |x0 − y0| = δ ¿ 1, entonces

|xn − yn| = δenλ. (2.17)

Es decir, si λ > 0 las trayectorias divergen de forma exponencial hasta que se alcanza ciertolımite determinado por la imagen del mapa.3

2.2. Grupo de renormalizacion

Examinando el diagrama de bifurcaciones del mapa logıstico vemos que existe un valorcrıtico rc en el que comienza el caos. A la izquierda de rc se observa un progresivo doblamientode perıodo que deviene en el caos como un atractor de perıodo infinito. Usando el metodo delgrupo de renormalizacion es posible hallar el valor de rc y estudiar el numero de bifurcacionesN(εm) en funcion de la distancia al punto crıtico ε = rc − rm.

Consideremos la secuencia de los puntos superestables r0, r1, r2, ..., los cuales satisfacen

M2m−1

(x∗, rm) = x∗ (2.18)

M ′(x∗, rm) = 0. (2.19)

La sequencia rm converge al parametro critico rc. Ademas, los puntos superestables x∗ sonextremos del mapa M2m−1

(x, rm) y localmente se pueden aproximar de segundo orden en(x− x∗).

Comparese los graficos de los mapas M(x, r) y M2(x, r) = M(M(x, r), r) en la Fig. 2.5.Tratemos de obtener una relacion entre los valores r1 y r2 que producen puntos superstables.Es evidente que la ventana dibujada en el grafico de M2 alrededor del punto superestablex∗ = 0,5 es similar al grafico del mapa M . En un entorno pequeno alrededor del puntoextremal cada mapa se puede expandir en potencias de (x − x∗). Eliminando las potenciasde grado mayor que 2 se pueden poner ambas curvas en una correspondencia exacta. En elmapa logistico la corrrespondencia se hace mediante el cambio de variables

y − 1

2= α

(x− 1

2

). (2.20)

Se espera que α < 0 pues la correspondencia require de una rotacion de los ejes. Lacorrespondencia debe cumplirse tambien para las imagenes xn+2 = M2(xn, r2) y yn+1 =M(yn, r1)

yn+1 − 1/2 = α (xn+2 − 1/2) . (2.21)

2Un estudio detallado revela que es infinito el numero de ventanas de orden dentro del caos.3En el mapa logistico |xn − yn| < 1.

2.2. GRUPO DE RENORMALIZACION 45

0.2 0.4 0.6 0.8 1xn

0.2

0.4

0.6

0.8

1

xn

+1

r1=2

0.2 0.4 0.6 0.8 1xn

0.2

0.4

0.6

0.8

1

xn

+2

r1=3.2

Figura 2.5: Mapa logıstico y mapa compuesto alrededor del punto superestable.

Expresando yn+1 y xn+2 en funcion de yn y cambiando yn por y se obtiene la relacion

M(y, r1)− 1/2 = α

(M2

(y − 1/2

α+

1

2, r2

)− 1/2

). (2.22)

Desarrollando el miembro derecho de la equacion anterior en series de (y−1/2)n y eliminandopotencias mayores de 2 se obtiene

0 =

(−1

2+α

2+r14− αr2

2

4+αr3

2

16

)+

(−r1 +

r22

α− r3

2

)(y − 1

2

)2

(2.23)

Igualando a 0 los coeficientes se obtienen dos soluciones para r1 y α como funcion de r2.Escogiendo la solucion que da α < 0 nos queda

r1 = R(r2) = 1 +

√8− 16 r22 + 8 r23 + 8 r24 − 6 r25 + r26

2√

2(2.24)

α = −−8 +√

64 + 8 (−2 + r2) r22 (8− 4 r22 + r23)

2 (8− 4 r22 + r23)(2.25)

Puesto que el la transformacion anterior hace corresponder el mapa M2 con el mapa M ,localmente de forma exacta, la misma transformacion permite obtener M4, M8, etc. Luego,la relacion R es general

rm = R(rm+1). (2.26)

Notese que seria mejor obtener la funcion inversa R−1. Sin embargo, esta se expresa por unaformula mucho mas larga y afortunadamente podemos prescindir de ella. El punto fijo delmapa rm = R(rm+1) satisface la equacion

rc = R(rc) (2.27)

Las soluciones son

r → 2, r → 1 + i

√−3 + 2

√3, r → 1 +

√3 + 2

√3 (2.28)

46 CAPITULO 2. MAPAS DISCRETOS

El valor 2 es el punto fijo estable del mapa R, y por tanto es inestable para R−1, por tantose descarta. El segundo punto se descarta por ser complejo. El tercer valor es el punto fijoestable de R−1 y es el valor que buscamos

rc = 1 +

√3 + 2

√3 ' 3,54246. (2.29)

Para el parametro α se obtiene el valor −2/(√

3− 1) ' −2,73205.Llamemos εm = rc − rm. El numero de bifurcaciones de doblamiento de periodo es

N(εm) = 2m. (2.30)

Cuando εm → 0 se cumple que

εm = δεm+1, δ =dR

dr

∣∣∣∣r=rc

= 4 +√

3 ' 5,73205. (2.31)

La relacion anterior admite la solucion

εm = Kδ−m = Ke−m ln δ, (2.32)

donde K es una constante que depende de las condiciones iniciales. Relacionando (2.30) y(2.32) se obtiene la dependencia

N(εm) ∝ ε− ln 2/ ln δm . (2.33)

La ecuacion anterior se puede rescribir en la forma

N(rm) ∝ |rc − rm|ν , ν = − ln 2/ ln δ ' −0,396975. (2.34)

ν se llama exponente crıtico.Naturalmente, para los mapas unidimensionales es posible hallar los parametros crıticos

mediante un examen detallado del diagrama de bifurcaciones y un conteo de las bifurcacionesde doblamiento de perıodo. Se propone este ejercicio de tarea y comparar los resultados con losvalores obtenidos mediante el grupo de renormalizacion. El grupo de renormalizacion es unatecnica bastante amplia que permite encontrar parametros y exponentes crıticos aproximados,en situaciones en que no es posible obtener soluciones numericas o exactas. En particular esimportante en la teorıa de las transiciones de fase, en la cual que intervienen “parametros deorden” que divergen en la forma (2.34).

Capıtulo 3

Caos en ecuaciones diferencialesordinarias

3.1. Conceptos

En esta parte se pretende extender los conceptos de mapas discretos a los sistemas deecuaciones diferenciales ordinarias.

Consideremos un sistema de ecuaciones diferenciales de primer orden, escrito generica-mente en la forma

dx

dt= F (x, p), x(0) = x0, (3.1)

donde p es un conjunto de parametros y x es un vector de N dimensiones, cuyo conjunto devalores posibles es llamado espacio de fase.

Puede demostrarse que si las funciones F y dF/dt son continuas en una vecindad S de x0,entonces existe algun intervalo (−τ, τ) de medida no nula en el cual el sistema de ecuacionestiene solucion unica. Si la solucion es unica, entonces dos trayectorias x(t) no se cruzan nunca,siempre que la funcion F (x, p) no dependa explıcitamene de t. El sitema de ecuaciones sepuede resolver numericamente usando el algoritmo de Runge-Kutta.

dx

dt= f(x, t) (3.2)

k1 = ∆tf(x, t) (3.3)

k2 = ∆tf(x+ k1, t+ ∆t/2) (3.4)

k3 = ∆tf(x+ k2/2, t+ ∆t/2) (3.5)

k4 = ∆tf(x+ k3, t+ ∆t) (3.6)

x(t+ ∆t) = x(t) +k1 + 2k2 + 2k3 + k4

6+O((∆t)6) (3.7)

Un ejemplo clasico es el sistema de Lorenz, obtenido en 1963 en un estudio de fenomenos

47

48 CAPITULO 3. CAOS EN ECUACIONES DIFERENCIALES ORDINARIAS

-100

10x

-20

-10

0

10

20y

0

10

20

30

40

z

-100

10x

-20

-10

0

10

20y

Figura 3.1: Trayectoria caotica del sistema de Lorenz. σ = 10, b = 8/3, r = 28, t ∈ (60, 100).

de conveccion.

dx

dt= σ(y − x) (3.8)

dy

dt= −xz + rx− y (3.9)

dz

dt= xy − bz. (3.10)

Este sistema presenta caos para ciertas condiciones iniciales y valores de los parametros, porejemplo, σ = 10, b = 8/3, r = 28. En la Fig. 3.1 se muestra parte del atractor caotico delsistema de Lorenz. El caracter caotico se pone de manifiesto considerando dos trayectorias~x1(t) y ~x2(t) tales que

δ(t0) = |~x1(t0)− ~x2(t0)| = 10−10 (3.11)

con t0 suficientemente largo para eliminar el transiente y estar ya en el atractor. Si se plotealg δ(t) vs t, con t0 = 55 se obtiene el grafico de la Fig. 3.2.

Definiendo el exponente de Lyapunov mediante la relacion

δ(t) = δ(t0)eλ(t−t0), (3.12)

se obtiene para el caso de la Fig. 3.2 el valor λ = 0,39. Al igual que en los mapas discretos,λ > 0 caracteriza el caos del sistema. Notemos que si el sistema es caotico resulta dificilobtener la solucion numericamente, ya que los errores debido a la finitud de ∆t se amplifican

3.1. CONCEPTOS 49

60 65 70 75t

-10

-6

-4

-2

lg δ

Figura 3.2: Evolucion de la diferencia de dos trayectorias con condiciones iniciales casi igualesen el sistema de Lorenz. La linea recta es un ajuste a la relacion lg δ(t) = λt+ C.

exponencialmente.1

Otro metodo de clasificar el caos consiste en generar mapas discretos a partir de la solucionde la ecuacion diferencial. Estos mapas discretos se analizan mediante las tecnicas explicadasen el capıtulo anterior.

3.1.1. Corte de Poincare

Este es un metodo que permite reducir una dimension. Considerese como ejemplo elsistema de Lorenz. Consideremos los puntos de la trayectoria x(t), y(t), z(t) en que x(t) = Cy dx/dt > 0, es decir, los puntos en que la trayectoria atraviesa cierto plano en direccionpositiva. Esto da una secuencia de instantes tn y los correspondientes valores yn = y(tn) yzn = z(tn). Entonces con cada variable se puede hacer un mapa

yn+1 = M(yn) o zn+1 = M(zn) (3.13)

3.1.2. Mapa de los maximos sucesivos

En realidad este corte de Poincare, en caso del sistema de Lorenz, no permite visualizarbien, pues tanto el dominio y la imagen del mapa son bidimensionales. Esa es la causa deque el mapa, como funcion de yn, parezca multivaluado. Una alternativa util es la sucesionde maximos de la variable z(t). El mapa zn+1 = M(zn) se muestra en la Fig. 3.4

Con este mapa se puede hacer diagrama de bifurcaciones como funcion de los paramtrosr, σ, b, calcular exponentes de Lyapunov, y todo lo demas que se hace con mapas discretos.Comparando con la recta y = x se ve que siempre |dM/dx| > 1 y no es invertible, lo queimplica inmediatamente que el mapa, y por tanto el sistema de ecuaciones diferenciales, soncaoticos.

1He estudiado que variando ∆t de 0.0001 a 0.01 con el algoritmo NDSolve de Mathematica, el valor deλ aumenta hasta 0.55.

50 CAPITULO 3. CAOS EN ECUACIONES DIFERENCIALES ORDINARIAS

12 14 16 18yn

12

14

16

18

yn + 1

Figura 3.3: Corte de Poincare del sistema de Lorenz. Izquierda: imagen de libro. Derecha:calculado por mi, con σ = 10, b = 8/3, r = 28, t ∈ (200, 500).

202 204 206 208 210t10

15

20

25

30

35

40

z(t)

32.5 35 37.5 40 42.5 45zn

32.5

35

37.5

40

42.5

45

zn+1

Figura 3.4: Izquierda: evolucion de la componente z(t) del sistema de Lorenz. Derecha: mapade los maximos sucesivos de z(t) del sistema de Lorenz. Parametros: r = 28, σ = 10, b = 8/3.

3.1.3. Mapa estroboscopico

Este consiste en la funcion xn = z(nT ), siendo T un valor que determina la escala de lavariable t. Esa escala de tiempo es discernible en casos como el del pendulo forzado.

d2x

dt2+ β

dx

dt+ sin x = A cosωt. (3.14)

Este sistema se lleva a la forma canonica (3.1) introduciendo las variables auxiliares y = dx/dty z = t.

dx

dt= y (3.15)

dy

dt= −βy − sinx+ A cosωz (3.16)

dz

dt= 1 (3.17)

3.2. ESCALERAS DEL DIABLO 51

-2 -1 1 2x

-2

-1

1

2

yA=1.0

25 50 75 100 125 150t 2 π

-3

-2.5

-2

-1.5

-1

-0.5

x A=1.0

Figura 3.5: Trayectoria en el espacio de fases del pendulo forzado. y = dx/dt, siendo x elangulo con la vertical. x(0) = 0, y(0) = 0, β = 0,1, A = 1,0, ω = 1.

La variable z = t se introdujo para que el miembro derecho solo dependa de las variablesdel espacio de fases. Por tanto las trayectorias en el espacio x, y, z no se cortan. La figuras 3.5y 3.6 muestran la proyeccion del atractor en el plano xy de las trayectorias del pendulo, concondiciones iniciales x = y = z = 0. Para A = 1,0 el atractor difiere poco del oscilador lineal,pero para A = 1,2 el atractor es mucho mas complejo. El periodo T = 2π es determinado porla fuerza perturbadora. El diagrama estroboscopico para A = 1,0 muestra que la trayectoriaes periodica. Para A = 1,2 muestra que el periodo no es 2π. Al hacer T = 12π se ve claramenteque la trayectoria es periodica. Notese la gran diferencia de amplitud entre los atractores paraA = 1,0 y A = 1,2, siendo iguales las condiciones iniciales.

3.2. Escaleras del diablo

Esta seccion es un encabezamiento provisional. El contenido puede verse en el articulo“The Devil’s staircase”, Physics Today Vol 39 (Dic 1986), pag 38.

En esta seccion se describira el fenomeno llamado Escalera del Diablo y varios sistemasque manifiestan este comportamiento. Algunos de estos son

1. Reaccion de Belousov-Zhabotinsky.

2. Junturas de Josephson forzadas por un voltage periodico.

3. Oscilaciones en un conductor superionico.

4. Periodicidad en fallas de apilamiento en compuestos intermetalicos.

5. Politipismo en aleaciones ternarias basadas en magnesio.

6. Estructura magnetica modulada con espines alineados en erbio.

En espera de la construccion definitiva de estos apuntes, agrego una nota relevante alsistema enumerado como 5. La Fig. 3.7 ilustra la diferencia entre las estructuras hexagonalcompacta (hcp) y cubica compacta (cpp), esta ultima puede ser descrita como una red fccsimple. Ambas estructuras se construyen a partir del apilamiento de planos sucesivos de bolas

52 CAPITULO 3. CAOS EN ECUACIONES DIFERENCIALES ORDINARIAS

-24 -22 -20 -18x

-2

-1

1

2

y A=1.2

25 50 75 100 125 150t 2 π

-30

-25

-20

-15

-10

-5

x A=1.2

5 10 15 20 25t 12 π

-30

-25

-20

-15

-10

-5

x A=1.2

Figura 3.6: Trayectoria en el espacio de fases del pendulo forzado. y = dx/dt, siendo x elangulo con la vertical. x(0) = 0, y(0) = 0, β = 0,1, A = 1,2, ω = 1.

con simetrıa hexagonal, como se indica en la figura. En estos planos cada bola tiene 6 bolasvecinas y es la forma mas densa de llenar el plano. Sobre un plano A se apila un plano Bdisponiendo las bolas del plano B sobre sitios intersticiales del plano A. Solo es posible ponerbolas sobre la mitad de los intersticios del plano inferior. Notemos en la parte inferior de lafigura 3.7 que los planos A y B tienen un set de intersticios comunes. La diferencia entrehcp y cpp radica en como se disponen las bolas del tercer plano. La opcion 1 es ponerlassobre los intersticios comunes al plano A y B. De este modo las posiciones ocupadas sondistintas a las de A y B, por tanto esto es un plano distinto llamado C. Esta es la estructuracpp y el apilamiento se llama ABCABC.... La opcion 2 es poner las bolas en los intersticiosde B no comunes con los de A. De esta forma el tercer plano es igual al primero, del tipoA, este apilamiento es ABABAB.... y corresponde a la estructura hcp. Considerando esferasrigidas, ambas estructuras llenan la misma fraccion del volumen y es posible alternar el modode apilamiento, digamos una estructura ABCABABABCAC... sin alterar la densidad ni laenergia potencial del sistema de bolas. Si en vez de bolas se trata de atomos, las diferenciasenergeticas entre un tipo y otro de apilamiento pueden ser muy pequena y por eso es que seproducen estructuras aperiodicas o con periodos muy largos, llamados politipos.

3.2. ESCALERAS DEL DIABLO 53

Figura 3.7: Apilamiento de los planos sucesivos en un cristal con estructura cubica compacta.La normal al plano es la direccion (111) de la estructura fcc.

54 CAPITULO 3. CAOS EN ECUACIONES DIFERENCIALES ORDINARIAS

Capıtulo 4

Elementos de optica no lineal

4.1. Introduccion

Para todos los casos de luz producida por fuentes naturales, los campos electromagneticosasociados son mucho mas debiles que los campos internos de los atomos y moleculas queforman los gases, o que los campos interatomicos en los solidos. Como consecuencia de esto,

Las propiedades opticas (indices de refraccion, coeficientes de absorcion, constante die-lectrica) son independientes de la intensidad de la luz.

Se cumple el principio de superposicion.

La frecuencia de la luz no se altera al pasar por un medio.

Dos haces de luz no interactuan.

Esta situacion cambio en 1960, a partir de la invencion del laser. Un haz de luz laser intensoaltera las propiedades del medio y con eso afecta la proagacion de otros haces de luz. Eltermino no lineal se refiere a las propiedades del medio optico.

Consideremos, mediante un modelo simple, el efecto de un campo electrico sobre un atomo.Consideraremos el nucleo representado por una masa y carga positiva, y la nube electronicarepresentada por un cascaron unido or un resorte al nucleo1

Ek

Figura 4.1: Modelo de cascaron para la interaccion de un atomo con una onda electromagneti-ca.

1Esto recuerda al potencial shell model usado en simulaciones.

55

56 CAPITULO 4. ELEMENTOS DE OPTICA NO LINEAL

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0 1 2 3 4 5 6 7 8

Ere

st(x

)

x/r0

Emax f(x)

Figura 4.2: Campo restitutivo.

En el modelo de Lorentz cada atomo tiene un electron debilmente ligado al nucleo poruna fuerza de tipo elastico F = −kx. Ante un campo electrico E se establece el eqilibrio si

eE − kx = 0 =⇒ x =eE

k(4.1)

Como el dipolo electrico de cada atomo es µ = ex = e2E/k, entonces la susceptibilidaddielectrica es

χ =N

V

µ

E=N

V

e2

k, (4.2)

donde N/V es el numero de atomos por unidad de volumen.La constante k se puede estimar usando el modelo cuantico del atomo de hidrogeno. La

densidad de la nuve electronica es

ρ(r) = Ae−r/r0 , e =

∫ ∞

0

ρ(r) 4πr2dr,−→ A =e

8πr30

. (4.3)

Si el nucleo se desplaza x respecto al centro de la distribucion de carga, la fuerza derestitucion es

Frest = eEint = −e∫ x

0ρ(r) 4πr2dr

x2= −kx, (4.4)

donde el campo interno Eint es el campo restitutivo actuando sobre el nucleo atomico quecontrarresta al campo electrico aplicado externamente. Para una distribucion de carga consimetrıa esferica Eint es ocasionado por la carga encerrada en la esfera de radio x, dada porla integral de la formula anterior, siendo 0 la contribucion de la carga situada fuera de estaesfera.

Realizando la integracion se obtiene

Eint(x) = − e

x2

[1− e−x/r0 −

(x

r0

)e−x/r0 − 1

2

(x

r0

)2

e−x/r0

](4.5)

4.1. INTRODUCCION 57

Se puede ver en la figura que el campo restitutivo es lineal para pequenos desplazamientos,que es el ambito de la optica lineal. Por otra parte, ante u campo electrico externo E > Emax

el atomo se ioniza. Este campo maximo es del orden de e/r0. Evaluelo para un atomo deH y comparelo con los campos que se miden en el laboratorio.

La condicion de equilibrio ante un campo externo E, para x/r0 ¿ 1 es

−Eext = Eint = − ex

6r30

+ex2

8r40

. (4.6)

Para campo electrico E = Eext pequeno se puede obtener x mediante un metodo iterativo

xn+1 =

(6r3

0

e

)E +

6

8r0x2

n, x0 = 0. (4.7)

Iterando dos veces la relacion anterior se obtiene x correcto hasta segundo orden en potenciasde E.

x =

(6r3

0

8

)E +

(27r5

0

e2

)E2. (4.8)

Ejercicio: La ecuacion (4.6) tiene dos soluciones de x. Demuestre que la solucion obtenidaaplicando (4.7) es la solucion fısicamente correcta. El momento dipolar es

µ = ex =6p0

E0

E +27p0

E20

E2 + ..., p0 = er0, E0 = e/r20. (4.9)

La relacion anterior se escribe en forma general, para un medio con N/V atomos por volumen

P =Nµ

V= χ(1)E + χ(2)E2 + .... (4.10)

Incluso en la luz laser se cumple que E ¿ E0, de modo que χ(2) ¿ χ(1).En cristales las propiedades no son isotropas y deben ser expresadas por medio de tensores.

Expandiendo hasta tercer orden se escribe

Pi = χ(1)ij Ej + χ

(2)ijkEjEk + χ

(3)ijklEjEkEl. (4.11)

Muchos cristales, ası como los medios isotropos, tienen simetrıa de inversion y para ellosel tensor χ

(2)ijk es nulo.2

Puzzle: En el modelo de cascaron considerado arriba es los atomos son simetricos anteoperaciones de inversion. Sin embargo, en la ecuacion (4.9) esta presente el termino de segundoorden. Explique por que ocurre eso. ¿Es un error del modelo?

Veamos las implicaciones de la respuesta no lineal. Para eso consideremos las ecuacionesde Maxwell en un medio no lineal sin cargas libres y sin anisotropıa.

∇ · ~D = 0, ∇ · ~B = 0, (4.12)

∇× ~E = −1

c

∂ ~B

∂t, ∇× ~H =

1

c

∂ ~D

∂t(4.13)

2Recuerdese que un tensor cartesiano Aijk se transforma ante propiedades de simetria como el producto decoordenadas xixjxk. La inversion cambia xixjxk por (−xi)(−xj)(−xk) = −xixjxk y si es una transformacionde simetrıa, entonces Aijk = −Aijk.

58 CAPITULO 4. ELEMENTOS DE OPTICA NO LINEAL

junto con las relaciones constitutivas del medio

~B = ~H, Di = ε( ~E)ijEj = ε(E)Dj. (4.14)

Combinando las ecuaciones de Maxwell se obtiene

∇×∇× ~E +1

c

∂2 ~E

∂t2= −4π

c2∂2 ~P

∂t2(4.15)

Usando la identidad ∇×∇× ~E = ∇(∇ · ~E)−∇2 ~E y la primera ecuacion de Maxwell

0 = ∇ · ~D = ∇ · ( ~εE) = ε∇ · ~E + ~E · (∇ε) (4.16)

obtenemos que

∇ · ~E = −1

ε~E · ∇(ln ε) ' 0. (4.17)

El caso tıpico es que ln ε varıa lentamente, y por eso se puede despreciar la divergencia delvector de intensidad de campo electrico. Separando el vector de polarizacion en sus parteslineal y no lineal ~P = ~PL + ~PNL, y utilizando ~E + 4π ~PL = εL ~E, podemos llevar la ecuacion(4.15) a la forma

∇2 ~E − n2

c2∂2 ~E

∂t2= −4π

c2∂2 ~PNL

∂t2, (4.18)

donde n =√εL es el ındice de refraccion de la luz. La ec. (4.18) se puede resolver por un

metodo iterativo, siempre que los efectos no lineales sean correcciones a la solucion lineal. Sepuede reescribir (4.18) de forma abstracta, como

L( ~E) = S( ~E), (4.19)

L = ∇2 − n2

c2∂2

∂t2, (4.20)

S( ~E) = −4π

c2∂2 ~PNL

∂t2(4.21)

y se resuelven a partir de una semilla ~E0 (que puede ser la solucion de la ecuacion lineal) ysiguiendo un proceso iterativo ilustrado en la ecuacion (4.22)

~E0 −→ S( ~E0) −→L( ~E1) = S( ~E0)

−→ ~E1 −→ S( ~E1) −→

L( ~E2) = S( ~E1)

−→ ...

(4.22)

4.2. Fenomenos de segundo orden en medios cuadrati-

cos

Consideremos el caso de una onda monocromatica de frequencia ω que incide en un mediocuya susceptibilidad de segundo orden χ(2) es no nula. Considerando el medio isotropo parasimplicar, podemos orientar el eje de coordenadas a lo largo del vector ~E, de modo quetrabajaremos solo con ecuaciones escalares

E0 = E(ω)eiωt + E(ω)∗e−iωt. (4.23)

4.2. FENOMENOS DE SEGUNDO ORDEN EN MEDIOS CUADRATICOS 59

PNL = χ(2)(E(ω)eiωt + E(ω)∗e−iωt

)2(4.24)

= PNL(0) + PNL(2ω)ei2ωt + c.c., (4.25)

Donde c.c. significa complejo conjugado y

PNL(0) = 2χ(2)|E(ω)|2, (4.26)

PNL(2ω) = χ(2)E(ω)2. (4.27)

El termino PNL(0) es un campo estatico generado por un efecto no lineal. El termino PNL(2ω)es el responsable del efecto llamado generacion del segundo armonico. La generacion delsegundo armonico se utiliza en la generacion de luz laser. Por ejemplo, el laser de rubı tieneuna longitud de onda de 696 nm (infrarrojo). Al atravesar un cristal de un material denminadoKDP, se genera luz de 347 nm, ademas de luz de 696 nm.

4.2.1. Efecto electrooptico

Consideremos un medio sometido a una onda luminosa linealmente polarizada y a uncampo electrico constante paralelo al campo de la onda luminosa.

Einc = E(0) + E(ω)eiωt + c.c., (4.28)

PNL = χ(2)E2inc. (4.29)

Efectuando la operacion de elevar al cuadrado obtenemos

PNL = PNL(0) + PNL(ω)eiωt + PNL(2ω)ei2ωt + c.c., (4.30)

PNL(0) = χ(2)(E(0)2 + 2|E(ω)2|) , (4.31)

PNL(ω) = 2χ(2)E(0)E(ω), (4.32)

PNL(2ω) = χ(2)E(ω)2. (4.33)

La polarizacion lineal se ve afectada por PNL(ω)

P (ω) = P (1)(ω) + PNL(ω) =[χ(1) + 2χ(2)E(0)

]E(ω). (4.34)

La ecuacion anterior significa que el indice de refraccion se afecta por la presencia del campoelectrico constante

n2 = 1 + 4πχeff = 1 + 4πχ(1) + 4π(2χ(2)E(0)) = (n+ ∆n)2. (4.35)

Usando el hecho de que los efectos no lineales son pequenos (∆n¿ n) tenemos que

∆n2 ' 2n∆n = 8πχ(2)E(0), (4.36)

luego

∆n =4πχ(2)

nE(0) (4.37)

60 CAPITULO 4. ELEMENTOS DE OPTICA NO LINEAL

4.2.2. Mezcla de dos ondas

Consideremos dos ondas monocromaticas incidentes

E = E(ω1)eiω1t + E(ω2)e

iω2t + c.c. (4.38)

Entonces

PNL = χ(2)[E(ω1)

2ei2ω1t + E(ω2)2ei2ω2t + 2E(ω1)E(ω2)e

i(ω1+ω2)t

+2E(ω1)E(ω2)∗ei(ω1−ω2)t + c.c.

](4.39)

De aqui se deducen las polarizaciones no lineales

PNL(2ω1) = χ(2)E(ω1)2 (4.40)

PNL(2ω2) = χ(2)E(ω2)2 (4.41)

PNL(ω1 + ω2) = 2χ(2)E(ω1)E(ω2) (4.42)

PNL(ω1 − ω2) = 2χ(2)E(ω1)E(ω2)∗ (4.43)

Para que estos efectos sean observables es requisito que se cumpla la condicion de phasematching . Consideremos la mezcla de dos ondas planas

E(ω1) = A1e−i~k1·~r (4.44)

E(ω2) = A2e−i~k2·~r (4.45)

EntoncesPNL(ω1 + ω2) = 2χ(2)A1A2e

−i(~k1+~k2)·~r. (4.46)

Las leyes de conservacion de la energia y del momentum imponen que

ω3 = ω1 + ω2 (4.47)

~k3 = ~k1 + ~k2. (4.48)

La ley de dispersion da una relacion entre los vectores de onda y las frecuencias

ki =niωi

c. (4.49)

4.2.3. Phase matching en problemas unidimensionales

Las leyes de conservacion toman la forma

ω3 = ω1 + ω2 (4.50)

n3ω3 = n1ω1 + n2ω2 (4.51)

De las ecuaciones anteriores se obtiene

(n3 − n1)ω1 = (n2 − n3)ω2. (4.52)

En la mayor parte del espectro visible en medios transparentes se cumple que dn/dω > 0.Esto implica que si ω1 < ω2 < ω3 entonces n1 < n2 < n3 y la ecuacion (4.52) no tienesolucion. La solucion es posible, y ello determina la observabilidad del efecto de suma de dosondas, en regiones espectrales de dispersion anomala (dn/dω < 0), las que existen cerca delas bandas de absorcion.

4.3. FENOMENOS DE TERCER ORDEN EN MEDIOS CUBICOS 61

Up converter Amplificador

ωω

ω 1

1

3

ωω

ω 3

1

2

Figura 4.3: Dispositivos que utilizan phase matching.

4.2.4. Aplicaciones

En el seno del material optico estan presentes las tres frecuencias ω1, ω2 y ω3, de modo queson posibles todas las combinaciones entre estas. En la Figura 4.3 se ilustran dos aplicaciones.

4.3. Fenomenos de tercer orden en medios cubicos

En medios con simetria de inversion se cumple que χ(2) = 0, por lo cual se hace necesarioconsiderar los procesos de orden 3, los cuales estan regidos por la relacion

P(3)NL = χ(3)E3. (4.53)

4.3.1. Efecto electrooptico

Si tenemos un campo constante intenso y una onda monocromatica, dado por (4.38), conE(0) À E(ω) obtenemos

P(3)NL(ω) = χ(3)

(3E(0)2 + 3|E(ω)|2)E(ω) ' 3E(0)2χ(3)E(ω). (4.54)

El resultado anterior significa una modificacion al indice de refraccion lineal, dada por

∆n =6πχ(3)E(0)2

n(4.55)

4.3.2. Tercer armonico y efecto Kerr optico

Si no hay campo electrico constante, solamente la onda incidente de frecuencia ω, entoncesse obtiene

P(3)NL(3ω) = χ(3)E(ω)3 Generacion del tercer armonico. (4.56)

P(3)NL(ω) = 3χ(3)|E|2E(ω) Efecto Kerr. (4.57)

El resultado anterior implica un cambio del ındice de refraccion

∆n =6πχ(3)|E(ω)|2

n= n2I (I ∝ |E(ω)|2). (4.58)

Veamos como influye el efecto Kerr en una onda plana. La fase acumulada durante unrecorrido L es

ϕ(L) =2π

λ(n+ n2I)L. (4.59)

62 CAPITULO 4. ELEMENTOS DE OPTICA NO LINEAL

χ(3)

∆ϕ

Figura 4.4: Esquema de dispositivo controlado por el efecto Kerr.

Esto implica que el cambio de fase asociado a la intensidad de la luz es

∆ϕ(L) =2π

λn2IL. (4.60)

Esto permite realizar dispositivos de interferencia que regulen la intensidad de la luz emitidamediante un cambio de fase, que es a su vez dictado por la intensidad de la luz incidente.Esto se ilustra en la figura 4.4.

En la Figura 4.4, el dispositivo sealizado por χ(3), puede ser una fibra optica con lossiguientes parametros

L = 1 m, A = 10−2 mm2, n2 = 10−10 cm2/W, λ = 1µmm. (4.61)

Segun la ecuacion (4.60), la potencia requerida P = IA para provocar una interferenciadestructiva ∆ϕ = π es P = 1,5W .

4.3.3. Autoenfoque

Otra aplicacion importante es el autoenfoque, ilustrada en la Figura 4.5. Un haz de luzse describe generalmente por un perfil de intensidad gausiano. Al atravesar un medio cuyoindice de refraccion esta dado por N = n0 + n2I, los frentes de onda se encorvan, de modoque el producto n2IL sea constante en el frente de onda (vease (4.60)) y al salir del mediolos rayos convergen en un punto focal.

Demostremos esto analıticamente. Considerese la Figura 4.6 y el angulo θ(y) formado porun rayo con el eje Z. Considerendo la refraccion en una lamina paralela a Z de ancho dy, laley de Snell se lee

n(y) cos θ(y) = n(y + dy) cos θ(y + dy). (4.62)

esto lleva a la ecuacion diferencial

dn

dy= n tan θ

dy. (4.63)

4.3. FENOMENOS DE TERCER ORDEN EN MEDIOS CUBICOS 63

n=n

+ n

I0

2I

Figura 4.5: Efecto de autoenfoque de un haz de luz de perfil gausiano.

(y)θ

y+dy

y

θ (y+dy)

y

z

n(y)

Figura 4.6: Refraccion de un haz de luz en un medio de indice de refraccon variable.

Ahora bien, tan θ = dy/dz, siendo y(z) la trayectoria del rayo de luz. Usaremos la apro-ximacion paraxial, o sea, que consideramos rayos casi paralelos al eje focal (θ ∼ 0). Eneste caso tan θ ' θ y la ecuacion diferencial toma la forma

1

n

dn

dy=d2y

dz2(4.64)

El haz de luz tiene el perfil I = I0 exp(−αy2). Si consideramos la region cercana al eje focal,podemos aproximarla por I = I0(1− αy2). El indice de refraccion queda igual a

n = n0 + n2I = n0

(1− β2y2

2

), β =

n2

n0

αI0. (4.65)

Introduciendo la formula anterior en la ecuacion en (4.64) se obtiene

y′′ + β2y = 0 (4.66)

Y por tanto la solucion es

y(z) = y0 cos(βz) +θ0

βsin(βz) (4.67)

64 CAPITULO 4. ELEMENTOS DE OPTICA NO LINEAL

En una fibra optica la longitud L es mucho mayor que y(z), de modo que los rayos deluz siguen una trayectoria sinusoidal. y0 es la altura a la que penetra el rayo, y θ0 es el anguloque forma al penetrar.

En una lente delgada ocurre lo contrario, el grosor de la lente es L¿ y(z).

y(L) ' y0 (4.68)

tan θ(L) =θ(L)

dz= βy0 sin βL ' y0β

2L (4.69)

Despues de salir de la lente, el rayo de luz viaja en linea recta. Sea f el punto en que y(f) = 0

f =y0

tan θ(L)=

1

β2d=

n0

n2αLI0. (4.70)

f es independiente de la altura y0 con que inciden los rayos paralelos, lo que implica que fes una distancia focal.

4.4. Solitones opticos

El soliton es un paquete de ondas solitario que se propaga sin sufrir dispersion. En estaseccion veremos la respuesta optica no lineal permite la existencia de solitones opticos.

Consideremos un medio con no linealidad cubica, tal que el indice de refraccion dependede la intensidad

n(I) = n0 + n2I. (4.71)

Demostremos que este medio admite la propagacion de una onda electromagnetica del tipo

E(z, t) = A(z, t)ei(k0z−ωt) + C.C.. (4.72)

La intensidad de esta onda es

I(t) =n0c

4πE2 =

n0c

2π¯A(z, t)2, (4.73)

donde el promedio temporal ∗ se entiende promediado en el periodo 2π/ω0, mucho menorque el tiempo en que A(z, t varıa apreciablemente.

El campo E satisface la ecuacion

∂2E

∂z2− 1

c2∂2D

∂t2= 0 (4.74)

Como en el dominio de frecuencias se cumple la relacion D(ω) = ε(ω)E(ω), es convenientehacer la transformada de Fourier de la ec. (4.74).

∂2E(z, ω)

∂z2+ ε(ω)

ω2

c2E(z, ω) = 0 (4.75)

4.4. SOLITONES OPTICOS 65

Segun su definicion

E(z, ω) =1√2π

∫ ∞

−∞E(z, t)eiωt

=1√2π

∫ ∞

−∞

[A(z, t)ei(k0z−ω0t) + C.C.

]eiωtdt

=1√2π

∫ ∞

−∞A(z, t)ei(k0z+(ω−ω0)t)dt+

1√2π

∫ ∞

−∞A(z, t)∗e−i(k0z−(ω+ω0)t)dt

= A(z, ω − ω0)eik0z + A(z, ω + ω0)

∗e−ik0z. (4.76)

Aproximacion de la onda rotatoria

E(z, ω) ' A(z, ω − ω0)eik0z. (4.77)

∂2E(z, ω)

∂z2=

[∂2A

∂z2+ 2ik0

∂A

∂z− k2

0A

]eik0z. (4.78)

Con la aproximacion de envolvente lentamente variable

∣∣∣∣∂2A

∂z2

∣∣∣∣ ¿ k0∂A

∂z(4.79)

obtenemos la ecuacion

2ik0∂A

∂z+ (k2 − k2

0)A = 0, (4.80)

dondek = k(ω) =

ω

c

√ε =

ω

cn(ω,A) =

ω

c(n0 + n2I) (4.81)

Como A varıa suavemente con z entonces solo interesan los valores k ' k0, entonces k2−k20 =

(k + k0)(k − k0) ' 2k0(k − l0).

k(ω) ' k0 + ∆kNL + k1(ω − ωι0) +1

2k2(ω − ω0)

2, (4.82)

con

k1 =

(dk

)

k0

=1

vg

, k2 =

(d2k

dω2

)

k0

. (4.83)

k1 =d

ω

cn(ω,A) =

n

c+ω

c

dn

dω(4.84)

Reemplazando el la ec. (4.80) se obtiene

i∂A

∂z+

[∆kNL + k1(ω − ω0) +

1

2k2(ω − ω0)

2

]A = 0. (4.85)

Transformando Fourier al dominio temporal obtenemos

i∂A

∂z+ ∆kNLA+ ik1

∂A

∂t− 1

2k2∂2A

∂t2= 0. (4.86)

66 CAPITULO 4. ELEMENTOS DE OPTICA NO LINEAL

Hagamos el cambio de variables

τ = t− z

vg

, A(z, t) = AS(z, τ). (4.87)

Con en funcion de las nuevas variables tenemos que

∂A

∂z=

∂AS

∂z− k1

∂As

∂τ, (4.88)

∂A

∂t=

∂AS

∂τ. (4.89)

Explicitamente ∆kNL se expresa

∆kNL =ω0

cn2I =

ω0n2

c

n0c

2π|AS|2 ≡ γ|AS|2. (4.90)

COn esto la ecuacion (4.86) toma la forma

i∂AS

∂z=

1

2k2∂2A

∂t2− γ|AS|2. (4.91)

La ec. (4.91) es conocida como Ecuacion de Schrodinger no lineal. Comparando con laecuacion de Schrodinger de la mecanica cuantica vemos que tiene intercambiados los roles dela coordenada y el tiempo. El termino V (τ) = −γ|AS|2 juega el rol de un pozo de potencialautoconsistente. Para esta ecuacion podemos esperar soluciones del tipo “estado estacionario”y confinadas en el pozo de potencial V (τ). En efecto puede verificarse que una solucion es

AS(z, τ) = A0Se

ikzsech(τ/τ0), k = −γ2|A0

S|2, |A0S|2 = − 2πk2

n0n2ω0τ 20

. (4.92)

En funcion de las variables iniciales tenemos

A(z, t) = A0Se

ikzsech

(z − vgt

vgτ0

). (4.93)

τ0 es un parametro que determina el ancho del soliton vgτ0.

Capıtulo 5

Elementos de biofısica

5.1. Biomecanica

En esta seccion aplicaremos las leyes de la mecanica para estimar las fuerzas que actuuansobre algunos musculos y huesos del cuerpo humando.

5.1.1. Fuerzas que actuan sobre el femur y la cadera

La cadera esta formado por un conjunto de huesos que en la infancia estan unidos porcartılagos y en la adultez quedan soldados. La Fig. 5.1 ilustra este caso. La cadera se puededividir en tres partes: el ilio, el isquion (este es el hueso que se apoya en posicion sentada) yel pubis. Las partes derecha e izquierda se unen por detras con el sacro y el coxis, que sonlas partes inferiores de la columna vertebral, mientras que por delante se unen en el pubis.El conjunto completo se denomina pelvis.

Pubic crestIschialspine

Iliaccrest

Figura 5.1: Vista frontal y lateral de los huesos de la cadera.

Prestaremos especial atencion al acetabulo, que es la cavidad en que se ajusta la cabezadel femur (hueso del trutro :-) ) y cuya forma redondeada permite el movimiento articuladode la pierna (Vease la Fig. 5.2).

67

68 CAPITULO 5. ELEMENTOS DE BIOFISICA

Figura 5.2: Vistas frontal (izq) y trasera (cen) del femur. Estructura de la cabeza del femur(der).

Cubriendo la cabeza del femur se encuentra la epifisis, que es solo la parte superficialdel hueso. En casos patologicos (epifisiolisis) la epifisis se puede desprender parcialmente delfemur si esta sujeta a esfuerzos de corte (o cizalla). El femur tiene varias protuberanciasque sirven de puntos de insercion a los musculos, de las cuales en la Fig. 5.2 se destaca eltrocanter mayor. En el trocanter mayor se insertan los tendones que de cinco musculos quecolaboran en el movimiento de abduccion.1 Los musculos abductores mas importantes son elgluteo medio y el gluteo minimo. Los extremos opuestos se pegan en varias partes del ilio.Hay otros musculos presentes en esta zona, cuya funcion es rotar la pelvis y no desempenanningun rol en la abduccion. El tercer musculo importante es el llamado tensor de la fascialata, que se une al femur ligeramente bajo el trocanter mayor y por el otro extremo se une ala fascia lata y el tracto iliotibial, cerca de la rodilla.

La importancia relativa de estos musculos y su linea de accion efectiva ha sido estudiadamediante radiografıas.2 Se ha establecido que la lınea de accion de de los musculos abductorespasa por el trocanter mayor y forma un angulo de 70 respecto a la horizontal (vea Fig. 5.3).

5.1.2. Fuerzas en equlibrio sobre un pie

Con los datos anteriores se pueden calcular las fuerzas realizadas sobre el trocanter mayory sobre la cabeza del femur. Consideremos el caso de una persona en equilibrio sobre unsolo pie. El esquema de fuerzas se ilustra en la Fig. 5.3. N es la fuerza de reaccion del sueloy es igual al peso del cuerpo W . F1 es la fuerza neta de los musculos abductores, R es lafuerza de reaccion que ejerce el acetabulo sobre la cabeza del femur, y WL es el peso de la

1La abduccion es el movimiento de abrir los muslos lateralmente, y algunos creen que los extraterrestresle hacen eso a los humanos que llevan a sus naves. La aduccion es el movimiento contrario, o sea, cerrar losmuslos.

2Vease G. B. Benedek, Physics with illustrative examples from medicine and biology (New York : Springer-Verlag, 2000), Capitulo 3, y referencias citadas ahı.

5.1. BIOMECANICA 69

Figura 5.3: Esquema de las fuerzas que actuan sobre la pierna cuando el apoyo es sobre unsolo pie.

propia pierna, actuando sobre el centro de masa, y que se estima WL ' 17W . Apliquemos las

condiciones de equilibrio estatico a la pierna

F1 sin 70 −Ry − 1

7W +W = 0, (5.1)

F1 cos 70 −Rx = 0, (5.2)

(F1 sin 70)(2,75) + (1

7W )(1,25)−W (4,25) = 0 (torque respecto al acetabulo). (5.3)

Resolviendo el sistema de ecuaciones se obtiene

F1 = 1,58W, (5.4)

Rx = 0,54W,Ry = 2,34W,R =√R2

x +R2y = 2,4W,φ = 13. (5.5)

Ası encontramos que sobre la cabeza del femur, en el instante en que se esta en equilibriosobre un solo pie, actua una fuerza igual a 2.4 veces el peso del cuerpo.

El resultado anterior tiene implicaciones clinicas y anatomicas. La Fig. 5.4 muestra unaimagen de rayos X y un esquema de la microestructura del cuello femoral. La estructura oseaforma una red esponjosa (trabecula) cuya direccion de crecimiento coincide con la lınea deaccion de la fuerza R. Cuando la pelvis rota hacia arriba y hacia abajo en el plano vertical,resulta que R se mantiene dirigida a lo largo de la trabecula. De este modo la evolucion seha dirigido a evitar grandes esfuerzos de cizalla sobre el cuello del femur y sobre la epifisis.

70 CAPITULO 5. ELEMENTOS DE BIOFISICA

Figura 5.4: Estructura osea del femur e imagen de rayos X.

En el caso de haber lesiones en los musculos abductores ocurren cambios interesantes.Es claro que si se reduce la fuerza F1 que pueden ejercer los musculos es necesario variar laposicion del cuerpo para mantener el equilbrio. El enfermo corrige esto instintivamente (paraevitar dolor y para mantener el equilibrio) moviendo su centro de gravedad hacia el lado delmusculo afectado de modo que se reduzca el torque de la normal N . Esto es lo que se llamamarcha antalgica, o sea, una marcha encorvada para evitar el dolor. Si el encorvamiento estal que la linea de accion del peso y la normal pasan por la cabeza del femur y a lo largo dela pierna, entonces el brazo de las fuerzas N y WL se hace 0 y las ecuaciones de equilibriose satisfacen con F1=0. El precio que se paga es que apareen esfuerzos de corte en el cuellofemoral y el consecuente riesgo de fractura. Si la afeccion en los musculos abductores ocurreen etapas tempranas de la vida y se prolonga, entonces el crecimiento del cuello del femur seorienta hacia arriba en respuesta a la fuerza vertical R. Esto se denomina coxa valga. Comoresultado, un femur se hace mas largo que el otro, la pelvis queda en posicion inclinada, y seproducen deformaciones en la columna vertebral.

5.1.3. Efecto de un baston

Como hemos visto, la fuerza ejercida por los musculos abductores para mantener el equi-librio depende notablemente del torque ejercido por la fuerza de reaccion del suelo sobre elpie. Si se reduce el brazo de esta fuerza, se reduce la fuerza F1. Consideremos un hombre quetiene afectado los musculos abductores del lado derecho. Durante la caminata, al levantar elpie izquierdo se da el caso calculado en la seccion previa, y si hay afectaciones en los musculosabductores derechos, necesitara inclinarse hacia la derecha para mantener su momentaneoequilibrio. Una alternativa es usar un baston en la mano izquierda (notese que es el ladoopuesto al musculo afectado), de modo que reduzca la magnitud y el brazo de la fuerza N .

La Fig. 5.5 muestra el esquema de fuerzas para el hombre como un todo y para la pierna

5.1. BIOMECANICA 71

Figura 5.5: Esquema de las fuerzas que actuan sobre la pierna cuando el apoyo es un solo piey un baston.

afectada. Llamamos C a la fuerza trasmitida al cuerpo por el baston. Un hombre que pese200 libras puede ejercer cerca de 30 lb sobre el baston sin resultar un esfuerzo excesivo, locual representa C ' 1

6W . Las otras fuerzas externas son el peso W y la reaccion del suelo

N . Ademas, podemos estimar en 12 pulgadas la distancia horizontal del baston a la columnavertebral. (Fig. 5.5 central). En estas condiciones podemos calcular la posicion del pie y lafuerza N necesaria para mantener el equilibrio. Llamemos l a la distancia horizontal del puntode apoyo respecto a la linea media del cuerpo. Las condiciones de equilibrio para el cuerpocompleto son

N +W

6−W = 0 (fuerza neta), (5.6)

Nl − W

6(12′′) = 0 (torque respecto al centro de masa). (5.7)

Las soluciones son

N =5

6W, l = 2,4′′. (5.8)

Con estos datos podemos resolver las ecuaciones de equilibrio para la pierna (Fig. 5.5derecha), con lo cual se obtiene

F1 = 0,60W, R = 1,26W, φ = 9. (5.9)

El baston ha permitido reducir la fuerza sobre la cabeza femoral de R = 2,34W a R = 1,26W(En un hombre de 200 lb esto es pasar de 468 lb a 252 lb) gracias al modico esfuerzo de 30

72 CAPITULO 5. ELEMENTOS DE BIOFISICA

lb en el brazo opuesto. Este beneficio desempena un rol importante en la rehabilitacion depacientes que han sufrido cirugıa de la cadera o fractura de femur.

5.1.4. Fuerzas que actuan sobre las vertebras lumbares

La Fig. 5.6 muestra un diagrama de la columna vertebral, donde el frente esta haciala derecha y la espalda hacia la izquierda. La parte inferior es el coxis, seguida del sacro.Encima se encuentran cinco vertebras lumbares, numeradas desde arriba hacia abajo (la mascercana al sacro es la quinta, la mas lejana es la primera). Las cinco vertebras forman unacurva llamada lordosis lumbar. Encima se hallan doce vertebras toraxicas, dispuestas con unacurvatura inversa denominada cifosis. Encima se encuentran las siete vertebras cervicales. Elsacro esta soldado rigidamente a la pelvis en las personas adultas, y su geometria se describepor el angulo lumbosacral (ver Fig). Este angulo determina la magnitud de la lordosis lumbar.La pelvis puede girarse hacia adelante si los musculos abdominales estan debilitados, lo cualincrementa la lordosis. El angulo lumbosacral normal es cercano a 30.

Figura 5.6: Izquierda: esquema de la columna vertebral humana. Derecha: vista lateral de lade la cadera y la parte inferior de la columna vertebral.

Examinemos una vertebra. La Fig.5.7 en su parte izquierdaa muestra dos vertebras vistasdesde el lado. La parte anterior es la que soporta el peso del cuerpo. Para esto se ayuda deunos discos que estan entre cada dos vertebras consecutivas. Este disco es un sistema fluidoautocontenido (nucleo pulposo) que absorbe choques y trasmite la presion uniformemente,permite deformacion del espacio intervertebral y por tanto permite el movimiento. Las par-tes superior e inferior del disco intertertebral son cartilagos y estan unidos al hueso de lasvertebras. La pared lateral, llamada anillo fibroso, se compone de una docena de capas defibras de colageno. El interior del disco es un gel viscoelastico, 80 % agua. Durante la segundadecada de vida los discos intervertebrales tienen suministro de sangre, y luego se alimentan

5.1. BIOMECANICA 73

Figura 5.7: Esquema de una vertebra.

por difusion de linfa. La elasticidad es proporcionada en buena medida por el anillo fibroso, lacual degenera con la edad o por lesiones producidas por sobrecargas. La hernia discal consisteen la hernia del anillo fibroso y la extrusion del gel, presionando sobre los nervios vecinos ola medula espinal y produciendo dolor. El estrechamiento del espacio intervertebral terminaprovocando dano en las vertebras por contacto entre ellas. La Fig. 5.8 muestra la curva deelasticidad de los discos intervertebrales lumbares. Con una carga mayor de 1500 kg, el discose rompe. Para las vertebras superiores la carga maxima disminuye, siendo de 320 kg paralas vertebras cervicales. El area de los discos intervertebrales decrece, de modo que la presionmaxima es casi constante, cercana a 1.1 kg/mm2. En la parte derecha de la Fig.5.7 se veuna vertebra desde arriba. Las protuberancias (denominadas procesos), actuan como puntos

Figura 5.8: Carga soportada por una disco lumbar vertebral en funcion de la deformacion,para personas de 40 a 59 anos.

74 CAPITULO 5. ELEMENTOS DE BIOFISICA

Figura 5.9: Lo que ocurre cuando hay degeneracion del disco intervertebral.

de insercion para los musculos. El desplazamiento horizontal de las vertebras es limitadopor la estructura osea, los ligamentos y los musculos. Observese el ligamento longitudinalposterior, en la vista superior. Este ligamento impide impide la extrusion del fluido del discointervertebral hacia la cavidad, que es por donde pasa la medula espinal y por donde salenlos nervios. Resulta que este ligamento es mas delgado en las vertebras lumbares, en especialen la quinta, precisamente donde mas necesario es. Esto es obviamente un punto debil de laanatomia humana, un rezago de la cuadrupedia que la evolucion no ha alcanzado a corregiren el millon de anos de posicion erecta. La Figura 5.9b muestra lo que ocurre cuando haydegeneracion lumbar. El disco intervertebral presiona la raiz del nervio y produce dolor. Espor eso que las lesiones ocasionadas por esfuerzos al cargar pesos se producen generalmenteen la region lumbar.

Examinemos las fuerzas que actuan entre las vertebras cuando el cuerpo se alza un peso.En la Fig. 5.10 se muestra el diagrama de fuerzas que actuan sobre la columna al levantar eltronco. W1 = 0,4W es el peso del torax, W2 es el peso de los brazos, cabeza y carga sujetaen las manos. En ausencia de carga puede W2 = 0,2W . R es la fuerza de reaccion ejercidapor el sacro sobre el disco lumbo-sacral. La fuerza Fe es la resultante de la tension ejercidapor los musculos sacroespinal y erector espinal, que se insertan en el ilio y bajo sacro porun extremo y en cuatro de las vertebras toraxicas por arriba. Estos son, obviamente, losque hacen el trabajo de elevacion. La geometria de todos esos musculos ha sido estudiadamediante radiografias y puede ser reemplazado por la fuerza Fe, en el punto de insercionindicado y formando un angulo de 12 con la columna. Considerando un angulo θ = 30 yaplicando las ecuaciones del equilibrio estatico se obtiene

Fe = 2,5W, R = 2,74W, φR = 35. (5.10)

Como se ve, son fuerzas considerables. Para un hombre de 200 lb, la fuerza de compresion esR = 540 lb, equivalente a una carga de 250 kg. La Fig. 5.8 informa que esto corresponde auna compresion del 20% del espacio intervertebral. Considerando constante el volumen, estoimplica un aumento del 10% en el radio del disco, que va a presionar en la medula espinal.

5.1. BIOMECANICA 75

Figura 5.10: Esquema de la accion de los musculos de la espalda.

Si con las manos se toma un peso de un quinto del peso corporal (40 lb), entonces W2 =0,2W + 0,2W , y se obtiene una fuerta de compresion igual a R = 4,07W (equivalente auna carga de 370 kg en el ejemplo visto). La fuerza efectuada por los musculos erectores esFe = 3,74W . Las consecuencias de esto son claras. Con esto se puede entender facilmenteporque las posiciones correcta e incorrecta de cargar un peso son las mostradas en la Fig.5.11.

Figura 5.11: Derecha: posicion correcta de cargar un peso. Izquierda: posicion incorrecta.

76 CAPITULO 5. ELEMENTOS DE BIOFISICA

5.2. Conduccion del impulso nervioso

5.2.1. Descripcion de las neuronas

En esta seccion examinaremos el fenomeno de conduccion del impulso nervioso y explica-remos un modelo electromagnetico de este.

Las neuronas son las celulas especializadas del sistema nervioso. Las neuronas tienenvarias protuberancias que sirven para recibir o transmitir las senales nerviosas: las dendritaspara recibir, y los axones para transmitir. El numero de dendritas y axones puede ser uno(neuronas bipolares) o mas de uno(neuronas multipolares). En esta seccion nos ocuparemosbasicamente de las propiedades del axon y la membrana que lo cubre.

Figura 5.12: Imagenes de neuronas.

Las dendritas son los terminales de entrada de las neuronas. En la dendrita puede haberun transductor que genere una senal ante un esfuerzo mecanico, quimico, temperaruta, etc.En este caso la neurona y su dendrita originan una senal nerviosa. Otra posibilidad es quela neurona actue como repetidor de una senal procedente del axon de otra neurona. Lajuntura entre el axon y la dendrita se denomina sinapsis. En ambos casos, cuando la senalde entrada sobrepasa un unmbral la neurona se dispara y hace viajar un impulso de potenciala lo largo del axon, llamado potencial de accion. El fluido conductor dentro del axon sellama axoplasma, y su conductividad se debe a la presencia de iones Na+, Ca+2, K+, Cl− yotros en menor cantidad.

Desde el punto de vista electromagnetico, el axon es un conductor constituido por unelectrolito contenido en una membrana aislante. El axon puede tener dimensiones de hastaun metro. En el ser humano, el axon va desde el cerebro hasta una sinapsis en el cordonespinal, o desde el cordon espinal hasta una mano o pie.

El nervio esta constituido por un grupo de axones entrelazados.Las membrana celular desempena un papel importante en la propagacion del potencial

de accion. La estructura de la membrana se ilustra en la Fig. 5.14. Esta constuida por dosmoleculas de lipido con orientacion opuesta. Cada molecula de lıpido se divide esquematica-mente en una cabeza polar y una cola hidrofobica. El ancho total de la membrana es de 7nm.

5.2. CONDUCCION DEL IMPULSO NERVIOSO 77

Figura 5.13: Imagenes de nervios. Arriba: Fibras amielınicas. Abajo: Fibras mielınicas. Laflecha indica un nodo de Ranvier.

Figura 5.14: Estructura de la membrana celular compuesta por una bicapa lipıdica.

Las fibras nerviosas (axones) pueden ser mielınicas o amielınicas. En las fibras mielınicasel axoplasma solo esta envuelto por la membrana. El radio del axon varia de 0.5 a 10 µm en elser humano, llegando hasta 500 µm en el axon gigante del calamar. En las fibras mielinicas,

78 CAPITULO 5. ELEMENTOS DE BIOFISICA

Figura 5.15: Estructura de la mielina.

las mielina forma se enrolla como cinta adhesiva alrededor del axon, llegando a tener ungrosor de 0.4 veces el el radio del axoplasma. La estructura de la mielina se representa enla Fig. 5.15. La mielina tiene un color blanco, y la llamada sustancia blanca del cerebro secompone de axones mielinicos. La sustancia gris esta formada por la parte central de lascelulas nerviosas.

En las fibras mielınicas, ocurren interrupciones de la mielina, llamadas nodos de Ranvier.La distancia entre nodos consecutivos es de 1 a 2 mm, siendo esta mucho mayor que el anchoda cada nodo.

Figura 5.16: Esquema de fibra mielınica.

5.2. CONDUCCION DEL IMPULSO NERVIOSO 79

5.2.2. Electromagnetismo del axon

El axoplasma (fluido interno) y el fluido exterior son medios conductores gracias a laconcentracion de iones presente en ellos. Por tanto, en ausencia de corrientes macroscopicas(estado de reposo, sin impulso nervioso) el potencial en cada fluido es espacialmente constante.

Figura 5.17: Esquema del potencial y campo electrico en la direccion del diametero del axon.

El potencial electrico en el interior del axon en su estado de reposo es aproximadamente70 mV menor que en el exterior. Durante la propagacion del impulso nervioso, el potencialexterior experimenta variaciones mucho menores que en el interior, por lo cual se puedeconsidar constante y por convencion, cero.3 La membrana celular es aislante en el estado dereposo, pero permite el paso de corriente al paso de un impulso nervioso. En el estado dereposo, la membrana se comporta como un condensador, y la diferencia de potencial implicaque existe una carga de polarizacion a en la membrana.

La capacidad de la membrana se puede estimar a partir de la formula de capacidad deun condensador plano

C =κε0S

b, (5.11)

donde b es el ancho de la membrana (6 o 7 nm sin mielina, 1-10 µm con mielina), S el area,y ε0 es la constante dielectrica del vacıo.

Para las fibras mielinadas el ancho de la membrana b es del orden de 0,4a, de modo quees mas adecuado usar la formula de un condensador cilindrico

C =2πκε0D

ln(1 + b/a), (5.12)

siendo D el largo y a el radio interior del cilindro. Esta formula tiende a (5.11) cuandob/a→ 0.

3Las variaciones del potencial exterior son despreciables para el fenomeno del impulso nervioso. Sin em-bargo, estas variaciones son detectables y permiten la electrocardiografia y la elctroencefalografia.

80 CAPITULO 5. ELEMENTOS DE BIOFISICA

Figura 5.18: Variacion del potencial electrico en un punto interior del axon al paso de unimpulso nervioso

Durante el paso de un impulso nervioso, el potencial interior experimenta la variacionmostrada en la figura Fig. 5.18. El proceso de subida del potencial de -70 mV hasta 40 mVse llama depolarizacion, mientras que la caıda y posterior restablecimiento del potencial dereposo, se llama repolarizacion.

Figura 5.19: Concentraciones de los iones en el interior y el exterior del axon.

La membrana actua como un tamiz selectivo de los iones, de manera que mantiene lasconcentraciones ionicas en el axoplasma diferentes a las del medio exterior. La Fig. 5.19muestra las concentraciones de los distintos iones a los dos lados de la membrana. Estadiferencia de concentraciones se logra mediante la accion selectiva de los poros que se abrenen la membrana, cuyos mecanismos de accion a nivel molecular estan siendo investigadosactualmente.

5.2. CONDUCCION DEL IMPULSO NERVIOSO 81

Figura 5.20: a) Esquema de la membrana que muestra las corrientes de escape producidaspor iones positivos y negativos. b) Idem mostrando la corriente neta. c) Circuito equivalentede una seccion de membrana

Podemos preguntarnos cuan lejos del equilibrio se encuentran las concentraciones de losiones a ambos lados de la membrana. De acuerdo a la distribucion distribucion de Boltzmann,las concentraciones interior ci y exterior co de una especie ionica de carga q, en equilibriotermodinamico a una temperatura T dependen del potencial electrico (vi, vo) segun

ci = Ae−qvi/kBT , co = Ae−qvo/kBT ,cico

= e−q(vi−v0)/kBT (5.13)

Considerando T = 310 K, vi − vo = −70 mV, para iones positivos monovalentes (Na+, K+)obtenemos ci/co = 13,7. Para iones negativos como el Cl−, ci/co = 1/13,7. Comparando estosnumeros con la Fig. 5.19 se observa que el potasio esta en exceso respecto a los que se espera enequilibrio termodinamico, mientras que el sodio esta en falta y el cloro esta aproximadamenteen equilibrio. En una celula muerta existen pequenas corrientes potasio hacia afuera y desodio hacia adentro. Estas corrientes en la celula viva se balancean por mecanismos en que seconsume energia metabolica, llamados genericamente bomba de sodio, bomba de potasio,

82 CAPITULO 5. ELEMENTOS DE BIOFISICA

Cuadro 5.1: Propiedades de un nervio amielınico tıpico. Typeset by MaxTeX.a Radio del axon 5× 10−6 mb Grueso de la membrana 6× 10−9 mρi Resistividad del axoplasma 0,5 Ωmri = ρi/πa

2 Resistividad por unidad de largo del axoplasma 6,4× 109 Ωm−1

κ Constante dielectrica 7a

ρm Resistividad de la membrana 1,6× 107 Ωm(κρ)m 112× 106 ΩmCm = κε0/b Capacitancia por unidad de area 10−2 Fm−2

2πκε0a/b Capacitancia por unidad de largo 3× 10−7 Fm−1

gm = 1/ρmb Conductancia por unidad de area 10 S m−2

1/gm Recıproco de conductancia por unidad de area 0,1 Ωm2

2πa/ρmb Conductancia por unidad de axon 3,2× 10−4 S m−1

v Potencial interior en reposo −70 mVE = v/b Campo electrico en la membrana 1,2× 107 Vm−1

κε0v/b Carga por unidad de area 7× 10−4 Cm−2

Numero de iones univalentes por unidad de area 4,4× 1015 m−2

Numero de iones univalentes por unidad de largo 6,6× 107 m−1

etc.

La Fig. 5.20c muestra el circuito electrico equivalente de la membrana, considerada comoun capacitor con una resistencia que permite las corrientes residuales. La ecuacion de estecircuito RC es

dv

dt+

1

RmCv = 0, (5.14)

cuya solucion es

v(t) = v0e−t/τ , τ = RmC. (5.15)

Sea σm la conductividad de la membrana, la resistencia de una seccion de area S es

Rm =b

σmS. (5.16)

Usando 5.11 se obtiene

τ =κε0σm

. (5.17)

Usando los valores de κ y σm de la membrana dados en la Tabla 5.1 tenemos que τ ∼ 1 ms.

Consideremos los efectos de la extension espacial de la membrana. Para esto convienedefinir las siguientes magnitudes

Capacitancia por unidad de area: cm = CS

= κε0b

.

Conductancia por unidad de area: gm = 1SRm

= 1S

σmSb

= σm

b, donde σm es la conducti-

vidad de la membrana.

5.2. CONDUCCION DEL IMPULSO NERVIOSO 83

La corriente que ocasiona la depolarizacion de la membrana cumple la relacion i = −dQ/dt =−Cdv/dt. Dividiendo esta relacion por el area S se obtiene

jm = −cm∂v∂t. (5.18)

La resistencia del axoplasma, de radio a y largo L, ante corrientes longitudinales es (verFig. 5.21)

Ri =ρiL

πa2. (5.19)

La resistencia por unidad de longitud es

ri =Ri

L=

ρi

πa2=

1

σiπa2. (5.20)

Figura 5.21: Resistencia longitudinal del axoplasma.

La Fig. 5.22 muestra las corrientes entrantes y salientes en un sector de axon de largodiferencial dx. Aplicando la 1ra ley de Kirchoff tenemos

ii(x)− ii(x+ dx)− im =dQ

dt. (5.21)

Figura 5.22: Esquema para la relacion entre las corrientes que entran y salen de un sector deaxoplasma, a traves de los extremos y de la membrana.

84 CAPITULO 5. ELEMENTOS DE BIOFISICA

Cuadro 5.2: Propiedades de los axones amielınicos y mielınicos del mismo radio. Typeset byMaxTeX.

Cantidad Amielınicos MielınicosRadio interno del axon a 5× 10−6 m 5× 10−6 mGrueso de la membrana b′ 6× 10−9 mGrueso Myelin b 2× 10−6 mκε0 6,20× 10−11 s−1Ω−1m−1 6,20× 10−11 s−1Ω−1m−1

Resistividad del axoplasma ρl 1,1 Ωm 1,1 ΩmResistividad Mielina ρm 107 Ωm 107 ΩmConstante de tiempo τ = κε0ρm 6,20× 10−4 s 6,20× 10−4 s

Constante de espacio λ λ =√

abρm

2ρiλ =

√abρm

2ρi=

√0,4a2ρm

2ρi

= 0,165√a

= a√

0,4ρm

2ρi

= 370× 10−6 m = 1350a= 6,8× 10−3 m

Espaciado de nodos D D = 280a= 1,4× 10−3 m

Velocidad de conduccion uamielınicos ∝ λτ

umielınico ∝ λτ

para el modelo ≈ 270√a ≈ 2,2× 106a

oumielınica ∝ D

τ

≈ 4,5× 105aVelocidad de conduccion uamielınicos ≈ 1800

√a umielınicos ≈ 17× 106a

empıricaPrporcion entre las velocidades 6,7 7,2 o 38empirica y modelada

Constante espacial usando λ = a√

ln(1+b/a)ρm

2ρi

el modelo de membrana gruesa

= a√

ln(1,4)ρm

2ρi

= 1240a= 6,2× 10−3m

Como la membrana se comporta como un condensador

dQ

dt= C

d

dt(vi − vo). (5.22)

Considerando la ley de Ohm para el axoplasma tenemos la relacion

ii(x) =vi(x)− vi(x+ dx)

ridx= − 1

ri

∂vi

∂x. (5.23)

Igualmente podemos relacionar

ii(x)− ii(x+ dx) = −∂ii∂xdx =

1

ri

∂2vi

∂x2dx. (5.24)

5.2. CONDUCCION DEL IMPULSO NERVIOSO 85

Figura 5.23: Relacion entre el voltaje y la corriente interna longitudinal del axoplasma.

Considerando que el area del sector de membrana correspondiente es 2πadx, im = jm2πadxy C = cm2πadx. Sustituyendo todo esto en 5.21 se obtiene

1

2πari

∂2vi

∂x2− jm = cm

∂t(vi − vo). (5.25)

Dado que |vo| ¿ |vi|, y eliminando el subındice i en vi, la ecuacion anterior queda

1

2πari

∂2v

∂x2− jm = cm

dv

dt. (5.26)

Por su importancia repetimos el resultado

ii(x) = − 1

ri

∂v

∂x. (5.27)

La Fig. 5.23 ilustra la ecuacion 5.27.La ec. 5.26 debe completarse con una relacion entre la densidad de corriente de membrana

jm y el potencial v. Para esto veremos dos modelos de membrana: electrotono y el modelode Hodgkin-Huxley.

5.2.3. Electrotono

En este modelo se postula una relacion lineal

jm = gm(v − vr), (5.28)

donde vr es el potencial de reposo (-70 mV), y gm es constante. La validez de este modeloesta limitada a pequeos valores de v − vr en axones amielinicos y en axones mielinicos entrelos nodos de Ranvier. En condiciones en que las propiedades de membrana estan alterado elmodelo de electrotono es aplicable para valores grandes de v.

86 CAPITULO 5. ELEMENTOS DE BIOFISICA

Figura 5.24: Soluciones de la ecuacion de membrana con el modelo de electrotono.

Reemplazando 5.28 en 5.26 se obtiene la ecuacion

λ2 ∂2v

∂x2− v − τ

∂v

∂t= −vr, (5.29)

donde λ2 = 1/(2πarigm) y τ = cm/gm. λ y τ definen la longitud y el tiempo caracterısticodel problema, respectivamente.

La Fig. 5.24 muestra la solucion numerica de la ecuacion 5.29 con las condiciones inicialesy de borde

v(x, 0) = vr, (5.30)

− 1

ri

∂v(0, t)

∂x= i. (5.31)

La segunda de las condiciones anteriores significa que se inyecta una corriente constante enx = 0. En la Fig. 5.24 se aprecia que el perfil del voltage tiende hacia una estado estableindependiente del tiempo y decae exponencialmente como funcion de x a medida que se aleja

5.2. CONDUCCION DEL IMPULSO NERVIOSO 87

del extremo por donde se inyecta corriente. Si la corriente por el axon fuera constante, elvoltage decaeria linealmente. El decaimiento es no lineal debido a la corriente que sale delaxon atravesando la membrana.

5.2.4. Modelo de Hodgkin y Huxley

El modelo de electrotono no explica la propagacion del potencial de axion. Para explicaresto es necesario descubrir la dependencia no lineal de la corriente de membrana jm con elvoltage aplicado. En el descubrimiento de esta dependencia fue posible gracias a una tecnicaexperimental que permite eliminar la variacion de voltage a lo largo del axon, asi eliminandolas derivadas espaciales en la ecuacion 5.26. Estos experimentos, efectuados por Hodgkin yHuxley en los anos, fueron realizados con el axon gigante del calamar. Este axon tiene 0.5mm de diametro y permite la insercion de microelectrodos a lo largo del axon.

Figura 5.25: Esquema de los experimentos de voltage-clamp en el axon gigante del calamar.

Dos electrodos situados a ambos lados de la membrana permiten medir el voltaje de lamembrana. Un tercer electrodo, insertado dentro del axon, permite suministrar corriente, yel circuito de control permite que la corriente inyectada sea la necesaria para mantener elpotencial de membrana. De este modo se puede medir la dependencia de jm con v y comofuncion del tiempo. El siguiente paso es encontrar la dependencia de las distintas corrientesque contribuyen a la corriente de membrana.

Con el dispositivo mostrado en la Fig. 5.25 se pudo medir la dependencia de la corrientede membrana en funcion del tiempo y del voltage. Resumimos algunos hechos experimentales.

Si el voltage aumenta abruptamente desde el voltaje de reposo a un valor determinado yeste se mantiene constante, se observa el siguiente comportamiento:

1. Una corriente durante unos pocos microsegundos hacia adentro. Esta corriente depola-riza la membrana.

2. Una corriente hacia adentro durante 1 o 2 ms. Si se reemplaza los iones de sodio en elfluido externo con otro ion de la misma carga, esta corriente es eliminada. Esto permiteasignar esta corriente a la entrada de iones sodio.

88 CAPITULO 5. ELEMENTOS DE BIOFISICA

3. Una corriente hacia afuera que se establece gradualmente en 4 ms a partir de la subidainicial del voltaje. Esta corriente decae lentamente en un lapso de varias decenas de ms.Se debe a la salida de iones potasio.

La corriente de membrana se divide segun las especies ionicas que le contribuyen

jm = jNa + jK + jL, (5.32)

donde jL agrupa las demas especies aparte del sodio y el potasio.

Figura 5.26: Esquema electrico de la conductancia de membrana.

Expresaremos la corriente de sodio

jNa = gNa(v − vNa). (5.33)

A diferencia del electrotono, la conductancia de sodio por unidad de area gNa depende delvoltaje en una forma no trivial. Ademas, vNa es el voltaje que satisface la condicion deequilibrio termodinamico (5.13) para los iones sodio

vNa = (vi − vo)eq =kBT

eln

([Nao]

[Nai]

). (5.34)

5.2. CONDUCCION DEL IMPULSO NERVIOSO 89

La formula (5.33) cumple el requisito de que en caso de que la membrana sea totalmentepermeable, para el voltaje de equilibrio la corriente neta es 0. Para la corriente de potasio sepostula la misma forma

jK = gK(v − vK). (5.35)

Las ecuaciones (5.33) y (5.35) se representan por el circuito de la Fig. 5.26b, donde gNa

y gK son resistencias variables y gL es una resistencia grande constante que da paso a lacorriente residual.

Los experimentos de voltage-clamp permiten medir las corrientes ionica en funcion deltiempo para voltajes fijos predeterminados. La Fig. 5.27 muestra la conductancia en funciondel tiempo a partir del establecimiento del voltaje.

Figura 5.27: Conductancia del sodio y del potasio en funcion del tiempo a partir del estable-cimiento de un voltaje fijo sobre el nivel de reposo.

La diferencia de las conductividades del sodio y del potasio aun no esta explicada satis-factoriamente. En el modelo de Hodgkin y Huxley se usan formulas empiricas que ajustan ladependencia experimental. Por ejemplo, para la conductancia de potasio funciona la formula

gK(v, t) = gK∞n(v, t)4, (5.36)

n(v, t) = n∞(v)

[1−

(n∞ − n0

n∞

)e−t/τ(v)

]. (5.37)

La funcion anterior satisface la equacion diferencial

dn

dt= −n

τ+n∞τ

(5.38)

o equivalentementedn

dt= αn(1− n)− βnn. (5.39)

90 CAPITULO 5. ELEMENTOS DE BIOFISICA

Figura 5.28: Pulso en un axon space-clamped a T=6.3 C. El axon fue estimulado en t = 0,5ms durante 0.1 ms.

El objetivo de estas ecuaciones diferenciales es que sirvan para calcular gK cuando elvoltaje v es variable en el tiempo. Para αn y βn se encontraron los ajustes empıricos

αn(v) =0,01[10− (v − vr)]

exp(

10−(v−vr)10

)− 1

× 3(T−6,3)/10, (5.40)

βn(v) = 0,125 exp

(−(v − vr)

80

)× 3(T−6,3)/10, (5.41)

gK∞ = 360 S/m2, (5.42)

donde v se expresa en mV, T en C, αn y βn en ms−1.

5.2. CONDUCCION DEL IMPULSO NERVIOSO 91

Para la conductancia de sodio se usa la relacion

gNa = m3hgNa∞, (5.43)

dm

dt= αm(1−m)− βmm (5.44)

dh

dt= αh(1− h)− βhh (5.45)

donde

αm(v) =0,1[25− (v − vr)]

exp(

25−(v−vr)10

)− 1

× 3(T−6,3)/10, (5.46)

βm(v) = 4 exp

(−(v − vr)

18

)× 3(T−6,3)/10 (5.47)

y

βh(v) =1

exp(

30−(v−vr)10

)+ 1

× 3(T−6,3)/10, (5.48)

αh(v) = 0,07 exp

(−(v − vr)

20

)× 3(T−6,3)/10, (5.49)

gNa∞ = 1200 S/m2. (5.50)

La corriente residual se ajusta con

jL = gL(v − vL) (5.51)

gL = 3 S/m2, (5.52)

vL = vr + 10,6 mV. (5.53)

Los parametros de Hodgkin y Huxley han sido usados para modelar una gran variedadde celulas nerviosas y musculares, aunque estrictamente son validos solo para el axon gigantedel calamar. Tambien se han desarrollado modelos mas sofisticados que incorporan la bombade sodio-potasio, calcio, etc. Tambien se han desarrollado para varias celulas musculares ycardiacas.

La Fig. 5.28 muestra el pulso calculado para un experimento de voltage-clamp.En un axon libre se restaura el termino que contiene la segunda derivada espacial en

(5.26). La Fig. 5.29 muestra una solucion numerica obtenida por el metodo de diferenciasfinitas.

92 CAPITULO 5. ELEMENTOS DE BIOFISICA

Figura 5.29: Pulso propagante ploteado en funcion de la posicion a lo largo del axon en uninstante de tiempo.

Capıtulo 6

Fısica nuclear

6.1. Hechos fundamentales

Existen mas de 100 elementos, que se distinguen or la carga electrica del nucleo Ze.

Para cada elemento existen isotopos, que teniendo igual carga electrica se distinguenpor la masa del nucleo.

Mas del 99% de la masa atomica se concentra en el nucleo.

El tamano del nucleo es del orden de 10−15 m=1 fm. La unidad fm se llama femtometroy tambien fermi.

Las energıas se miden en MeV.

Las masas se expresan tradicionalmente en MeV/c2, segun la celebre formula E = mc2.

Los nucleos atomicos estan constituidos por protones y neutrones, rodeados por unanube electronica. Las masas del proton mp, el neutron mn y el electron me sonmp = 938.3 MeV/c2

mn = 939.6 MeV/c2

me = 0.5 MeV/c2

En el ambito de fısica nuclear cabe hacerse las siguientes preguntas fundamentales

¿Hay otros elementos en el universo?

¿Por que existen nucleos inestables y radiactivos?

¿Han existido siempre los nucleos?

Formulas utiles~c = 197 MeV fm e2

[4πε0]= 1,44 MeV fm

e2

[4πε0]~c = 1137

c = 3× 1023 fm/s

93

94 CAPITULO 6. FISICA NUCLEAR

En la tabla anterior se [4πε0] corresponden al SI de unidades y se omite en el sistemaCGS. Todos los numeros anteriores son redondeados. La magnitud e2/[4πε0]~c es la constantede estructura fina.

En fısica nuclear se utiliza para los nucleos la notacion AZX, donde Z se llama numero

atomico y es igual al numero de protones, A = Z + N se llama ındice de masa y N es elnumero de neutrones que hay en el nucleo y X es el sımbolo quımico del elemento. Como existeuna correspondencia entre Z y X, frequentemente se usa la notacion AX. El ındice de masapermite diferenciar isotopos del mismo elemento. La masa del nucleo es aproximadamenteZmp +Nmn, aunque ligeramente menor, segun veremos mas adelante. Casos particularmenteimportante son

Proton: n =10H.

Neutron: n. (No corresponde a ningun elemento.)

Partıcula α: 42He.

Los protones, electrones y neutrones son partıculas de espın 1/2. Todas las partıculas deespin semientero cumplen el principio de exclusion de Pauli y en equilibrio termico cumplenla estadıstica de Fermi. Hasta donde se conoce actualmente, los electrones son partıculaselementales. Sin embargo, los protones y neutrones son partıculas compuestas por trıos departıculas elementales llamadas quarks. Las reacciones nucleares generalmente involucrantransmutaciones de las partıculas elementales. Por este motivo, antes de adentrarnos en enla fisica nuclear, haremos una excursion al Modelo Estandar de las partıculas elementales ysus interacciones.

6.2. Modelo estandar

En el Modelo Estandar las partıculas elementales que constituyen la materia establese agrupan en seis quarks y seis leptones, ademas de sus correspondientes antipartıculas,totalizando 24. Los quarks y los leptones son fermiones. Existen cuatro tipos de interacciones:fuerte, electromagnetica, debil y gravitatoria. Los leptones experimentan las tres ultimasinteracciones, mientras los quarks presentan las cuatro interacciones. 1 Las interacciones setransmiten mediante el intercambio de partıculas virtuales de espın entero (bosones): gluon,foton, W y Z y el graviton, este ultimo es hipotetico. De estos cuantos de interacion, solamenteel foton y el hipotetico graviton son capaces de viajar por el espacio libre indefinidamente. Losquarks tampoco se han observado en estado libre, su existencia se infiere de las propiedadesdel proton, el neutron y un gran numero de partıculas intestables que se forman en lasreacciones nucleares.

6.2.1. Leptones

Los leptones se agrupan en tres parejas , dadas por las partıculas e, µ, τ y sus neutrinosνe, νµ, ντ . Ademas, estan presentes sus antipartıculas, totalizando 12. Las partıculas e, µ, τ

1¿Que evidencia hay de que los leptones sufren la interaccion gravitatoria?

6.2. MODELO ESTANDAR 95

Figura 6.1: Modelo estandar. A la derecha se muestran las partıculas elementales estables, ala izquierda se muestran las interacciones, y al centro las partıculas que trasmiten las fuerzas.

tienen carga −e y sus antipartıculas carga e, tienen espın 1/2 y se describen cuanticamentemediante la ecuacion de Dirac. Los neutrinos tienen carga electrica nula, espın 1/2 y unamasa muy pequena, aun no determinada con precision.

De estas, el electron es estable, pero los leptones mas pesados µ y el τ decaen

µ− → νµ + e− + νe, T1/2 = 2,2× 10−6s. (6.1)

τ− → ντ + µ− + νµ, T1/2 = 4× 10−13s. (6.2)

Los neutrinos se desconoce si decaen, pero actualmente hay evidencia de oscilaciones entrelos distintos tipos de neutrinos.

Sea P (t) la probabilidad de permanencia de la partıcula (P (0) = 1) y 1/τ la probabilidadde decaimiento por unidad de tiempo

P (t+ dt) = P (t)

(1− dt

τ

)(6.3)

Entonces

P + dP = P − Pdt

τ(6.4)

P (t) = P (0)e−t/τ = P (0)2−t/T1/2 , (6.5)

donde T1/2 = τ ln 2 es el tiempo de vida media de la partıcula, para el cual P (T1/2) = 0,5.

El numero leptonico se explica en la tabla 6.1. Estos expresan el hecho de que en losdecaimientos un lepton solo se transforma en otro del mismo tipo, o se aniquila a crea enpareja con un antilepton del mismo tipo.

96 CAPITULO 6. FISICA NUCLEAR

Cuadro 6.1: Numeros leptonicos.e, νe e, νe µ, νµ µ, νµ τ, ντ τ , ντ

Le 1 -1 0 0 0 0Lµ 0 0 1 -1 0 0Lτ 0 0 0 0 1 -1T1/2 ∞,? 2,2× 10−6 s, ? 4× 10−13 s, ?

Cuadro 6.2: Numeros cuanticos de los quarks y carga electrica (en unidades de la carga delpositron e).

Carga Extraneza Encanto Inferioridad Superioridadu 2e/3 0 0 0 0d −e/3 0 0 0 0s −e/3 1 0 0 0c 2e/3 0 1 0 0b −e/3 0 0 1 0t 2e/3 0 0 0 1

6.2.2. Quarks

Los quarks son partıculas de espın 1/2. Existen 6 tipos de quarks y 6 antiquarks. Los quarkse denominan: u (up), d (down), s (strange), c (charm), b (bottom) y t (top). Como los quarksse transforman unos en otros, mas que partıculas diferentes se consideran estados cuanticosde un mismo campo. En la terminologıa del modelo estandar, u, d, s, c, b, t se denominansabores.

La Tabla 6.2 lista las carga y los numeros cuanticos de los distintos sabores. Los quarkstienen espın 1/2 y or tanto son fermiones. Los numeros cuanticos de extraneza (c), encanto(c), inferioridad (b) y superioridad (t) fueron inventados para considerar los distintos saborescomo estados de un mismo campo sin violar el principio de exclusion de Pauli.

Los quarks u y d son los que forman el neutron y el proton.

p = (uud)n = (ddu)

La evidencia de que el proton tiene estructura interna se manifiesta, por ejemplo, en laseccion eficaz de absorcion de fotones γ.

Los picos de la secion eficaz indican estados excitados el proton. El primer estado excitado(294 MeV) es una partıcula llamada ∆+ con espın 3/2.

Los quarks nunca se encuentran aislados, sino en combinaciones de dos o tres formandoartıculas pesadas llamadas hadrones. Las combinaciones de tres quarks se llaman bariones,las de dos, mesones.

Reglas de Gell-Mann y Zweig

1. Un meson esta formado por un quark y un antiquark. El numero barionico es 0.

2. Un barion esta formado por tres quarks. El numero barionico es 1.

6.2. MODELO ESTANDAR 97

Figura 6.2: Seccion eficaz de absorcion de fotones γ por el proton y el neutroon.

3. Un antibarion se compone de tres antiquarks. El numero barionico es -1.

Los quarks tienen otra propiedad nombrada color o carga de color. Esto explica laexistencia de partıculas como Ω− = (sss), ∆++ = (uuu) y ∆− = (ddd). Ası, la carga de colores un numero cuantico que evita que se viole el principio de exclusion de Pauli. Los coloresde los quarks son: rojo, azul, verde, antirroje, antiazul y antiverde. El color es la propiedadque media las interaciones fuertes, tambien llamada interaccion de color. La teorıa de lasinteracciones de color se llama cromodinamica cuantica.

Los hadrones son objetos de color neutro o de carga de color nula. Esto significa en losbariones que cada quark tiene una carga distinta, de modo que las cargas roja, azul y verdese combinan en una carga nula, del mismo modo que la suma de los tres colores primariosda blanco (esta es la causa de que se le diera el nombre color). Lo mismo ocurre con losantibariones. En los mesones se combina un color con su anticolor, dando obviamente cargade color nula.

6.2.3. Interaccion electromagnetica

El campo electromagnetico clasico se describe mediante el campo relativista Aµ = (φ(~r, t), ~A(~r, t))

el cual obedece ecuaciones derivadas de las ecuaciones de Maxwell para los campos ~B y ~E.Por ejemplo, la camponente A0 = φ satisface

∇2φ− 1

c2∂2φ

∂t2= − ρ

ε0

(6.6)

98 CAPITULO 6. FISICA NUCLEAR

Para cargas en movimiento lento, la ecuacion anterior admite la solucion

φ(~r, t) =1

4πε0

∫ρ(~r′, t)|~r − ~r′|d

3~r′. (6.7)

La energıa de interaccion entre dos cargas es

u12 =1

4πε0

∫ρ1(~r, t)ρ2(~r

′, t) + 1c2~j1 ·~j2

|~r − ~r′| d3~rd3~r′, (6.8)

donde ~j = ρ~v es la densidad de corriente creada por el movimiento de cada partıcula. Lainteraccion de corriente es despreciable para la interaccion entre electrones de un atomos, sinembargo es importante en la interaccion dentro del nucleo atomico. A esto debe agregarse lainteraccion dipolar debido al espın.

Por otra parte, en el espacio libre las soluciones toman la forma

φ(~r, t) = Aei(~k·~r−ωt), ω = ck. (6.9)

La constante A debe satisfacer la condicion de cuantizacion de la energıa

E =1

2

∫ (εE2 + µ0B

2)dV = (n+ 1/2)~ω (6.10)

El foton es el cuanto de energia ~ω. Una onda que lleva energia (n + 1/2)~ω se dice que

lleva n fotones. Considerando que el momentum es ~~k, vemos que se satisface la equacionrelativista de la energıa.

E2 = p2c2 +m2c4, con m = 0. (6.11)

La interaccion entre cargas electricas se realiza mediante el intercambio continuo de fotonesentre las cargas. La existencia de fuerzas entre estas es consequencia del momento transferidoen estos procesos.

6.2.4. Interaccion debil

La interaccion debil se describe de forma similar a la electromagnetica. En lugar de uncampo asociado al foton, la interaccion debil tiene asociados tres campos: W+, W− y Z, cadauno de los cuales se describe por un campo Aµ = (φ, ~A). Por ejemplo, el potencial escalar delcampo Z satisface [

∇2 − 1

c2∂2

∂t2−

(MZc

~

)2]φZ = −ρZ

ε0

, (6.12)

donde ρZ es la carga debil.En el espacio libre ρZ = 0 y la solucion es

φZ = Bei(~k·~r−ωt), −k2 +ω2

c2− M2

Zc2

~2= 0 (6.13)

Lo anterior implica que

(~ω)2 = (~ck)2 +M2Zc

4 = p2 +M2Zc

4, (6.14)

6.2. MODELO ESTANDAR 99

que es la energıa relativista de una partıcula masiva. A diferencia del foton, los campos W±

tienen carga electrica y todos tienen masa en reposo.

MZ = 91,187± 0,007 GeV/c2

MW+ = MW− = 80,41± 0,10 GeV/c2

La ec. (6.12) tiene la solucion

φZ(~r, t) =1

4πε0

∫ρ(~r′, t)e−κ|~r−~r′|

|~r − ~r′| d3~r′, κ =MZc

~. (6.15)

El rango de accion del campo Z es ~/MZc ' 2× 10−3 fm, mucho menor que las dimensionesdel nucleo. En (6.15) se puede considerar ρZ(r, t) constante y se puede sacar de la integral.Con esto se obtiene

φZ(~r, t) =1

ε0κ2ρZ(~r, t). (6.16)

Esto muestra que la interaccion debil ocurre dentro de los lımites de las propias partıculasnucleares.

Los campos Z y W± se cuantifican de forma analoga al campo electromagnetico, y suscuantos son denominados bosones Z y W±. Estos no son estables, al igual que muchas otraspartıculas y nucleos atomicos. Estas partıculas decaen en otras partıculas, en un procesoestadıstico. Los bosones Z y W± tiene espın 1, al igual que el foton.

Se puede tener una idea cualitativa de las interacciones usando diagramas de Feynman.Por ejemplo, el decaimiento (6.1) se representa por los diagramas

Figura 6.3: Diagramas de Feynman del decaimiento del µ.

En los vertices, y en el proceso total, se conservan

Momento lineal.

Momento angular.

Carga electrica.

Numero leptonico.

En el proceso total, ademas se conserva la energıa. La conservacion del numero leptonico im-plica que un lepton solo puede cambiar a otro del mismo tipo, o aniquilarse con un antileptondel mismo tipo. Las evidencias recientes de la oscilacion de los neutrinos indican que esta leyno tiene una validez general.

100 CAPITULO 6. FISICA NUCLEAR

Figura 6.4: Diagramas de Feynman del decaimiento β.

Figura 6.5: Diagramas de Feynman del decaimiento de los mesones π+ y π0. El decaimientode π+ ocurre por interaccion debil, que es capaz de aniquilar dos antipartıculas diferentes. Encambio π0 decae electromagneticamente mediante la aniquilacion de antipartıculas iguales.

En los quarks, la interaccion debil es responsable de cambio de sabor en los quarks, y deldecaimiento de los mesones, esta ultima junto con la interaccion electromagnetica.

El decaimiento beta

n→ p+ e− + νe (6.17)

es resultado de la transmutacion de un quark d del neutron (n = (ddu)) en u (p = (uud)),emitiendo un boson W− que luego decae en el par e−, νe.

La interaccion debil viola la ley de conservacion de la paridad. Esto se observa en eldecaimiento del µ (Ec. 6.1). En este decaimiento el momento del e− apunta (estadısticamente)en direccion opuesta al espın de µ. Sin embargo, ante una transformacion de inversion decoordenadas se invierte el momento lineal, pero no el momento angular, como el espın. Estosignifica que la interaccion debil no es invariante ante la inversion de coordenadas. Otroejemplo es el caso de los neutrinos. Los neutrinos presentan espın antiparalelo al momentolineal, mientras los antineutrinos lo tienen paralelo.2 Una operacion de inversion cambia estasrelaciones, lo cual no corresponde a las observaciones. Notese que si bien no existe simetrıade paridad, si se obtienen estados realizados si se componen la operacion de inversion y secambia la partıcula por su antipartıcula. Esto se llama simetrıa de carga-paridad (CP). Lainteraccion debil no tiene simetrıa P ni CP. Si ademas se invierte la direccion del tiempo,

2Una corriente teorica fuera del Modelo Estandar afirma que los neutrinos y antineutrinos son la mismapartıcula.

6.2. MODELO ESTANDAR 101

tendremos la simetrıa CPT, que es la unica simetrıa satisfecha por todas las interacciones.

Finalmente, la interaccion electromagnetica y debil han podido ser descritas mediante uncampo unico: el campo electro-debil, que a bajas energıas se manifiestan como interaccionesdiferentes.

6.2.5. Interaccion gravitatoria

La interaccion gravitatoria se describe en primera aproximacion mediante el potencialgravitario de Newton y mas exactamente por las ecuaciones de Einstein (Relatividad Ge-neral). Hasta el presente no existe un teorıa cuantica satisfactoria de la gravedad, ni se haconfirmado la prediccion de la existencia de ondas gravitatorias ni su cuanto de interaccionel graviton.

6.2.6. Interaccion fuerte o de color

En el caso de la interaccion electrodebil, el valor de la constante de estructura fina α =e2/~c ∼ 1/137 permite el uso de la teorıa de perturbaciones. Esto permite demostrar, porejemplo, que la interaccion entre dos cargas electricas se puede describir por medio de unpotencial

V (r12) =q1q2r12

+O(α).

En el caso de la interaccion de color, la constante de acoplamiento es mayor que 1, esto haceinefectivo el uso de la teorıa de perturbaciones y limita el uso de potenciales entre quarks.Por otra parte, con potenciales no se describe la transmutacion o aniquilacion de partıculas.Esto hace la interaccion de color sumamente complicada de tratar matematicamente.

El gluon es el boson que media esta interaccion. El gluon porta carga de color. De modogeneral, colores iguales se repelen, un color y su anticolor se atraen y colores diferentes seatraen con menos intensidad que color y anticolor. A diferencia del unico foton en la interacconelectromagnetica y los tres bosones de la interacion debil, hay ocho tipos de gluones.

La emision o aniquilacion de gluones se acompana de cambios de color (sin cambio desabor) o creacion o aniquilacion de pares de quark-antiquark. Los cambios de sabor ocu-rren mediante interaccion debil, generalmente son decaimientos de quarks pesados en quarksligeros acompanados de creacion de leptones.

Uno de los objetivos de la fisica de partıculas es lograr un teorıa unificada de las interac-ciones electrodebil y de color.

102 CAPITULO 6. FISICA NUCLEAR

6.2.7. Ejemplos de decaimiento de partıculas

Consideremos la cadena de decaimiento originados en la partıcula llamada Ξ∗−.

Ξ∗− → K− + Σ0

K− → π− + π0

Σ0 → Λ0 + γ

Λ0 → p+ e− + νe

π− → µ− + νµ

π0 → 2γ

µ− → e− + νµ + νe

Las componentes de los hadrones vistos son; Ξ∗− = (ssd), Σ0 = (sud), Λ0 = (sud),Σ0 = (sud), K− = (su) , π− = (du), π0 = (uu − dd), p = (uud). La primera ecuacion,puesta en termino de quarks, se expresa (ssd) → (su) + (sud). En esta operacion solo secrea un par uu. No se involucra ningun lepton, ni se transmuta ningun quark, por tantola interaccion es fuerte. El decaimiento del K− es dado por la transmutacion s → d, portanto es interaccion debil. Σ0 decae a Λ0 emitiendo un foton y sin cambio de sabor en susquarks, el foton indica un mecanismo electromagnetico. El decaimiento de Λ0 es debil, pueshay un cambio s → u y creacion de leptones. π− decae por interaccion debil, indicado porla formacion de leptones. π0 decae electromagneticamente (indicado por los fotones γ) poraniquilacion de sus componentes (uu y dd). Finalmente µ− decae por interaccion debil, sololeptones hay involucrados aquı.

6.3. Interaccion entre nucleones

Las propiedades mas importantes de las fuerzas entre nucleones son:

La fuerza nuclear solo actua entre hadrones.

A distancias tıpicas (1.3 fm) es una fuerza muy atractiva, mas fuerte que la de Coulomb.

A distancias muy pequenas es repulsiva.

A distancias mayores d 1,3 fm, tiende exponencialmente a cero.

Es nearly casi independiente de si los nucleones son protones o neutrones.

Depende de la orientacion relativa de los espines de los nucleones.

Tiene una componente tensorial (no central).

Como hemos visto, el proton y el neutron estan compuestos por trios de quarks. Lainteraccion de color tiene la propiedad de saturacion, que significa que un quark se liga condos quarks a lo sumo, siendo mucho mas debil la interaccion con otros quarks. Esto es lo quepermite la existencia de neutrones y protones bien diferenciados dentro del nucleo atomico,

6.3. INTERACCION ENTRE NUCLEONES 103

en vez de una sopa de quarks. Esto es evidente en el hecho de que las energıas de excitacionde los nucleos son un orden de magnitud menores que las energıas de excitacion de losnucleones individuales. La interaccion entre nucleones es un residuo de la interaccion entre losquarks. Algo similar ocurre en fısica atomica, donde electrones y nucleos interactuan mediantepotenciales de Coulomb, proporcionales al inverso de la distancia, pero el apantallamientoentre cargas positivas y negativas provoca que la interaccion entre atomos se describa porpotenciales mas debiles (por ejemplo, Lennard-Jones). En fısica nuclear existe el problemaadicional de que las energıas de excitacion son suficientes para crear pares de partıcula-antipartıcula. La interaccion entre nucleones se puede describir en tres niveles de complejidad.

6.3.1. Nivel 1: Potenciales empıricos

El llamado potencial de Parıs parametriza la interaccion fuerte de forma igual paraneutron y proton. Es un potencial de pares empırico (tan empırico como era el potenciale Coulomb en 1781). Este potencial depende del espın del par de nucleones.

Espın 0.

V (~r) = VC0(r) (6.18)

Espın 1.

V (~r) = VC1(r) + VT (r)ΩT + VSO(r)ΩSO + VSO2(r)ΩSO2 (6.19)

ΩT =3(~σ1 · ~r)(~σ2 · ~r)

r2− ~σ1 · ~σ2 (6.20)

~ΩSO = (~σ1 + ~σ2) · ~L (6.21)

~2ΩSO2 = (~σ1 · ~L)(~σ2 · ~L) + (~σ2 · ~L)(~σ1 · ~L), (6.22)

donde ~L y (~/2)~σ son los operadores del momento angular y de espın, respectivamente.

La Fig. 6.6 muestra la parte radial de las distintas componentes del potencial de Parıs.

Note que el potencial tensorial VT es el pozo mas profundo de todos. Esto permite “explicarporque existe el estado ligado n− p (deuteron 2H) y no existen nucleos p− p (2He) o n− n.

En el deuteron tenemos dos posibilidades

S = 0: V = VC0(r) no es suficientemente profundo para tener un estado ligado.

S = 1: El potencial tensorial VT ΩT es suficientemente profunda para que exista un estadoligado. Por esto el 2H tiene espın 1.

En un supuesto estado de dos nucleones identicos ligados n − n o p − p tenemos dosposibilidades para el espın total.

S = 0: V = VC0(r) no es suficientemente profundo para tener un estado ligado.

104 CAPITULO 6. FISICA NUCLEAR

Figura 6.6: Parte radial de las distintas componentes del potencial de Parıs.

S = 1: El potencial tensorial VT ΩT es profundo, pero la identidad de las partıculas requiereque la funcion de onda total sea antisimetrica. Con S = 1 la parte espinorial es simetrica,de modo que la parte espacial de la funcion de onda debe ser antisimetrica: ψ(−~r) =−ψ(~r) siendo ~r el vector de posicion relativa de los dos neutrones. Esto implica que ψdebe ser un orbital con simetrıa p o f . Esta restriccion a la simetrıa de la funcion deonda implica que la profundidad del pozo VT no basta para que el estado sea ligado.

Hemos visto que el potencial tensorial es esencial para el enlace en el deuteron. En nucleospesados la parte tensorial pierde importancia, pues su promedio espacial es 0, siendo VC0 yVC1 los que contribuyen mas a la energıa de enlace.

Una caracterıstica de la interaccion entre nucleones es que es de corto alcance, es decir,que tiende a 0 de forma exponencial y es despreciable a distancias mayores de 2 fm. Comovimos en la seccion de interaccion debil, el caracter de corto alcance en una interaccion sedescribe mediante una cuanto de interaccion con masa en reposo. Esto es lo que veremos enel siguiente apartado.

6.3. INTERACCION ENTRE NUCLEONES 105

6.3.2. Nivel 2: Meson de Yukawa

Este modelo supone que la interaccion entre dos nucleones se realiza a traves de un campomesonico π. La ecuacion del campo mesonico en el espacio libre es

[∇2 − 1

c2∂2

∂t2−

(mπc

~

)2]φ(~r, t) = 0, (6.23)

El campo asociado a un nucleon de espın 1/2 tiene la forma

φ(~r) = gπ(~σ1 · ∇1)e−mπc|~r1−~r2|/~

|~r1 − ~r2| . (6.24)

La longitud de apantallamiento es ~/mπc ' 1, 4 fm.

El modelo mesonico se debe a H. Yukawa en 1935, antes del descubrimiento experimentalde los mesones. Con el desarrollo del Modelo Estandar quedo claro que el meson es unapartıcula compuesta por un quark y un antiquark, siendo el gluon el campo portador de lainteraccion.

6.3.3. Nivel 3: Interaccion de color residual

Existe mas de un meson mediando la interaccion entre nucleones. Cada uno se componede parejas quark-antiquark.

π+ = (ud), mπ+ = 139,57 MeV/c2

π− = (du), mπ− = 139,57 MeV/c2

π0 = (uu−dd)√2

, mπ0 = 134,9 MeV/c2

η = (uu+dd)√2

Todos estos mesones tienen espın 0. Sus estados excitados son los mesones ρ+, ρ−, ρ0 y tienenmasas mayores.

La Fig. 6.7 muestra uno de los procesos que contribuyen a la interaccion neutron-proton,resaltando la equivalencia entre el modelo mesonico y la descripcion fundamental en base alintercambio de gluones. En este marco, el proton y el neutron una pareja de quarks d y u,que compuestos forman precisamente un meson π−.

Sin embargo, las ecuaciones de la cromodinamica cuantica son tan complejas que hasael presente ha resultado imposible resolverlas en las escalas de energıa relevantes al nucleoatomico. Es decir, la descripcion pictorica mostrada en la Fig. 6.7 no se ha podido plasmar enen formulas matematicas. Sorprendentemente, si ha sido posible resolverlas para reaccionesaltas energıas, en que las interaccion entre quarks y gluones es debil (libertad asimptotica).

106 CAPITULO 6. FISICA NUCLEAR

Figura 6.7: Equivalencia entre la descripcion mesonica y gluonica de la ineraccion entrenucleones

6.4. Dimensiones y masas nucleares

6.4.1. Distribucion de masa y carga

Los datos basicos del tamano y distribucion de la materia nuclear fueron obtenidos en ladecada de 1950 en experimentos de dispersion elastica de electrones de alta energıa. Dado elcortısimo alcance de la interaccion debil, en este caso solo la fuerza electromagnetica actuaentre electrones y nucleos. Para poder sensar la estructura del nucleo los electrones debentener una longitud de onda del orden de 1 fm. Para esto requieren una energıa

~ω = 2π~cλ

= 2π197 MeV. (6.25)

Esto significa que los electrones son ultrarrelativistas E = pc = ~ck, y que tambien es posiblela creacion de pares e−e+. En la dispersion elastica el vector de onda cambia de direccion,pero no de magnitud |~ki| = |~kf |. Es facil demostrar que si el cambio de direccion es θ modulo

de ~q = ~kf − ~ki es |~q| = (2E/~c) sin(θ/2). La seccion eficaz de dispersion resulta igual a

dΩ=

(E

)2 (1

~c

)41

q4

∣∣∣∣e2

ε0

∫ρ(~r)ei(~q·~r)

∣∣∣∣2

d3~r. (6.26)

La formula anterior nos dice que la seccion eficaz es proporcional al cuadrado de la transfor-mada de Fourier de la densidad de carga. Mediante ajustes de mınimos cuadrados se pudoestablecer la siguiente dependencia de la densidad de carga ρ con la distancia al centro delnucleo.

La densidad de carga mostrada en la Fig. 6.8 se puede aproximar por la funcion

ρc(r) =ρ0

c

1 + e(r−R)/a. (6.27)

En el perfil de la densidad se identifican claramente dos regiones: una en que la densidades casi constante (el interior del nucleo) y otra en que la densidad cae abruptamente a 0(la superficie). El parametro a es podrıa decirse que es el grosor de la superficie del nucleo,resulta ser casi constante para todos los elementos. Si se supone que los protones se distribuyen

6.4. DIMENSIONES Y MASAS NUCLEARES 107

Figura 6.8: Densidad de carga en funcion de la distancia al centro del nucleo de 20882 Pb.

uniformemente en el nucleo entonces la densidad de masas es proporcional a la densidad decarga.

ρm(r) =A

Zρc(r). (6.28)

Bajo esta suposicion, la densidad de masa en el interior del nucleo es casi la misma para todoslos elementos. Este hecho se ilustra en la Fig. 6.9. Este valor constante puede considerarsecomo la densidad de la materia nuclear.

ρ0m ∼ 0,17nucleones fm−3. (6.29)

Figura 6.9: Densidad de masa en funcion de la distancia al centro del nucleo de 16O, 109Ag y208Pb.

108 CAPITULO 6. FISICA NUCLEAR

Para R tenemos la formula de ajuste

R = 1,12A1/3 fm. (6.30)

6.4.2. Energıa de enlace

La energıa de enlace B(Z,N) es la energıa requerida para disgregar un nıcleo en susZ protones y N = A − Z neutrones. Matematicamente se define mediante la equivalenciamasa-energıa expresada para la masa del nucleo M(Z,N)

M(Z,N) = Zmp +Nmn − B(Z,N)

c2. (6.31)

La energıa de enlace es tıpicamente del orden de la centesima de la masa nuclear. Experimen-talmente se miden las masas atomicas con error relativo de 10−7. La relacion entre la masaatomica y la masa del nucleo es

mat(Z,N) = Z(me +mp) +Nmn − B(Z,N)

c2− belecc

2, belec ' 20,8Z7/3 eV. (6.32)

El valor belec es la energıa de enlace de los electrones originada por la interaccion de Coulomb,y el valor dado es un estimado obtenido mediante el modelo de Thomas-Fermi.

La energıa de enlace por nucleon se muestra en la Fig. 6.10B(Z,N)/A. Esta es la magnitudque determina la estabilidad relativa de los distintos nucleos y determina la direccion en queocurren las reacciones nucleares. Los nucleos 56Ni y 56Fe son los que tienen mayor energia deenlace por nucleon. Por tanto son los que tienen menor energıa total por nucleon y por tantoson los elementos mas estables.

La siguiente formula semiempırica, conocida como formula de masa, aproxima los va-lores experimentales de la energıa de enlace

B(Z,N) = aA− bA2/3 − s(N − Z)2

A− dZ2

A1/3− δ

A1/2. (6.33)

Cuadro 6.3: Parametros de la formula de masa, en MeV.

a b s d δ11.2 si N y Z son impares

15.835 18.33 23.20 0.714 -11.2 si N y Z son pares0 si A = N + Z es impar

En la formula 6.33, los distintos terminos tienen el siguiente significado: aA es la energıa decohesion. bA2/3 es la energıa de superficie (note que A2/3 ∝ R2, vease ec. (6.30)). s(N−Z)2/Aes la llamada energıa de simetrıa que da cuenta de la tendencia de los nucleos a tener N = Z.Esta tendencia se desvıa en favor del numero de neutrones gracias al termino dZ2/A1/3, querepresenta la energıa de repulsion electrica de los protones. Finalmente, δ/A1/2 es la energıade apareamiento, que expresa la la tendencia de cada tipo de nucleon a estar en pares.

6.4. DIMENSIONES Y MASAS NUCLEARES 109

Figura 6.10: Energia de enlace por nucleon.

La combinacion de (6.31) y (6.33) produce para ındice de masa A constante, reemplazandoN por A− Z, la dependencia

mat(Z,A)c2 = α− βZ + γZ2, (6.34)

donde

α = Amnc2 − aA+ bA2/3 + sA+ δA−1/2,

β = 4s+ (mn −mp −me)c2,

γ = (4sA−1 + dA−1/3)Z2.

La formula anterior representa dos parabolas, pues δ depende de la paridad de Z y N . Losmınimos de estas parabolas son nucleos mas estables. Un nucleo A

ZX que experimenta decai-mientos beta (ver proxima seccion), aumentando o disminuyendo Z hasta llegar al mınimode (6.34). Como en los decaimientos beta Z cambia en saltos de uno y la energıa de enlacepor nucleon debe disminuir siempre, no siempre se alcanza el mınimo absoluto de (6.34).Por ejemplo, para A = 64 (Fig. 6.11) los nucleos ligeros decaen hacia el mınimo absoluto enZ = 28. Sin embargo, los nucleos pesados decaen hacia Z = 30 y no pueden llegar al mınimoabsoluto porque Z = 29 requiere un aumento de la energıa.

110 CAPITULO 6. FISICA NUCLEAR

Figura 6.11: Masas atomicas par A = 64. Los circulos vacios son para N y Z impar, loscirculos llenos son par N y Z impar. Note que el nucleo 64

29Cu puede decaer β− a 6430Zn o β+

6428Ni, los cuales son isotopos estables que existen en la naturaleza.

Ası, para cada valor del ındice de masas hay uno o dos valores de Z que representannucleos β−estables. Los otros valores de Z corresponden a nucleos que decaen en tiemposrelativamente cortos. La Fig. 6.12 muestra el llamado valle de la β−estabilidad, mostrandolos nucleos estables y los nucleos inestables conocidos. La Fig. 6.10 solamente muestra lasenergıas de enlace de los nucleos β−estables. El fondo del valle de β−estabilidad se aproximamuy bien por el valor de Z que minimiza la masa atomica (6.34) considerando δ = 0

Z =β

2γ=

(4s+ (mn −mp −me)c2)A

2(4s+ dA2/3). (6.35)

6.5. Decaimiento beta

6.5.1. Decaimiento beta directo (β−)

El decaimiento beta es el proceso de desintegracion de un neutron en el interior del nucleo,originando un electron y un antineutrino

AZX −→A

Z+1 Y + e− + νe + ∆E. (6.36)

El decaimiento es posible si

∆E = (M(N,Z)−M(N−1, Z+1)−me)c2 = B(N−1, Z+1)−B(N,Z)−mec

2 > 0. (6.37)

En terminos de las masas atomicas

∆E = (mat(N,Z)−mat(N − 1, Z + 1))c2.

6.5. DECAIMIENTO BETA 111

Figura 6.12: Figura 4.6. Valle de la β−estabilidad. Los cuadrados llenos muestran los nucleosestables o de largo tiempo de vida. Los nucleos vecinos son inestables. Las lıneas (fronterasdel valle) acotan los nucleos para los que hay datos de masas y tiempos de vida media.

La condicion anterior difiere de (6.37) en algunos eV/c2, asociado a la diferencia de energıa deenlace elecronica. La energıa liberada ∆E es repartida como energıa cinetica de los productosdel decaimiento.

Como ejemplo tenemos el decaimiento del 77Ge.

7732Ge −→77

33 As + e− + νe + 2,75MeV.

7733As −→77

34 Se + e− + νe + 0,68MeV.

112 CAPITULO 6. FISICA NUCLEAR

6.5.2. Decaimiento beta inverso (β+)

Este es el proceso en que un proton decae en neutron, positron y neutrino electronico.Para los nucleos se representa ası

AZX −→A

Z−1 Y + e+ + νe + ∆E. (6.38)

Este proceso no es posible en el vacıo porque la energıa en reposo del neutron es mayor quela del proton. Sin embargo, en el nucleo es posible gracias a las variaciones de la energıa deenlace por nucleon. La condicion necesaria es

∆E = (M(N,Z)−M(N+1, Z−1)−me)c2 = B(N+1, Z−1)−B(N,Z)−mec

2 > 0. (6.39)

En terminos de masas atomicas

∆E = (mat(N,Z)−mat(N + 1, Z − 1)− 2me)c2.

Como ejemplo tenemos el decaimiento del kripton.

7736Kr −→77

35 Br + e+ + νe + 2,89MeV.

7735Br −→77

34 Se + e+ + νe + 1,36MeV.

6.5.3. Captura electronica

El nucleo puede capturar un electron de la capa mas profunda del atomo produciendo latrasnmutacion de un proton en neutron.

AZX + e− −→A

Z−1 Y + νe + ∆E. (6.40)

La captura es posible si

∆E = (M(N,Z)+me+Eelec−M(N+1, Z−1))c2 = B(N+1, Z−1)+Eelec−B(N,Z)+mec2 > 0.(6.41)

En terminos de masas atomicas

∆E = (mat(N,Z)−m∗at(N + 1, Z − 1))c2,

donde m∗at es la masa del atomo excitado. A diferencia de los decaimientos beta directo e

inverso, en los cuales las partıculas emitidas se van lejos del atomo, en la captura electronicaes importante considerar la energıa de enlace del electron capturado Eelec < 0, ya que elelectron capturado, siendo de la capa mas interna, tiene una energıa de enlace de varioscientos de keV . El atomo producto de la reaccion se queda en un estado excitado en cualesta desocupado el estado correspondiente al eletron absorbido. Esta vacancia se reocupa porpor un electron que cae desde un estado de mayor energıa emitiendo un foton (rayos X) otransfiriendo la energia a otro electron que es eyectado (efecto Auger). Un ejemplo es

74Be + e− −→7

3 Li + νe + 0,86MeV.

Finalmente, notemos que existen los procesos doble-β que involucran dos electrones odos positrones. Estos procesos tienen un tiempo medio del orden de 1020 anos (la edad delUniverso es 1010 anos) y logicamente son observables solo a nivel microscopico, no afectandoel valle de la β− estabilidad.

6.6. DECAIMIENTO ALFA 113

6.6. Decaimiento alfa

El decaimiento α es la emision de una particula α (nucleo 42He) por un nucleo pesado.

Esquematicamente se representa

AZX −→A−4

Z−2 Y + α +Q, (6.42)

donde Q es la energia liberada en forma de energia cinetica de A−4Z−2Y y α. Esta energia se

produce a costa del aumento de la energia de enlace por nucleon en el nucleo A−4Z−2Y.

Q(A,Z) = B(A− 4, Z − 2) +B(4, 2)−B(A,Z). (6.43)

Notemos que B(4, 2) = 28,3 MeV.

Figura 6.13: Energias de decaimiento α en funcion del numero atomico del nucleo padre. Lospuntos son los datos experimetales para los nucleos β−estables. La linea continua se obtienede la formula de masa (6.33) y de (6.35).

De la Fig. 6.13 se nota que el decaimiento α es energeticamente favorable para los nucleospesados. Los nucleos con Z > 66 son inestable. Cineticamente, el tiempo de vida media puedeser muy largo y se encuentra que hasta el Bi (Z = 83) los tiempos de vida de los nucleosβ−estables son muchos ordenes de magnitud mayores que la edad del planeta Tierra. ParaZ > 83 solamente han sobrevivido en la Tierra algunos isotpos de torio y uranio.

Entendamos la fisica del decaimiento α. Para fijar ideas consideremos el proceso hipotetico

20983 Bi −→205

81 Tl + α + 3,11 MeV.

Este proceso puede ser modelado como la separacion y escape de la particula α del pozo depotencial creado por el nucleo 205

81 Tl. Este pozo se potencial tiene cualitativamente el aspectomostrado en la Fig. 6.14.

114 CAPITULO 6. FISICA NUCLEAR

Figura 6.14: Energia potencial de la particula α en el campo de Coulomb y nuclear. En r ' rs

se forma la particula, penetra la barrera de potencial y alcanza rc por efecto tunel.

La particula α se forma en el borde del nuclo r = rs. Esto significa que los cuatro nucleonesque forman la particula se independizan del resto. El radio rs se estima de la formula empirica(6.30), con A = 209. Para r > rs el potencial es determinado por la repulsion Coulombiana,y clasicamente representa una region prohibida para la particula α, que tiene una energiaQ, que es la energia cinetica que conservara al alejarse del nucleo. rc es el radio en que laenergia potencial de electrostatica iguala a Q. Resolviendo la ecuacion de Schrodinger parael potencial de la Fig. 6.14 se encuentra la relaci on siguiente para la funcion de onda

∣∣∣∣f(rc)

f(rs)

∣∣∣∣2

= e−G, (6.44)

donde

G = G = 2

∫ rc

rs

√2m

~2

(2Zαe2

4πε0r−Q

)dr =

π

~c

(2ZT le

2

4πε0

)2√

2mc2

QG(rs/rc). (6.45)

La funcion G(x) toma valores en el rango (0,1) y tiende a 1 cuando x tiende a 0. En el limitede baja energia liberada (Q→ 0), G(rs/rc) → 1 y G→∞. La probabilidad de emision de laparticula α por unidad de tiempo ser proporcional a |f(rc)|2 ∝ e−G. El tiempo de vida mediaes el inverso de esta probabilidad, y lo podemos escribir en la forma

τ = τ0eG. (6.46)

τ−10 se interpreta como la probabilidad de formacion de la particula α en r = rs. Suponiendo

que τ0 varia suavemente de nucleo a nucleo, (al menos no de forma exponencial) se ha llegadoa obtener el valor ajustado

τ0 = 7,0× 10−23 s. Sı, es 10−23!! (6.47)

6.7. FISION NUCLEAR 115

Figura 6.15: Serie de decaimientos del 238U.

La formula 6.47), que fue propuesta en 1928 por Gamow3 y por Condon y Gurney, escapaz de aproximar notablemente los tiempos de vida media en escalas de tiempo desde elmicrosegundo hasta la edad de La Tierra (1017 s.)

El nucleo hijo producido en un decaimiento α puede ser β−inestable o ser β−estable yα−inestable. En consecuencia, se ocurre una serie de decaimientos sucesivos hasta llegar aun isotopo estable. La Fig. 6.15 muestra la serie que se origina en el isotopo del uranio 238

92 U.Esta serie es una de las fuentes de radiactividad natural.

6.7. Fision nuclear

La fision nuclear es el proceso en que un nucleo se divide en dos partes mas o menossimetricamente, acompanado de algunos neutrones emitidos libremente.

Para que ocurra la fision, el proceso debe ser energeticamente favorable. Consideremos elcaso de fision en dos nucleos iguales. Entonces debe cumplirse que

∆B = 2B(A/2, Z/2)−B(A,Z) > 0. (6.48)

La energıa de apareamiento puede despreciarse en primera aproximacion. Si la proporcionZ/N esta fijada, la energıa de simetrıa es proporcional al numero de nucleones y no contribuyea ∆B. Lo mismo es obviamente valido para la energıa de cohesion. Luego, las contribucionesa ∆B provienen de la energıa de superficie y la energıa de Coulomb.

∆B = −bA2/3[2(1/2)2/3 − 1

]− dZ2

A1/3

[2(1/2)5/3 − 1

]. (6.49)

La condicion ∆B > 0 se satisface siZ2

A> 18. (6.50)

3Las aventuras del senor Tompkins en el paıs de las maravillas, de George Gamow, es un divertido clasicode la literatura de divulgacion. Gamow tambien es padre de la teoria del Big Bang y del modelo nuclear degota liquida.

116 CAPITULO 6. FISICA NUCLEAR

La condicion (6.50) se cumple para los nucleos β−estables mas pesados que el 9842Mo. La

energıa liberada en la fision es mucho mayor que en el decaimiento α. Por ejemplo, en la fisionsimetrica del 238U ∆B ' 180 MeV. Sin embargo, el proceso es limitado por la existencia deuna barrera de energia, que se consigue superar por efecto tunel. El pequeno valor del loscoeficientes de tunelaje provoca que la fisıon espontanea solo se observa en los elementos maspesados.

El modelo de gota lıquida y la formula de masa proporcionan un descripcion cruda deeste proceso. La Fig. 6.16 ilustra este proceso.

Figura 6.16: Representacion esquematica de la fusion nuclear en el modelo de gota lıquida.

Resulta util considerar el estadıo inicial de la deformacion que termina en la separacion delas dos “gotas” de materia nuclear. En este estadıo la gota esferica se convirte en un esferoidesin variar el volumen. En funcion del parametro de deformacion ε, los semiejes del esferoideestan dados por

a = (1 + ε)R, b = c = R/(1 + ε)1/2 (6.51)

Un ejercicio matematico permite demostrar que el area del esferoide es

S(ε) = S(0)

(1 +

2

5ε2 − 52

105ε3

), S(0) =

4

3πR3. (6.52)

Esto permite expresar la energıa superficial en la formula de masa como

ES = bA2/3

(1 +

2

5ε2 − 52

105ε3

)(6.53)

La energıa de Coulomb es igual a

EC =ρ2

8πε0

∫d3rd3r′

|~r − ~r′| =3

5

Z2e2

4πε0R(1− 4

5ε2 +

4

21ε3)

El factor 35

Z2e2

4πε0Rse identifica en la formula de masa como dZ2

A1/3 . Los demas terminos enla formula de masa no guardan relacion con la superficie. Luego, la energıa asociada a ladeformacion

∆E(ε) =

(2

5bA2/3 − 1

5

dZ2

A1/3

)ε2 +

(52

105bA2/3 − 4

21

dZ2

A1/3

)ε3. (6.54)

El coeficiente de ε2 es negativo si se cumple la condicion

Z2

A>

2b

d≈ 51. (6.55)

6.8. REACCION EN CADENA 117

La condicion anterior significa que ante una deformacion pequena la energıa de la deformaciones negativa y la fision progresa sin se inhibida por ninguna barrera de potencial. Usando lacondicion de β−estabilidad (6.35) esta condicion se cumple para Z > 144.

Para elementos con Z < 144 la fusion espontanea involucra vencer una barrera de po-tencial. Se puede estimar crudamente la altura de la barrera a partir de (6.54). Poniendo losparametros del 235

92 U, la energıa de deformacion

∆E(235, 92) = (83,35ε2 − 159,16ε3) MeV. (6.56)

El coeficiente de ε3 es negativo, lo que significa que la deformacion procede hacia los valorespositivos de ε. El esferoide para ε > 0 es un esferoide prolatado. El maximo de esta barreraes 3.4 MeV cuando ε = 0,35. El valor experimental de la barrera, determinado medianteexperimentos de fision inducida, es de 5.8 MeV.

La fision inducida se logra mediante captura de neutrones o absorcion de rayos γ, demanera que el nucleo excitado tenga la energıa suficiente para vencer la barrera de energıa.Esta es una forma practica de medir la altura de la barrera.

Generalmente los fragmentos producidos por la fision son ricos en neutrones, ya que larelacion N/Z de los nucleos β−estables decrece al decrecer A. Tıpicamente, entre 1 y 4neutrones son emitido por los fragmentos de la fision, en un tiempo de 10−18 a 10−15 s. Losnucleos resultantes caen al estado basico emitiendo fotones γ y luego β−decaen hasta formarnucleos estables. Ocasionalmente uno de los nucleos producidos por el decaimiento β emiteun neutron. Este se llama neutron retardado, pues su aparıcion es dictada por la dinamicadel decaimiento β. Por ejemplo, uno de los productos de la fision del 236U es 87

35Br. Este nucleodecae β en 80 s hacia el estado basico o hacia un estado excitado del 87

36Kr. El estado excitadoemite un neutron rapidamente, pero en total 80 s despues de la fision. Como veremos masadelante, los neutrones retardados son importantes en el control de los reactores nucleares.

6.8. Reaccion en cadena

Como vimos en la seccion anterior, la fision de nucleos pesados produce un excedentede energıa ∆B, que se distribuye en su mayor parte en la energıa cinnetica de los nucleoshijos, y en menor medida en los neutrones y otras partıculas generadas. Esta energıa es lafuente de potencia de los reactores nucleares dedicados a la produccion de electricidad. Laenergıa cinnetica de los productros de la fision se intercambia con los atomos del material quecontiene la reaccion nuclear, con ele efecto neto de producir calor. Este calor se usa para hacerfuncionar una turbina del mismo modo que las plantas termoelectricas. En 1997 habıan cercade 430 plantas nucleares operando en todo el mundo, produciendo el 17% de la electricidadgenerada globalmente.

Consideremos la fision del 235U. Para producirse debe ser superada la barrera descrita porla ec. (6.56), cuy maximo tiene una altura experimental de 5.8 MeV. Esta barrera se superasi el nucleo es bombardeado por neutrones.

235U + n −→236 U∗ −→ X + Y + 2,5n. (6.57)

En este caso la energıa del nucleo excitado 236U∗ es cerca de 6 MeV por encima del estadobase, y por ende es sufuciente para superar la barrera de potencial. Los 2.5 neutrones son

118 CAPITULO 6. FISICA NUCLEAR

emitidos (o sea, cada dos reacciones se generan 5 neutrones estadısticamente) en un tiempode 10−18 a 10−15 s. Los fragmentos X y Y son inestables, y emiten 0.02 neutrones pasados13 s. Estos se llaman neutrones retardados y, como veremos mas adelante, son importantespara el control de los reactores nucleares.

Para fisionar el 238U es necesario un neutron con 1.4 MeV de energıa

238U + n+ ∆E −→239 U∗ −→ X + Y + xn. (6.58)

Figura 6.17: Seccion eficaz total y seccion eficaz de fision en funcion de la energıa cinetica delos neutrones incidentes en (a) 235U y (b) 238U.

La Fig. 6.17 muestra tecnicamente la diferencia entre los dos isotopos de uranio. Laseccion eficaz total incluye la fision, ası como la dispersion elastica e inelastica y la absorcionsin originar fision. Se puede apreciar como en el 238U la seccion eficaz de fision es distinta de0 para ∆E > 1,4 MeV, mientras para el 235U hay seccion eficaz a cualquier energıa. Para el235U a 0 energıa cinetica la fision aporta el 84 % de la seccion eficaz total. Entre 1 y 200 eV seobserva una zona de resonancias que se deben a procesos de sispersion inelastica y procesos

6.8. REACCION EN CADENA 119

de absorcion seguidos de emision de rayos γ. Para energıas mayores de 1 keV la dispersioninelastica aporta la mayor contribucion a la seccion eficaz total.

Consideremos un haz de partıculas de seccion cilındrica de radio a. Si la densidad delhaz es uniforme, la propabilidad de que pase por una seccion de area δA dentro del haz esδA/πa2. Existe una probabilidad cuantica P (r) de que al pasar por δA la partıcula cambie deestado de movimiento. El efecto conjunto es P (r)δA/πa2. La seccion eficaz se define como

σ =

∫P (r)dA =

∫ ∞

0

P (r)2πrdr, (6.59)

donde se ha considerado simetrıa azimutal y dA = 2πrdr. σ tiene obviamente dimensionesde area. De acuerdo a esta definicion, cuando el haz tiene un radio a grande, la probabilidadde interaccion es σ/πa2.

En la Tierra, el 99.27% del uranio es 238U y 0.72% es 235U. Sea c la fraccion de 235U. Laseccion eficaz promedio es

σtot = cσ235tot + (1− c)σ238.

tot (6.60)

Puede demostrarse que el recorrido libre medio de un neutron es

l =1

ρnucσtot

, ρnuc = 4,8× 1028nucleos/m3. (6.61)

La energıa media de los neutrones liberados en la fision es aproximadamente 2 MeV. Paraesa energıa la seccion eficaz para los dos isotopos del uranio es σtot ' 7 barn (1 barn10−24

cm2), con lo cual se obtiene un recorrido libre medio l = 3 cm.Consideremos el caso extremo c = 1, es decir, 235U puro. Para la energıa de 2 MeV, la

proporcion entre la seccion eficaz de fision y la total es σfis/σtot ≈ 0,18. Esto significa queestadısticamente un neutron induce un evento de fision cada 6 colisiones. Asumiendo quelas colisiones desvıan el neutron en direccion aleatoria4 obtenemos que el desplazamientopromedio del neutron para inducir fision es

√6 l = 7 cm. El tiempo de este recorrido es

tp =6l

v(2 MeV)≈ 10−8 s.

Cada fision produce estadısticamente 2.5 neutrones. Cada uno de estos necesita permane-cer 10 ns en el uranio para poder inducir otra fision. El neutron puede abandonar el materialfisible o permanecer en el y provocar otra fision. Sea q la probabilidad de que un neutroninduzca fision antes de escapar. q depende de la masa y de la geometrıa del material fisible.Llamemos ν al numero de neutrones producidos por la reaccion. Entonces el numero neto deneutrones producidos cada tiempo tp es igual νq−1 (se resta el neutron gastado para inducirla fision). Expresemos esto matematicamente para el numero de neutrones en un instantedeterminado n(t).

n(t+ dt) = n(t) + (νq − 1)n(t)dt

tp. (6.62)

La solucion de esta ecuacion diferencial es

4Esta es la hipotesis del movimiento Browniano, para el cual Einstein obtuvo la celebre formula 〈~r(t)〉2 =6Dt, siendo D el coeficiente de difusion de la Ley de Fick.

120 CAPITULO 6. FISICA NUCLEAR

n(t) = n(0)eλt, λ =νq − 1

tp. (6.63)

Si νq − 1 > 0 el numero de neutrones, y por tanto el numero de fisiones se amplificaexponencialmente, resultando en la llamada reaccion en cadena. En la bomba nuclearλ ∼ 108 s−1. Si νq − 1 < 0 entonces la reaccion se extingue y solamente ocurre la fisionespontanea. Para un volumen esferico de 235U la condicion νq = 1 se obtiene con un radio de8.7 cm, lo que significa una masa de 52 kg. Esta es la llamada masa crıtica para la reaccionen cadena. Para la reaccion en cadena la escala de tiempo es de 10 ns y no es necesarioconsiderar los neutrones retardados.

6.9. Reactores nucleares

Los reactores nucleares operan en el borde de la reaccion en cadena, de forma que seaautosostenida, pero no explosiva. En este caso es necesario considerar el aporte de los neu-trones retardados, caracterizado por la tasa de replicacion νr. La condicion de operacion seexpresa

νq < 1, (ν + νr)q = 1.

Las condiciones anteriores expresan que para los neutrones instantaneos el regimen essubcrıtico, y para los neutrones instantaneos mas los retardados el regimen es crıtico. Laescala de tiempo de los neutrones retardados esta determinada por el tiempo de emisionτ = 13 s. Esto permite controlar la reaccion en cadena variando la geometrıa del materialfisible por medios mecanicos. Un parametro importante en los reactores es la variacion deq con la temperatura. Se busca que dq/dt < 0, de modo que si la reaccion se descontrola,provocando el aumento de temperatura, la variacion del parametro q provoque la extincionde la reaccion. El reactor accidentado en Chernobil violaba esta regla. En Chernobil noocurrio una explosion nuclear, pues al aumentar la temperatura la presion de los gases hizoexplotar el reactor, provocando la dispersion (causante de los danos) del material fisible yextinguiendo la reaccion en cadena. Un reactor moderno se disena para que la reaccion seextinga antes de danar el reactor.

En realidad, resulta impractico usar 235U como combustible nuclear, pues este es el 0.72%del uranio existente en los yacimientos. Veamos como ocurre la reaccion en el uranio natural.

La seccion eficaz total σtot = σ238tot . Para los neutrones generados en una fision, con 2 MeV

de energıa, σfis/σtot = 0,05. Despues de dos colisiones inelasticas la energia cae por debajode 1.4 MeV y solo el 235U puede fisionar, pero este es minoritario y predominan las colisionescon el 238U. Los neutrones que no escapan, van perdiendo energıas en colisiones sucesivashasta ser capturados en una de las resonancias del 238U (energıas 10-100 eV), produciendoseel proceso

n+ 238U → 239U + γ. (6.64)

El 239U decae β, pero no fisiona. Ası, la reaccion (6.64) impide la reaccion en cadena en unamasa de uranio natural.

Hay dos alternativas tecnologicas para lograr la reaccion automentenida: los reactorestermicos y los reactores rapidos.

6.9. REACTORES NUCLEARES 121

6.9.1. Reactores termicos

En los reactores termicos el combustible es UO2 contenido en un arreglo de barras estre-chas. Las barras estan inmersas en un medio (agua, grafito, agua pesada) llamado modera-dor. El moderador tiene dos roles

1. Hacer perder energıa a los neutrones evitando la reaccion (6.64).

2. Colectar la energıa de los neutrones, adquiriendo temperatura, que se aprovecha en unciclo termodinamico para producir la electricidad. Tambien sirve para enfriar las barrasde combustible.

El moderador debe tener baja masa atomica, baja seccion de absorcion de neutrones yalta seccion eficaz total. La baja masa se necesita para hacer perder energıa a los neutronesrapidamente mediante colisiones elasticas5. Los neutrones pierden energıa hasta que alcanzanun equilibrio termico con el moderador, a 0.1 eV ≡ 1160 K. En este estado los neutrones sedenominan neutrones termicos.

Los neutrones termicos son capturados por el 235U y lo fisionan, pues

σ235fis (E = 0,1MeV ) = 103 barn,

σ235fis

σ235tot

= 0,84 y σ238tot = 10 barn.

El moderador usado con uranio natural es 12C en forma de grafito y el agua pesada(D2O). Los criterios de diseno son menos demandantes si se utiliza como combustible eluranio enriquecido. El uranio enriquecido contiene de 2 a 3% de 235U. El reactor puedeconstruirse mucho mas pequeno y se puede usar agua ordinaria como moderador, a pesar deque el hidrogeno tienen una alta seccion eficaz de absorcion de neutrones.

6.9.2. Reactores rapidos

Los reactores rapidos toman su nombre porque usan neutrones rapidos, sin necesidad demoderarlos. Un reactor rapido funciona porque la probabilidad de fision se incrementa res-pecto a las del uranio natural incrementando la proporcion de nucleos fisibles. El combustibleusado en estos es una mezcla de 80% de 238U y 20 % de 239Pu. Es mas economico obtener elplutonio que enriquecer el uranio. El plutonio se obtiene de las reacciones

23992 U

β−→ 23993 Np

β−→ 23994 Pu.

El primer decaimiento tiene un tiempo medio de 34 minutos, mientras el segundo toma 3.36dıas. El 239Pu produce ν = 2,96 neutrones, mas que el 235U. Gracias a esto en un reactorrapido de fisiona el plutonio y es posible obtener mas plutonio a costa del 238U. La tecnologıade los reactores rapidos no ha prosperado y los prototipos ya han sido desmantelados. Enparte se debe a que hay problemas ingenieriles complejos, entre ellos el riesgoso uso desodio lıquido como refrigerante. Por otra parte los yacimientos de uranio parecen asegurar elfuncionamiento de los reactores termicos durante un siglo mas.

5Compare el choque elastico de una partıcula ligera con otra de masa parecida y el choque con otra demasa mucho mayor.

122 CAPITULO 6. FISICA NUCLEAR

6.9.3. Otros problemas de la energetica nuclear

Quizas el mayor problema de la energıa nuclear es que hay poca distancia tecnologica en-tre reactores nucleares y bombas nucleares. En particular, la tecnologıa de reactores termicosrequiere el enriquecimiento de uranio. El enriquecimiento puede extenderse facilmente paraobtener una composicion adecuada al explosivo nuclear. La IAEA y algunas agencias naciona-les de inteligencia mantiene un monitoreo de las operaciones que se realizan con el combustiblenuclear y hay temores fundamentados de que algunos paıses esten desarrollando armamentonuclear. Esto se conoce con el nombre de proliferacion. Esto provoca presiones polıticas pa-ra limitar desarrollos con fines pacıficos. Las investigaciones apuntan hacia el desarrollo detecnologıa energetica nuclear que no permita proliferacion. Solamente ası sera aceptado eldesarrollo de la tecnologıa nuclear en todos los paıses.

Por otra parte, se han descubierto reactores naturales, (CANDU en India) que producenplutonio 239.

Las reacciones que pueden sustentar la energıa nuclear por largo tiempo son

232Th + n −→ 233U; 233U + n −→ fision + 2,3n (Ciclo del Th) (6.65)238U + n −→ 239Pu; 239Pu + n −→ fision + 2,5n (Ciclo del 238U) (6.66)

Li + n −→ T; T + D −→ He+ n (Fusion) (6.67)

El ciclo del uranio es proliferante, pues genera 239Pu, cuya masa crıtica para bpmbas nucleareses 3 kg. Con los productos del ciclo del torio masa crıtica esta entre 28 y 60 kg. Estosproductos decaen mas rapido que el uranio y el plutonio tradicional, planteando problemasde almacenamiento y de seguridad de manejo que se estiman insuperables. Por eso estese considera un no proliferante. Por otra parte, la reaccion de fusion automantenida es unproblema no resuelto.

En cuanto al mantenimiento y control de la reaccion nuclear, ya existen disenos de reac-tores que operan en regimen subcrıtico. En estos se usan fuentes externas de neutrones paramantener la fision, de modo que no ocurre la reaccion en cadena.

6.10. Modelo nuclear de capas

Este modelo permite explicar desviaciones de la formula de masa dada por el modelo dela gota lıquida. Tambien proporciona una explicacion de la alta energıa de enlace de ciertosnucleos que contienen numeros magicos de protones o de neutrones: 8, 20, 28, 50, 82, 126.

El modelo de capas se basa en los siguientes postulados

1. Cada neutron se mueve independientemente en un pozo de potencial producido por lainteraccion fuerte con los demas nucleones.

2. Cada proton se mueve independientemente en un pozo de potencial producido por lainteraccion fuerte con los demas nucleones y la interaccion de Coulomb con los otrosprotones.

3. Dado el corto alcance de la fuerza nuclear, la profundidad del potencial es proporcionala la densidad

6.10. MODELO NUCLEAR DE CAPAS 123

Figura 6.18: Esquema del pozo de potencial del (a) neutron, (b) proton para el nucleo 20882 Pb.

El potencial de Coulomb creado por los protones causa una diferencia entre la profundidaddel pozo de los neutrones y los protones.

Uc(r) =

(Z−1)e2

4πε0R

(32− r2

2R2

), r < R

(Z−1)e2

4πε0r, r > R.

(6.68)

Como la interaccion nucleon-nucleon depende del estado hay otros factores que modifican laprofundidad relativa de los pozos del neutron y el proton. Como vimos en la Sec. 6.3.1, lainteraccion proton-neutron es mas efectiva que entre nucleones del mismo tipo. En nucleoscon mas neutrones que protones la interaccion nuclear es mas atractiva para los protones,puesto que un proton esta en promedio rodeado por mas neutrones que un neutron porprotones. Esto da una contribucion negativa, que sumado a la contribucion positiva delpotencial de Coulomb, da el valor promedio U mostrado en la Fig. 6.18, supuesto constantepor simplicidad.

Despreciemos por el momento los detalles del potencial nuclear en la superficie y supon-gamos que es infinito. Esto implica que la funcion de onda es cero en r = R y en el exterior.Pongamos en cero de la energıa en el fondo del pozo de potencial neutronico. El fondo del po-tencial protonico es U . Entonces las ecuaciones de Schrodinger para los protones y neutronesson

− ~2

2mn

∇2ψn = Enψn, (6.69)

− ~2

2mp

∇2ψp = (Ep − U)ψpsip, (6.70)

donde se han despreciado los terminos que dependen del espın. Los nucleones tienen espın 1/2,por lo que cumplen el principio de exclusion de Pauli. Este requiere que no haya dos nucleonesen el mismo estado cuantico. Consecuentemente, los neutrones ocupan los N estados de menorenergıa, dados por (6.69), y los protones ocupan los Z estados de menor energıa dados por(6.70). Podemos estimar las energıas totales suponiendo N y Z suficientemente grande parausar la formula de la densidad de estados de partıculas libres en una caja (1.117). La densidad

124 CAPITULO 6. FISICA NUCLEAR

integrada de estados es

N(E) =

∫ E

0

ρ(E ′) dE ′ =V

3π2

(2mE

~2

)3/2

. (6.71)

Como Z y N son relativamente pequenos, una mejor aproximacion que incluye efectos desuperficie es6

N(E) =V

3π2

(2mE

~2

)3/2[1− 3π

8

S

V

(~2

2mE

)1/2]. (6.72)

Figura 6.19: Densidad de estados integrada comparada con la formula asintotica (6.72)

La energıa de Fermi (neutrones EFn , protones EF

p ) es la energıa del ultimo nivel ocupado.Los numeros de neutrones y protones se obtienen de (6.71)

N ≈ V

3π2

(2mEF

n

~2

)3/2

, (6.73)

Z ≈ V

3π2

(2m(EF

p − U)

~2

)3/2

. (6.74)

En nucleos ligeros (A < 40) el numero de protones y neutrones es aproximadamente igual.Entonces N/V es aproximadamente igual a la mitad de la densidad el nucleo 0,085 fm−3.Sustituyendo N/V en (6.73) se obtiene EF

n ≈ 38 MeV. Como Z ≈ N se obtiene el mismoEF

p − U ≈ 38 MeV. En nucleos pesados este mismo razonamiento permite estimar EFn , EF

p yU .

6La obtencion de esta formula puede verse en H. P. Baltes y E. R. Hilf, Spectra of Finite Systems (1976).

6.10. MODELO NUCLEAR DE CAPAS 125

Los niveles de Fermi deben cumplir la condicion

|EFn − EF

p | < mec2 −∆E, (6.75)

donde ∆E es el espaciamiento energetico entre el el menor nivel de Fermi y el primer estadodesocupado. Si esta condicion no se cumple, un nucleon en el nivel de Fermi mas alto podrıadecaer β y pasar a un estado vacıo sobre el nivel de Fermi menor, formando entonces unnucleo con distinta carga y menor energıa.

Para pozos de potencial mas realistas que el pozo infinito se esperan energıas parecidas.La energıa de separacion de neutrones Sn es la diferencia entre el potencial en el exterior yEF

n . En terminos de la energıa de enlace

Sn = B(N,Z)−B(N − 1, Z). (6.76)

Similarmente, la energıa de separacion de un proton es

Sp = B(N,Z)−B(N,Z − 1). (6.77)

Las energıas respecto al potencial exterior son

Ekl = −Vn(p) +~2x2

kl

2mn(p)R2, (6.78)

donde Vn(p) = Sn(p) +EFn(p). Los valores de xkl se muestran en la Tabla 6.20. Las funciones de

onda toman la forma

ψklm(r, θ, φ) = ukl(r)Ylm(θ, φ), m = −l,−l + 1..., l. (6.79)

La degeneracion de los niveles Ekl, considerando el grado de libertad de espın, es 2(2l + 1).Esto implica la secuencia de niveles y densidad integrada de estados mostrada en la tabla6.4.

Cuadro 6.4: Numero de protones o neutrones en capas llenas sin considerar la interaccionespın-orbita. Se usa la notacion espectroscopica kA, con A=s,p,d,f,... para l = 0, 1, 2, 3, ....

kl 1s 1p 1d 2s 1fxkl 3.14 4.49 5.76 6.28 6.99

N(Ekl) 2 8 18 20 34

Figura 6.20: La primera y la ultima columna dan la secuencia de niveles de energıa en unpozo esferico con barreras infinitas. La segunda columna da xnl. La tercera columna da lasecuencia observada de niveles de neutrones, y la cuarta da el numero cumulativo de estadosen esos niveles. Las dos columnas siguientes dan los mismos numeros para los protones.

Hasta ahora hemos despreciado el espın. Es crucial considerar la interaccion espın-orbita.Esta se incorpora al hamiltoniano mediante el operador

Uso(r)~L · ~s, (6.80)

126 CAPITULO 6. FISICA NUCLEAR

Cuadro 6.5: Comparacion de la degeneracion en el esquema de acoplamiento espın-orbita ysin este acoplamiento. Para los estados acoplados se usa la notacion klj con j1 = l − 1/2 yj2 = l + 1/2.

Sin espın-orbita Con espın-orbitaNivel kl kll+1/2 kll−1/2

Degeneracion 2(2l + 1) 2l + 2 2l − 1

donde ~L y ~s son los operadores del momento angular y de espın, respectivamente. La interac-cion espın-orbita es una correccion relativista a la ecuacion de Schrodinger. Los operadores

~L2 y ~s2 conmutan con el hamiltoniano, por lo que estas magnitudes son constantes de movi-miento. Ademas, conmutan con el hamiltoniano el cuadrado y las proyecciones del momento

angular total ~J2 y Jx, Jy, Jz, con ~J = ~L+ ~s. Esto permite caracterizar los niveles de energıacon los numeros cuanticos k, l, j, jz (s = 1/2 para todos los nucleones y se omite en la nota-cion). j toma los valores j1 = l− 1/2 y j2 = l+1/2. El numero de niveles para un valor dadode l es (2j1 + 1) + (2j2 + 1) = 2(2l + 1).

El efecto de la interaccion espın-orbita en las energıas se debe a los elementos matriciales

〈lsjjz|~L · ~s|lsjjz〉 =1

2[j(j + 1)− l(l + 1)− s(s+ 1)]

=

12l~2 si j = l + 1

2

−12(l + 1)~2 si j = l − 1

2.

(6.81)

El resultado anterior se obtiene de la identidad

~J2 = ~L2 + ~s2 + 2~L · ~s.Los experimentos muestran que Uso(r) es negativo, de modo que el estado con j = l+1/2

siempre tiene menor energıa que el estado correspondiente conj = l − 1/2. La magnitud delos desdoblamientos es suficientemente grande para cambiar el orden de los niveles de energıaobtenidos previamente sin considerar el acoplamiento espın-orbita. La Fig. 6.20 muestra elordenamiento considerando todos los efectos. El corrimiento de la columna del proton relativola columna del neutron refleja el llenado observado para los nucleos β−estables.

El mayor exito del modelo de capas es la prediccion del momento angular de los nucleosen sus estados basicos. Estos valores cumplen reglas simples: los nucleos con numero par deprotones y neutrones (par-par) tienen momento angular cero y paridad positiva. Los nucleospar-impar (osea, A impar) tienen momento y paridad igual a la del nucleon no apareadoen la capa que esta parcialmente llena. La formula de masa describe el hecho de que losnucleos con paridad de neutrones y protones tienen menor energıa. La informacion sobrelos espines nucleares revela el origen de esta energıa: es energeticamente favorable que quelos protones y neutrones se ordenen en pares dentro de capas energeticas, con el momentoangular de los pares igual a ~J1 + ~J2 = 0. Luego, el nucleon no apareado es el que determina elmomento angular y la paridad del nucleo entero. Hay algunas excepciones a esta regla, peronotablemente pocas considerando su simplicidad.

En los nucleos que tienen numero impar de protones y neutrones, estos no combinan susmomentos angulares de forma sistematica y no siguen una regla simple. Ciertamente estos

6.11. BIBLIOGRAFIA 127

nucleos son desfavorecidos energeticamente y solo hay cuatro que son β−estables (21H, 6

3Li,105 B y 14

7 N).

6.10.1. Numeros magicos

In la Fig. 6.20 se han dibujado lıneas donde la suma de los estados de las capas mostradasarriba de las lıneas es 2, 8, 20, 28, 50, 82 y 126. Estos son llamados numeros magicos. Losdos primeros corresponden al llenado de las capas 1s y 1p. Los otros parecen arbitrarios, perose encuentra empıricamente que los gaps de energıa hasta la capa siguiente son mayores queel gap promedio en la secuencia. Los nucleos que tienen Z o N igual a uno de los numerosmagicos tienen propiedades que reflejan la existencia de estos gaps. Por ejemplo, el estano(Z = 50) tiene 10 isotopos estables, y hay siete elementos estables con N = 82. Z = 50y N = 82 son nucleos proximos en la secuencia, como puede verse en la Fig. 6.20. Estoesta relacionado con la condicion (6.75). Las desviaciones de la energıa de enlace por nucleonrespecto a la formula de masa se asocian con la estructura de capas nucleares y los numerosmagicos. Notemos que los nucleos α−estables mas pesados son 208

82 Pb que es doble magico(N = 126, Z = 82) y el 209

83 Bi (N = 126).

6.11. Bibliografıa

1. W. N. Cottingham y D. A. Greenwood, An Introduction to Nuclear Physics, 2nd ed.Cambridge University Press (2001).

6.12. Erratas

El texto tiene erratas por descubrir, y probablemente errores. Se agradece retroalimenta-cion.

128 CAPITULO 6. FISICA NUCLEAR

Capıtulo 7

Fısica de suelos

129